Способ и устройство масштабированного кодирования и декодирования звука

Патент 2185024

Авторы

Классы МПК

H03M13/07 - арифметические коды

Реферат

Способ и устройство относятся к средствам масштабируемого кодирования/декодирования звука. Техническим результатом является повышение качества звука. Для кодирования аудиосигнала в состоящие из нескольких слоев потоки данных, имеющие основной слой и по меньшей мере один слой выделения сигнала из шумов, в предлагаемом способе кодирования осуществляют этапы временного/частотного отображения входных аудиосигналов, квантования спектральных данных одним и тем же масштабным коэффициентом для каждой заданной полосы частот масштабного коэффициента и упаковки квантованных данных в потоки битов, причем этап формирования потока битов содержит этапы кодирования квантованных данных, соответствующих основному слою, кодирования квантованных данных, соответствующих следующему слою выделения сигнала из шумов в кодированном основном слое, и остающихся квантованных данных, не кодированных из-за ограничения размера слоя и относящихся к кодированному слою, и выполнение этапа кодирования слоя для всех слоев выделения сигнала из шумов для формирования потоков битов. 4 с. и 22 з.п. ф-лы, 6 ил., 67 табл.

Изобретение относится к кодированию и декодированию звука, более конкретно к способу и устройству масштабируемого кодирования/декодирования звука с помощью секционированного по двоичным разрядам арифметического кодирования. Данное изобретение принято в качестве ISO/IEC JTC1/SC29/WG11 N1903 (Комитетский проект 14496-3 ISO/IEC, подраздел 4).

Аудиостандарты MPEG, или способ АС-2/АС-3, обеспечивают то же качество звука, что и компакт-диск, при скорости передачи данных в битах 64-384 кб/с, что составляет от одной шестой до одной восьмой скорости обычного цифрового кодирования. По этой причине аудиостандарты MPEG играют важную роль с точки зрения запоминания и передачи аудиосигналов - в цифровом аудиовещании, телефонной связи Интернета, или в абонентском аудиовещании.

В последнее время ведутся исследования способов для воспроизведения чистого качества звука в его первоначальном звучании на более низкой скорости передачи данных в битах. Одним из способов является Усовершенствованное Кодирование Звука MPEG-2 (ААС), принятое в качестве нового международного стандарта. Этот способ обеспечивает чистое качество звука относительно первоначального звучания при скорости 64 кб/с и рекомендован этой экспертной группой.

В обычной методике в кодер подают фиксированную скорость передачи данных в битах, и затем находят оптимальное состояние, соответствующее данной скорости передачи данных в битах для последующего квантования и кодирования, тем самым получая значительно повышенную эффективность. Но с распространением мультимедийной техники возрастает потребность в кодере/декодере (кодек), обладающем универсальностью при низкой скорости передачи данных в битах. Одной из таких потребностей является обеспечение масштабируемого кодека звука. Масштабируемый кодек звука может кодировать потоки битов высокой скорости передачи данных в битах в потоки с низкой скоростью передачи данных в битах, чтобы затем восстановить только некоторые из них. Тем самым сигналы можно восстанавливать с приемлемой эффективностью только с некоторыми потоками битов, при этом имея небольшое ухудшение рабочих характеристик из-за более низких скоростей передачи данных в битах, в тех случаях, когда к системе прилагают перегрузку, или когда рабочие характеристики декодера низкие, или по просьбе пользователя.

В соответствии с общепринятыми методами кодирования звука, такими как стандарты MPEG-2 ААС, фиксированную скорость передачи данных в битах направляют к кодирующему устройству, затем находят оптимальное состояние для данной скорости передачи данных в битах для последующего выполнения квантования и кодирования, тем самым формируя потоки битов в соответствии с данной скоростью передачи данных в битах. Один поток битов содержит информацию для одной скорости передачи данных в битах. Другими словами, информация о скорости передачи данных в битах содержится в заголовке потока битов, и при этом используют фиксированную скорость передачи данных в битах. Таким образом, можно использовать способ, имеющий наивысшую эффективность при определенной скорости передачи данных в битах. Например, когда поток битов формируют кодером на скорости 64 кб/с, то наилучшее качество звучания можно будет восстановить декодером, соответствующим кодеру, имеющему скорость передачи данных в битах 64 кб/с.

Согласно этим способам потоки битов формируют без учета прочих скоростей передачи данных в битах, но формируют потоки битов с величиной, соответствующей данной скорости передачи данных в битах, а не порядок потоков битов. Если таким образом сформированные потоки битов передают по сети связи, то эти потоки битов секционируют по двоичным разрядам в несколько временных интервалов для последующей передачи. При подаче перегрузки к каналу передачи или когда на принимающей стороне принимают только некоторые отправленные передающей стороной временные интервалы по причине узкой ширины полосы частот канала передачи, данные нельзя восстановить должным образом. Также, поскольку потоки битов не формируют в соответствии с их значимостью, если восстанавливают только некоторые из потоков битов, то качество серьезно ухудшается. При этом восстановленные аудиоданные при прослушивании не являются приемлемыми на слух.

В случае с масштабируемым кодеком звука для решения указанных выше проблем выполняют кодирование для основного слоя и затем разностной сигнал между первоначальным сигналом и кодированным сигналом кодируют в следующем слое выделения сигнала из шумов (К. Бранденбург и др., "Основные концепции масштабируемого кодирования звука", 97-я Конвенция ОИА, препринт 3924, Сан-Франциско, 1994 и (К. Бранденбург и др., "Система масштабируемого кодирования звука двух- или трехэтапной скорости передачи данных в битах", 99-я Конвенция ОИА, препринт 4132, Нью-Йорк, 1995). Таким образом, чем больше слоев, тем хуже становятся рабочие характеристики при высокой скорости передачи данных в битах. В случае использования устройства масштабируемого кодирования сначала воспроизводят сигнал с хорошим качеством звука. Но если состояние каналов связи ухудшается либо если нагрузка на декодер принимающего оконечного устройства возрастает, то воспроизводится звук, имеющий качество низкой скорости передачи данных в битах. Поэтому упомянутый способ кодирования не подходит для практического достижения масштабируемости.

Для решения изложенных выше проблем техническая задача данного изобретения заключается в обеспечении способа масштабируемого кодирования цифровых аудиоданных, устройства и носителя записи для записи способа кодирования с помощью методики секционированного по двоичным разрядам арифметического кодирования (ДРСАК) вместо модуля кодирования без потерь; при этом все другие модули обычного кодера остаются без изменения.

Другая задача данного изобретения заключается в обеспечении способа масштабируемого кодирования цифровых аудиоданных, устройства и носителя записи для записи способа декодирования с помощью методики секционированного по двоичным разрядам арифметического кодирования (ДРСАК) вместо модуля кодирования без потерь; при этом все другие модули обычного аудиодекодера остаются без изменения.

Для достижения первой задачи данного изобретения обеспечивают способ масштабируемого кодирования звука для кодирования аудиосигналов в состоящий из нескольких слоев поток данных, имеющий основной слой и слои выделения сигнала из шумов в заданном количестве, причем данный способ содержит этапы: сигналообработки входных аудиосигналов, и квантования их для каждой заданной полосы частот кодирования, и упаковки квантованных данных в целях формирования потоков битов; причем этап формирования потока битов содержит: кодирование квантованных данных, соответствующих основному слою; кодирование квантованных данных, соответствующих следующему слою выделения сигнала из шумов в кодированном основном слое, и остающихся квантованных данных, не кодированных по причине ограничения размера слоя, и относящихся к кодированному слою; и последовательного выполнения этапов кодирования слоев для всех слоев выделения сигнала из шумов в целях формирования потоков битов; причем этап кодирования основного слоя, этап кодирования слоя выделения сигнала из шумов и этап последовательного кодирования выполняют таким образом, что дополнительная информация и квантованные данные, соответствующие кодируемому слою, представляют цифрами одинакового заданного числа и затем подвергают арифметическому кодированию с помощью заданной вероятностной модели в порядке от последовательностей самого старшего разряда до последовательностей самого младшего разряда, при этом дополнительная информация содержит масштабные коэффициенты и вероятностные модели, используемые в арифметическом кодировании.

Этап кодирования масштабных коэффициентов содержит этапы выведения максимального масштабного коэффициента; и получения разниц между максимальным масштабным коэффициентом и соответствующими масштабными коэффициентами, и арифметического кодирования этих разниц.

Если квантованные данные состоят из данных знака и данных величины, то этап кодирования включает в себя следующие этапы: кодирование заданным способом кодирования последовательностей самых старших разрядов, состоящих из самых старших разрядов данных величины квантованных данных, представленных одинаковым числом битов; кодирование данных знака, соответствующих ненулевым данным из числа кодированных последовательностей самых старших разрядов; кодирование заданным способом кодирования последовательностей самых старших разрядов из числа некодированных данных величины цифровых данных посредством заданного способа кодирования; кодирование некодированных данных знака из числа данных знака, соответствующих ненулевым данным величины из числа последовательностей битов; и выполнение этапа кодирования данных величины и этапа кодирования данных знака, используя соответствующие биты цифровых данных.

Этапы кодирования выполняют соединением битов, составляющих соответствующие последовательности битов для данных величины и данных знака, в блоки битов заданного числа.

Четырехмерный вектор, соединенный в блоки битов, разделяют на два подвектора согласно его предшествующим состояниям при кодировании соответствующих выборок.

Скорость передачи данных в битах основного слоя составляет 16 кб/с, а скорость передачи данных в битах промежуточного слоя составляет 8 кб/с.

Для достижения второй задачи данного изобретения обеспечивают устройство масштабируемого кодирования звука, содержащее: квантующий узел для сигналообработки входных аудиосигналов и квантования их для каждой полосы частот кодирования; и узел упаковки битов для формирования потоков битов путем ограничения полосы частот для основного слоя в целях масштабируемости, кодирования дополнительной информации, соответствующей основному слою, последовательного кодирования квантованной информации с последовательности самых старших разрядов до последовательности самых младших разрядов и от низкочастотных составляющих до высокочастотных составляющих; и кодирования дополнительной информации, соответствующей следующему слою выделения сигнала из шумов в основном слое, и квантованных данных, для выполнения кодирования по всем слоям.

Квантующий узел содержит: узел временного/частотного отображения для преобразования входных аудиосигналов временной области в сигналы частотной области; психоакустический узел для соединения преобразованных сигналов с помощью сигналов заданных поддиапазонов посредством временного/частотного отображения и вычисления порога маскировки для каждого поддиапазона с помощью явления маскировки, создаваемого взаимодействием соответствующих сигналов; и квантующий узел для квантования сигналов для каждой заданной полосы частот кодирования при одновременном сравнении шума квантования каждой полосы частот с порогом маскировки.

Для обеспечения третьей задачи данного изобретения обеспечивают способ масштабируемого декодирования звука для декодирования аудиоданных, кодированных для получения состоящих из нескольких слоев скоростей передачи данных в битах, содержащий этапы: декодирования дополнительной информации, имеющей по меньшей мере масштабные коэффициенты и информацию модели арифметического декодирования, назначенную для каждой полосы частот, в порядке создания слоев в потоках данных, имеющих состоящие из нескольких слоев скорости передачи данных в битах, путем анализирования значимости составляющих потоки данных битов от более значимых битов до менее значимых битов, применения моделей арифметического кодирования, соответствующих квантованным данным; восстановления декодированных масштабных коэффициентов и квантованных данных в сигналы, имеющие первоначальные величины; и преобразования обращенно квантованных сигналов в сигналы временной области.

Декодирование масштабных коэффициентов выполняют посредством следующих этапов: декодирование максимального масштабного коэффициента в потоке битов, арифметическое декодирование разниц между максимальным масштабным коэффициентом и соответствующими масштабными коэффициентами, и вычитание этих разниц из максимального масштабного коэффициента.

Также обеспечивают устройство масштабируемого декодирования звука, содержащее: узел анализирования потока битов для декодирования дополнительной информации, имеющей по меньшей мере масштабные коэффициенты и информацию арифметической модели и квантованные данные, в порядке создания слоев в состоящих из нескольких слоев потоков битов; узел обращенного квантования для восстановления декодированных масштабных коэффициентов и квантованных данных в сигналы, имеющие первоначальные величины; и узел частотного/временного отображения для преобразования обращенно квантованных сигналов частотной области в сигналы временной области.

Данное изобретение можно осуществить в универсальном цифровом компьютере, использующем программу из числа применяемых для компьютеров носителей, включая, но не ограничиваясь только этим, запоминающую среду, такую как магнитная запоминающая среда (например, ПЗУ, гибкие диски, жесткие диски и пр.), среда, считываемая оптическими средствами (например, КД-ПЗУ, ЦВД и пр. ), и несущие волны (например, передачи по Интернету). Например, обеспечивают используемую в компьютере среду, материально осуществляющую программу команд, выполняемую машиной, для выполнения способа масштабируемого кодирования звука для кодирования аудиосигналов в состоящий из нескольких слоев поток данных, имеющий основной слой и слои выделения сигнала из шумов в заданном количестве, причем этот способ содержит следующие этапы: сигналообработка входных аудиосигналов и их квантование для каждой заданной полосы частот кодирования; и упаковка квантованных данных для формирования потоков битов; причем этап формирования потока битов содержит: кодирование квантованных данных, соответствующих основному слою; кодирование квантованных данных, соответствующих следующему слою выделения сигнала из шумов в кодированном основном слое, и остающихся квантованных данных, не кодированных по причине ограничения размера слоя, и относящихся к кодированному слою; и последовательное выполнение этапов кодирования слоя для всех слоев выделения сигнала из шумов для формирования потоков битов; при этом этап кодирования основного слоя, и этап кодирования слоя выделения сигнала из шумов, и этап последовательного кодирования выполняют таким образом, что дополнительную информацию и квантованные данные, соответствующие кодируемому слою, представляют цифрами заданного одинакового числа и затем подвергают арифметическому кодированию с помощью заданной вероятностной модели в порядке от последовательностей самых старших разрядов до последовательностей самых младших разрядов, причем дополнительная информация содержит масштабные коэффициенты и вероятностные модели, подлежащие применению в арифметическом кодировании.

Этап кодирования масштабного коэффициента содержит следующие этапы: выведение максимального масштабного коэффициента и получение разниц между максимальным масштабным коэффициентом и соответствующими масштабными коэффициентами, и арифметического кодирования их.

Кодирование информации для вероятностных моделей выполняют с помощью следующих этапов: выведение минимального значения из числа значений информации вероятностной модели; получение разниц между минимальным значением информации вероятностной модели и соответствующими значениями информации модели, и их арифметическое кодирование с помощью вероятностных моделей, указанных в таблицах 5.5-5.9.

Также обеспечивают используемый компьютером носитель, материально осуществляющий программу команд, исполняемую машиной для выполнения способа масштабируемого декодирования звука для декодирования аудиоданных, кодированных для получения имеющих несколько слоев скоростей передачи данных в битах, содержащего следующие этапы: декодирование дополнительной информации, имеющей по меньшей мере масштабные коэффициенты и информацию модели арифметического кодирования, назначенную для каждой полосы частот, в порядке создания слоев в потоках данных, имеющих состоящие из нескольких слоев скорости передачи данных в битах, путем анализирования значимости составляющих потоки данных битов, от более значимых разрядов к менее значащим разрядам; использование моделей арифметического кодирования, соответствующих квантованным данным; восстановление декодированных масштабных коэффициентов и квантованных данных в сигналы, имеющие первоначальные величины; и преобразование обращенно квантованных сигналов в сигналы временной области, причем носитель записи выполнен с возможностью считывания программы для выполнения способа масштабируемого кодирования звука с помощью компьютера.

Потоки битов декодируют в блоках четырехмерных векторов, и декодируют секционированную по двоичным разрядам информацию четырех выборок четырехмерных векторов.

Декодирование масштабных коэффициентов производится путем декодирования максимального масштабного коэффициента, арифметического кодирования разниц между максимальным масштабным коэффициентом и соответствующими масштабными коэффициентами, и вычитанием этих разниц из максимального масштабного коэффициента.

Декодирование индексов арифметической модели выполняют декодированием минимального индекса арифметической модели в потоке битов, декодированием разниц между минимальным индексом и соответствующими индексами в дополнительной информации соответствующих слоев, и суммированием минимального индекса и этих разниц.

Указанные выше цели и преимущества данного изобретения станут более очевидными из подробного описания его предпочтительного осуществления, при обращении к прилагаемым чертежам, на которых: фиг. 1 - блок-схема простого устройства масштабируемого кодирования/декодирования (кодека); фиг. 2 - блок-схема устройства кодирования в соответствии с данным изобретением; фиг.3 - структура потока битов в соответствии с данным изобретением; фиг. 4 - блок-схема устройства декодирования в соответствии с данным изобретением; фиг. 5 - расположение частотных составляющих длинного блока (размер окна = 2048); и фиг.6 - расположение частотных составляющих короткого блока (размер окна =2048).

Далее предпочтительные осуществления данного изобретения описываются с обращением на прилагаемые чертежи.

Потоки битов, формируемые в данном изобретении, не составляются единой скоростью передачи данных в битах, а их составляют несколько слоев выделения сигнала из шумов, основанных на основном слое. Данное изобретение имеет хорошую эффективность кодирования, то есть наилучшие рабочие характеристики имеются при фиксированной скорости передачи данных в битах как в обычных методах кодирования, и оно относится к способу кодирования/декодирования и устройству, в котором восстанавливают скорость передачи данных в битах, кодированную сообразно с получившей в последнее время развитие мультимедийной техникой.

Фиг.2 представляет собой блок-схему устройства масштабируемого кодирования звука согласно данному изобретению, которое в основном состоит из процессора квантования 230 и узла упаковки битов 240.

Процессор квантования 230 для сигналообработки входных аудиосигналов и квантования их для заданной полосы частот кодирования содержит узел временного/частотного отображения 200, психоакустический узел 210 и квантующий узел 220. Узел временного/частотного отображения 200 преобразует входные аудиосигналы временной области в сигналы частотной области. Воспринимаемая слухом разница между характеристиками сигнала с точки зрения времени не очень велика. Но в соответствии с человеческими психоакустическими моделями для каждой полосы частот производится большая разница. Таким образом эффективность сжатия можно повысить назначением разных битов квантования в зависимости от частотных диапазонов.

Психоакустический узел 210 соединяет преобразованные сигналы посредством сигналов заданных поддиапазонов с помощью узла временного/частотного отображения 200 и вычисляет порог маскировки на каждом поддиапазоне с помощью явления маскировки, производимого взаимодействием с соответствующими сигналами. Явление маскировки является феноменом, при котором аудиосигнал (звук) не слышен из-за другого сигнала. Например, когда поезд проходит по станции, человек не слышит голоса другого человека при разговоре на низком тоне из-за шума поезда.

Узел квантования 220 квантует сигналы для каждой заданной полосы частот кодирования, в результате чего шум квантования каждой полосы частот становится меньше порога маскировки. Другими словами, частотные сигналы каждой полосы частот прилагают к масштабируемому квантованию, в результате чего величина шума квантования каждой полосы частот меньше порога маскировки и поэтому не воспринимается. Квантование выполняют таким образом, чтобы значение ОШМ (отношение шума к маскировке), которое является отношением порога маскировки, вычисленного психоакустическим узлом 210, к генерируемому на каждой полосе частот шуму, было равно 0 дБ или меньше этого значения. Значение ОШМ, меньшее или равное 0 дБ, означает, что эффект маскировки выше шума квантования. Другими словами, шум квантования не слышен.

Узел упаковки битов 240 кодирует дополнительную информацию и квантованные данные, соответствующие основному слою, имеющему самую низкую скорость передачи битов; последовательно кодирует дополнительную информацию и квантованные данные, соответствующие следующему слою выделения сигнала из шумов в основном слое; и выполняет эту процедуру для всех слоев, чтобы сформировать потоки битов. В данном случае дополнительная информация включает в себя масштабные коэффициенты и информацию вероятностной модели, которые используют затем в арифметическом кодировании. Кодирование квантованных данных соответствующих слоев выполняют этапами секционирования каждой единицы квантованных данных в блоки битов путем представления квантованных данных как двоичных данных, состоящих из битов заданного одинакового числа, и последовательного кодирования секционированных по двоичным разрядам данных от последовательности самых старших разрядов до последовательности самых младших разрядов с помощью заданной вероятностной модели. Если цифровые данные состоят из данных знака и данных величины, то узел упаковки битов 240 отбирает каждую единицу данных величины для тех битов, которые имеют одинаковый уровень значимости, из числа секционированных по двоичным разрядам данных, кодирует данные величины, и затем кодирует некодированные данные знака из числа данных знака, соответствующих ненулевым данным величины из числа кодированных данных величины. В данном случае процедуру кодирования для данных знака и данных величины выполняют последовательно от самых старших до самых младших разрядов.

Потоки битов, сформированные устройством кодирования и имеющие указанную выше конфигурацию, имеют состоящую из нескольких слоев структуру, в которой потоки битов слоев с более низкой скоростью передачи данных в битах содержатся в слоях с более высокой скоростью передачи данных в битах: в соответствии с изображением на фиг.3. Обычно дополнительную информацию кодируют первой, и затем кодируют остающуюся информацию, чтобы сформировать потоки битов. Но в данном изобретении, в соответствии с изображением на фиг.3, дополнительную информацию для каждого слоя выделения сигнала из шумов кодируют отдельно. Также несмотря на то, что все квантованные данные последовательно кодируют в блоках выборок обычным образом, в данном изобретении квантованные данные представляют двоичными данными и кодируют от последовательности самых старших разрядов двоичных данных для формирования потоков битов в числе назначенных битов.

Далее следует описание работы устройства кодирования. Входные аудиосигналы кодируют и формируют в виде потоков битов. Для этого входные сигналы преобразуют в сигналы частотной области посредством МДСП (модифицированное дискретное косинус-преобразование) в узле временного/частотного отображения 200. Психоакустический узел 210 соединяет частотные сигналы соответствующими поддиапазонами, чтобы получить порог маскировки.

Узел квантования 220 выполняет скалярное квантование, в результате чего величина шума квантования каждой полосы частот масштабного коэффициента меньше порога маскировки, который слышен, но не воспринимается среди назначенных битов. При выполнении квантования с соблюдением этих условий генерируют масштабные коэффициенты для соответствующих полос частот масштабного коэффициента и квантованные частотные значения.

В общем, с точки зрения психоакустики человека близкие частотные составляющие можно легко воспринимать на более низкой частоте. Но при повышении частоты интервал воспринимаемых частот становится шире. Ширина полос масштабного коэффициента увеличивается с повышением полос частот. Но для содействия кодированию полосы частот масштабного коэффициента, ширина полосы которых не является постоянной, для кодирования не используют, а вместо них используют полосы частот кодирования, ширина полосы которых является постоянной. Полосы частот кодирования включают в себя 32 квантованных значения частотного коэффициента.

1. Кодирование масштабных коэффициентов Для сжатия масштабных коэффициентов применяют способ арифметического кодирования. Для этого, во-первых, выводят максимальный масштабный коэффициент. Затем получают разницы между соответствующими масштабными коэффициентами и максимальным масштабным коэффициентом, и затем эти разницы подвергают арифметическому кодированию. Для арифметического кодирования разниц между масштабными коэффициентами используют четыре модели. Эти четыре модели показаны в таблицах 5.1-5.4. Информацию для этих моделей запоминают в модели масштабного коэффициента.

2. Кодирование индекса модели арифметического кодирования Каждая полоса частот кодирования содержит 32 частотных составляющих. Арифметически кодируют 32 квантованных частотных коэффициента. Затем определяют модель для арифметического кодирования для каждой полосы частот кодирования и эту информацию запоминают в индексе модели арифметического кодирования (ArModel). Для сжатия ArModel применяют способ арифметического кодирования. Для этого выводят минимальный индекс ArModel (min_ArModel). Затем получают разницы между соответствующими индексами ArModel и минимальным индексом ArModel, и затем эти разницы подвергают арифметическому кодированию. В данном случае используют четыре модели арифметического кодирования. Эти четыре модели даны в таблицах 5.5-5.8. Информацию для модели, используемой в арифметическом кодировании, запоминают в ArModel_model.

1.3 Секционированное по двоичным разрядам кодирование квантованных частотных составляющих В общем значимость самого старшего разряда намного превышает значимость самого младшего разряда. Но согласно обычному способу кодирование выполняют независимо от значимости. То есть, если используют только некоторые потоки битов из числа ведущих потоков битов среди всех потоков битов, то информацию, менее важную, чем информация, включенная в неиспользуемых отстающих потоках битов, в значительной степени включают в ведущие потоки битов.

По этой причине в данном изобретении квантованные сигналы соответствующих полос частот кодируют последовательно от самых старших разрядов до самых младших разрядов. Другими словами, соответствующие квантованные сигналы представляют двоичным обозначением, а квантованные значения соответствующих частотных составляющих последовательно обрабатывают в блоках битов от низкочастотных составляющих до высокочастотных составляющих. Во-первых, выводят самые старшие разряды соответствующих частотных составляющих, и затем следующие более значимые биты последовательно кодируют по одному биту до самых младших разрядов. Таким образом, более важную информацию кодируют первой, в результате чего потоки битов формируют сначала.

Значения знака квантованных значений запоминают отдельно, и их абсолютные значения берут для выведения данных, представленных в качестве положительных значений. Квантованные частотные данные секционируют в блоки битов и затем последовательно располагают от самых старших разрядов до самых младших разрядов. Секционированные по двоичным разрядам данные восстанавливают четырехмерными векторами. Теперь предположим, что 8 квантованных значений, каждое из которых имеет 4 бита, представлены двоичным обозначением следующим образом: Обычно 1001 низкочастотной составляющей кодируют первым, и затем последовательно кодируют 1000, 0101, 0010 (т.е. горизонтально для каждой частотной составляющей). Но согласно данному изобретению выводят 1, последовательности самых старших разрядов, состоящие из самых старших разрядов низкочастотной составляющей, и 0, 1, 0, 0, ... самые старшие разряды других частотных составляющих, и затем их обрабатывают последовательно путем соединения несколькими битами.

Например, в случае кодирования в блоках по 4 бита: кодируют 1010 и затем кодируют 0000. Если кодирование самых старших разрядов завершено, то получают следующие более значимые последовательности битов и затем их кодируют в порядке 0001, 000, ... до самых младших разрядов.

Соответствующие четырехмерные векторы, соединенные в блоки из четырех битов, подразделяют на два подвектора согласно их состоянию. Два подвектора кодируют эффективным не имеющим потери кодированием, таким как арифметическое кодирование. В этих целях определяют модель для применения в арифметическом кодировании для каждой полосы частот кодирования. Эту информацию запоминают в ArModel. Соответствующие модели арифметического кодирования состоят из нескольких моделей более низкого порядка. Подвекторы кодируют с помощью одной из моделей более низкого порядка. Модели более низкого порядка классифицируют в соответствии с размерами кодируемого подвектора, значимостью вектора или состояниями кодирования соответствующих выборок. Значимость вектора определяется битовым положением кодируемого вектора. Другими словами, значимость вектора изменяется в зависимости от следующего: предназначена ли секционированная по двоичным разрядам информация для самых старших разрядов, следующих самых старших разрядов или для самых младших разрядов. Самые старшие разряды имеют наибольшую значимость, и самые младшие разряды имеют наименьшую значимость. Значения состояния кодирования соответствующих выборок обновляют по мере того, как кодирование вектора идет от самых старших разрядов к самым младшим разрядам. Вначале значение состояния кодирования устанавливают на ноль. Затем, когда встречается ненулевое значение бита, значение состояния кодирования становится 1.

1.4 Кодирование бита знака В основном кодирование бита знака выполняют последовательно от последовательности самых старших разрядов до последовательности самых младших разрядов; при этом кодирование данных частотной составляющей, бит знака которой кодируют, резервируют и сначала выполняют кодирование тех данных, бит знака которых не кодирован. После того как биты знака всех частотных составляющих будут кодированы таким образом, выполняют кодирование резервированных данных частотной составляющей в порядке более значимых последовательностей битов.

Это обстоятельство описывается более подробно ниже. Вновь обращаясь к приведенному выше примеру: обе последовательности самых старших разрядов "1010, 0000" кодируют, поскольку их биты знака ранее не кодированы, то есть резервировать кодирование не нужно. Затем кодируют следующие более значимые последовательности битов "0001, 0000". В данном случае для 0001, первый 0 и третий 0 не кодируют, т.к. биты знака уже кодированы в самых старших разрядах; и затем кодируют второй и четвертый биты 0 и 1. В данном случае, поскольку 1 среди более значимых битов нет, то кодируют бит знака для частотной составляющей четвертого бита 1. Для 0000, поскольку среди более значимых битов кодированных битов знака нет, то кодируют все эти четыре бита. Таким образом биты знака кодируют в самые младшие разряды, и затем остающуюся некодированную информацию последовательно кодируют из более значимых битов.

1.5 Формирование масштабируемых потоков битов Далее следует описание структуры потоков битов, формируемых согласно данному изобретению. При представлении соответствующих значений частотной составляющей в двоичные цифры самые старшие разряды сначала кодируют в основном слое; следующие более значимые биты затем кодируют в следующем слое выделения сигнала из шумов, а самые младшие разряды, наконец, кодируют в верхнем слое. Другими словами, в основном слое кодируют только контур всех частотных составляющих. Затем с увеличением скорости передачи данных в битах можно выразить более подробную информацию. Поскольку значения данных более подробной информации кодируют согласно увеличивающимся скоростям передачи данных в битах, т.е. слои выделения сигнала из шумов, то можно улучшить качество звука.

Далее следует описание способа формирования масштабируемых потоков битов с помощью таковых представленных данных. Во-первых, формируют потоки битов основного слоя. Затем кодируют дополнительную информацию, используемую для этого основного слоя. Дополнительная информация включает в себя информацию масштабного коэффициента для полос частот масштабного коэффициента и индексы модели арифметического кодирования для каждой полосы частот кодирования. Если кодирование дополнительной информации завершено, то информацию для квантованных значений последовательно кодируют от самых старших разрядов до самых младших разрядов и от низкочастотных составляющих до высокочастотных составляющих. Если назначенные биты определенной полосы частот меньше, чем назначенные биты кодируемой в данное время полосы частот, то кодирование не производят. Когда назначенные биты данной полосы частот равны назначенным битам кодируемой в данное время полосы частот, то кодирование производят. Другими словами, кодирование выполняют в заданном пределе полосы частот.

Далее следует описание обоснования предела полосы частот.

Если в кодирующих сигналах соответствующих слоев выделения сигнала из шумов предела полосы частот не имеется, то кодирование выполняют от самых старших разрядов независимо от полос частот. Тогда может генерироваться звук, неприемлемый для слуха, поскольку сигналы включаются и выключаются при восстановлении сигналов слоев, имеющих низкие скорости передачи данных в битах. То есть целесообразно должным образом ограничить полосы частот согласно скоростям передач