Способ и устройство иерархического кодирования, декодирования аудио
Иллюстрации
Показать всеИзобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности иерархического кодирования/декодирования аудио. Способ иерархического кодирования аудио включает разделение коэффициентов частотной области аудио сигнала после модифицированного дискретного косинусного преобразования (МДКП) на множество поддиапазонов кодирования, квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования; распределение битов в каждый поддиапазон кодирования основного уровня, квантование и кодирование коэффициентов частотной области основного уровня, чтобы получить закодированные биты коэффициентов частотной области основного уровня; вычисление значения огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня; распределение битов в каждый поддиапазон кодирования расширенного уровня, квантование и кодирование сигнала кодирования расширенного уровня, чтобы получить закодированные биты сигнала кодирования расширенного уровня; мультиплексирование и упаковку закодированных битов значения огибающей амплитуды каждого поддиапазона кодирования, состоящего из коэффициентов частотной области основного уровня и расширенного уровня, закодированных битов частотных коэффициентов основного уровня и закодированных битов сигнала кодирования расширенного уровня, затем передачу на сторону декодирования. 4 н. и 18 з.п. ф-лы, 12 ил., 9 табл.
Реферат
Предпосылки изобретения
Иерархическое кодирование аудио относится к организации потоков кода аудиокодирования по иерархическому принципу, в основном это разделение на основной уровень и несколько расширенных уровней. При отсутствии потоков кода высших уровней (таких, как расширенный уровень) кодирования декодер может декодировать только потоки кода нижнего уровня (такого, как основной уровень), а чем больше декодированных уровней, тем выше качество звука.
Технология иерархического кодирования имеет весьма значительное прикладное значение для сетей связи. С одной стороны, передача данных может быть полностью совместима разными каналами, а коэффициент потери пакетов каждого канала может быть разным, в этом случае для данных требуется иерархическая обработка, при которой важная часть данных передается на стабильном канале с относительно низким коэффициентом потери пакетов, тогда как менее важная часть данных передается на нестабильном канале с относительно высоким коэффициентом потери пакетов, тем самым гарантируется, что, когда пакеты теряются на нестабильном канале, происходит лишь относительное падение качества звука, а не полный сбой декодирования блока данных. С другой стороны, ширина каналов определенных сетей связи (таких, как Интернет) не является стабильной, и ширина каналов у различных пользователей различна, так что требования пользователей с различной шириной каналов не могут быть одновременно удовлетворены при помощи использования фиксированной кодовой скорости, тогда как иерархическая схема кодирования может позволить разным пользователям получать удовольствие оптимального качества звука при имеющейся у них ширине канала.
В обычной схеме иерархического кодирования аудио, например стандарте G.729.1 и G.VBR Международного союза телекоммуникаций ITU, основной уровень использует кодирование аудио, тогда как расширенный уровень применяет кодирование временной области или области преобразования. Схема кодирования основного уровня не зависит от схемы кодирования расширенного уровня, что приводит к низкой эффективности кодирования, а также влияет на качество кодирования музыкального сигнала в условиях передачи средней/низкой кодовой скорости. В других иерархических схемах, например схеме кодирования ВSAC (разрядно-секционный арифметический код) изменяющейся (или сократимой) кодовой скорости, применяемой стандартом MPEG4 (4 Экспертная группа по движущимся изображениям), распределение битов и иерархический принцип работы используются только на основании размера самого элемента данных, без рассмотрения характеристик распределения остаточного восприятия всего сигнала как такового, так что имеющаяся информация основного уровня не может использоваться, чтобы помогать выполнять кодирование расширенному уровню, что приводит к относительно низкой эффективности кодирования.
Суть изобретения
Техническая задача, которую предстоит решить в данном изобретении, состоит в том, чтобы преодолеть недостаток прототипов путем предоставления способа иерархического кодирования, декодирования аудио и устройства с высокой эффективностью.
Чтобы решить вышеуказанную техническую задачу, настоящее изобретение предоставляет способ иерархического кодирования аудио, содержащий следующие этапы:
разделение коэффициентов частотной области аудиосигнала, для которого было осуществлено модифицированное дискретное косинусное преобразование (МДКП), на коэффициенты частотной области основного уровня и коэффициенты частотной области расширенного уровня, разделение коэффициентов частотной области основного уровня и коэффициентов частотной области расширенного уровня на множество поддиапазонов кодирования, и квантование и кодирование значений огибающей амплитуды поддиапазонов кодирования;
распределение битов в каждый поддиапазон кодирования основного уровня согласно значению огибающей амплитуды каждого поддиапазона кодирования основного уровня, и затем квантование и кодирование коэффициентов частотной области основного уровня, чтобы получить закодированные биты коэффициентов частотной области основного уровня;
вычисление значения огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня согласно значению огибающей амплитуды и числу распределения битов каждого поддиапазона кодирования основного уровня;
распределение битов в каждый поддиапазон кодирования расширенного уровня согласно сигналу кодирования расширенного уровня, состоящему из остаточного сигнала основного уровня и коэффициентов частотной области расширенного уровня, и значению огибающей амплитуды каждого поддиапазона кодирования, состоящего из сигнала кодирования расширенного уровня, и затем квантование и кодирование сигнала кодирования расширенного уровня, чтобы получить закодированные биты сигнала кодирования расширенного уровня; и
мультиплексирование и упаковка закодированных битов значения огибающей амплитуды каждого поддиапазона кодирования, состоящего из коэффициентов частотной области основного уровня и коэффициентов частотной области расширенного уровня, закодированных битов коэффициентов частотной области основного уровня и закодированных битов сигнала кодирования расширенного уровня, и затем передача на сторону декодирования.
Кроме того, на указанном этапе разделения коэффициентов частотной области аудиосигнала, для которого было произведено модифицированное дискретное косинусное преобразование (МДКП), на коэффициенты частотной области основного уровня и коэффициенты частотной области расширенного уровня, разделения коэффициентов частотной области основного уровня и коэффициентов частотной области расширенного уровня на множество поддиапазонов кодирования,
разделение коэффициентов частотной области после МДКП на множество равномерных поддиапазонов, или разделение на множество неравномерных поддиапазонов кодирования согласно характеристикам, воспринимаемым на слух; группировка низкочастотных поддиапазонов кодирования как поддиапазонов кодирования основного уровня и группировка высокочастотных поддиапазонов кодирования как поддиапазонов кодирования расширенного уровня.
Кроме того, распределение битов с изменяющимися длинами этапов осуществляется для каждого поддиапазона кодирования согласно значению огибающей амплитуды поддиапазонов кодирования;
во время процесса распределения битов длина этапа распределения битов составляет 1 бит, а длина этапа уменьшения важности после распределения бита составляет 1 для поддиапазона кодирования, чье число распределения битов равно 0, длина этапа распределения битов для распределения битов дополнительно составляет 0,5, а длина этапа уменьшения важности после распределения бита составляет 0,5 для поддиапазона кодирования, чье число распределения битов больше 0 и меньше порога классификации, и длина этапа распределения битов для распределения битов дополнительно составляет 1 бит, а длина этапа уменьшения важности после распределения бита составляет 1 для поддиапазона кодирования, чье число распределения битов больше или равняется порогу классификации;
число распределения битов - это число битов, распределенных в один коэффициент частотной области в одном поддиапазоне кодирования.
Кроме того, на указанном этапе квантования и кодирования коэффициентов частотной области основного уровня и сигнала кодирования расширенного уровня,
квантование и кодирование подлежащих квантованию векторов поддиапазона кодирования, чье число распределения битов меньше, чем порог классификации, используя векторное квантование пирамидальной решетки, и квантование и кодирование подлежащих квантованию векторов поддиапазона кодирования, чье число распределения битов больше, чем порог классификации, используя векторное квантование сферической решетки;
число распределения битов - это число битов, распределенных в один коэффициент частотной области в одном поддиапазоне кодирования.
Кроме того, на указанном этапе расчета значения огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня согласно значению огибающей амплитуды и числу распределения битов каждого поддиапазона кодирования основного уровня,
значение огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня рассчитывается следующим образом:
обратным квантованием квантованного значения коэффициента частотной области основного уровня и применением расчета разности относительно коэффициентов частотной области основного уровня, чтобы получить остаточный сигнал основного уровня;
разделением остаточного сигнала основного уровня на поддиапазоны кодирования тем же способом, что и для коэффициента частотной области основного уровня, и вычислением значения огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня согласно значению огибающей амплитуды и числу распределения битов каждого поддиапазона кодирования основного уровня.
Кроме того, этап вычисления значения огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня содержит: вычисление показателя степени квантования огибающей амплитуды каждого поддиапазона кодирования основного уровня и осуществление расчета разности относительно значения изменения показателя степени квантования соответствующего поддиапазона кодирования, чтобы получить показатель степени квантования огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня;
где значение изменения показателя степени квантования каждого поддиапазона кодирования больше или равно 0, и не уменьшается, когда число распределения битов соответствующего поддиапазона кодирования основного уровня возрастает; и
когда число распределения битов поддиапазона кодирования основного уровня равно 0, значение изменения показателя степени квантования равно 0, и когда число распределения битов поддиапазона кодирования основного уровня является определенным максимальным числом распределения битов, значение огибающей амплитуды остаточного сигнала основного уровня в поддиапазоне кодирования равно 0.
Кроме того, значение изменения показателя степени квантования поддиапазона кодирования получается согласно числу распределения битов основного уровня, и когда число распределения битов поддиапазона кодирования основного уровня равно, соответственно, 0, 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7 или 8, значение изменения показателя степени квантования, соответствующее поддиапазону кодирования, равно, соответственно, 0, 1,2, 3, 4, 5, 5, 6, 7, 7, 9, 10 или 12;
кроме того, указанный этап получения закодированных битов коэффициентов частотной области основного уровня содержит: вычисление показателя степени квантования огибающей амплитуды каждого поддиапазона кодирования основного уровня и распределение битов в каждый поддиапазон кодирования основного уровня; и
нормализация коэффициента частотной области каждого поддиапазона кодирования с использованием значения огибающей амплитуды квантования каждого поддиапазона кодирования основного уровня, восстановленной согласно показателю степени квантования огибающей амплитуды каждого поддиапазона кодирования основного уровня, и квантование и кодирование согласно числу распределения битов каждого поддиапазона кодирования основного уровня с использованием векторного квантования пирамидальной решетки и векторного квантования сферической решетки соответственно, чтобы получить закодированные биты коэффициентов частотной области основного уровня;
где указанный этап получения закодированных битов сигнала кодирования расширенного уровня содержит:
составление сигнала кодирования расширенного уровня из остаточного сигнала основного уровня и коэффициентов частотной области расширенного уровня;
распределение битов в каждый поддиапазон кодирования расширенного уровня согласно показателю степени квантования огибающей амплитуды каждого поддиапазона кодирования сигнала кодирования расширенного уровня; и
нормализация сигнала кодирования каждого поддиапазона кодирования с использованием значения огибающей амплитуды квантования каждого поддиапазона кодирования расширенного уровня, восстановленной согласно показателю степени квантования огибающей амплитуды каждого поддиапазона кодирования расширенного уровня, и квантование и кодирование согласно числу распределения битов каждого поддиапазона кодирования расширенного уровня с использованием векторного квантования пирамидальной решетки и векторного квантования сферической решетки соответственно, чтобы получить закодированные биты сигнала кодирования расширенного уровня.
Кроме того, на указанном этапе мультиплексирования и упаковки закодированных битов значения огибающей амплитуды каждого поддиапазона кодирования, составленного из коэффициентов частотной области основного уровня и коэффициентов частотной области расширенного уровня, закодированных битов коэффициентов частотной области основного уровня и закодированных битов сигнала кодирования расширенного уровня, и затем передачи на сторону декодирования
мультиплексирование и упаковка осуществляются в соответствии со следующим форматом потока кода:
запись битов дополнительной информации основного уровня после заголовка кадра потока кода, запись закодированных битов значения огибающей амплитуды поддиапазона кодирования основного уровня в мультиплексор MUX потока битов, и затем запись закодированных битов коэффициентов частотной области основного уровня в MUX; и запись битов дополнительной информации расширенного уровня в MUX, запись закодированных битов значения огибающей амплитуды поддиапазона кодирования коэффициентов частотной области расширенного уровня в MUX, и затем запись закодированных битов сигнала кодирования расширенного уровня в MUX;
биты, чье число соответствует требованиям кодовой скорости, отсылаются на сторону декодирования согласно требуемой кодовой скорости.
Кроме того, закодированные биты сигнала кодирования расширенного уровня записываются в поток кода согласно начальному значению важности каждого поддиапазона кодирования в ниспадающем порядке, и отсылаются на сторону декодирования.
Кроме того, дополнительная информация основного уровня включает биты флажков кодирования Хаффмана огибающей амплитуды поддиапазона кодирования, составленного из коэффициентов МДКП, биты флажков кодирования Хаффмана коэффициентов частотной области основного уровня и биты числа итераций;
дополнительная информация расширенного уровня включает биты флажков кодирования Хаффмана сигнала кодирования расширенного уровня и биты числа итераций.
Кроме того, указанный этап передачи битов, чье число удовлетворяет условиям кодовой скорости, на сторону декодирования содержит:
кодирование основного уровня и расширенного уровня в диапазоне всей частотной полосы, в которой необходимо кодирование, согласно числу битов для определенной максимальной скорости кодирования, так что максимальная скорость кодирования достигается в диапазоне частотной полосы кодирования;
после закодированных битов основного уровня запись закодированных битов сигнала кодирования расширенного уровня в мультиплексор потока битов, согласно начальному значению важности каждого поддиапазона кодирования в убывающем порядке; и
передачу битов, число которых удовлетворяет требованиям кодовой скорости, на сторону декодирования, на основе принципа, что закодированные биты поддиапазона кодирования с меньшим начальным значением важности отклоняются в первую очередь;
где кодовая скорость, соответствующая основному уровню, обозначается как уровень L0, каждая кодовая скорость, соответствующая расширенному уровню, обозначается как уровень L1_1, уровень L1_2, вплоть до уровня L1_K согласно числу отклоненных битов расширенного уровня, где кодовая скорость уровня L1_K является точно максимальной скоростью кодирования.
Кроме того, диапазон частотной полосы кодирования составляет 0-13,6 кГц, и когда максимальная скорость кодирования составляет 64 кбит/с, биты, чье число удовлетворяет условиям кодовой скорости, отсылаются на сторону декодирования способом иерархии скорости кодирования, как ниже:
группирование коэффициентов МДКП частотной области в 0-6,4 кГц из диапазона 0-13,6 кГц частотной полосы кодирования в основной уровень, максимальная кодовая скорость, соответствующая основному уровню, составляет 32 кбит/с и обозначается как уровень L0; диапазон частотной полосы кодирования расширенного уровня составляет 0-13,6 кГц, и его максимальная кодовая скорость составляет 64 кбит/с и обозначается как уровень L1_5;
до передачи на сторону декодирования кодовая скорость разделяется, согласно числу отклоненных битов, на уровень L1_1, соответствующий 36 кбит/с, уровень L1_2, соответствующий 40 кбит/с, уровень L1_3, соответствующий 48 кбит/с, уровень L1_4, соответствующий 56 кбит/с, и уровень L1_5, соответствующий 64 кбит/с.
Кроме того, после указанного этапа разделения коэффициентов частотной области аудиосигнала, для которого было выполнено модифицированное дискретное косинусное преобразование (МДКП), на коэффициенты частотной области основного уровня и коэффициенты частотной области расширенного уровня, способ также включает: разделение коэффициентов частотной области расширенного уровня, в возрастающем порядке частот, на М частей, которые являются коэффициентами частотной области расширенного уровня от расширенного уровня 1 до расширенного уровня М соответственно, где частота для коэффициента частотной области в расширенном уровне 1 является самой низкой, а частота для коэффициента частотной области в расширенном уровне М - наивысшей;
после указанного этапа квантования и кодирования коэффициентов частотной области основного уровня способ также включает: обратное квантование квантованного значения коэффициента частотной области основного уровня, и осуществление расчета разности относительно коэффициента частотной области основного уровня, чтобы получить остаточный сигнал основного уровня; на указанном этапе вычисления значения огибающей амплитуды остаточного сигнала каждого поддиапазона кодирования основного уровня согласно значению огибающей амплитуды и числу распределения битов каждого поддиапазона кодирования основного уровня, разделение остаточного сигнала основного уровня на поддиапазоны кодирования тем же способом, что и для основного уровня, и вычисление значения огибающей амплитуды остаточного сигнала каждого поддиапазона кодирования основного уровня согласно значению огибающей амплитуды и числу распределения битов каждого поддиапазона кодирования основного уровня;
на указанном этапе распределения битов в каждый поддиапазон кодирования расширенного уровня согласно сигналу кодирования расширенного уровня, составленному из остаточного сигнала основного уровня и коэффициентов частотной области расширенного уровня и значения огибающей амплитуды каждого поддиапазона кодирования, составленного из сигнала кодирования расширенного уровня, и затем квантования и кодирования сигнала кодирования расширенного уровня, чтобы получить закодированные биты сигнала кодирования расширенного уровня,
составление сигнала кодирования расширенного уровня 1 из остаточного сигнала основного уровня и коэффициента частотной области расширенного уровня 1, вычисление показателя степени квантования огибающей амплитуды каждого поддиапазона кодирования согласно сигналу кодирования расширенного уровня 1, и распределение битов в каждый поддиапазон кодирования расширенного уровня 1; квантование и кодирование сигнала кодирования расширенного уровня 1 согласно числу распределения битов каждого поддиапазона кодирования расширенного уровня 1;
обратное квантование квантованного значения сигнала кодирования расширенного уровня i, и осуществление расчета разности относительно сигнала кодирования расширенного уровня i, чтобы получить остаточный сигнал расширенного уровня i; разделение остаточного сигнала расширенного уровня i на поддиапазоны кодирования тем же способом, что и для расширенного уровня i, и вычисление значения огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала расширенного уровня i согласно значению огибающей амплитуды и числу распределения битов каждого поддиапазона кодирования расширенного уровня i;
составление сигнала кодирования расширенного уровня i+1 из остаточного сигнала расширенного уровня i и коэффициента частотной области расширенного уровня i+1, и распределение битов в каждый поддиапазон кодирования расширенного уровня i+1 согласно показателю степени квантования огибающей амплитуды каждого поддиапазона кодирования сигнала кодирования расширенного уровня i+1; и
нормализация, векторное квантование и кодирование сигнала кодирования каждого поддиапазона кодирования расширенного уровня i+1 с использованием значения огибающей амплитуды квантования и числа закодированных битов каждого поддиапазона кодирования расширенного уровня i+1, восстановленных согласно показателю степени квантования огибающей амплитуды каждого поддиапазона кодирования расширенного уровня i+1, чтобы получить закодированные биты сигнала кодирования расширенного уровня i+1;
указанное i=1,….N-1, и N являются положительными целыми числами, большими 2.
Кроме того, мультиплексирование и упаковка осуществляются согласно следующему формату потока кода:
после закодированных битов основного уровня запись битов расширенного уровня с меньшим порядковым номером в мультиплексор MUX потока битов, а затем запись битов расширенного уровня с большим порядковым номером в мультиплексор MUX потока битов, т.е. запись в MUX сначала битов расширенного уровня i, а затем запись битов расширенного уровня i+1; в идентичном расширенном уровне запись битов дополнительной информации расширенного уровня в MUX, запись закодированных битов значения огибающей амплитуды поддиапазона кодирования коэффициентов частотной области расширенного уровня в MUX сначала, а затем запись закодированных битов сигнала кодирования расширенного уровня в MUX;
передача битов, чье число удовлетворяет требованиям кодовой скорости, на сторону декодирования согласно требуемой кодовой скорости.
Кроме того, биты, чье число удовлетворяет требованиям кодовой скорости, передаются на сторону декодирования иерархическим способом скорости кодирования, как ниже:
кодирование основного уровня и расширенных уровней 1-М в диапазоне всей частотной полосы, в которой необходимо кодирование, согласно числу битов для определенной максимальной скорости кодирования, так что максимальная скорость кодирования достигается в диапазоне частотной полосы кодирования;
после закодированных битов основного уровня предпочтительно запись битов расширенного уровня с меньшим порядковым номером в мультиплексор потока битов, а затем предпочтительно запись закодированных битов поддиапазона кодирования с большим начальным значением важности в мультиплексор потока битов в идентичном расширенном уровне;
для каждого расширенного уровня отклонение ненужных битов в задней части мультиплексора потока битов согласно расчетным требованиям кодовой скорости в каждом уровне, т.е. передача битов, чье число удовлетворяет требованиям кодовой скорости, на сторону декодирования согласно тому принципу, что закодированные биты поддиапазона кодирования с меньшим начальным значением важности отклоняются первыми;
обозначение кодовой скорости, соответствующей основному уровню, как уровень L0, обозначение максимальной кодовой скорости, соответствующей каждому расширенному уровню, как уровень L1_K1, уровень L2_K2, вплоть до уровня LM_KM, соответственно, согласно определенным требованиям для кодовых скоростей передачи, где кодовая скорость уровня LM_KM является точно максимальной кодовой скоростью, требуемой кодировщиком;
дальнейшее разделение уровня кодовой скорости между расширенным уровнем i и расширенным уровнем i+1 согласно числу отклоненных битов, т.е. подразделение на уровень Li+1_1, уровень Li+1_2, вплоть до уровня Li+1_Ki+1 между уровнем Li_Ki и уровнем Li+1_Ki+1 согласно числу отклоненных битов.
Кроме того, диапазон частотной полосы кодирования составляет 0-20 кГц, и когда максимальная скорость кодирования составляет 96 кбит/с, биты, чье число удовлетворяет требованиям кодовой скорости, отправляются на сторону декодирования иерархическим способом скорости кодирования, как ниже:
группирование МДКП коэффициентов частотной области в 0-6,4 кГц из диапазона 0-20 кГц частотной полосы кодирования в основной уровень, максимальная кодовая скорость, соответствующая основному уровню, составляет 32 кбит/с и обозначается как уровень L0;
диапазон частотной полосы кодирования расширенного уровня 1 составляет 0-13,6 кГц, и его максимальная кодовая скорость составляет 64 кбит/с и обозначается как уровень L1_5; диапазон частотной полосы кодирования расширенного уровня 2 составляет 0-20 кГц, и его максимальная кодовая скорость составляет 96 кбит/с и обозначается как уровень L2_2;
перед отправкой на сторону декодирования также разделение уровня L1_5 и уровня L2_2 на уровень L2_1, соответствующий 80 кбит/с, и уровень L2_2, соответствующий 96 кбит/с, согласно числу отклоненных битов.
Настоящее изобретение также предоставляет иерархический способ декодирования аудио, включающий следующие этапы:
демультиплексирование потока битов, посланного стороной кодирования, и декодирование закодированных битов огибающей амплитуды коэффициентов частотной области основного уровня, чтобы получить величину огибающей амплитуды каждого поддиапазона кодирования основного уровня;
распределение битов в каждый поддиапазон основного уровня согласно значению огибающей амплитуды каждого поддиапазона кодирования основного уровня, и вычисление значения огибающей амплитуды остаточного сигнала основного уровня; декодирование закодированных битов огибающей амплитуды коэффициентов частотной области расширенного уровня, чтобы получить величину огибающей амплитуды коэффициентов частотной области расширенного уровня; распределение битов в каждый поддиапазон кодирования расширенного уровня согласно значению огибающей амплитуды остаточного сигнала основного уровня и значению огибающей амплитуды коэффициентов частотной области расширенного уровня; и
соответственно декодирование закодированных битов коэффициентов частотной области основного уровня и закодированных битов сигнала кодирования расширенного уровня согласно числу распределения битов основного уровня и числу распределения битов расширенного уровня, чтобы получить коэффициенты частотной области основного уровня и сигнал кодирования расширенного уровня, переустройство сигнала кодирования расширенного уровня согласно порядку частотных полос, и сложение с коэффициентами частотной области основного уровня, чтобы получить коэффициенты частотной области всей полосы частот, выполнение обратного модифицированного дискретного косинусного преобразования (ОМДКП) для коэффициентов частотной области всей полосы частот, чтобы получить выходной аудиосигнал.
Кроме того, способ для вычисления значения огибающей амплитуды остаточного сигнала представляет собой:
этап вычисления значения огибающей амплитуды остаточного сигнала основного уровня включает:
вычисление показателя степени квантования огибающей амплитуды каждого поддиапазона кодирования основного уровня и осуществление расчета разности относительно значения изменения показателя степени квантования соответствующего поддиапазона кодирования, чтобы получить показатель степени квантования огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала основного уровня;
вычисление значения огибающей амплитуды каждого поддиапазона остаточного сигнала расширенного уровня i согласно огибающей амплитуды и числу распределения битов каждого поддиапазона кодирования расширенного уровня i;
значение изменения показателя степени квантования каждого поддиапазона кодирования является большей или равной 0, и неубывающей, когда число распределения битов соответствующего поддиапазона кодирования основного уровня возрастает; и
когда число распределения битов поддиапазона кодирования основного уровня равно 0, значение изменения показателя степени квантования равно 0, и когда число распределения битов поддиапазона кодирования является определенным максимальным числом распределения битов, значение огибающей амплитуды остаточного сигнала основного уровня в поддиапазоне кодирования равно 0.
Кроме того, значение изменения показателя степени квантования поддиапазона кодирования получается согласно числу распределения битов основного уровня, и когда число распределения битов поддиапазона кодирования основного уровня составляет 0, 1, 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 6, 7 или 8 соответственно, значение изменения показателя степени квантования, соответствующее поддиапазону кодирования, составляет 0, 1, 2, 3, 4, 5, 5, 6, 7, 7, 9, 10 или 12 соответственно.
Кроме того, указанный этап получения коэффициентов частотной области основного уровня и сигнала кодирования расширенного уровня включает:
декодирование, обратное квантование и обратная нормализация закодированных битов коэффициентов частотной области основного уровня согласно числу распределения битов, значению огибающей амплитуды квантования и дополнительной информации каждого поддиапазона кодирования основного уровня, чтобы получить коэффициенты частотной области основного уровня; и
декодирование, обратное квантование и обратная нормализация закодированных битов сигнала кодирования расширенного уровня согласно числу распределения битов каждого поддиапазона кодирования расширенного уровня, значению огибающей амплитуды квантования и дополнительной информации сигнала кодирования расширенного уровня, чтобы получить сигнал кодирования расширенного уровня.
Кроме того, на указанном этапе декодирования закодированных битов сигнала кодирования расширенного уровня,
закодированные биты сигнала кодирования расширенного уровня декодируются в следующем порядке:
в различных расширенных уровнях порядок для декодирования различных уровней таков: в первую очередь декодирование закодированных битов каждого поддиапазона кодирования и огибающей амплитуды нижнего расширенного уровня с меньшим порядковым номером расширенного уровня, а затем декодирование закодированных битов каждого поддиапазона кодирования и огибающей амплитуды верхнего расширенного уровня с большим порядковым номером расширенного уровня, число декодированных битов рассчитывается во время декодирования, и декодирование прекращается, когда число декодированных битов удовлетворяет требованиям к общему числу битов;
в идентичном расширенном уровне порядок для декодирования различных поддиапазонов определяется начальным значением важности каждого поддиапазона кодирования, поддиапазон кодирования с большей важностью декодируется предпочтительно, а если присутствуют два поддиапазона кодирования с одинаковой важностью, то предпочтительно декодируется поддиапазон кодирования более низкой частоты, число декодированных битов рассчитывается во время декодирования, и декодирование прекращается, когда число декодированных битов удовлетворяет требованиям к общему числу битов.
Кроме того, когда кодовая скорость, с которой биты отсылаются со стороны кодирования на сторону декодирования, составляет 64 кбит/с, на стороне декодирования для декодирования перехватываются различные количества битов, и скорость декодирования может составлять 36 кбит/с, 40 кбит/с, 48 кбит/с, 56 кбит/с или 64 кбит/с.
Когда кодовая скорость, с которой биты отсылаются со стороны кодирования на сторону декодирования, составляет 96 кбит/с, на стороне декодирования для декодирования перехватываются различные количества битов, и скорость декодирования может составлять 80 кбит/с или 96 кбит/с.
Настоящее изобретение также предоставляет систему иерархического кодирования аудио, содержащую: блок модифицированного дискретного косинусного преобразования (МДКП), блок вычисления огибающей амплитуды, блок квантования и кодирования огибающей амплитуды, блок распределения битов основного уровня, блок векторного квантования и кодирования коэффициентов частотной области основного уровня и мультиплексор потока битов; система также содержит: блок генерирования сигнала кодирования расширенного уровня, блок генерирования огибающей амплитуды остаточного сигнала, блок распределения битов расширенного уровня и блок векторного квантования и кодирования сигнала кодирования расширенного уровня, где:
блок МДКП приспособлен выполнять модифицированное дискретное косинусное преобразование для входящего аудиосигнала, чтобы генерировать коэффициенты частотной области основного уровня и коэффициенты частотной области расширенного уровня;
блок вычисления огибающей амплитуды приспособлен разделять подлежащую кодированию часть коэффициентов частотной области основного уровня и коэффициентов частотной области расширенного уровня на поддиапазон кодирования коэффициентов частотной области основного уровня и поддиапазон кодирования коэффициентов частотной области расширенного уровня, и вычислять величину огибающей амплитуды каждого поддиапазона кодирования;
блок квантования и кодирования огибающей амплитуды приспособлен квантовать и кодировать значения огибающей амплитуды поддиапазона кодирования коэффициентов частотной области основного уровня и поддиапазона кодирования коэффициентов частотной области расширенного уровня, чтобы генерировать показатель степени квантования огибающей амплитуды и закодированные биты огибающей амплитуды каждого поддиапазона кодирования коэффициентов частотной области основного уровня и поддиапазона кодирования коэффициентов частотной области расширенного уровня;
блок распределения битов основного уровня приспособлен распределять биты в основной уровень, чтобы получать число распределения битов каждого поддиапазона кодирования основного уровня;
блок векторного квантования и кодирования коэффициентов частотной области основного уровня приспособлен нормализовать, векторно квантовать и кодировать коэффициенты частотной области каждого поддиапазона кодирования основного уровня, используя величину огибающей амплитуды квантования и число распределения битов каждого поддиапазона кодирования основного уровня, восстановленные согласно показателю степени квантования огибающей амплитуды каждого поддиапазона кодирования основного уровня, чтобы получать закодированные биты коэффициентов частотной области основного уровня;
блок генерирования сигнала кодирования расширенного уровня приспособлен генерировать остаточный сигнал и получать сигнал кодирования расширенного уровня, составленный из остаточного сигнала и коэффициентов частотной области расширенного уровня;
блок генерирования огибающей амплитуды остаточного сигнала приспособлен получать показатель степени квантования огибающей амплитуды каждого поддиапазона кодирования остаточного сигнала согласно показателю степени квантования огибающей амплитуды каждого поддиапазона кодирования основного уровня и числу распределения битов соответствующего поддиапазона кодирования;
блок распределения битов расширенного уровня приспособлен распределять биты в расширенный уровень согласно показателю степени квантования огиба