2621003 - Адаптивное к тональности квантование низкой сложности аудиосигналов

Адаптивное к тональности квантование низкой сложности аудиосигналов

Иллюстрации

Показать все

Изобретение относится к цифровой обработке аудиосигналов, более конкретно к квантованию аудиосигналов. Технический результат – обеспечение улучшенных концепций для адаптивного квантования аудиосигналов. Аудиокодер содержит: устройство формирования кадров, сконфигурированное с возможностью извлекать кадры (F) из аудиосигнала (AS); модуль квантования, сконфигурированный с возможностью отображать спектральные линии (SL_1-32) сигнала спектра (SPS), выведенного из кадра (F) аудиосигнала (AS), в индексы квантования (I₀, I₁), при этом модуль квантования имеет мертвую зону (DZ), в которой входные спектральные линии (SL) отображаются в индекс квантования ноль (I₀); и устройство управления, сконфигурированное с возможностью модифицировать мертвую зону (DZ); при этом устройство управления содержит устройство вычисления тональности, сконфигурированное с возможностью вычислять одно значение (TI_5-32) указания тональности для одной спектральной линии (SL_1-32) или для одной группы спектральных линий (SL_1-32), при этом устройство управления сконфигурировано с возможностью модифицировать мертвую зону (DZ) для упомянутой одной спектральной линии (SL_1-32) или упомянутой одной группы спектральных линий (SL_1-32) в зависимости от соответствующего значения (TI_5-32) указания тональности. 4 н. и 13 з.п. ф-лы, 2 ил.

Реферат

Изобретение относится к цифровой обработке аудиосигналов. Более конкретно изобретение относится к квантованию аудиосигналов.

В кодировании с преобразованием с очень низким битрейтом (частотой следования битов), количество бит в расчете на кадр, в общем, не является достаточным, чтобы избегать артефактов в декодированном сигнале. Музыкальный шум, в частности, может появляться в стационарных музыкальных или шумовых спектрах вследствие линий (интервалов) преобразования, которые "включаются и выключаются", то есть квантуются в нуль или не квантуются в нуль, на некоторой частоте от одного кадра к другому. Такой подход кодирования не только придает области декодированного сигнала более тональный характер, чем имеет исходный сигнал (отсюда признак музыкальный шум), он также не обеспечивает заметного преимущества над тем, чтобы не кодировать упомянутую спектральную область вовсе, и вместо этого применять способ замены интервалов, как, например, алгоритмы заполнения шумом в системах кодирования TCX или FD, используемых в xHE-AAC [4]. Фактически, явное, но недостаточное кодирование областей, подверженных музыкальному шуму кодирования, требует биты на этапе энтропийного кодирования кодера с преобразованием, которые с точки зрения звука более хорошо расходуются в других спектральных областях, особенно на низких частотах, где слуховая система человека является чувствительной.

Один способ уменьшения появления музыкального шума в кодировании аудио с низким битрейтом состоит в том, чтобы модифицировать поведение модуля квантования, отображающего входные спектральные линии в индексы квантования, так что он адаптируется к мгновенной характеристике входного сигнала и потреблению битов квантованного спектра. Более точно, мертвая зона, используемая в течение квантования, изменяется адаптивно к сигналу. Были опубликованы несколько подходов [5, 6, и ссылки в них]. В [5] адаптация модуля квантования выполняется над всем спектром, подлежащим кодированию. Адаптированный модуль квантования, поэтому, ведет себя одинаково для всех спектральных интервалов заданного кадра. Более того, в случае квантования с оптимальной мертвой зоной z_opt, 2 бита сторонней информации должны передаваться в декодер, представляя битрейт и штраф обратной совместимости. В [6] модуль квантования адаптируется на основе в расчете на частотный диапазон, но в расчете на диапазон выполняются две попытки квантования, и только более хорошая попытка (согласно некоторому решению) используется для передачи. Это является сложным.

Цель настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для обработки аудиосигналов. Более конкретно, цель настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для адаптивного квантования аудиосигналов. Цель настоящего изобретения достигается посредством аудиокодера согласно пункту 1 формулы изобретения, посредством системы согласно пункту 15 формулы изобретения, посредством способа согласно пункту 16 формулы изобретения и посредством компьютерной программы согласно пункту 17 формулы изобретения.

В одном аспекте изобретение обеспечивает аудиокодер для кодирования аудиосигнала, чтобы вырабатывать из него кодированный сигнал, при этом аудиокодер содержит:

устройство формирования кадров, сконфигурированное с возможностью извлекать кадры из аудиосигнала;

модуль квантования, сконфигурированный с возможностью отображать спектральные линии сигнала спектра, выведенного из кадра аудиосигнала, в индексы квантования; при этом модуль квантования имеет мертвую зону, в которой спектральные линии отображаются в индекс квантования ноль; и

устройство управления, сконфигурированное с возможностью модифицировать мертвую зону;

при этом устройство управления содержит устройство вычисления тональности, сконфигурированное с возможностью вычислять по меньшей мере одно значение указания тональности для по меньшей мере одной спектральной линии или для по меньшей мере одной группы спектральных линий,

при этом устройство управления сконфигурировано с возможностью модифицировать мертвую зону для упомянутой по меньшей мере одной спектральной линии или упомянутой по меньшей мере одной группы спектральных линий в зависимости от соответствующего значения указания тональности.

Устройство формирования кадров может быть сконфигурировано с возможностью извлекать кадры из аудиосигнала посредством применения оконной функции к аудиосигналу. В обработке сигналов оконная функция (также известная как функция аподизации или коническая функция) является математической функцией, которая принимает нулевые значения вне некоторого выбранного интервала. Посредством применения оконной функции к сигналу, сигнал может разбиваться на короткие сегменты, которые обычно называются кадрами.

Квантование, в цифровой обработке аудиосигналов, является процессом отображения большого набора входных значений в (перечислимый) меньший набор - как, например, округлением значений с некоторой единицей точности. Устройство или алгоритмическая функция, которая выполняет квантование, называется модулем квантования.

Согласно изобретению сигнал спектра вычисляется для кадров аудиосигнала. Сигнал спектра может содержать спектр каждого из кадров аудиосигнала, который является сигналом временной области, при этом каждый спектр является представлением одного из кадров в частотной области. Частотный спектр может генерироваться посредством математического преобразования сигнала, и результирующие значения обычно представляются как амплитуда по отношению к частоте.

Мертвая зона является зоной, используемой в течение квантования, при этом спектральные линии (частотные интервалы) или группы спектральных линий (частотные диапазоны) отображаются в нуль. Мертвая зона имеет нижний предел, который обычно находится на амплитуде нуля, и верхний предел, который может изменяться для разных спектральных линий или групп спектральных линий.

Согласно изобретению мертвая зона может модифицироваться посредством устройства управления. Устройство управления содержит устройство вычисления тональности, которое сконфигурировано с возможностью вычислять по меньшей мере одно значение указания тональности для по меньшей мере одной спектральной линии или для по меньшей мере одной группы спектральных линий.

Термин "тональность" указывает на тональный характер сигнала спектра. В общем, можно сказать, что тональность является высокой в случае, когда спектр содержит преимущественно периодические компоненты, что означает, что спектр кадра содержит доминирующие пики. Противоположностью к тональному характеру является шумовой характер. В последнем случае спектр кадра является более плоским.

Дополнительно, устройство управления сконфигурировано с возможностью модифицировать мертвую зону для упомянутой по меньшей мере одной спектральной линии или упомянутой по меньшей мере одной группы спектральных линий в зависимости от соответствующего значения указания тональности.

Настоящее изобретение раскрывает схему квантования с адаптивной к сигналу мертвой зоной, которая

- не требует какой-либо сторонней информации, что обеспечивает возможность ее использования в существующих кодеках мультимедиа,

- принимает решение до квантования в отношении того, какую мертвую зону использовать в расчете на интервал или диапазон, при сохранении сложности,

- может определять мертвую зону в расчете на интервал или в расчете на диапазон на основе частоты диапазона и/или тональности сигнала.

Изобретение может применяться в существующей инфраструктуре кодирования, так как изменяется только модуль квантования сигналов в кодере; соответствующий декодер будет все еще способным читать (неизмененный) битовый поток, вырабатываемый из кодированного сигнала, и декодировать выходной сигнал. В отличие от [6] и ссылок в нем, мертвая зона для каждой группы спектральных линий или для каждой спектральной линии выбирается до квантования, таким образом, является необходимой только одна операция квантования в расчете на группу или спектральную линию. Наконец, решение модуля квантования не ограничено выбором между двумя возможными значениями мертвой зоны, но полным диапазоном значений. Решение детально описывается ниже. Схема адаптивного к тональности квантования, кратко описанная выше, может осуществляться в тракте возбуждения с кодированным преобразованием (TCX) кодера LD-USAC, вариант с низкой задержкой стандарта xHE-AAC [4].

Согласно одному предпочтительному варианту осуществления изобретения устройство управления сконфигурировано с возможностью модифицировать мертвую зону таким способом, что мертвая зона на одной из спектральных линий больше, чем мертвая зона на одной из спектральных линий, имеющих более большую тональность, или таким способом, что мертвая зона на одной из групп спектральных линий больше, чем мертвая зона на одной из групп спектральных линий, имеющих более большую тональность. Посредством этих свойств нетональные спектральные области имеют тенденцию квантоваться в нуль, что означает, что количество данных может уменьшаться.

Согласно одному предпочтительному варианту осуществления изобретения устройство управления содержит устройство вычисления спектра мощности, сконфигурированное с возможностью вычислять спектр мощности кадра аудиосигнала, при этом спектр мощности содержит значения мощности для спектральных линий или групп спектральных линий, при этом устройство вычисления тональности сконфигурировано с возможностью вычислять упомянутое по меньшей мере одно значение указания тональности в зависимости от спектра мощности. Посредством вычисления значения указания тональности на основе спектра мощности вычислительная сложность остается достаточно низкой.

Согласно одному предпочтительному варианту осуществления изобретения значение указания тональности для одной из спектральных линий основывается на сравнении значения мощности для соответствующей спектральной линии и суммы предварительно определенного количества его окружающих значений мощности спектра мощности, или значение указания тональности для одной из групп спектральных линий основывается на сравнении значения мощности для соответствующей группы спектральных линий и суммы предварительно определенного количества его окружающих значений мощности спектра мощности. Посредством сравнения значения мощности с его соседними значениями мощности пиковые области или плоские области спектра мощности могут легко идентифицироваться, так что значение указания тональности может вычисляться легким способом.

Согласно одному предпочтительному варианту осуществления изобретения значение указания тональности для одной из спектральных линий основывается на значении указания тональности спектральной линии предшествующего кадра аудиосигнала, или значение указания тональности для одной из групп спектральных линий основывается на значении указания тональности группы спектральных линий для предшествующего кадра аудиосигнала. Посредством этих свойств мертвая зона модифицируется с течением времени гладким способом.

Согласно одному предпочтительному варианту осуществления изобретения значение указания тональности вычисляется посредством формулы

где i является индексом, указывающим конкретный кадр аудиосигнала, k является индексом, указывающим конкретную спектральную линию, P_k,i является значением мощности k-й спектральной линии i-го кадра, или значение указания тональности вычисляется посредством формулы

где i является индексом, указывающим конкретный кадр аудиосигнала, m является индексом, указывающим конкретную группу спектральных линий, P_m,i является значением мощности m-й группы спектральных линий i-го кадра. Как можно заметить из формулы, значение указания тональности вычисляется из значения мощности i-го кадра, который является текущим кадром, и из i-1-го кадра, который является предшествующим кадром. Формула может быть изменена посредством опускания зависимости от i-1-го кадра. Здесь сумма 7 левых и 7 правых соседних значений мощности k-го значения мощности вычисляется и делится на соответствующее значение мощности. С использованием этой формулы низкое значение указания тональности показывает высокую тональность.

Согласно одному предпочтительному варианту осуществления изобретения аудиокодер содержит устройство вычисления начальной частоты, сконфигурированное с возможностью вычислять начальную частоту для модификации мертвой зоны, при этом мертвая зона модифицируется только для спектральных линий, представляющих частоту, более высокую чем или равную начальной частоте. Это означает, что мертвая зона является фиксированной для низких частот и переменной для более высоких частот. Эти особенности ведут к более хорошему качеству аудио, так как слуховая система человека является более чувствительной на низких частотах.

Согласно одному предпочтительному варианту осуществления изобретения устройство вычисления начальной частоты сконфигурировано с возможностью вычислять начальную частоту на основе частоты дискретизации аудиосигнала и/или на основе максимального битрейта, предвидимого для битового потока, вырабатываемого из кодированного сигнала. Посредством этих свойств качество аудио может оптимизироваться.

Согласно одному предпочтительному варианту осуществления изобретения аудиокодер содержит устройство вычисления модифицированного дискретного косинусного преобразования, сконфигурированное с возможностью вычислять модифицированное дискретное косинусное преобразование из кадра аудиосигнала, и устройство вычисления модифицированного дискретного синусного преобразования, сконфигурированное с возможностью вычислять модифицированное дискретное синусное преобразование из кадра аудиосигнала, при этом устройство вычисления спектра мощности сконфигурировано с возможностью вычислять спектр мощности на основе модифицированного дискретного косинусного преобразования и на основе модифицированного дискретного синусного преобразования. Модифицированное дискретное косинусное преобразование должно вычисляться в любом случае для цели кодирования аудиосигнала. Следовательно, только модифицированное дискретное синусное преобразование должно вычисляться дополнительно для цели адаптивного к тональности квантования. Поэтому сложность может уменьшаться. Однако могут использоваться другие преобразования, такие как дискретное преобразование Фурье или нечетное дискретное преобразование Фурье.

Согласно одному предпочтительному варианту осуществления изобретения устройство вычисления спектра мощности сконфигурировано с возможностью вычислять значения мощности согласно формуле P_k,i=(MDCT_k,i)²+(MDST_k,i)², где i является индексом, указывающим конкретный кадр аудиосигнала, k является индексом, указывающим конкретную спектральную линию, MDCT_k,i является значением модифицированного дискретного косинусного преобразования на k-й спектральной линии i-го кадра, MDST_k,i является значением модифицированного дискретного синусного преобразования на k-й спектральной линии i-го кадра, и P_k,i является значением мощности k-й спектральной линии i-го кадра. Формула выше обеспечивает возможность вычисления значения мощности легким способом.

Согласно одному предпочтительному варианту осуществления изобретения аудиокодер содержит устройство вычисления сигнала спектра, сконфигурированное с возможностью вырабатывать сигнал спектра, при этом устройство вычисления сигнала спектра содержит устройство установки амплитуды, сконфигурированное с возможностью устанавливать амплитуды спектральных линий сигнала спектра таким способом, что потеря энергии вследствие модификации мертвой зоны компенсируется. Посредством этих особенностей квантование может осуществляться способом сохранения энергии.

Согласно одному предпочтительному варианту осуществления изобретения устройство установки амплитуды сконфигурировано с возможностью устанавливать амплитуды сигнала спектра в зависимости от модификации мертвой зоны на соответствующей спектральной линии. Например, спектральные линии, для которых мертвая зона увеличивается, могут незначительно усиливаться для этой цели.

Согласно одному предпочтительному варианту осуществления изобретения устройство вычисления сигнала спектра содержит устройство нормализации. Посредством этого свойства последующий этап квантования может осуществляться легким способом.

Согласно одному предпочтительному варианту осуществления изобретения модифицированное дискретное косинусное преобразование из кадра аудиосигнала, вычисленное посредством устройства вычисления модифицированного дискретного косинусного преобразования, подается в устройство вычисления сигнала спектра. Посредством этой особенности модифицированное дискретное косинусное преобразование используется для цели адаптации квантования и для цели вычисления кодированного сигнала.

В одном аспекте изобретение обеспечивает систему, содержащую кодер и декодер, при этом кодер сконструирован согласно изобретению.

В одном аспекте изобретение обеспечивает способ для кодирования аудиосигнала, чтобы вырабатывать из него кодированный сигнал, при этом способ содержит этапы:

извлечение кадров из аудиосигнала;

отображение спектральных линий сигнала спектра, выведенного из кадра аудиосигнала, в индексы квантования; при этом используется мертвая зона, в которой входные спектральные линии отображаются в нуль; и

модификацию мертвой зоны;

при этом вычисляется по меньшей мере одно значение указания тональности для по меньшей мере одной спектральной линии или для по меньшей мере одной группы спектральных линий,

при этом мертвая зона для упомянутой по меньшей мере одной спектральной линии или упомянутой по меньшей мере одной группы спектральных линий модифицируется в зависимости от соответствующего значения указания тональности.

В одном аспекте изобретение обеспечивает компьютерную программу для выполнения, когда исполняется на компьютере или процессоре, способа согласно изобретению.

Предпочтительные варианты осуществления изобретения далее описываются по отношению к сопровождающим чертежам, на которых:

фиг. 1 иллюстрирует один вариант осуществления кодера согласно изобретению и

Фиг. 2 иллюстрирует принцип работы кодера согласно изобретению.

Фиг. 1 изображает аудиокодер 1 для кодирования аудиосигнала, чтобы вырабатывать из него кодированный сигнал ES согласно изобретению. Аудиокодер 1 содержит:

устройство 2 формирования кадров, сконфигурированное с возможностью извлекать кадры F из аудиосигнала AS;

модуль 3 квантования, сконфигурированный с возможностью отображать спектральные линии SL_1-32 (см. фиг. 2) сигнала спектра SPS, выведенного из кадра F аудиосигнала AS, в индексы квантования I₀, I₁; при этом модуль 3 квантования имеет мертвую зону DZ (см. фиг. 2), в которой спектральные линии SL_1-32 отображаются в индекс квантования ноль I₀; и

устройство 4 управления, сконфигурированное с возможностью модифицировать мертвую зону DZ;

при этом устройство 4 управления содержит устройство 5 вычисления тональности, сконфигурированное с возможностью вычислять по меньшей мере одно значение TI_5-32 указания тональности для по меньшей мере одной спектральной линии SL_1-32 или для по меньшей мере одной группы спектральных линий SL_1-32,

при этом устройство 4 управления сконфигурировано с возможностью модифицировать мертвую зону DZ для упомянутой по меньшей мере одной спектральной линии SL_1-32 или упомянутой по меньшей мере одной группы спектральных линий SL_1-32 в зависимости от соответствующего значения TI_5-32 указания тональности.

Устройство 2 формирования кадров может быть сконфигурировано с возможностью извлекать кадры F из аудиосигнала AS посредством применения оконной функции к аудиосигналу AS. В обработке сигналов, оконная функция (также известная как функция аподизации или коническая функция) является математической функцией, которая принимает нулевые значения вне некоторого выбранного интервала. Посредством применения оконной функции к сигналу AS, сигнал AS может разбиваться на короткие сегменты, которые обычно называются кадрами F.

Согласно изобретению сигнал SPS спектра вычисляется для кадров F аудиосигнала AS. Сигнал SPS спектра может содержать спектр каждого из кадров F аудиосигнала AS, который является сигналом временной области, при этом каждый спектр является представлением одного из кадров F в частотной области. Частотный спектр может генерироваться посредством математического преобразования сигнала AS, и результирующие значения обычно представляются как амплитуда в зависимости от частоты.

Мертвая зона DZ является зоной, используемой в течение квантования, при этом спектральные линии SL_1-32 (частотные интервалы) или группы спектральных линий SL_1-32 (частотные диапазоны) отображаются в индекс квантования ноль. Мертвая зона DZ имеет нижний предел, который обычно находится на амплитуде нуля, и верхний предел, который может изменяться для разных спектральных линий SL_1-32 или групп спектральных линий SL_1-32.

Согласно изобретению мертвая зона DZ может модифицироваться посредством устройства 4 управления. Устройство 4 управления содержит устройство 5 вычисления тональности, которое сконфигурировано с возможностью вычислять по меньшей мере одно значение TI_5-32 указания тональности для по меньшей мере одной спектральной линии SL_1-32 или для по меньшей мере одной группы спектральных линий SL_1-32.

Термин "тональность" указывает на тональный характер сигнала SPS спектра. В общем, можно сказать, что тональность является высокой в случае, когда спектр или его часть содержит преимущественно периодические компоненты, что означает, что спектр или его часть из кадра F содержит доминирующие пики. Противоположностью к тональному характеру является шумовой характер. В последнем случае спектр или его часть из кадра F является более плоским.

Дополнительно, устройство 4 управления сконфигурировано с возможностью модифицировать мертвую зону DZ для упомянутой по меньшей мере одной спектральной линии SL_1-32 или упомянутой по меньшей мере одной группы спектральных линий SL_1-32 в зависимости от соответствующего значения TI_5-32 указания тональности.

Настоящее изобретение раскрывает схему квантования с адаптивной к сигналу мертвой зоной DZ, которая

- принимает решение до квантования в отношении того, какую мертвую зону DZ использовать в расчете на интервал или диапазон, при сохранении сложности,

- может определять в расчете на интервал или в расчете на диапазон мертвую зону DZ на основе частоты диапазона и/или тональности сигнала.

Изобретение может применяться в существующей инфраструктуре кодирования, так как изменяется только модуль 3 квантования сигналов в кодере 1; соответствующий декодер будет все еще способным читать (неизмененный) битовый поток, вырабатываемый из кодированного сигнала, и декодировать вывод. В отличие от [6] и ссылок в нем, мертвая зона DZ для каждой группы спектральных линий SL_1-32 или для каждой спектральной линии SL_1-32 выбирается до квантования, таким образом, является необходимой только одна операция квантования в расчете на группу или спектральную линию SL_1-32. Наконец, решение модуля квантования не ограничено выбором между двумя возможными значениями мертвой зоны, но полным диапазоном значений. Схема адаптивного к тональности квантования, очерченная выше, может осуществляться в тракте возбуждения с кодированным преобразованием (TCX) кодера LD-USAC, вариант с низкой задержкой стандарта xHE-AAC [4].

Согласно одному предпочтительному варианту осуществления изобретения устройство 4 управления сконфигурировано с возможностью модифицировать мертвую зону DZ таким способом, что мертвая зона DZ на одной из спектральных линий SL_1-32 больше, чем мертвая зона DZ на одной из спектральных линий SL_1-32, имеющих более большую тональность, или таким способом, что мертвая зона DZ на одной из групп спектральных линий SL_1-32 больше, чем мертвая зона DZ на одной из групп спектральных линий SL_1-32, имеющих более большую тональность. Посредством этих особенностей нетональные спектральные области имеют тенденцию квантоваться в нуль, что означает, что количество данных может уменьшаться.

Согласно одному предпочтительному варианту осуществления изобретения устройство 4 управления содержит устройство 6 вычисления спектра мощности, сконфигурированное с возможностью вычислять спектр мощности PS (см. также фиг. 2) кадра F аудиосигнала AS, при этом спектр мощности PS содержит значения PS_5-32 мощности для спектральных линий SL_1-32 или групп спектральных линий SL_1-32, при этом устройство 5 вычисления тональности сконфигурировано с возможностью вычислять упомянутое по меньшей мере одно значение TI_5-32 указания тональности в зависимости от спектра мощности PS. Посредством вычисления значения указания TI_5-32 тональности на основе спектра мощности PS вычислительная сложность остается достаточно низкой. Дополнительно, точность может увеличиваться.

Согласно одному предпочтительному варианту осуществления изобретения значение TI_5-32 указания тональности для одной из спектральных линий SL_1-32 основывается на сравнении значения PS_5-32 мощности для соответствующей спектральной линии SL_1-32 и суммы предварительно определенного количества его окружающих значений PS_5-32 мощности спектра мощности PS, или значение указания тональности для одной из групп спектральных линий SL_1-32 основывается на сравнении значения PS_5-32 мощности для соответствующей группы спектральных линий и суммы предварительно определенного количества его окружающих значений PS_5-32 мощности спектра мощности. Посредством сравнения значения PS_5-32 мощности с его соседними значениями PS_5-32 мощности пиковые области или плоские области спектра мощности SP могут легко идентифицироваться, так что значение TI_5-32 указания тональности может вычисляться легким способом.

Согласно одному предпочтительному варианту осуществления изобретения значение TI_5-32 указания тональности для одной из спектральных линий SL_1-32 основывается на значении TI_5-32 указания тональности спектральной линии SL_1-32 предшествующего кадра F аудиосигнала AS, или значение TI_5-32 указания тональности для одной из групп спектральных линий SL_1-32 основывается на значении TI_5-32 указания тональности группы спектральных линий SL_1-32 для предшествующего кадра F аудиосигнала AS. Посредством этих особенностей мертвая зона DZ модифицируется с течением времени гладким (плавным) способом.

Согласно одному предпочтительному варианту осуществления изобретения значение TI_5-32 указания тональности вычисляется посредством формулы

где i является индексом, указывающим конкретный кадр F аудиосигнала AS, k является индексом, указывающим конкретную спектральную линию SL_1-32, P_k,i является значением PS_5-32 мощности k-й спектральной линии SL_1-32 i-го кадра, или значение TI_5-32 указания тональности вычисляется посредством формулы

где i является индексом, указывающим конкретный кадр F аудиосигнала AS, m является индексом, указывающим конкретную группу спектральных линий SL_1-32, P_m,i является значением PS_5-32 мощности m-й группы спектральных линий SL_1-32 i-го кадра. Как можно заметить из формулы, значение TI_5-32 указания тональности вычисляется из значения PS_5-32 мощности i-го кадра, который является текущим кадром F, и из i-1-го кадра F, который является предшествующим кадром F. Формула может быть изменена посредством опускания зависимости от i-1-го кадра F. Здесь сумма 7 левых и 7 правых соседних значений PS_5-32 мощности k-го значения PS_5-32 мощности некоторой спектральной линии SL_1-32 или m-ое значение мощности группы спектральных линий SL_1-32 вычисляется и делится на соответствующее значение PS_5-32 мощности. С использованием этой формулы низкое значение TI_5-32 указания тональности указывает высокую тональность.

Согласно одному предпочтительному варианту осуществления изобретения аудиокодер 1 содержит устройство 7 вычисления начальной частоты, сконфигурированное с возможностью вычислять начальную частоту SF для модификации мертвой зоны DZ, при этом мертвая зона DZ модифицируется только для спектральных линий SL_5-32, представляющих частоту, более высокую, чем или равную начальной частоте SF. Это означает, что мертвая зона DZ является фиксированной для низких частот и переменной для более высоких частот. Эти свойства ведут к более хорошему качеству аудио, так как слуховая система человека является более чувствительной на низких частотах.

Согласно одному предпочтительному варианту осуществления изобретения устройство 7 вычисления начальной частоты сконфигурировано с возможностью вычислять начальную частоту SF на основе частоты дискретизации аудиосигнала AS и/или на основе максимального битрейта, предвидимого для битового потока, вырабатываемого из кодированного сигнала ES. Посредством этих особенностей качество аудио может оптимизироваться.

Согласно одному предпочтительному варианту осуществления изобретения аудиокодер 1 содержит устройство 8 вычисления модифицированного дискретного косинусного преобразования, сконфигурированное с возможностью вычислять модифицированное дискретное косинусное преобразование CT из кадра F аудиосигнала AS, и устройство 9 вычисления модифицированного дискретного синусного преобразования, сконфигурированное с возможностью вычислять модифицированное дискретное синусное преобразование ST из кадра F аудиосигнала AS, при этом устройство 6 вычисления спектра мощности сконфигурировано с возможностью вычислять спектр мощности PS на основе модифицированного дискретного косинусного преобразования CT и на основе модифицированного дискретного синусного преобразования ST. Модифицированное дискретное косинусное преобразование CT должно вычисляться в любом случае во многих случаях для цели кодирования аудиосигнала AS. Следовательно, только модифицированное дискретное синусное преобразование ST должно вычисляться дополнительно для цели адаптивного к тональности квантования. Поэтому сложность может уменьшаться. Однако могут использоваться другие преобразования, такие как дискретное преобразование Фурье или нечетное дискретное преобразование Фурье.

Согласно одному предпочтительному варианту осуществления изобретения устройство 6 вычисления спектра мощности сконфигурировано с возможностью вычислять значения мощности согласно формуле P_k,i=(MDCT_k,i)²+(MDST_k,i)², где i является индексом, указывающим конкретный кадр F аудиосигнала, k является индексом, указывающим конкретную спектральную линию SL_1-32, MDCT_k,i является значением модифицированного дискретного косинусного преобразования CT на k-й спектральной линии i-го кадра, MDST_k,i является значением модифицированного дискретного синусного преобразования ST на k-й спектральной линии i-го кадра, и P_k,i является значением PS_5-32 мощности k-й спектральной линии i-го кадра. Формула выше обеспечивает возможность вычислять значения PS_5-32 мощности легким способом.

Согласно одному предпочтительному варианту осуществления изобретения аудиокодер 1 содержит устройство 10 вычисления сигнала спектра, сконфигурированное с возможностью вырабатывать сигнал SPS спектра, при этом устройство 10 вычисления сигнала спектра содержит устройство 11 установки амплитуды, сконфигурированное с возможностью устанавливать амплитуды спектральных линий SL_1-32 сигнала SPS спектра таким способом, что потеря энергии вследствие модификации мертвой зоны DZ компенсируется. Посредством этих особенностей квантование может осуществляться способом сохранения энергии.

Согласно одному предпочтительному варианту осуществления изобретения устройство 11 установки амплитуды сконфигурировано с возможностью устанавливать амплитуды сигнала SPS спектра в зависимости от модификации мертвой зоны DZ на соответствующей спектральной линии SL_1-32. Например, спектральные линии SL_1-32, для которых мертвая зона DZ увеличивается, могут незначительно усиливаться для этой цели.

Согласно одному предпочтительному варианту осуществления изобретения устройство 10 вычисления сигнала спектра содержит устройство 12 нормализации. Посредством этого свойства последующий этап квантования может осуществляться легким способом.

Согласно одному предпочтительному варианту осуществления изобретения модифицированное дискретное косинусное преобразование CT из кадра F аудиосигнала AS, вычисленное посредством устройства 8 вычисления модифицированного дискретного косинусного преобразования, подается в устройство 10 вычисления сигнала спектра. Посредством этой особенности модифицированное дискретное косинусное преобразование CT используется для цели адаптации квантования и для цели вычисления кодированного сигнала ES.

Фиг. 1 изображает поток данных и информацию управления в новом адаптивном кодере 1. Следует повторить, что нетональные спектральные области выше некоторой частоты SF имеют тенденцию квантоваться в нуль достаточно широко при низких битрейтах. Это, однако, предусматривается: вставка шума, применяемая на нулевых интервалах в декодере, будет с достаточной степенью восстанавливать шумо-подобные спектры, и квантование в нуль будет сохранять биты, которые могут использоваться, чтобы квантовать низкочастотные интервалы более точно.

Фиг. 2 иллюстрирует принцип работы кодера согласно изобретению. Здесь, мертвая зона DZ аудиокодера 1 согласно изобретению, спектр мощности PS с его значениями PS_5-32 мощности кадра F аудиосигнала AS, значения TI_5-32 указания тональности и спектральные линии SL_1-32 спектра SP показаны в общей системе координат, где ось x обозначает частоту и ось y обозначает амплитуды. Необходимо отметить, что индексы отображения, более большие, чем 1, на фиг. 2 не показаны для упрощения.

Ниже начальной частоты SF, которая вычисляется посредством устройства 7 вычисления начальной частоты, мертвая зона имеет фиксированный размер. В этом примере спектральная линия SL₁ оканчивается вне мертвой зоны, так что она будет отображаться в индекс один I₁, тогда как спектральная линия SL₇ оканчивается внутри мертвой зоны DZ, так что она может отображаться в индекс 0 I₀. Однако начиная с начальной частоты SF и идя к более высоким частотам, размер мертвой зоны DZ может модифицироваться посредством устройства 4 управления. Для этой цели, значения PS_5-32 мощности вычисляются, как описано выше. Дополнительно, значения TI_5-32 указания тональности вычисляются из значений PS_5-32 мощности.

В области от k=20 до k=23 спектр мощности PS имеет пик, который дает результатом низкие значения TI_20-23 указания тональности, которые указывают высокую тональность. В других областях выше начальной частоты SF поскольку спектр мощности PS является более плоским, значения TI_12-19 и TI

Адаптивное к тональности квантование низкой сложности аудиосигналов

Патент 2621003