Низкочастотное акцентирование для основанного на lpc кодирования в частотной области

Иллюстрации

Показать все

Изобретение относится к области кодирования и декодирования аудиосигналов. Технический результат – обеспечение минимума слышимых артефактов кодирования в выходном аудиосигнале на низких частотах путем низкочастотного акцентирования на стороне кодера и деакцентирования на стороне декодера. Аудиокодер содержит комбинацию фильтра кодирования с линейным предсказанием, имеющего множество коэффициентов (LC) кодирования с линейным предсказанием, и преобразователя из временной области в частотную область, причем упомянутая комбинация выполнена с возможностью фильтрации и преобразования фрейма (FI) аудиосигнала (AS) в частотную область для того, чтобы вывести спектр (SP) на основе этого фрейма (FI) и коэффициентов (LC) кодирования с линейным предсказанием; блок низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра (PS) на основе спектра (SP), причем спектральные линии (SL) обработанного спектра (PS), представляющие более низкую частоту, чем референсная спектральная линия (RSL), акцентированы; и управляющее устройство, выполненное с возможностью управления вычислением обработанного спектра (PS) с помощью блока низкочастотного акцентирования в зависимости от коэффициентов (LC) кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием. 7 н. и 21 з.п. ф-лы, 10 ил.

Реферат

Известно, что неречевые сигналы, например музыкальный звук, могут быть более сложными в обработке, чем звук человеческого голоса, занимая более широкую полосу частот. Системы кодирования аудиосигналов современного уровня техники, такие как AMR-WB+ [3] и xHE-AAC [4], предлагают инструмент кодирования преобразования для музыки и других общих, неречевых сигналов. Этот инструмент широко известен как кодируемое преобразованием возбуждение (TCX) и основан на принципе передачи разности кодирования с линейным предсказанием (LPC), которую называют возбуждением, проквантованной и энтропийно закодированной в частотной области. Однако из-за ограниченного порядка предсказателя, используемого на этапе LPC, в декодируемом сигнале могут образовываться артефакты, особенно на низких частотах, где человеческий слух является очень чувствительным. С этой целью в публикациях [1-3] была введена схема низкочастотного акцентирования и деакцентирования.

Упомянутая схема адаптивного низкочастотного акцентирования (ALFE) предшествующего уровня техники усиливает низкочастотные спектральные линии перед квантованием в кодере. В частности, низкочастотные линии группируются в полосы, вычисляется энергия каждой полосы, и находится полоса с локальным энергетическим максимумом. На основе величины и положения энергетического максимума полосы, находящиеся ниже полосы с максимальной энергией, усиливаются так, чтобы они были более точно проквантованы при последующем квантовании.

Низкочастотное деакцентирование, выполняемое для инвертирования ALFE в соответствующем декодере, является концептуально аналогичным. Как и в кодере, устанавливаются низкочастотные полосы и определяется полоса с максимальной энергией. В отличие от кодера, полосы, находящиеся ниже энергетического пика, не усиливаются, а ослабляются. Эта процедура примерно восстанавливает энергии линий первоначального спектра.

Стоит заметить, что в предшествующем уровне техники вычисление энергии полос в кодере выполняется перед квантованием, то есть на входном спектре, тогда как в декодере оно выполняется на обратно проквантованных линиях, то есть на декодированном спектре. Хотя операция квантования может быть спроектирована так, чтобы спектральная энергия сохранялась в среднем, невозможно гарантировать точное сохранение энергии для индивидуальных спектральных линий. Следовательно, схема ALFE не может быть точно инвертирована. Кроме того, в предпочтительной реализации схемы ALFE предшествующего уровня техники и в кодере, и в декодере требуется операция вычисления квадратного корня. Желательно избежать таких относительно сложных операций.

Задачей настоящего изобретения является предложить улучшенные концепции для обработки аудиосигнала. Более конкретно, задачей настоящего изобретения является предложить улучшенные концепции для адаптивного низкочастотного акцентирования и деакцентирования. Задача настоящего изобретения решается аудиокодером в соответствии с п. 1 формулы изобретения, аудиодекодером в соответствии с п. 12 формулы изобретения, системой в соответствии с п. 22 формулы изобретения, способами в соответствии с пп. 25 и 26 формулы изобретения и компьютерной программой в соответствии с п. 27 формулы изобретения.

В одном аспекте настоящее изобретение предлагает аудиокодер для кодирования неречевого аудиосигнала, производящий из него поток битов и включающий в себя:

комбинацию фильтра кодирования с линейным предсказанием, имеющего множество коэффициентов кодирования с линейным предсказанием, и преобразователя из временной области в частотную область, причем эта комбинация выполнена с возможностью фильтрации и преобразования фрейма аудиосигнала в частотную область для того, чтобы вывести спектр на основе этого фрейма и коэффициентов кодирования с линейным предсказанием;

блок низкочастотного акцентирования, выполненный с возможностью вычисления обработанного спектра на основе спектра, в котором спектральные линии обработанного спектра, представляющие более низкие частоты, чем референсная спектральная линия, акцентированы; и

управляющее устройство, выполненное с возможностью управления вычислением обработанного спектра с помощью блока низкочастотного акцентирования в зависимости от коэффициентов кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием.

Фильтр кодирования с линейным предсказанием (фильтр LPC) является инструментом, используемым в обработке аудиосигнала и обработке речи для представления спектральной огибающей кадрированного цифрового сигнала звука в сжатой форме, используя информацию линейной прогнозирующей модели.

Преобразователь из временной области в частотную область является инструментом для преобразования в частности кадрированного цифрового сигнала из временной области в частотную область так, чтобы оценить спектр сигнала. Преобразователь из временной области в частотную область может использовать модифицированное дискретное косинусное преобразование (MDCT), которое является преобразованием свертки, основанным на дискретном косинусном преобразовании типа IV (DCT-IV), с дополнительным свойством свертки: оно разработано для выполнения на последовательных фреймах большего набора данных, где последовательные фреймы перекрываются так, что вторая половина одного фрейма совпадает с первой половиной следующего фрейма. Это перекрытие, в дополнение к свойствам энергетического уплотнения DCT, делает преобразование MDCT особенно притягательным для приложений сжатия сигналов, так как это помогает избежать артефактов, обуславливаемых границами фреймов.

Блок низкочастотного акцентирования выполнен с возможностью вычисления обработанного спектра на основе спектра, причем спектральные линии обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, акцентируются, так что акцентируются только низкие частоты, содержащиеся в обработанном спектре. Референсная спектральная линия может быть предопределена на основе эмпирического опыта.

Управляющее устройство выполнено с возможностью управления вычислением обработанного спектра с помощью блока низкочастотного акцентирования в зависимости от коэффициентов кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием. Следовательно, кодер в соответствии с настоящим изобретением не должен анализировать спектр аудиосигнала с целью акцентирования низких частот. Кроме того, поскольку в кодере и в последующем декодере могут использоваться идентичные коэффициенты кодирования с линейным предсказанием, адаптивное низкочастотное акцентирование полностью обратимо независимо от квантования спектра, если коэффициенты кодирования с линейным предсказанием передаются декодеру в потоке битов, который производится кодером или любыми другими средствами. В большинстве случаев коэффициенты кодирования с линейным предсказанием должны быть так или иначе переданы в потоке битов с целью восстановления выходного аудиосигнала из потока битов соответствующим декодером. Следовательно, скорость передачи потока битов не будет увеличиваться низкочастотным акцентированием, описанным в настоящем документе.

Описанная в настоящем документе система с адаптивным низкочастотным акцентированием может быть осуществлена в основном кодере TCX стандарта LD-USAC (EVS), разновидности стандарта xHE-AAC с малой задержкой [4], который может пофреймово переключаться между временной областью и областью кодирования MDCT.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения фрейм аудиосигнала подается на вход фильтра кодирования с линейным предсказанием, в котором фильтрованный фрейм выводится фильтром кодирования с линейным предсказанием, и в котором преобразователь из временной области в частотную область выполнен с возможностью оценки спектра на основе фильтрованного фрейма. Соответственно, фильтр кодирования с линейным предсказанием может работать во временной области, получая на входе аудиосигнал.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения фрейм аудиосигнала подается на преобразователь из временной области в частотную область, в котором преобразованный фрейм выводится преобразователем из временной области в частотную область, и в котором фильтр кодирования с линейным предсказанием выполнен с возможностью оценки спектра на основе преобразованного фрейма. Альтернативно, но эквивалентно первому варианту осуществления кодера в соответствии с настоящим изобретением, имеющему блок низкочастотного акцентирования, кодер может вычислять обработанный спектр на основе спектра фрейма, произведенного посредством шумового формирования в частотной области (FDNS), как раскрыто, например, в публикации [5]. Более конкретно, порядок чередования инструментов здесь изменен: преобразователь из временной области в частотную область, такой как вышеупомянутый, может быть выполнен с возможностью оценки преобразованного фрейма на основе фрейма аудиосигнала, а фильтр кодирования с линейным предсказанием выполнен с возможностью оценки аудиоспектра на основе преобразованного фрейма, который выводится преобразователем из временной области в частотную область. Соответственно, фильтр кодирования с линейным предсказанием может работать в частотной области (вместо временной области), имея на входе преобразованный фрейм, с фильтром кодирования с линейным предсказанием, применяемым посредством умножения на спектральное представление коэффициентов кодирования с линейным предсказанием.

Специалистам в данной области техники должно быть очевидно, что эти два подхода - линейная фильтрация во временной области с последующим преобразованием из временной области в частотную область по сравнению с преобразованием из временной области в частотную область с последующей линейной фильтрацией посредством спектрального взвешивания в частотной области - могут быть осуществлены так, что они будут эквивалентными.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения аудиокодер включает в себя устройство квантования, выполненное с возможностью производства проквантованного спектра на основе обработанного спектра, а также генератор потока битов, выполненный с возможностью встраивания проквантованного спектра и коэффициентов кодирования с линейным предсказанием в поток битов. Квантование в цифровой обработке сигналов представляет собой процесс отображения большого набора входных значений на (исчисляемый) меньший набор, такой как округление значений с некоторой точностью. Устройство или алгоритмическая функция, которая выполняет квантование, называется устройством квантования. Генератор потока битов может быть любым устройством, которое способно встраивать цифровые данные из различных источников в единый поток битов. С помощью этих особенностей поток битов, произведенный с адаптивным низкочастотным акцентированием, может быть произведен легко, причем адаптивное низкочастотное акцентирование является полностью обратимым для последующего декодера путем использования исключительно информации, уже содержащейся в потоке битов.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство включает в себя спектральный анализатор, выполненный с возможностью оценки спектрального представления коэффициентов кодирования с линейным предсказанием, анализатор максимума-минимума, выполненный с возможностью оценки минимума спектрального представления и максимума спектрального представления ниже дополнительной референсной спектральной линии, и устройство вычисления коэффициента акцентирования, выполненное с возможностью вычисления коэффициентов акцентирования спектральной линии для вычисления спектральных линий обработанного спектра, представляющего более низкую частоту, чем ссылочная спектральная линия, на основе минимума и максимума, причем спектральные линии обработанного спектра акцентируются путем применения коэффициентов акцентирования спектральной линии к спектральным линиям спектра фильтрованного фрейма. Анализатор спектра может быть преобразователем из временной области в частотную область, как описано выше. Спектральное представление является передаточной функцией фильтра кодирования с линейным предсказанием и может быть, но не обязательно, тем же самым спектральным представлением, которое используется для FDNS, как описано выше. Спектральное представление может быть вычислено из нечетного дискретного преобразования Фурье (ODFT) коэффициентов кодирования с линейным предсказанием. В стандартах xHE-AAC и LD-USAC передаточная функция может быть аппроксимирована 32 или 64 усилениями в области модифицированного дискретного косинусного преобразования, которые покрывают все спектральное представление.

В предпочтительном варианте осуществления настоящего изобретения устройство вычисления коэффициента акцентирования конфигурируется таким образом, что коэффициент акцентирования спектральной линии увеличивается в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту спектра. Это означает, что спектральная линия, представляющая самую низкую частоту, усиливается больше всего, тогда как спектральная линия, смежная с референсной спектральной линией, усиливается меньше всего. Референсная спектральная линия и спектральные линии, представляющие более высокие частоты, чем референсная спектральная линия, не акцентируются вообще. Это снижает вычислительную сложность без каких-либо слышимых недостатков.

В предпочтительном варианте осуществления настоящего изобретения блок вычисления коэффициента акцентирования включает в себя первый каскад, выполненный с возможностью вычисления базисного коэффициента акцентирования в соответствии с первой формулой γ=(α⋅min/max)β, где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом спектрального представления, max является максимумом спектрального представления, и γ является базисным коэффициентом акцентирования, а также блок вычисления коэффициента акцентирования включает в себя второй каскад, выполненный с возможностью вычисления коэффициентов акцентирования спектральной линии в соответствии со второй формулой εii'-i, в которой i' является количеством спектральных линий, которые будут акцентированы, i является индексом соответствующей спектральной линии, причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0…i'-1, γ является базисным коэффициентом акцентирования, и εi является коэффициентом акцентирования спектральной линии с индексом i. Базисный коэффициент акцентирования легко вычисляется из отношения минимума и максимума с помощью первой формулы. Базисный коэффициент акцентирования служит базисом для вычисления всех коэффициентов акцентирования спектральных линий, причем вторая формула гарантирует, что коэффициенты акцентирования спектральных линий увеличиваются в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту спектра. В отличие от решений предшествующего уровня техники предложенное решение не требует сложных вычислений типа вычисления квадратного корня для каждой спектральной полосы. Необходимы только 2 операции деления и 2 операции возведения в степень, по одной на стороне декодера и кодера.

В предпочтительном варианте осуществления настоящего изобретения первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30. Вышеупомянутые интервалы основаны на эмпирических экспериментах. Наилучшие результаты могут быть достигнуты, когда первая заданная величина устанавливается равной 32.

В предпочтительном варианте осуществления настоящего изобретения вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством акцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2. Эти интервалы также основаны на эмпирических экспериментах. Было найдено, что наилучшие результаты могут быть достигнуты, когда вторая заданная величина устанавливается равной 4.

В предпочтительном варианте осуществления настоящего изобретения референсная спектральная линия представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц. Эти найденные опытным путем интервалы гарантируют достаточное низкочастотное акцентирование, а также низкую вычислительную сложность системы. Эти интервалы гарантируют в частности, что в плотно заполненных спектрах линии низких частот закодированы с достаточной точностью. В предпочтительном варианте осуществления референсная спектральная линия представляет 800 Гц, причем акцентируются 32 спектральных линии.

В предпочтительном варианте осуществления настоящего изобретения дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия. Эти особенности гарантируют, что оценка минимума и максимума делается в соответствующем частотном диапазоне.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство конфигурируется таким образом, что спектральные линии обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, акцентируются только в том случае, если максимум меньше минимума, умноженного на первую заданную величину α. Эти особенности гарантируют, что низкочастотное акцентирование выполняется только при необходимости, так что рабочая нагрузка кодера может быть минимизирована, и биты не тратятся впустую на перцепционно незначительные области во время спектрального квантования.

В одном аспекте настоящее изобретение предлагает аудиодекодер для декодирования потока битов, на основе неречевого аудиосигнала, так, чтобы произвести из этого потока битов декодированный неречевой выходной аудиосигнал, в частности для декодирования производимого аудиокодером в соответствии с настоящим изобретением потока битов, содержащего проквантованные спектры и множество коэффициентов кодирования с линейным предсказанием, причем этот аудиодекодер включает в себя:

приемник потока битов, выполненный с возможностью извлечения проквантованного спектра и коэффициентов кодирования с линейным предсказанием из потока битов;

устройство деквантования, выполненное с возможностью производства деквантованного спектра на основе квантованного спектра;

блок низкочастотного деакцентирования, выполненный с возможностью вычисления обратно обработанного спектра на основе деквантованного спектра, в котором спектральные линии обратно обработанного спектра, представляющие более низкие частоты, чем референсная спектральная линия, деакцентированы; и

управляющее устройство, выполненное с возможностью управления вычислением обратно обработанного спектра с помощью низкочастотного корректора в зависимости от коэффициентов кодирования с линейным предсказанием, содержащихся в потоке битов.

Приемник потока битов может быть любым устройством, которое способно классифицировать цифровые данные из единого потока битов так, чтобы отправлять классифицированные данные подходящему последующему этапу обработки. В частности, приемник потока битов выполнен с возможностью извлечения из потока битов проквантованного спектра, который затем передается устройству деквантования, и коэффициентов кодирования с линейным предсказанием, которые затем передаются управляющему устройству.

Устройство деквантования выполнено с возможностью производства деквантованного спектра на основе квантованного спектра, в котором деквантование является процессом, обратным квантованию, как объяснено выше.

Блок низкочастотного деакцентирования выполнен с возможностью вычисления обратно обработанного спектра на основе деквантованного спектра, причем спектральные линии обратно обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, деакцентируются, так что деакцентируются только низкие частоты, содержащиеся в обратно обработанном спектре. Референсная спектральная линия может быть предопределена на основе эмпирического опыта. Следует отметить, что референсная спектральная линия декодера должна представлять ту же самую частоту, что и референсная спектральная линия кодера, как объяснено выше. Однако частота, к которой относится референсная спектральная линия, может храниться на стороне декодера так, чтобы не было необходимости передавать эту частоту в потоке битов.

Управляющее устройство выполнено с возможностью управления вычислением обратно обработанного спектра с помощью блока низкочастотного деакцентирования в зависимости от коэффициентов кодирования с линейным предсказанием фильтра кодирования с линейным предсказанием. Поскольку в кодере, производящем поток битов, и в декодере могут использоваться идентичные коэффициенты кодирования с линейным предсказанием, адаптивное низкочастотное акцентирование является полностью обратимым независимо от квантования спектра, если коэффициенты кодирования с линейным предсказанием передаются к декодеру в потоке битов. В большинстве случаев коэффициенты кодирования с линейным предсказанием должны быть так или иначе переданы в потоке битов с целью восстановления выходного аудиосигнала из потока битов декодером. Следовательно, скорость передачи потока битов не будет увеличиваться описанными в настоящем документе низкочастотным акцентированием и низкочастотным деакцентированием.

Описанная в настоящем документе система с адаптивным низкочастотным деакцентированием может быть осуществлена в основном кодере TCX стандарта LD-USAC, разновидности стандарта xHE-AAC с малой задержкой [4], который может переключаться между временной областью и областью кодирования MDCT.

С помощью этих функций поток битов, произведенный с адаптивным низкочастотным акцентированием, может быть декодирован легко, причем адаптивное низкочастотное деакцентирование может быть выполнено декодером путем использования исключительно информации, уже содержащейся в потоке битов.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения аудиодекодер включает в себя комбинацию преобразователя из частотной области во временную область и фильтра обратного кодирования с линейным предсказанием, получающего множество коэффициентов кодирования с линейным предсказанием, содержащихся в потоке битов, причем эта комбинация выполнена с возможностью обратной фильтрации и преобразования обратно обработанного спектра во временную область для того, чтобы вывести выходной сигнал, основанный на обратно обработанном спектре и на коэффициентах кодирования с линейным предсказанием.

Преобразователь из частотной области во временную область является инструментом для выполнения операции, обратной операции преобразования из временной области в частотную область, как объяснено выше. Он является инструментом для преобразования в частности спектра сигнала в частотной области в кадрированный цифровой сигнал во временной области с тем, чтобы оценить первоначальный сигнал. Преобразователь из частотной области во временную область может использовать обратное модифицированное дискретное косинусное преобразование (обратное MDCT), которое является преобразованием свертки, основанным на дискретном косинусном преобразовании типа IV (DCT-IV), с дополнительным свойством свертки: оно разработано для выполнения на последовательных фреймах большего набора данных, где последовательные фреймы перекрываются так, что вторая половина одного фрейма совпадает с первой половиной следующего фрейма. Это перекрытие, в дополнение к свойствам энергетического уплотнения DCT, делает преобразование MDCT особенно притягательным для приложений сжатия сигналов, так как это помогает избежать артефактов, обуславливаемых границами фреймов. Специалист в данной области техники поймет, что возможны и другие преобразования. Однако преобразование в декодере должно быть обратным преобразованием для преобразования в кодере.

Обратный фильтр кодирования с линейным предсказанием является инструментом для выполнения операции, обратной операции, выполняемой фильтром кодирования с линейным предсказанием (фильтром LPC), как объяснено выше. Он является инструментом, используемым в обработке аудиосигнала и в обработке речи для декодирования спектральной огибающей кадрированного цифрового сигнала для того, чтобы реконструировать цифровой сигнал, используя информацию линейной прогнозирующей модели. Кодирование и декодирование с линейным предсказанием является полностью обратимым, если используются одни и те же коэффициенты кодирования с линейным предсказанием, что может быть обеспечено путем передачи из кодера декодеру коэффициентов кодирования с линейным предсказанием, встроенных в поток битов, как описано в настоящем документе.

С помощью этих особенностей выходной сигнал может быть легко обработан.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения преобразователь из частотной области во временную область выполнен с возможностью оценки временного сигнала на основе обратно обработанного спектра, причем обратный фильтр кодирования с линейным предсказанием выполнен с возможностью вывода выходного сигнала на основе временного сигнала. Соответственно, обратный фильтр кодирования с линейным предсказанием может работать во временной области, получая на входе временной сигнал.

В соответствии с одним предпочтительным вариантом осуществления настоящего изобретения обратный фильтр кодирования с линейным предсказанием выполнен с возможностью оценки обратно фильтрованного сигнала на основе обратно обработанного спектра, причем преобразователь из частотной области во временную область выполнен с возможностью вывода выходного сигнала на основе обратно фильтрованного сигнала.

Альтернативно и эквивалентно, и аналогично вышеописанной процедуре FDNS, выполняемой на стороне кодера, порядок чередования преобразования из частотной области во временную область и обратного фильтра кодирования с линейным предсказанием может быть изменен, так что последний будет выполняться первым и в частотной области (вместо временной области). Более конкретно, обратный фильтр кодирования с линейным предсказанием может выводить обратно фильтрованный сигнал на основе обратно обработанного спектра, с применением обратного фильтра кодирования с линейным предсказанием посредством умножения (или деления) на спектральное представление коэффициентов кодирования с линейным предсказанием, как описано в публикации [5]. Соответственно, преобразователь из частотной области во временную область, такой как вышеупомянутый, может быть выполнен с возможностью оценки фрейма выходного сигнала на основе обратно фильтрованного сигнала, который является входом для преобразователя из временной области в частотную область.

Специалистам в данной области техники должно быть очевидно, что эти два подхода - линейная обратная фильтрация посредством спектрального взвешивания в частотной области с последующим преобразованием из частотной области во временную область по сравнению с преобразованием из частотной области во временную область с последующей обратной линейной фильтрацией во временной области - могут быть осуществлены так, что они будут эквивалентными.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство включает в себя спектральный анализатор, выполненный с возможностью оценки спектрального представления коэффициентов кодирования с линейным предсказанием, анализатор максимума-минимума, выполненный с возможностью оценки минимума спектрального представления и максимума спектрального представления ниже дополнительной референсной спектральной линии, и устройство вычисления коэффициента деакцентирования, выполненное с возможностью вычисления коэффициентов деакцентирования спектральной линии для вычисления спектральных линий обработанного спектра, представляющего более низкую частоту, чем ссылочная спектральная линия, на основе минимума и максимума, причем спектральные линии обратно обработанного спектра деакцентируются путем применения коэффициентов деакцентирования спектральной линии к спектральным линиям деквантованного спектра. Анализатор спектра может быть преобразователем из временной области в частотную область, как описано выше. Спектральное представление является передаточной функцией фильтра кодирования с линейным предсказанием и может быть, но не обязательно, тем же самым спектральным представлением, которое используется для FDNS, как описано выше. Спектральное представление может быть вычислено из нечетного дискретного преобразования Фурье (ODFT) коэффициентов кодирования с линейным предсказанием. В стандартах xHE-AAC и LD-USAC передаточная функция может быть аппроксимирована 32 или 64 усилениями в области модифицированного дискретного косинусного преобразования, которые покрывают все спектральное представление.

В предпочтительном варианте осуществления настоящего изобретения блок вычисления коэффициента деакцентирования конфигурируется таким образом, что коэффициенты деакцентирования спектральной линии уменьшаются в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту обратно обработанного спектра. Это означает, что спектральная линия, представляющая самую низкую частоту, ослабляется больше всего, тогда как спектральная линия, смежная с референсной спектральной линией, ослабляется меньше всего. Референсная спектральная линия и спектральные линии, представляющие более высокие частоты, чем референсная спектральная линия, не деакцентируются вообще. Это снижает вычислительную сложность без каких-либо слышимых недостатков.

В предпочтительном варианте осуществления настоящего изобретения блок вычисления коэффициента деакцентирования включает в себя первый каскад, выполненный с возможностью вычисления базисного коэффициента деакцентирования в соответствии с первой формулой δ=(α⋅min/max), где α является первой заданной величиной, α>1, β является второй заданной величиной, 0<β≤1, min является минимумом спектрального представления, max является максимумом спектрального представления, и δ является базисным коэффициентом деакцентирования, а также блок вычисления коэффициента деакцентирования включает в себя второй каскад, выполненный с возможностью вычисления коэффициентов деакцентирования спектральной линии в соответствии со второй формулой ii'-i, в которой i' является количеством деакцентируемых спектральных линий, i является индексом соответствующей спектральной линии, причем значение индекса увеличивается с увеличением частоты спектральных линий, i=0…i'-1, δ является базисным коэффициентом деакцентирования и i является коэффициентом деакцентирования спектральной линии с индексом i. Операция вычисления коэффициента деакцентирования является обратной по отношению к операции вычисления коэффициента акцентирования, как описано выше. Базисный коэффициент деакцентирования легко вычисляется из отношения минимума и максимума с помощью первой формулы. Базисный коэффициент деакцентирования служит базисом для вычисления всех коэффициентов деакцентирования спектральных линий, причем вторая формула гарантирует, что коэффициенты деакцентирования спектральных линий уменьшаются в направлении от референсной спектральной линии к спектральной линии, представляющей самую низкую частоту обработанного спектра. В отличие от решений предшествующего уровня техники предложенное решение не требует сложных вычислений типа вычисления квадратного корня для каждой спектральной полосы. Необходимы только 2 операции деления и 2 операции возведения в степень, по одной на стороне декодера и кодера.

В предпочтительном варианте осуществления настоящего изобретения первая заданная величина меньше чем 42 и больше чем 22, в частности меньше чем 38 и больше чем 26, более конкретно меньше чем 34 и больше чем 30. Вышеупомянутые интервалы основаны на эмпирических экспериментах. Наилучшие результаты могут быть достигнуты, когда первая заданная величина устанавливается равной 32. Следует отметить, что первая заданная величина декодера должна быть той же самой, что и первая заданная величина кодера.

В предпочтительном варианте осуществления настоящего изобретения вторая заданная величина определяется в соответствии с формулой β=1/(θ⋅i'), в которой i' является количеством деакцентируемых спектральных линий, θ является коэффициентом между 3 и 5, в частности между 3,4 и 4,6, более конкретно между 3,8 и 4,2. Наилучшие результаты могут быть достигнуты, когда вторая заданная величина устанавливается равной 4. Следует отметить, что вторая заданная величина декодера должна быть той же самой, что и вторая заданная величина кодера.

В предпочтительном варианте осуществления настоящего изобретения референсная спектральная линия представляет частоту между 600 Гц и 1000 Гц, в частности между 700 Гц и 900 Гц, более конкретно между 750 Гц и 850 Гц. Эти найденные опытным путем интервалы гарантируют достаточное низкочастотное акцентирование, а также низкую вычислительную сложность системы. Эти интервалы гарантируют в частности, что в плотно заполненных спектрах линии низких частот закодированы с достаточной точностью. В предпочтительном варианте осуществления референсная спектральная линия представляет 800 Гц, причем деакцентируются 32 спектральных линии. Очевидно, что референсная спектральная линия декодера должна представлять ту же самую частоту, что и референсная спектральная линия кодера.

В предпочтительном варианте осуществления настоящего изобретения дополнительная референсная спектральная линия представляет ту же самую или более высокую частоту, чем референсная спектральная линия. Эти особенности гарантируют, что оценка минимума и максимума выполняется в соответствующем частотном диапазоне, как и в случае кодера.

В предпочтительном варианте осуществления настоящего изобретения управляющее устройство конфигурируется таким образом, чтобы спектральные линии обратно обработанного спектра, представляющие более низкую частоту, чем референсная спектральная линия, деакцентировались только в том случае, если максимум меньше чем минимум, умноженный на первую заданную величину α. Эти особенности гарантируют, что низкочастотное деакцентирование выполняется только при необходимости, так что рабочая нагрузка декодера может быть минимизирована, и биты не тратятся впустую на перцепционно несоответствующие области во время квантования.

В одном аспекте настоящее изобретение предлагает систему, включающую в себя декодер и кодер, в которой кодер спроектирован в соответствии с настоящим изобретением и/или декодер спроектирован в соответствии с настоящим изобретением.

В одном аспекте настоящее изобретение предлагает способ для кодирования неречевого аудиосигнала так, чтобы произвести из него поток битов, причем этот способ включает в себя этапы:

фильтрования с фильтром кодирования с линейным предсказанием, имеющим множество коэффициентов кодирования с линейным предсказанием, и преобразования фрейма аудиосигнала в частотную область для того, чтобы вывести спектр на основе этого фрейма и коэффициентов кодирования с линейным предсказанием;

вычисления обработанного спектра на основе спектра фи