Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
Иллюстрации
Показать всеГруппа изобретений относится к устройствам и способам кодирования и декодирования аудиосигнала с удалением алиасинга (наложения спектров). Техническим результатом является нейтрализация артефактов алиасинга при прохождении через декодер аудиосигнала. Способ включает этапы: преобразования из временной области в частотную область представления входных звуковых данных с формированием в частотной области представления аудиоконтента; формирования спектра частотного представления аудиоконтента или его предварительно обработанной модификации в зависимости от набора параметров области линейного предсказания для фрагмента аудиоконтента, кодируемого в области линейного предсказания, с получением частотного представления аудиоконтента, рассчитанного по форме спектра; и формирования представления сигнала стимуляции антиалиасинга с получением в результате фильтрации сигнала стимуляции антиалиасинга при учете, по меньшей мере, некоторого множества параметров области линейного предсказания сигнала безалиасингового синтеза с нейтрализацией артефактов наложения спектров (алиасинга) на стороне аудиодекодера. 6 н. и 12 з.п. ф-лы, 25 ил., 8 табл.
Реферат
Область техники
Заявляемое изобретение обеспечивает реализацию декодера аудиосигнала (аудиодекодера), формирующего декодированное представление звуковых данных (аудиоконтента) на основе кодированного представления акустического материала.
Заявляемое изобретение обеспечивает реализацию кодера аудиосигнала, формирующего кодированное представление аудиоконтента, содержащее первый набор спектральных коэффициентов, представление сигнала возбуждения антиалиасинга (задающего сигнала устранения наложения спектров) и множество параметров области линейного предсказания на основе представления входящих звуковых данных.
В заявляемом изобретении предложен способ формирования декодированного представления аудиоконтента на основе кодированного представления акустического материала.
В заявляемом изобретении предложен способ формирования кодированного представления аудиоконтента на основе представления входящего звукового материала.
Частью предлагаемого изобретения является компьютерная программа для осуществления одного из указанных способов.
В предлагаемом изобретении сформулирована концепция унификации оконного взвешивания и переходов между фреймами для гибридного кодирования речи и звука (обозначаемого также аббревиатурой USAC),.
Уровень техники
Далее будут рассмотрены некоторые предпосылки к созданию изобретения, способствующие пониманию его технической сути и преимуществ.
В течение последних десяти лет значительные усилия были направлены на разработку технологий хранения и распространения фонограмм в цифровом виде. Одним из важных достижений на этом пути стало оформление Международного стандарта ISO/IEC 14496-3. Часть 3 этого стандарта касается кодирования и декодирования звукоданных, а подраздел 4 части 3 относится к общему кодированию звука. ISO/IEC 14496 в части 3, подразделе 4, определяет понятие кодирования и декодирования общих звуковых данных (общего аудиоконтента). В дополнение к этому были предложены другие усовершенствования, способствующие повышению качества и/или снижению объема задействуемого вычислительного ресурса. Более того, было установлено, что аудиокодеры, работающие в частотной области, не обеспечивают оптимальный результат при обработке звукового материала, содержащего речь. Недавно был предложен гибридный звуко-речевой кодек, который эффективно интегрировал в себе технологии обоих направлений - кодирование речи и кодирование звука. Подробнее смотри: «A Novel Scheme for Low Bitrate Unified Speech and Audio Coding - MPEG-RMO» [«Новейшая схема гибридного кодирования речи и звука с низким битрейтом - MPEG-RMO»] of M. Neuendorf et al. (presented at the 126th Convention of the Audio Engineering Society, May 7-10, 2009, Munich, Germany).
Такой аудиокодер кодирует часть аудиофреймов в частотной области, а часть аудиофреймов - в области значений линейного предсказания.
Однако, на практике переход между фреймами, закодированными в разных областях, трудно выполнить, не жертвуя значительным вычислительным ресурсом.
В сложившейся ситуации насущным стало создание концепции кодирования и декодирования звукового контента, содержащего как речь, так и общее звуковое наполнение, которая предусматривала бы оптимизацию переходов между фрагментами, закодированными в разных режимах.
Краткое описание изобретения
Заявляемое изобретение обеспечивает реализацию декодера аудиосигнала (аудиодекодера), формирующего декодированное представление аудиоконтента на основе кодированного представления аудиоконтента. В компоновку данного аудиодекодера включен тракт области трансформанты (например, тракт области линейного предсказания с возбуждением, управляемым кодом в трансформанте), в котором формируется представление во временной области звукоданных, закодированных в области трансформанты на базе первого набора спектральных коэффициентов с использованием представления сигнала стимуляции антиалиасинга и множества параметров области линейного предсказания (например, коэффициентов фильтра кодирования с линейным предсказанием). В тракт трансформанты введен спектральный процессор, предназначенный для приложения формы спектра к (первому) набору спектральных коэффициентов, исходя из, по меньшей мере, подмножества параметров области линейного предсказания с получением рассчитанного по форме спектра варианта первой последовательности спектральных коэффициентов. Кроме того, тракт области трансформанты включает в себя (первый) преобразователь из частотной области во временную область, формирующий представление аудиоконтента во временной области на базе рассчитанного по форме спектра варианта первой последовательности спектральных коэффициентов. Наряду с этим в тракт области трансформанты входит фильтр сигнала стимуляции антиалиасинга, рассчитанный на пропускание задающего сигнала компенсации наложения спектров (в виде представления), исходя из, по меньшей мере, некоторого подмножества параметров области линейного предсказания, с выведением из сигнала стимуляции антиалиасинга производного сигнала, синтезированного с устранением алиасинга. Тракт трансформанты также имеет в своем составе блок сведения представления аудиоконтента во временной области и сигнала безалиасингового синтеза или его доработанной постпроцессингом версии с генерацией во временной области сигнала с компенсированным наложением спектров (без алиасинга).
Предложенное конструктивное решение изобретения базируется на определении, что аудиодекодер, который формирует спектр первого набора спектральных коэффициентов в частотной области и который рассчитывает сигнал, синтезируемый с нейтрализацией алиасинга, посредством фильтрования во временной области сигнала стимуляции антиалиасинга, исходя в обоих случаях из параметров области линейного предсказания, надлежащим образом отвечает требованиям переходов между элементами (например, фреймами) аудиосигнала, закодированными с использованием разных видов формирования искажения, и переходов между фреймами, закодированными в разных областях. Таким образом, переходы (допустим, между перекрывающимися или неперекрывающимися фреймами) в структуре аудиосигнала, закодированные в разных режимах многорежимного кодирования звукового сигнала, могут быть реконструированы аудиодекодером с хорошим акустическим качеством при умеренном объеме оверхеда (протокольной информации).
В частности, моделирование спектра первого набора коэффициентов в частотной области позволяет кодировать переходы между фрагментами (фреймами) аудиоконтента, закодированными в разных режимах формирования шума в трансформанте, при этом антиалиасинг выполняется с достаточной эффективностью для переходов между разными элементами аудиоконтента, закодированными с применением разных механизмов формирования шума (например, на базе масштабных коэффициентов и на базе параметров области линейного предсказания). Наряду с этим, названные выше подходы предусматривают существенное сокращение артефактов спектрального наложения между составными частями (такими, как фреймы) аудиоконтента, закодированными в разных областях (предположим, одна - в области трансформанты, а другая - в области линейного предсказания с возбуждением алгебраическим кодом). Пропускание во временной области сигнала, стимулирующего антиалиасинг, дает возможность устранения алиасинга на переходах между фрагментами аудиоконтента, закодированными в режиме линейного предсказания с возбуждением алгебраическим кодом, даже если искажения в текущем фрагменте аудиоконтента (допустим, закодированном в режиме линейного предсказания с возбуждением кодом трансформанты) были компенсированы в частотной области, а не проходят фильтрацию во временной области.
Итак, из вышесказанного следует, что конструктивные решения по заявляемому изобретению предусматривают надлежащий баланс между объемом необходимой служебной информации и должным перцептуальным качеством переходов между участками аудиоконтента, кодированными с использованием трех разных алгоритмов (например, в частотной области, в режиме линейного предсказания с возбуждением кодом трансформанты и в режиме линейного предсказания с возбуждением алгебраическим кодом).
Предпочтительный вариант реализации декодера аудиосигнала представляет собой мультирежимный аудиодекодер, выполненный с возможностью коммутации между множеством режимов кодирования. В данном случае ветвь трансформанты характеризуется тем, что избирательно синтезирует сигнал с компенсацией алиасинга для того фрагмента аудиоконтента, который следует за фрагментом, или за которым следует фрагмент аудиоконтента, где не применим антиалиасинг посредством сложения наложением. Было установлено, что формирование искажения через построение формы спектра первой последовательности спектральных коэффициентов обеспечивает переход между элементами аудиоконтента, закодированными в области трансформанты, и позволяет использовать различные механизмы формирования искажений (в том числе алгоритмы ограничения шума с применением коэффициентов масштабирования и параметров области линейного предсказания) без задействования сигналов антиалиасинга, поскольку использование первого преобразователя сигнала из частотной области во временную область вслед за формированием спектра позволяет эффективно предотвращать наложение спектров последовательных фреймов, закодированных в спектральной области (в трансформанте), даже если для последовательности аудиофреймов используются разные способы формирования искажений. Таким образом, эффективность битрейта достигается за счет селективного пропускания сигнала безалиасингового синтеза только в случаях переходов между элементами аудиоконтента, закодированными не в трансформанте (а, например, в режиме линейного предсказания с управлением алгебраическим кодом).
В предпочтительной версии аудиодекодер выполнен с возможностью переключения с рабочего режима в области линейного предсказания с кодовым возбуждением из трансформанты, в котором используется информация о кодах возбуждения в трансформанте и о параметрах области линейного предсказания, на рабочий режим в частотной области, в котором используются данные спектральных коэффициентов и коэффициентов масштабирования. В этом случае тракт трансформанты выдает первый набор спектральных коэффициентов на основе информации о кодах возбуждения в трансформанте, и выводит параметры области линейного предсказания на основе информации о параметрах области линейного предсказания. Схема декодера аудиосигнала включает в себя тракт частотной области, предназначенный для образования во временной области представления аудиоконтента, закодированного в режиме частотной области с использованием набора спектральных коэффициентов частотной области, описанных в информации о спектральных коэффициентах, с учетом набора масштабных коэффициентов, описанных в информации о коэффициентах масштабирования. Тракт частотной области включает в себя спектральный процессор, предназначенный для приложения формы спектра к набору спектральных коэффициентов частотной области или к их предобработанной модификации с применением масштабных коэффициентов для получения рассчитанной по форме спектра последовательности спектральных коэффициентов в частотной области. Наряду с этим, тракт частотной области включает в себя частотно-временной преобразователь, формирующий представление аудиоконтента во временной области на базе сформированной по спектру последовательности спектральных коэффициентов в частотной области. Аудиодекодер характеризуется тем, что представления во временной области двух последовательных фрагментов аудиоконтента, один из которых закодирован в режиме линейного предсказания с возбуждением кодом из трансформанты, и второй из которых закодирован в частотной области, содержат перекрывание по времени, устраняющее алиасинг во временной области, возникающий в результате преобразования из частотной области во временную.
Как рассматривалось выше, реализуемая концепция изобретения хорошо применима в отношении переходов между фрагментами аудиоконтента, закодированными в режиме линейного предсказания с кодовым возбуждением из трансформанты и в режиме частотной области. Высокое качество антиалиасинга достигается за счет формирования спектра в частотной области в режиме линейного предсказания с кодовым возбуждением из трансформанты.
В предпочтительном конструктивном решении аудиодекодер предусматривает переключение между режимом работы в области линейного предсказания с кодированным в трансформанте возбуждением, где используется информация о кодах возбуждения в трансформанте и информация о параметрах области линейного предсказания, и режимом линейного предсказания с алгебраическим кодовым управлением, где используется информация о алгебраических кодах и информация о параметрах области линейного предсказания. При этом тракт трансформанты выстраивает первую последовательность спектральных коэффициентов на основе информации о кодах возбуждения в трансформанте и выводит параметры области линейного предсказания из информации о параметрах области линейного предсказания. В конструкцию аудиодекодера введен тракт линейного предсказания с алгебраическим кодовым возбуждением, предназначенный для формирования представления во временной области аудиоконтента, закодированного в режиме линейного предсказания с возбуждением алгебраическим кодом (далее обозначаемом сокращенно по-английски ACELP) на основе информации о алгебраических кодах возбуждения и информации о параметрах области линейного предсказания. В предлагаемой компоновке в тракт ACELP включены процессор возбуждения ACELP, генерирующий сигнал возбуждения во временной области на основе информации об алгебраических кодах возбуждения, и фильтр синтеза во временной области, обеспечивающие реконструкцию аудиосигнала на основе сигнала возбуждения во временной области и с использованием коэффициентов пропускания фильтра области линейного предсказания, выведенных из информации о параметрах области линейного предсказания. Тракт области трансформанты выполнен с возможностью избирательного синтеза безалиасингового сигнала для фрагмента аудиоконтента, закодированного в режиме линейного предсказания с возбуждением кодом из трансформанты, следующего за фрагментом аудиоконтента, закодированным в режиме ACELP, и для фрагмента аудиоконтента, закодированного в режиме линейного предсказания с кодовым возбуждением из трансформанты, предшествующего фрагменту аудиоконтента, закодированному в режиме ACELP. Установлено, что сигнал синтеза с нейтрализацией алиасинга оптимально подходит для переходов между сегментами (в частности, фреймами), закодированными в режиме области линейного предсказания с возбуждением кодами из трансформанты (далее обозначаемом английским акронимом TCX-LPD), и - в режиме ACELP.
В предпочтительном варианте исполнения аудиодекодера фильтр сигнала стимуляции антиалиасинга пропускает сигналы активации компенсации наложения спектров в зависимости от параметров фильтра области линейного предсказания, которые соответствуют левосторонней симметричной точке алиасинга первого частотно-временного преобразователя для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, следующего за фрагментом аудиоконтента, закодированным в режиме ACELP. Фильтр сигнала стимуляции антиалиасинга рассчитан на пропускание сигнала возбуждения нейтрализации алиасинга в зависимости от параметров фильтра области линейного предсказания, которые соответствуют правосторонней симметричной точке алиасинга второго частотно-временного преобразователя для фрагмента аудиоконтента, закодированного в режиме TCX-LPD, предшествующего фрагменту аудиоконтента, закодированному в режиме ACELP. Благодаря применению параметров фильтра области линейного предсказания, соответствующих симметричным точкам зеркального наложения спектров, может быть достигнута чрезвычайно эффективная нейтрализация алиасинга. Более того, параметры фильтра области линейного предсказания, которые соответствуют зеркальным точкам алиасинга, как правило, легко доступны, поскольку эти симметричные точки зеркального наложения спектров часто находятся на переходе от одного фрейма к следующему, в силу чего передача названных параметров фильтра области линейного предсказания требуется постоянно. Следовательно, объем оверхеда (потока протокольных данных) сводится к необходимому минимуму.
Далее, декодер аудиосигнала выполняет функцию обнуления значений в памяти фильтра стимуляции антиалиасинга для выработки сигнала безалиасингового синтеза и функцию введения М отсчетов сигнала стимуляции антиалиасинга в фильтр стимуляции антиалиасинга для получения соответствующих отсчетов сигнала безалиасингового синтеза в качестве отклика на ненулевой входной сигнал и, далее, для получения множества отсчетов сигнала безалиасингового синтеза в качестве отклика на нулевой входной сигнал. Комбинатор [в составе аудиодекодера] преимущественно предназначен для сведения представления во временной области аудиоконтента с отсчетами отклика на ненулевой ввод и последующими отсчетами отклика на нулевой ввод с целью генерирования сигнала временной области с компенсированным алиасингом на переходе между фрагментом аудиоконтента, закодированным в режиме ACELP, и фрагментом аудиоконтента, закодированным в режиме TCX-LPD, следующим за фрагментом аудиоконтента, закодированным в режиме ACELP. Благодаря комбинированному использованию отсчетов отклика на ненулевое входящее значение и отсчетов отклика на нулевое входящее значение фильтр сигнала управления нейтрализацией наложения спектров может быть использован весьма эффективно. Кроме того, сигнал с устранением алиасинга может быть синтезирован очень сглаженным при условии сохранения максимально низкого числа требуемых отсчетов сигнала стимуляции антиалиасинга. Более того, было установлено, что при применении вышеуказанного подхода форма сигнала, синтезированного с устранением алиасинга, может быть очень хорошо адаптирована к типичным артефактам алиасинга. Таким образом достигается сбалансированное соотношение между эффективностью кодирования и компенсацией эффекта наложения спектров (алиасинга).
В предпочтительном варианте аудиодекодер выполнен с возможностью комбинирования оконной (взвешенной) и свернутой (симметрично сложенной) версии, по меньшей мере, одного сегмента представления во временной области, сгенерированного в режиме ACELP, с представлением во временной области следующего сегмента аудиоконтента, сгенерированного в режиме TCX-LPD, с целью, хотя бы, частичной нейтрализации алиасинга. Выявлено, что применение подобных механизмов предотвращения наложения спектров в дополнение к генерации сигнала безалиасингового синтеза обеспечивает возможность компенсации алиасинга при очень эффективном битрейте. В частности, требуемый сигнал активации антиалиасинга может быть закодирован с высокой эффективностью, если к сигналу, синтезируемому с устранением алиасинга, при нейтрализации алиасинга будет дополнительно применена оконно-взвешенная и симметрично свернутая версия, по крайней мере, одного фрагмента представления во временной области, полученного с использованием режима ACELP.
Предпочтительное конструктивное решение предусматривает способность аудиодекодера комбинировать взвешенную версию нулевой импульсной характеристики синтезирующего фильтра ветви ACELP с представлением во временной области следующего фрагмента аудиоконтента, сгенерированного в режиме TCX-LPD, с целью, как минимум, частично нейтрализовать алиасинг. Исследования показали, что использование такой нулевой импульсной характеристики может также помочь повысить эффективность кодирования сигнала стимуляции антиалиасинга, поскольку нулевая импульсная характеристика синтезирующего фильтра ветви ACELP обычно компенсирует, по меньшей мере, часть наложения спектров в сегменте аудиоконтента, кодированном в TCX-LPD. Соответственно, энергия сигнала безалиасингового синтеза снижается, что, в свою очередь, ведет к снижению энергии сигнала стимуляции антиалиасинга. Однако, кодирование сигналов с меньшим уровнем энергии, как правило, возможно при сниженных требованиях к скорости передачи данных.
В предпочтительном варианте исполнения аудиодекодер предусматривает переключение между режимом TCX-LPD, где используют частотно-временное преобразование «вершин» [Λ], и режимом частотной области, где используют частотно-временное преобразование «ветвей (/лучей)» [Λ], а также - режимом линейного предсказания с алгебраическим кодовым управлением. В этом случае аудиодекодер предусматривает возможность, по меньшей мере, частичной компенсации алиасинга на переходе от фрагмента аудиоконтента, закодированного в режиме TCX-LPD, к фрагменту аудиоконтента, закодированному в режиме частотной области путем выполнени операции наложения и сложения временных отсчетов последовательных перекрывающихся фрагментов аудиоконтента. Кроме того, аудиодекодер предусматривает возможность, по меньшей мере, частичной компенсации алиасинга на переходе от фрагмента аудиоконтента, закодированного в режиме TCX-LPD к фрагменту аудиоконтента, закодированному в режиме ACELP, с использованием сигнала безалиасингового синтеза. Установлено также, что декодер аудиосигнала полностью соответствует требованиям коммутации между различными рабочими режимами для эффективного устранения алиасинга.
В предпочтительной версии исполнения декодер аудиосигнала предусматривает использование общего коэффициента усиления для масштабного пересчета коэффициентов усиления представления во временной области, формируемого первым частотно-временным преобразователем в тракте трансформанты (например, в тракте TCX-LPD), и для масштабного пересчета коэффициентов усиления сигнала стимуляции антиалиасинга или сигнала безалиасингового синтеза. Расчеты показывают, что применение одного и того же общего коэффициента усиления как для масштабирования представления во временной области, выполняемого первым частотно-временным преобразователем, так и для масштабирования задающего сигнала компенсации наложения спектров или сигнала, синтезируемого с устранением наложения спектров, позволяет снизить скорость передачи данных на переходах между фрагментами аудиоконтента, закодированными в разных режимах. Это имеет очень большое значение, поскольку при кодировании сигнала активации антиалиасинга в условиях перехода между блоками аудиоконтента, закодированными в разных режимах, потребности в битрейте возрастают.
Предпочтительное конструктивное решение аудиодекодера предусматривает в дополнение к функции формирования спектра, выполняемой в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания, применение функции «де-формировáния» (деконфигурирования) спектра в соответствии с, по меньшей мере, подмножеством первого набора спектральных коэффициентов. В такой ситуации аудиодекодер предусматривает де-формирование спектра, по крайней мере, того подмножества из набора спектральных коэффициентов антиалиасинга, которое является исходным для производного сигнала стимуляции антиалиасинга. Приложение функции деконфигурирования спектра одновременно к первому ряду коэффициентов спектрального разложения и к спектральным коэффициентам антиалиасинга, исходным для производного задающего сигнала антиалиасинга, обеспечивает гарантию, что сигнал, синтезированный с устранением алиасинга, будет адекватно адаптирован к «основному» сигналу аудиоконтента, генерируемому первым частотно-временным преобразователем. При этом вновь повышается эффективность кодирования сигнала стимуляции антиалиасинга.
В предпочтительной компоновке в схему декодера аудиосигнала введен второй частотно-временной преобразователь, генерирующий представление сигнала стимуляции антиалиасинга во временной области в зависимости от набора спектральных коэффициентов, представляющих сигнал стимуляции антиалиасинга. В этом случае первый частотно-временной преобразователь выполняет преобразование с перекрытием (наложением), в которое попадает алиасинг во временной области. Второй частотно-временной преобразователь выполняет преобразование без перекрытия. Соответственно, благодаря использованию преобразования с перекрытием при синтезе „главного» сигнала поддерживается надлежащая эффективность кодирования. Тем не менее, нейтрализация алиасинга достигается благодаря использованию дополнительного преобразования из частотной области во временную без перекрывания. И все же, установлено, что комбинированное преобразование из частотной области во временную с перекрыванием и без перекрывания обеспечивает более эффективное кодирование переходов, чем только частотно-временное преобразование без перекрывания.
Заявляемое изобретение включает в себя варианты реализации кодера аудиосигнала (аудиокодера), предназначенного для формирования кодированного представления звукового материала (аудиоконтента), которое включает в себя первую последовательность спектральных коэффициентов, представление сигнала стимуляции антиалиасинга и множество параметров области линейного предсказания на базе входящего представления аудиоконтента. В компоновку аудиокодера введен преобразователь из временной области в частотную область, выполняющий обработку входного представления массива акустических данных с формированием на выходе его представления в частотной области. В состав аудиокодера также введен спектральный процессор для приложения формы спектра к набору спектральных коэффициентов или к их предобработанной версии в зависимости от набора параметров области линейного предсказания для фрагмента аудиоконтента, который должен быть закодирован в области линейного предсказания, с формированием частотного представления, смоделированного по форме спектра аудиоконтента. Кроме того, в кодер аудиосигнала введен драйвер доступа к данным антиалиасинга, формирующий представление сигнала стимуляции антиалиасинга таким образом, чтобы в результате фильтрации сигнала стимуляции антиалиасинга в зависимости от, по меньшей мере, подмножества параметров области линейного предсказания был генерирован сигнал безалиасингового синтеза, обеспечивающий устранение артефактов алиасинга на стороне декодера аудиосигнала.
Обсуждаемый здесь кодер аудиосигнала полностью совместим с описанным выше декодером аудиосигнала. В частности, кодер аудиосигнала формирует такое представление звукового материала, которое позволяет удерживать в рационально низких пределах избыточность битрейта, которая необходима для нейтрализации алиасинга на переходах между фрагментами (например, фреймами или подфреймами) аудиоконтента, закодированными в разных режимах.
Еще одной составляющей заявляемого изобретения является способ формирования декодированного представления аудиоконтента и способ формирования кодированного представления звукового материала (аудиоконтента). Названные способы базируются на тех же принципах, что и рассмотренные выше аппаратные средства.
Заявляемое изобретение включает в себя создание компьютерных программ осуществления указанных способов. Компьютерные программы также основаны на представленной выше концепции.
Краткое описание фигур
Далее, варианты конструктивных решений заявляемого изобретения будут рассмотрены со ссылкой на прилагаемые фигуры, где: на фиг.1 показана принципиальная блочная схема реализации кодера аудиосигнала в соответствии с данным изобретением; на фиг.2А и 2B представлена принципиальная блочная схема реализации декодера аудиосигнала в соответствии с данным изобретением; на фиг.3А представлена принципиальная блочная схема образца декодера аудиосигнала согласно рабочей версии 4 проекта стандарта по «гибридному кодированию речи и звука» (USAC); на фиг.3B представлена принципиальная блочная схема другого варианта решения декодера аудиосигнала в соответствии с данным изобретением; на фиг.4 дано графическое представление образцов оконных переходов в соответствии с рабочей версией 4 проекта стандарта USAC; на фиг.5 схематически представлены возможные варианты оконных переходов при осуществлении кодирования аудиосигнала согласно изобретению; на фиг.6 представлена обзорная таблица всех типов окон, используемых аудиокодером или аудиодекодером, реализованными в соответствии с данным изобретением; на фиг.7 представлена таблица возможных оконных последовательностей, используемых аудиокодером или аудиодекодером, реализованными в соответствии с данным изобретением; на фиг.8А, 8B, 8C, 8D детализирована принципиальная блочная схема реализации кодера аудиосигнала в соответствии с изобретением; на фиг.9А, 9B, 9C, 9D детализирована принципиальная блочная схема реализации декодера аудиосигнала в соответствии с изобретением; на фиг.10 схематически представлены варианты операции декодирования переходов от и к ACELP с упреждающим антиалиасингом (РАС);на фиг.11 представлена схема вычисления кодером целевого РАС; на фиг.12 представлена схема квантования целевого РАС в контексте формирования искажения в частотной области (FDNS); в таблице 1дан перечень условий введения в битстрим вариантов фильтра LPC; на фиг.13 представлена принципиальная блочная схема обратного квантователя взвешенного алгебраического LPC-кодирования; в таблице 2 дан перечень возможных абсолютных и относительных видов квантования и соответствующей сигнализации „mode_lpc» в битстриме; в таблице 3 дан перечень режимов кодирования для номеров nk кодового словаря; в таблице 4 представлен нормирующий множитель (коэффициент нормализации) W для алгебраического векторного квантования (AVQ); в таблице 5 представлено построение кодовых соответствий средней энергии возбуждения E ¯ , в таблице 6 представлено число спектральных коэффициентов как функция от «mod[]»; на фиг.14 представлен синтаксис потока канала частотной области «fd_channel_stream()»; на фиг.15А, 15B представлен синтаксис потока канала частотной области «lpd_channel_stream()»; и на фиг.16 представлен синтаксис данных прямого антиалиасинга «fac_data()».
Подробное техническое описание
1. Декодер аудиосигнала на фиг.1
На фиг.1 дана принципиальная блочная схема реализации кодера аудиосигнала (аудиокодера) 100 в соответствии с изобретением. Аудиокодер 100 принимает входное представление 110 аудиоконтента и на его базе генерирует кодированное представление 112 аудиоконтента. Кодированное представление 112 аудиоконтента включает в себя первый набор 112а спектральных коэффициентов, массив параметров области линейного предсказания 112b и представление 112 с сигнала стимуляции антиалиасинга.
В состав аудиокодера 100 входит преобразователь сигнала из временной области в частотную область (время-частотный преобразователь) 120, пересчитывающий входное представление 110 аудиоконтента (или его вариант, прошедший предварительную обработку - препроцессинг 110') в частотное представление 122 аудиоконтента (которое может иметь форму набора коэффициентов спектрального разложения).
Кроме того, аудиокодер 100 включает в свой состав спектральный процессор 130, который формирует спектр частотного представления 122 аудиоконтента, или его модификации 122' в результате препроцессинга, с учетом набора 140 параметров области линейного предсказания для фрагмента аудиоконтента, который подлежит кодированию в области линейного предсказания, с формированием в частотной области представления аудиоконтента, рассчитанного по форме спектра 132. Первый набор 112а спектральных коэффициентов может быть идентичен частотному представлению 132, рассчитанному по форме спектра аудиоконтента, или может быть выведен из него же.
Аудиокодер 100 также включает в себя драйвер доступа 150 к данным антиалиасинга, формирующий представление 112 с задающего сигнала антиалиасинга таким образом, что пропускание сигнала активации антиалиасинга в зависимости от, хотя бы, подмножества параметров области линейного предсказания 140 обеспечивает синтез безалиасингового сигнала 112b с устранением артефактов наложения спектров на стороне декодера аудиосигнала.
Следует обратить внимание на то, что параметры области линейного предсказания 112b могут, в том числе, быть идентичными параметрам области линейного предсказания 140.
Аудиокодер 100 формирует поток данных, полностью отвечающий требованиям реконструкции аудиоконтента, даже если разные фрагменты (допустим, фреймы или субфреймы) аудиоконтента закодированы в различных режимах. Например, для фрагмента аудиоконтента, закодированного в области линейного предсказания в режиме линейного предсказания с возбуждением кодом трансформанты, моделирование спектра, сопровождаемое формированием искажения, что обеспечивает квантование аудиоконтента с относительно невысоким битрейтом, осуществляют после преобразования из временной области в частотную область (время-частотного преобразования). Это дает возможность выполнять компенсирующее алиасинг сложение наложением фрагмента аудиоконтента, закодированного в области линейного предсказания, с предыдущим или последующим фрагментом аудиоконтента, закодированным в частотной области. Задействование параметров области линейного предсказания 140 способствует построению формы спектра, хорошо адаптированной к аудиоконтенту, подобному речи, обеспечивая высокую эффективность его кодирования. В дополнение к этому представление сигнала активации антиалиасинга обеспечивает действенную нейтрализацию эффекта наложения спектров (алиасинга) на переходах между фрагментами (например, фреймами или подфреймами) звукового контента, закодированными в режиме линейного предсказания с алгебраическим кодовым возбуждением. Благодаря учету параметров области линейного предсказания при формировании представления сигнала активации антиалиасинга такое представление является особенно эффективным и может быть декодировано на стороне декодера, учитывающего параметры области линейного предсказания, которые в любом случае присутствуют в декодере.
Исходя из сказанного, кодер аудиосигнала 100 характеризуется полным соответствием требованиям переходов между фрагментами аудиоконтента, закодированными в разных режимах кодирования, и возможностью предоставления антиалиасинговой информации в особо компактной форме.
2. Декодер аудиосигнала на фиг.2А и 2B
На фиг.2А и 2B отображена принципиальная блочная схема реализации декодера аудиосигнала (аудиодекодера) 200 в соответствии с изобретением. Аудиодекодер 200 служит для приема кодированного представления 210 аудиоконтента и формирования на его базе декодированного представления 212 аудиоконтента, например, в форме сигнала временной области с компенсированным алиасингом.
Аудиодекодер 200 включает в себя тракт области трансформанты (например, тракт области линейного предсказания с кодовым возбуждением в трансформанте), функцией которого является формирование представления во временной области 212 звукового материала, закодированного в трансформанте на базе первого набора 220 спектральных коэффициентов, представления 224 сигнала возбуждения антиалиасинга и множества параметров области линейного предсказания 222. В состав тракта трансформанты входит спектральный процессор 230, предназначенный для приложения формы спектра к (первому) набору 220 спектральных коэффициентов, исходя из, по меньшей мере, некоторого подмножества параметров области линейного предсказания 222 с получением рассчитанного по форме спектра варианта 232 первой последовательности 220 спектральных коэффициентов. Кроме того, тракт в области трансформанты включает в себя (первый) преобразователь из частотной области во временную область 240, формирующий представление