Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений

Иллюстрации

Показать все

Изобретение относится к области кодирования аудио сигналов, а именно к области кодирования аудио сигналов с низким битрейтом. Технический результат заключается в обеспечении вариативности на этапе предварительной обработки, улучшении качества и низкого битрейта выходного сигнала. Такой результат достигается тем, что аудио кодер включает первую ветвь кодирования спектральной области; вторую ветвь кодирования LPC-области; переключатель между первой и второй ветвями кодирования; вторая ветвь кодирования включает конвертер, который выполняет преобразование данных в определенную область, отличную от временной области, таким образом, на этапе LPC-анализа генерируется сигнал возбуждения; вторая ветвь кодирования включает ветвь обработки LPC-области, и спектральную область - ветвь обработки спектральной LPC-области и дополнительный переключатель между ветвью кодирования LPC-области и ветвью кодирования особой спектральной области. Аудио декодер, включающий первую область - ветвь декодирования спектральной области, вторую область - ветвь декодирования LPC-области, и третью область - LPC-спектральную декодирующую ветвь; третья область появляется в результате частотного преобразования из второй области. 7 н. и 19 з.п. ф-лы, 10 ил.

Реферат

Область техники, к которой относится изобретение

Изобретение относится к области кодирования аудио сигналов, а именно к области кодирования аудио сигналов с низким битрейтом.

Предпосылки создания изобретения и уровень техники

В данной области техники известны такие системы кодирования частотной области, как МР3 и ААС. Работа кодеров частотной области включает этап преобразования данных из временной области в частотную область, последующий этап квантования, при котором ошибка квантования контролируется на основе информации из психоакустического модуля, и этап кодирования, в ходе которого спектральные коэффициенты квантования и соответствующая служебная информация кодируются по методу энтропии при помощи кодовых таблиц.

С другой стороны, существуют кодеры, которые хорошо подходят для обработки речи, такие как AMR-WB+, описанные в 3GPP TS 26.290. Подобные схемы кодирования речи выполняют фильтрование временного сигнала с линейным предсказанием. Фильтрование с линейным предсказанием получило название от анализа входного временного сигнала с линейным предсказанием. Полученные коэффициенты LP фильтрования затем подвергаются квантованию/кодированию и передаются как служебная информация. Этот процесс известен как кодирование с линейным предсказанием (LPC). На выходе фильтра разностный сигнал предсказания или сигнал ошибки предсказания, который также называется сигнал возбуждения, кодируется при помощи кодера ACELP, использующего метод анализа через синтез, или кодера преобразований, который применяет преобразование Фурье с наложением. Решение о применении метода кодирования ACELP или ТСХ (Transform Coded eXcitation coding) принимается на основе алгоритма замкнутого или открытого цикла.

Системы аудио кодирования частотной области, такие как высокоэффективная система ААС, позволяют комбинировать саму систему кодирования ААС с методом репликации спектральной полосы и устройством кодирования объединенных стерео или многоканальных аудио сигналов, известных как "MPEG surround".

С дугой стороны, системы кодирования речи, такие как AMR-WR+, включают этап коррекции высоких частот и применяются для стерео сигналов.

Системы кодирования частотной области имеют преимущество благодаря тому, что обеспечивают высокое качество музыкальных сигналов при низком битрейте. Однако качество речевых сигналов с низким битрейтом остается невысоким. Использование систем кодирования речи приводит к высокому качеству речевых сигналов с низким битрейтом, но качество музыкальных сигналов с низким битрейтом оказывается низким.

Краткое описание

Задачей настоящего изобретения является усовершенствование концепции кодирования/декодирования.

Поставленная задача достигается благодаря аудио кодеру согласно п.1, методу аудио кодирования согласно п.15, декодеру согласно п.16, методу декодирования согласно п.23, кодированному сигналу согласно п.24 и компьютерной программе согласно п.25.

Первой частью изобретения является аудио кодер для кодирования входящего аудио сигнала, который находится в исходной области. Аудио кодер включает: первую кодирующую ветвь для кодирования аудио сигнала при помощи первого кодирующего алгоритма, в результате чего генерируется первый кодированный сигнал; вторую ветвь кодирования для кодирования аудио сигнала при помощи второго кодирующего алгоритма, в результате чего генерируется второй кодированный сигнал, при этом первый кодирующий алгоритм отличается от второго кодирующего алгоритма; первый переключатель для перехода от первой ветви кодирования ко второй ветви кодирования для того, чтобы порция входного аудио сигнала на выходе кодера стала кодированным сигналом первого или второго типа; вторая ветвь кодирования включает: конвертер для преобразования аудио сигнала во вторую область, отличную от первой области; первую ветвь обработки для обработки аудио сигнала во второй области для получения первого обработанного сигнала; вторую ветвь обработки для преобразования сигнала в третью область, отличную от первой и второй областей, а также для обработки сигнала в третьей области, в результате чего получается второй обработанный сигнал; второй переключатель для переключения между первой ветвью обработки и второй ветвью обработки, благодаря этому часть входного аудио сигнала направляется на вторую ветвь кодирования, таким образом, либо первый обработанный сигнал, либо второй обработанный сигнал становится вторым кодированным сигналом.

Второй частью изобретения является декодер для декодирования кодированного аудио сигнала, кодированный аудио сигнал содержит первый кодированный сигнал, первый обработанный сигнал во второй области и второй обработанный сигнал в третьей области; первый кодированный сигнал, первый обработанный сигнал и второй обработанный сигнал относятся к разным временным порциям декодированного аудио сигнала; первая, вторая и третья области отличаются друг от друга.

Декодер включает: первую ветвь декодирования для декодирования первого кодированного сигнала на основе первого алгоритма кодирования; вторую ветвь декодирования, канал для декодирования первого или второго обработанного сигнала; вторая ветвь декодирования включает первую ветвь инверсной обработки для инверсной обработки первого обработанного сигнала, в результате чего получается первый инвертированный сигнал во второй области; вторую ветвь инверсной обработки для обработки второго обработанного сигнала, в результате чего получается второй инвертированный сигнал во второй области; первый блок объединения для соединения первого и второго инвертированного сигналов, в результате чего получается объединенный сигнал во второй области; конвертер для преобразования объединенного сигнала в первую область; второй блок объединения для соединения конвертированного сигнала в первой области и декодированного первого сигнала на выходе первой ветви декодирования, в результате чего получается декодированный выходной сигнал в первой области.

Предпочтительная форма осуществления настоящего изобретения имеет два последовательно расположенных переключателя. Первый переключатель выбирает между кодированием в спектральной области с применением кодера спектральной области и кодированием в LPC-области, то есть обработки сигнала на выходе этапа LPC-анализа. Второй переключатель применяется для переключения в LPC-области для того, чтобы кодировать сигнал LPC-области в самой LPC-области при помощи кодера ACELP или кодировать сигнал в спектральной LPC-области, для чего необходим конвертер для преобразования сигнала LPC-области в спектральную LPC-область, которая отличается от спектральной области, так как спектральная LPC-область показывает спектр фильтрованного LPC-сигнала, а не спектр сигнала временной области.

Первый переключатель выбирает одну из двух ветвей обработки, одна ветвь основывается на модели приемника и/или психоакустической модели, то есть на воспринимаемых на слух наложениях звука, вторая ветвь основывается на модели источника и сегментных вычислениях SNR. Например, одна ветвь включает кодер частотной области, вторая ветвь включает LPC-кодер, а именно речевой кодер. Модель источника обычно представляет собой обработку речи, поэтому обычно используется LPC.

Второй переключатель выбирает между двумя ветвями обработки, но в области, отличной от области «внешней» первой ветви. Необходимо повторить, что одна «внутренняя» ветвь, в основном, основывается на модели источника или на SNR-вычислениях, вторая «внутренняя» ветвь может основываться на модели приемника и/или психоакустической модели, то есть на маскировке, или, по крайней мере, включает параметры кодирования частотной/спектральной области.

Например, одна «внутренняя» ветвь включает кодер частотной области/спектральный конвертер, вторая ветвь включает кодер, кодирующий в другой области, такой как LPC-область; этот кодер представляет собой, например, CELP или ACELP квантователь/скейлер, который обрабатывает входной сигнал без спектрального преобразования.

Следующая предпочтительная форма осуществления настоящего изобретения представляет собой аудио кодер, включающий первую ветвь кодирования, ориентированную на данные приемника, а именно ветвь кодирования спектральной области; вторую ветвь кодирования, ориентированную на данные источника или SNR-данные, а именно ветвь кодирования LPC-области; переключатель между первой и второй ветвями кодирования; вторая ветвь кодирования включает конвертер, который выполняет преобразование данных в определенную область, отличную от временной области, таким образом, на этапе LPC-анализа генерируется сигнал возбуждения; вторая ветвь кодирования далее включает такую особую область, как ветвь обработки LPC-области, и особую спектральную область - ветвь обработки спектральной LPC-области; и дополнительный переключатель между ветвью кодирования LPC-области и ветвью кодирования особой спектральной области.

Следующая форма осуществления настоящего изобретения представляет собой аудио декодер, включающий первую область - ветвь декодирования спектральной области, вторую область - ветвь декодирования LPC-области, которая декодирует такие сигналы, как сигнал возбуждения во второй области, и третью область - LPC-спектральную декодирующую ветвь, которая декодирует такие сигналы, как сигнал возбуждения в третьей области, то есть LPC-спектральной области; третья область появляется в результате частотного преобразования из второй области; декодер также имеет первый переключатель между сигналом второй области и сигналом третьей области и второй переключатель между декодером первой области и декодером второй или третьей области.

Краткое описание чертежей

Предпочтительные формы осуществления настоящего изобретения последовательно описываются в соответствии с прилагаемыми схемами:

Фиг.1а - схема системы кодирования в соответствии с первой частью настоящего изобретения;

Фиг.1b - схема системы декодирования в соответствии с первой частью настоящего изобретения;

Фиг.1с - схема системы кодирования в соответствии со следующим аспектом настоящего изобретения;

Фиг.2а - схема системы кодирования в соответствии со второй частью настоящего изобретения;

Фиг.2b - схема системы декодирования в соответствии со второй частью настоящего изобретения;

Фиг.2с - схема системы кодирования в соответствии со следующим аспектом настоящего изобретения;

Фиг.3а показывает схему кодирования в соответствии со следующим аспектом настоящего изобретения;

Фиг.3b показывает схему декодирования в соответствии со следующим аспектом настоящего изобретения;

Фиг.3с схематично представляет устройство/метод кодирования с каскадными переключателями;

Фиг.3d схематично представляет устройство/метод декодирования, где применяются каскадные блоки объединения;

Фиг.3е схематично показывает сигнал во временной области и соответствующую репрезентацию кодированного сигнала, а также небольшие зоны плавного перехода для обоих кодированных сигналов;

Фиг.4а показывает схему с переключателем, который расположен перед ветвями кодирования;

Фиг.4b показывает схему системы кодирования с переключателем, который расположен за ветвями кодирования;

Фиг.4с показывает схему предпочтительной формы реализации изобретения с блоком объединения;

Фиг.5а показывает форму волны речевого сегмента во временной области как квазипериодического или импульсного сигнального сегмента;

Фиг.5b показывает спектр сегмента Фиг.5а;

Фиг.5с показывает сегмент невокализованной речи во временной области в качестве примера шумоподобного сегмента;

Фиг.5d показывает спектр формы волны во временной области в соответствии с Фиг.5с;

Фиг.6 схематично показывает метод анализа через синтез, используемый кодером CELP;

Фиг.7a-7d схематично показывают вокализованные/невокализованные сигналы возбуждения в качестве примеров импульсных сигналов;

Фиг.7е показывает этап LPC со стороны кодера, который обеспечивает данные о кратковременном прогнозировании и ошибке предсказания сигнала (возбуждения);

Фиг.7f показывает форму реализации устройства LPC для генерации взвешенного сигнала;

Фиг.7g показывает форму реализации изобретения, при которой происходит преобразование взвешенного сигнала в сигнал возбуждения в результате применения инверсного взвешивания и последующий анализ сигнала возбуждения, как этого требует конвертер 537 на Фиг.2b;

Фиг.8 показывает схему объединенного многоканального алгоритма в соответствии с формой реализации настоящего изобретения;

Фиг.9 показывает предпочтительную форму реализации алгоритма расширения полосы частот;

Фиг.10а показывает детальное описание переключателя при выполнении переключения по незамкнутому циклу;

Фиг.10b показывает описание переключателя при выполнении переключения по замкнутому циклу.

Описание изобретения

Фиг.1а показывает форму реализации изобретения, имеющую два каскадных переключателя. На вход переключателя 200 поступают моно сигнал, стерео сигнал или многоканальный сигнал. Переключатель 200 контролируется блоком принятия решений 300. Блок принятия решений получает на входе сигнал, поступающий также в блок 200. Кроме этого, блок принятия решений 300 может также получать служебную информацию, которая включена в поступающий моно, стерео или многоканальный сигнал или которая соотносится с ним. Служебная информация может, например, поступать от устройства, из которого исходит моно, стерео или многоканальный сигнал.

Блок принятия решений 300 приводит в действие переключатель 200, который направляет сигнал либо по ветви частотного кодирования 400, которая показана как верхняя ветвь на фиг.1а, либо по ветви кодирования в LPC-области 500, которая показана как нижняя ветвь на фиг.1а. Основным элементом ветви кодирования в частотной области является блок спектрального преобразования 410, который выполняет преобразование обычного выходного сигнала (этот вопрос будет обсуждаться далее) в спектральную область. Блок спектрального преобразования может применять алгоритмы MDCT, QMF и FFT, вейвлет-анализ и банк фильтров, например многополосный банк фильтров, который имеет определенное количество каналов, где каждый сигнал поддиапазона имеет вещественное или комплексное значение. Сигнал на выходе спектрального преобразователя 410 кодируется с помощью спектрального аудио кодера 421, который может включать блоки обработки согласно системе кодирования ААС.

В целом ветвь обработки 400 представляет собой обработку сигнала на основе модели восприятия или модели приемника. Поэтому эта ветвь моделирует систему восприятия звука человеком, которая воспринимает звук. В отличие от нее ветвь обработки сигнала 500 генерирует сигнал в стадии возбуждения, затухания или в области LPC. В обобщенном виде ветвь обработки 500 представляет собой обработку в условиях речевой модели или модели генерирования информации. Для речевых сигналов эта модель представляет собой модель воспроизводства речи/звука человеком. Однако если звук имеет другие характеристики, поступает от иного источника и кодированию подвергается другая модель, то ветвь обработки 500 также может отличаться. На нижней ветви кодирования 500 основным элементом является блок LPC 510, на выходе которого генерируются LPC-данные, контролирующие параметры LPC-фильтров. Эти LPC-данные передаются в декодер. На этапе блока LPC 510 выходной сигнал является сигналом LPC-области, который состоит из сигнала возбуждения и/или взвешенного сигнала. Блок LPC, как правило, генерирует на выходе сигнал LPC-области, который может быть любым сигналом в области LPC, таким как сигнал возбуждения, показанный на Фиг.7е, или взвешенный сигнал, показанный на Фиг.7f, или любой другой сигнал, который генерируется с применением коэффициентов LPC-фильтров. Кроме этого, блок LPC может также определять и квантовать/кодировать эти коэффициенты.

На этапе принятия решения учитывается тип сигнала, блок принятия решений определяет музыкальные/речевые сигналы и таким образом контролирует переключатель 200: музыкальные сигналы направляются по верхней ветви 400, а речевые сигналы - по нижней ветви 500. В одной из форм реализации настоящего изобретения блок принятия решений направляет свою информацию на выход битового потока, чтобы декодер мог использовать эти данные для корректного выполнения процедуры декодирования. Такой декодер показан на фиг.1b. Сигнал на выходе спектрального аудио кодера 421 после передачи становится входным сигналом спектрального аудио декодера 431. Выходной сигнал спектрального аудио декодера 431 является входным сигналом конвертера временной области 440. Аналогичным образом сигнал на выходе ветви кодирования LPC-области 500 на фиг.1а принимается на стороне декодера и обрабатывается элементами 531, 533, 534 и 532 для получения LPC-сигнала возбуждения. LPC-сигнал возбуждения является входным сигналом для синтезирующего LPC-блока 540, который далее принимает в качестве входного сигнала параметры LPC, генерируемые соответствующим блоком LPC-анализа 510. Выходной сигнал конвертера временной области 440 и/или выходной сигнал синтезирующего LPC-блока 540 поступают на вход переключателя 600. Переключатель 600 контролируется управляющим сигналом, который создается, например, блоком принятия решений 300, или поступает извне от источника исходного моно, стерео или многоканального сигнала. Выходным сигналом переключателя 600 является моно, стерео или многоканальный сигнал.

Входным сигналом переключателя 200 и блока принятия решений 300 может быть моно, стерео или многоканальный сигнал или общий аудио сигнал. В зависимости от выбора, который принимается на основе входного сигнала, поступающего в переключатель 200, или любого другого внешнего источника, каким может быть сигнал, поступающий от генератора исходного сигнала совместно с входным сигналом в переключатель 200, переключатель 200 выбирает между ветвью частотного кодирования 400 и ветвью LPC-кодирования 500. Ветвь частотного кодирования 400 включает блок спектрального преобразования 410 и последующий блок дискретизации/кодирования 421. Блок дискретизации/кодирования может обладать любыми функциональными возможностями, которыми обладают современные частотные кодеры, такие как кодер ААС. Кроме этого, этап квантования, производимый блоком квантования/кодирования 421, может контролироваться с помощью психоакустической модели, которая генерирует такую психоакустическую информацию, как порог маскировки над частотой, и передает ее на вход блока 421.

Выходной канал переключателя на ветви кодирования LPC обрабатывается блоком LPC-анализа 510, который генерирует служебные данные LPC и LPC-сигнал. Согласно изобретению, кодер сигнала возбуждения имеет дополнительный переключатель, который направляет для дальнейшей обработки LPC-сигнал либо в блок квантования/кодирования 522, либо в блок квантования/кодирования 524, который обрабатывает спектральные значения в LPC-области. В этом случае сигнал проходит через спектральный преобразователь 523, а затем направляется на вход блока квантования/кодирования 524. Переключатель 521 управляется в режиме открытого цикла или закрытого цикла в зависимости от настроек, которые описываются, например, в технической спецификации AMR-WB+.

В режиме управления закрытого цикла кодер дополнительно имеет блок инверсного квантования/кодирования 531 для LPC-сигнала, блок инверсного квантования/кодирования 533 для спектрального LPC-сигнала и инверсный спектральный конвертер 534 для выходного сигнала блока 533. Как кодированные сигналы, так и декодированные сигналы всех направлений обработки второй ветви кодирования направляются на вход блока управления переключателем 525. В блоке управления переключателем два выходных сигнала сравниваются друг с другом и/или целевой функцией, либо целевая функция вычисляется на основе сравнения отклонений обоих сигналов. В этом случае сигнал, имеющий меньшие отклонения, становится основой для выбора, который принимает переключатель 521. В том случае, если обе ветви имеют нестабильный битрейт, выбирается та ветвь, которая имеет более низкий битрейт, даже если соотношение сигнал/шум этой ветви ниже, чем такое же соотношение другой ветви. Кроме этого, целевая функция может применять в качестве входного сигнала соотношение сигнал/шум каждого сигнала и битрейт каждого сигнала и/или дополнительные критерии для того, чтобы прийти к лучшему решению и соответствовать определенной цели. Например, если целью является максимально низкий битрейт, тогда целевая функция будет, в основном, основываться на битрейте обоих сигналов на выходе элементов 531, 534.

Однако когда целью является получение максимального качества для определенного битрейта, тогда блок управления переключателем 535 может, например, отклонять сигналы, которые имеют битрейт выше или ниже установленного показателя. Блок управления будет также выбирать сигналы, имеющие лучшее соотношение сигнал/шум, то есть те сигналы, которые имеют наименьшие отклонения по показателям квантования/кодирования.

Схема декодирования в соответствии с настоящим изобретением, как было указано выше, показана на фиг.1b. Для трех возможных типов выходных сигналов существуют отдельные блоки декодирования/аналогового преобразования 431, 531 или 533. Блок 431 имеет на выходе спектральные данные, которые преобразовываются во временную область при помощи частотно-временного конвертера 440, блок 531 имеет на выходе сигнал LPC-области. И блок 533 имеет на выходе спектральные данные LPC. На входе переключателя 532 принимаются только LPC-сигналы, поэтому спектральные LPC-данные проходят через блок преобразования 534. Выходной сигнал переключателя 532 преобразовывается обратно во временную область при помощи LPC-синтезатора 540, который управляется при помощи LPC-параметров, которые генерируются на стороне кодера и передаются в декодер. Следом за блоком 540 обе ветви декодирования принимают параметры временной области, которые применяются в соответствии с управляющим сигналом. В итоге генерируется аудио сигнал, который может быть моно, стерео или многоканальным сигналом в соответствии с тем сигналом, который поступал на вход схемы кодирования на фиг.1а.

Фиг.1с показывает форму реализации изобретения с иной структурой переключателя 521, которая подобна структуре на фиг.4b.

Фиг.2а показывает предпочтительную схему кодирования в соответствии со второй частью изобретения. Переключателю 200 предшествует общая схема предварительной обработки, которая содержит блок объемного/сведенного стерео 101, генерирующий на выходе параметры сведенного стерео и выходной моно сигнал, который получается в результате микширования с понижением входного сигнала, имеющего два или более канала.

Сигнал на выходе блока 101 может иметь большее количество сигналов, но благодаря функции микширования с понижением блока 101 количество каналов на выходе блока 101 будет меньше, чем количество каналов на входе блока 101.

Общая схема предварительной обработки может иметь вместо блока 101 или в дополнение к нему блок расширения полосы частот 102. Как показано на фиг.2а, выходной сигнал блока 101 является входным сигналом блока расширения полосы частот 102, который в кодере на фиг.2а генерирует на выходе сигнал с ограниченной полосой, например сигнал низкого диапазона. Желательно также, чтобы частота дискретизации сигнала была понижена (например, в два раза). Что касается полосы высоких частот сигнала на входе блока 102, то параметры расширения полосы частот, такие как огибающая спектра, параметры обратной фильтрации, параметры шумового порога и т.д., указанные в профиле НЕ ААС MPEG-4, генерируются и направляются в мультиплексер битового потока 800.

Блок принятия решений 300 направляет сигнал на вход блока 101 или блока 102 и делает выбор между режимом обработки музыки и режимом обработки речи. В случае режима обработки музыки выбирается верхняя ветвь кодирования 400, в случае режима обработки речи - нижняя ветвь кодирования 500. Желательно, чтобы блок принятия решений в дополнение к этому управлял блоком совмещенного стерео 101 и/или блоком расширения полосы частот 102 так, чтобы эти блоки могли адаптироваться к определенным задачам. Так, когда блок принятия решений определяет, что определенная временная часть входного сигнала относится к первому режиму обработки, то есть к режиму обработки музыки, тогда некоторыми параметрами блока 101 и/или блока 102 может управлять блок принятия решений 300. И наоборот, когда блок принятия решений 300 определяет, что сигнал относится к режиму обработки речи или, в общем, ко второй ветви обработки LPC, тогда определенными параметрами блоков 101 и 102 может управлять блок принятия решений 300.

Желательно, чтобы ветвь кодирования 400 производила спектральное преобразование на основе MDCT-преобразования. Также желательно, чтобы MDCT-преобразование было деформированным во времени, сила деформации может колебаться от нуля до высоких показателей. При силе деформации, равной нулю, преобразование MDCT, производимое блоком 411, называется прямым. Показатель временной деформации и служебная информация о временной деформации могут передаваться на вход мультиплексера битового потока 800 в качестве служебной информации.

На ветви кодирования LPC кодер содержит основной блок ACELP 526, который вычисляет увеличение тона, запаздывание тона шага и/или данные кодовой книги, такие как индексы кодовой книги и показатели увеличения. Режим ТСХ, согласно 3GPP TS 26.290, подвергает обработке взвешенный на основе восприятия сигнал в области преобразования. Подвергшийся преобразованию Фурье взвешенный сигнал квантуется с помощью решетки разделения с изменяющимися показателями (алгебраическое векторное квантование) посредством квантования на основе показателя шума. Преобразование вычисляется для 1024, 512 или 256 окон отсчетов. Сигнал возбуждения извлекается при инверсной фильтрации квантованного взвешенного сигнала через инверсный взвешивающий фильтр.

На второй ветви кодирования 400 спектральный конвертер имеет особым образом адаптированный блок MDCT, который обладает определенными оконными функциями, применяющимися вслед за этапом квантования/энтропийного метода кодирования, который может включать один этап векторного квантования. Однако желательно, чтобы этот этап комбинировался со скалярным квантователем/энтропийным кодером, подобным квантователю/кодеру ветви кодирования в частотной области, т.е. блоку 421 на Фиг.2а.

Вторая ветвь кодирования имеет блок LPC 510, за которым следует переключатель 521, и далее снова блок ACELP 526 или блок ТСХ 527. Кодер ACELP описывается в 3GPP TS 26.190, ТСХ описывается в 3GPP TS 26.290. Блок ACELP принимает сигнал возбуждения LPC, который вычисляется согласно процедуре, показанной на фиг.7е. Блок ТСХ 527 принимает взвешенный сигнал, процедура генерирования которого показана на Фиг.7f.

В блоке ТСХ применяется преобразование к взвешенному сигналу, который вычисляется при помощи фильтрации входного сигнала через взвешивающий фильтр LPC. Предпочтительная форма реализации настоящего изобретения применяет взвешивающий фильтр, который представлен выражением: (1-A(z/γ))/(1-µz-1). Таким образом, взвешенный сигнал является сигналом в LPC-области и его преобразование также относится к LPC-области. Сигнал, обработанный блоком ACELP 526, является сигналом возбуждения, он отличается от сигнала, обработанного блоком 527, но оба сигнала относятся к LPC-области.

На стороне декодера, показанного на фиг.2b, после инверсного спектрального преобразования в блоке 537, применяется инверсный взвешивающий фильтр, который представлен выражением: (1-µz-1)/(1-A(z/γ)). Затем сигнал фильтруется согласно выражению (1-A(z)) и направляется в LPC-область возбуждения. Таким образом, конверсия в блок LPC 534 и блок ТСХ-1 537 включает инверсное преобразование и фильтрацию согласно выражению: , благодаря чему осуществляется конверсия из области взвешенных сигналов в область сигналов возбуждения.

Несмотря на то что блок 510 на фиг.1а, 1с, 2а, 2с показывает один блок, блок 510 может иметь на выходе различные сигналы, если эти сигналы присутствуют в LPC-области. Действительный режим блока 510, который может функционировать в режиме сигнала возбуждения или в режиме взвешенного сигнала, зависит от положения переключателя. Кроме этого, блок 510 может иметь два параллельных устройства обработки, одно из которых функционирует так, как это показано на фиг.7е, второе - так, как показано на фиг.7f. Таким образом, блок LPC на выходе может иметь LPC-сигнал возбуждения, взвешенный LPC-сигнал или любой другой LPC-сигнал.

На второй ветви кодирования (ACELP/TCX), показанной на фиг.2а и 2с, сигнал предварительно выделяется фильтром 1-0.68z-1 до этапа кодирования. На этапе декодирования в блоках ACELP/TCX, как показано на фиг.2b, синтезированный сигнал подвергается процедуре, обратной выделению, с помощью фильтра 1/(1-0.68z-1). Предварительное выделение может быть частью блока LPC 510, где сигнал выделяется до этапа LPC-анализа и квантования. Аналогичным образом обратная процедура может быть частью блока LPC-синтеза LPC-1 540.

Фиг.2с показывает следующий вариант реализации изобретения, проиллюстрированный на фиг.2а, но с другой организацией переключателя 521, подобно принципу, продемонстрированному на фиг.4b.

Предпочтительная форма реализации изобретения содержит первый переключатель 200 (см. фиг.1а или 2а), который контролируется в режиме открытого цикла (как показано на фиг.4а), и второй переключатель, который контролируется в режиме закрытого цикла (как показано на фиг.4b).

Например, на фиг.2с показан второй переключатель, который расположен после блоков ACELP и ТСХ, то же самое расположение показано на фиг.4b. Далее на первой ветви обработки первый блок LPC представляет LPC-сигнал возбуждения, а на второй линии обработки второй блок LPC представляет взвешенный LPC-сигнал. Таким образом, первый LPC-сигнал образуется путем фильтрации согласно выражению: (1-A(z)), благодаря чему сигнал переводится в разностную LPC-область, второй LPC-сигнал образуется путем фильтрации согласно выражению: (1-A(z/γ))/(1-µz-1), благодаря чему сигнал переводится в LPC-область взвешенных сигналов.

Фиг.2b иллюстрирует схему декодирования, соответствующую схеме кодирования на фиг.2а. Битовый поток, генерируемый мультиплексером битового потока 800 на фиг.2а, является входным сигналом для демультиплексера битового потока 900. В зависимости от данных, поступающих, например, из битового потока, с помощью блока определения режима 601 переключатель на стороне декодера 600 принимает решение направить в блок расширения частотной полосы 701 либо сигналы верхней ветви, либо сигналы нижней ветви. Блок расширения частотной полосы 701 принимает служебную информацию от демультиплексера битового потока 900. Основываясь на этой информации, а также на данных блока определения режима 601 блок расширения частотной полосы восстанавливает высокий диапазон частот на базе низких частот выходного сигнала переключателя 600.

Сигнал с полной полосой частот, который генерируется блоком 701, передается на этап обработки в блок объемного/совмещенного стерео сигнала 702, который восстанавливает два стерео канала или несколько каналов. Как правило, на выходе блока 702 имеется большее количество каналов, чем на входе. В зависимости от приложения вход блока 702 может иметь два канала, как в режиме стерео, или большее количество каналов, однако выход блока 702 будет иметь большее количество каналов, чем вход.

Как было сказано выше, переключатель 200 выполняет переключение между двумя ветвями, поэтому одна ветвь получает сигнал для обработки, а вторая ветвь не получает. Альтернативный вариант реализации изобретения включает переключатель, который расположен, например, за кодером 421 или кодером возбуждения 522, 523, 524, что означает, что обе ветви 400 и 500 обрабатывают один и тот же сигнал параллельно. Для того чтобы не дублировать битрейт выбирается только один выходной сигнал из двух ветвей кодирования 400 и 500, который далее становится выходным битовым потоком. Блок принятия решений функционирует таким образом, что сигнал, направляемый в битовый поток, минимизирует определенную функцию издержки. Функция издержек представляет собой полученный битрейт и отклонение, полученное на базе восприятия, или битрейт и отклонение вместе. Таким образом, в этом режиме или в режиме, показанном на предыдущих фигурах, блок принятия решений может функционировать в режиме закрытого цикла для того, чтобы быть уверенным, что в итоге только тот выходной сигнал ветви кодирования направляется в битовый поток, который имеет минимальный битрейт для определенного отклонения на базе восприятия или имеет минимальное отклонение для определенного битрейта. В режиме закрытого цикла входной сигнал обратной связи может быть получен от трех блоков квантования/масштабирования 421, 522 и 524 на фиг.1а.

В варианте изобретения, имеющем два переключателя, то есть переключатель 200 и переключатель 521, желательно, чтобы временное разрешение для первого переключателя было ниже, чем временное разрешение для второго переключателя. Иными словами, порции входного сигнала, направляемые к первому переключателю, были бы больше, чем порции сигнала, направляемые ко второму переключателю, который функционирует в LPC-области. Например, переключатель 200, который выбирает между частотной областью и LPC-областью, может переключать порции сигнала длиной 1024 отсчета, а второй переключатель может переключать порции длиной 256 отсчетов.

Несмотря на то что некоторые из фиг.1a-10b представляют собой схемы устройства, эти схемы одновременно являются иллюстрациями метода, где функциональные блоки соответствуют этапам применяемого метода.

Фиг.3а показывает аудио кодер для получения кодированного аудио сигнала на выходе первой ветви кодирования 400 и второй ветви кодирования 500. Кроме этого, кодированный аудио сигнал включает служебную информацию типа параметров предварительной обработки на соответствующем этапе или информацию об управлении переключателей, как упоминалось при рассмотрении предыдущих фигур.

Желательно, чтобы первая ветвь кодирования применялась для кодирования среднего аудио сигнала 195 в соответствии с первым алгоритмом кодирования, который является алгоритмом модели приемника. Первая ветвь кодирования 400 генерирует первый кодированный выходной сигнал, который представляет собой кодированную репрезентацию спектральной информации среднего аудио сигнала 195.

Далее вторая ветвь кодирования 500 применяется для кодирования среднего аудио сигнала 195 в соответствии со вторым алгоритмом кодирования.

Второй алгоритм кодирования является алгоритмом модели источника, он генерирует во втором кодированном выходном сигнале кодированные параметры для модели источника информации, которые представляют средний аудио сигнал.

Далее аудио кодер включает этап общей предварительной обработки 99 для того, чтобы получить средний аудио сигнал 195. Если быть более точным, то на этапе общей предварительной обработки входной сигнал 99 обрабатывается таким образом, что средний аудио сигнал 195, то есть сигнал на выходе этапа предварительной обработки, представляет собой сжатую версию входного аудио сигнала.

Метод аудио кодирования для получения кодированного аудио сигнала включает этап кодирования 400 среднего аудио сигнала 195 в соответствии с первым алгоритмом кодирования; первый алгоритм кодирования является алгоритмом кодирования на базе модели приемника, благодаря которому в первом выходном сигнале генерируется кодированная спектральная информация, которая представляет аудио сигнал; этап кодирования 500 среднего аудио сигнала 195 в соответствии со вторым алгоритмом кодирования, второй алгоритм кодирования является алгоритмом на базе модели источника, в итоге второй выходной сигнал содержит кодированные параметры для модели источника информации, которые представляют средний сигнал 195; этап общей предварительной обработки 100, в результате которого входной аудио сигнал 99 преобразуется в средний аудио сигнал 195, при этом средний аудио сигнал 195 представляет собой сжатую версию входн