Устройство и способ кодирования/декодирования звукового сигнала посредством использования схемы переключения совмещения имен

Иллюстрации

Показать все

Устройство для кодирования звукового сигнала включает устройство управления окнами (11) для управления окнами первого блока звукового сигнала посредством использования окна анализа, имеющего часть совмещения имен и последующую часть, кроме того, включает процессор (12) для обработки первого подблока звукового сигнала, связанного с частью совмещения окна анализа посредством преобразования подблока от области в другую область, вслед за управлением окнами первого подблока для получения обработанного первого подблока, и для обработки второго подблока звукового сигнала, связанного с последующей частью, посредством преобразования второго подблока от области в другую область до управления окнами второго подблока для получения обработанного второго подблока. Устройство, кроме того, включает преобразователь (13) для преобразования обработанного первого подблока и обработанного второго подблока от другой области в последующую другую область посредством использования того же самого правила преобразования блока для получения преобразованного первого блока, который сжимают посредством использования любого из известных алгоритмов сжатия данных. Таким образом, получено критически выбранное переключение между двумя режимами кодирования, так как части совмещения окна анализа, появляющиеся в двух различных областях, подходят друг к другу. Технический результат - обеспечить улучшенную концепцию кодирования/декодирования при низкой скорости передачи с высоким качеством. 6 н. и 11 з.п. ф-лы, 20 ил.

Реферат

Данное изобретение имеет отношение к звуковому кодированию и, в частности, к схеме звукового кодирования с низкой скоростью передачи битов (битрейт).

В этой области техники известны схемы кодирования частотной области, такие как MP3 или AAC. Эти кодирующие устройства частотной области основаны на преобразовании временной области/частотной области, последующей стадии квантования, в которой ошибка квантования регулируется посредством использования информации из психоакустического модуля, и стадии кодирования, в которой квантованные спектральные коэффициенты и соответствующая дополнительная информация энтропийно (статистически) закодированы с использованием кодовых таблиц.

С другой стороны, существуют кодирующие устройства, которые очень хорошо подходят для обработки речи, такие как AMR-WB+, как описано в 3GPP TS 26.290. Такие схемы кодирования речи выполняют Линейное фильтрование (LP) с предсказанием сигнала временной области. Такое LP фильтрование основывается на линейном предиктивном анализе входного сигнала временной области. Получающиеся коэффициенты LP фильтрования затем квантуются/кодируются и передаются как дополнительная информация. Этот процесс известен как линейное кодирование с предсказанием (LPC). На выходе фильтра остаточный сигнал прогнозирования или сигнал ошибки предсказания, известный также как сигнал возбуждения, кодируется посредством использования стадии анализа через синтез кодирующего устройства ACELP или, альтернативно, кодируется посредством использования кодирующего устройства с преобразованием, которое использует преобразование Фурье с перекрыванием. Принятие решения о выборе между кодированием ACELP и кодированием Преобразования закодированного возбуждения, которое также называют кодированием ТСХ, выполняется посредством использования алгоритма замкнутого контура или разомкнутого контура.

Схемы звукового кодирования частотной области, такие как высокоэффективная AAC схема кодирования, которая комбинирует AAC схему кодирования и технику репликации спектральной полосы, могут также объединяться с совместным стерео или многоканальным инструментом кодирования, который известен под названием «MPEG surround (окружающий)».

С другой стороны, речевые кодирующие устройства, такие как AMR-WB+, также имеют высокочастотную стадию усиления и стерео функциональные возможности.

Схемы кодирования частотной области выгодны тем, что они обеспечивают высокое качество при низкой скорости передачи битов (битрейт) для музыкальных сигналов. Однако проблематичным является качество речевых сигналов при низкой скорости передачи битов (битрейт).

Схемы речевого кодирования показывают высокое качество для речевых сигналов даже при низкой скорости передачи битов (битрейт), но показывают низкое качество для музыкальных сигналов при низкой скорости передачи битов (битрейт).

Схемы кодирования частотной области часто используют так называемое MDCT (MDCT=измененное дискретное косинусное преобразование). MDCT было первоначально описано в работе Дж. Принсена, А. Брэдли, «Схема анализирующей/синтезирующей гребенки фильтров, основанная на отмене совмещения имен временной области», IEEE Транс. ASSP, ASSP-34 (5): 1153-1161, 1986. MDCT или MDCT гребенка фильтров широко используется в современных и эффективных звуковых кодирующих устройствах. Этот вид обработки сигнала обеспечивает следующие преимущества:

Плавное взаимное ослабление между блоками обработки: Даже если сигнал в каждом блоке обработки изменяется по-разному (например, благодаря квантизации спектральных коэффициентов), не возникают никакие артефакты блокирования из-за резких переходов от блока к блоку из-за реализуемой посредством организации окон операции перекрывания/добавления.

Критическая выборка: число спектральных значений на выходе гребенки фильтров равно числу входных значений временной области на ее входе, и должны быть переданы дополнительные служебные величины.

MDCT гребенка фильтров обеспечивает высокочастотную селективность и эффективность кодирования.

Эти свойства достигаются посредством использования техники отмены совмещения имен временной области. Отмена совмещения имен временной области выполняется во время синтеза путем перекрывания-добавления двух смежных сигналов, реализуемых посредством организации окна. Если не применяется квантизация между стадиями анализа и синтеза MDCT, получается прекрасное восстановление оригинального сигнала. Однако MDCT используется для схем кодирования, которые специально приспосабливаются для музыкальных сигналов. Такие схемы кодирования частотной области имеют, как было заявлено ранее, пониженное качество при низких скоростях передачи битов (битрейт) или речевые сигналы, в то время как специально приспособленные речевые кодирующие устройства имеют более высокое качество при сопоставимых скоростях передачи битов (битрейт) или даже имеют значительно более низкие скорости передачи битов (битрейт) для того же самого качества, по сравнению со схемами кодирования частотной области.

Техники кодирования речи, такие как так называемый AMR-WB+ кодер-декодер, как определено в Технической Спецификации «Расширенный адаптивный мультискоростной - широкополосный (AMR- WB+) кодер-декодер», 3GPP TS, 26.290 V6.3.0, 2005-06, не применяют MDCT и, поэтому, не могут извлекать выгоду из превосходных свойств MDCT, которые, в частности, полагаются на обработку критической выборкой с одной стороны и переход от одного блока к другому с другой стороны. Поэтому, переход от одного блока к другому, полученный посредством MDCT без какого-либо ухудшения в отношении скорости передачи битов (битрейт) и, поэтому, свойство критической выборки MDCT еще не было получено в речевых кодирующих устройствах.

Когда будут объединены речевые кодирующие устройства и звуковые кодирующие устройства в пределах единой гибридной схемы кодирования, все еще останется проблема того, как получить переключение от одного режима кодирования на другой режим кодирования при низкой скорости передачи битов (битрейт) и с высоким качеством.

Задача данного изобретения - обеспечить улучшенную концепцию кодирования/декодирования.

Эта задача достигается посредством устройства кодирования звукового сигнала по п.1, устройства декодирования кодированного звукового сигнала по п.8, кодированного звукового сигнала по п.14, способа кодирования звукового сигнала по п.15, способа декодирования кодированного звукового сигнала по п.16 или компьютерной программы по п.17.

Аспектом данного изобретения является применение гибридной схемы кодирования, в которой применяется первый режим кодирования, специально приспособленный для определенных сигналов и действующий в одной области, и в которой последующий режим кодирования, специально приспособленный для других сигналов, и функционирование в другой области используются вместе. В этой концепции кодирования/декодирования критически выбранное переключение от одного режима кодирования на другой режим кодирования становится возможным, при этом, на стороне кодирующего устройства тот же самый блок звуковых сэмплов (образцов), который был генерирован посредством одной операции управления окнами, обрабатывается по-разному. В частности, часть совмещения имен блока звукового сигнала обрабатывается преобразованием подблока, связанного с частью совмещения имен окна, от одной области в другую область, вслед за управлением окнами этого подблока, где другой подблок, полученный посредством той же самой операции управления окнами, преобразуется от одной области в другую область до управления окнами этого подблока посредством использования окна анализа.

Обработанный первый подблок и обработанный второй подблок, впоследствии, преобразуются в последующую область, используя то же самое правило преобразования блока, чтобы получить преобразованный первый блок звукового сигнала, который затем может далее обрабатываться, используя любой из известных алгоритмов сжатия данных, таких как квантование, энтропийное кодирование и так далее.

На стороне декодера этот блок снова обрабатывается по-другому, в зависимости от того, обрабатывается ли часть совмещения имен блока, или обрабатывается другая последующая часть блока. Часть совмещения имен преобразуется в целевую область до выполнения управления окном синтеза, в то время как последующая часть подвергается управлению окном синтеза до выполнения преобразования в целевую область. Дополнительно, чтобы получить свойство критической выборки, выполняется отмена совмещения имен временной области, в которой реализованная посредством организации окон часть совмещения имен и реализованная посредством организации окон часть совмещения имен закодированного другого блока звуковых данных объединяются вслед за преобразованием части совмещения имен блока кодированного звукового сигнала в целевую область так, чтобы получить декодированный звуковой сигнал, соответствующий части совмещения имен первого блока. Ввиду этого существует два подблока/части в окне. Одна часть/подбок (подблок совмещения имен) имеет компоненты совмещения имен, которые перекрывают второй блок, закодированный в другой области, и второй подблок/часть (последующий подблок), который может иметь или не иметь компонентов совмещения имен, которые перекрывают второй блок или блок, отличный от второго блока.

Предпочтительно, чтобы совмещение имен, введенное в определенные части, которые соответствуют друг другу, но которые закодированы в различных областях, с выгодой использовалось для получения критически выбранного переключения от одного режима кодирования на другой режим кодирования, посредством другой обработки части совмещения имен и последующей части в пределах одного и того же блока звукового сэмпла (образца), реализуемого посредством организации окна.

Это в отличие от прототипной обработки, основанной на окнах анализа и окнах синтеза, так как, до сих пор, полный блок данных, полученный посредством применения окна анализа, подвергался той же самой обработке. В соответствии с данным изобретением, однако, часть совмещения имен блока, реализуемого посредством организации окон, обрабатывается иначе, по сравнению с последующей частью этого блока.

Последующая часть может включать часть несовмещения имен, появляющуюся, когда используются определенные окна начала/остановки (начальные/стоповые окна). Альтернативно, последующая часть может включать часть совмещения имен, перекрывающуюся частью результата смежного процесса управления окнами. Тогда, последующая часть (совмещения имен) перекрывается частью совмещения имен соседнего фрейма, обработанного в той же самой области, что и последующая часть (совмещения имен) обрабатываемого фрейма, и часть совмещения имен перекрывается частью совмещения имен соседнего фрейма, обработанного в другой области, по сравнению с частью совмещения имен обрабатываемого фрейма.

В зависимости от выполнения, последующая часть и часть совмещения имен вместе формируют полный результат применения функции окна к блоку звуковых сэмплов (образцов). Последующая часть может быть полностью без совмещения имен, или может быть полностью с совмещением имен, или может включать подчасть совмещения имен, и подчасть без совмещения имен. Кроме того, порядок этих подчастей и порядок части совмещения имен и последующей части могут быть отобраны произвольно.

В предпочтительном осуществлении переключенной схемы звукового кодирования смежные сегменты входного сигнала могли быть обработаны в двух различных областях. Например, AAC вычисляет MDCT в области сигнала, и МТРС (Шон А. Рампрашад, «Принцип многорежимного предиктивного кодирования с преобразованием», IEEE Операция речевой и звуковой обработки, т.11, №2, март 2003) вычисляет MDCT в LPC остаточной области. Это может быть проблематично, в частности, когда перекрывающиеся зоны имеют компоненты совмещения имен временной области вследствие использования MDCT. Действительно, совмещение имен временной области не может быть отменено в переходах от одного кодирующего устройства к другому, потому что они были произведены в двух различных областях. Одно решение состоит в том, чтобы выполнить переходы реализуемыми посредством организации окон сигналами с взаимным ослаблением без совмещения имен. Переключаемое кодирующее устройство тогда уже больше не является критически выбранным и производит информацию о служебных сигналах. Осуществления позволяют поддерживать преимущество критической выборки посредством отмены компонентов совмещения имен временной области, вычисленных в двух различных областях.

В предпочтительном осуществлении данного изобретения два переключателя предоставлены в последовательном порядке, где первый переключатель выбирает между кодированием в спектральной области, используя кодирующее устройство частотной области, и кодированием в LPC-области, то есть, обрабатывая сигнал на входе LPC стадии анализа. Второй переключатель предоставлен для переключения в LPC-область, чтобы кодировать сигнал LPC-области либо в LPC-области, например, используя кодирующее устройство ACELP, или чтобы кодировать сигнал LPC-области в LPC-спектральной области, для чего необходим преобразователь для преобразования сигнала LPC-области в LPC-спектральную область, которая отличается от спектральной области, так как LPC-спектральная область показывает спектр LPC отфильтрованного сигнала, а не спектр сигнала временной области.

Первый переключатель выбирает между двумя ветвями обработки, где одна ветвь, главным образом, мотивируется стоковой моделью и/или психоакустической моделью, то есть, слуховой маскировкой, а другой, главным образом, мотивируется исходной моделью и сегментальными SNR (отношение сигнал/шум) вычислениями. Например, одна ветвь имеет кодирующее устройство частотной области, а другая ветвь имеет кодирующее устройство, основанное на LPC, такое как речевое кодирующее устройство. Исходная модель обычно обрабатывает речь и поэтому обычно использует LPC.

Второй переключатель снова выбирает между двумя ветвями обработки, но в области, отличающейся от «внешней» первой области ветви. Снова одна «внутренняя» ветвь, главным образом, мотивируется исходной моделью или SNR (отношение сигнал/шум) вычислениями, а другая «внутренняя» ветвь может мотивироваться стоковой моделью и/или психоакустической моделью, то есть, маскировкой, или, по крайней мере, включает аспекты кодирования частотной/спектральной области. Например, одна «внутренняя» ветвь имеет кодирующее устройство частотной области/спектральный преобразователь, а другая ветвь имеет кодирующее устройство, кодирующее в другой области, такой как LPC область, где это кодирующее устройство, например, - CELP или ACELP квантизатор/счетчик, обрабатывающий входной сигнал без спектрального преобразования.

Последующее предпочтительное осуществление - звуковое кодирующее устройство, включающее первую ветвь кодирования, ориентированную на стоковую информацию, такую как ветвь кодирования спектральной области, вторую ветвь кодирования, ориентированную на информацию об источнике или на SNR (отношение сигнал/шум), такую как ветвь кодирования LPC-области, и переключатель для переключения между первой ветвью кодирования и второй ветвью кодирования, где вторая ветвь кодирования включает преобразователь в определенную область, отличающуюся от временной области, такую как LPC стадия анализа, генерирующая сигнал возбуждения, и где вторая ветвь кодирования, кроме того, включает определенную область, такую как ветвь обработки LPC области и определенную спектральную область, такую как ветвь обработки LPC спектральнаой области, и дополнительный переключатель для переключения между ветвью кодирования определенной области и ветвью кодирования определенной спектральной области.

Последующее осуществление изобретения - звуковой декодер, включающий первую область, такую как ветвь декодирования спектральной области, вторую область, такую как ветвь декодирования LPC области, для декодирования сигнала, такого как сигнал возбуждения во второй области, и третью область, такую как ветвь декодирования LPC-спектральной области для декодирования сигнала, такого как сигнал возбуждения в третьей области, такой как LPC спектральная область, где третья область получается посредством выполнения частотного преобразования от второй области, где предоставляется первый переключатель для сигнала второй области и сигнала третьей области, и где предоставляется второй переключатель для переключения между декодером первой области и декодером для второй области или третьей области.

Предпочтительные осуществления данного изобретения далее описываются со ссылкой на приложенные рисунки, в которых:

Фиг.1A - схематическое представление предпочтительного устройства или способа кодирования звукового сигнала;

Фиг.1B - схематическое представление перехода от MDCT-TCX к ААС;

Фиг.1C - схематическое представление перехода от ААС к MDCT-TCX;

Фиг.1D - иллюстрация предпочтительного осуществления изобретательной концепции в виде блок-схемы;

Фиг.2 - схематическое представление для иллюстрации четырех различных областей и их соотношений, которые возникают в осуществлениях изобретения;

Фиг.3A - схема, иллюстрирующая изобретательное устройство/способ декодирования звукового сигнала;

Фиг.3B - следующая иллюстрация схем декодирования в соответствии с осуществлениями данного изобретения;

Фиг.4A - иллюстрирует детали совмещения имен - преобразований, таких как MDCT, применимое в обоих режимах кодирования;

Фиг.4B - иллюстрирует функции окна, сопоставимые с функцией окна на фиг.4A, но с частью совмещения имен и частью несовмещения имен;

Фиг.5 - схематическое представление кодирующего устройства и декодера в одном режиме кодирования, таком как AAC-MDCT режим кодирования;

Фиг.6 - представление кодирующего устройства и декодера, применяющего MDCT в другой области, такой как область LPC в контексте ТСХ кодирования в AMR-WB+;

Фиг.7 - определенная последовательность окон для переходов между ААС и AMR-ВБ+;

Фиг.8A - представление предпочтительного осуществления кодирующего устройства и декодера в контексте переключения от режима ТСХ на режим AAC;

Фиг.8B - предпочтительное осуществление иллюстрации кодирующего устройства и декодера для перехода от ААС к ТСХ;

Фиг.9A - блок-схема предпочтительной гибридной переключаемой схемы кодирования, в которой применено данное изобретение;

Фиг.9B - блок-схема, иллюстрирующая процесс, выполняемый в контроллере фиг.9A;

Фиг.10A - предпочтительное осуществление декодера в гибридной переключаемой схеме кодирования;

Фиг.1B - блок-схема, иллюстрирующая процедуру, выполняемую в переходном контроллере фиг.10А;

Фиг.11A - иллюстрирует предпочтительное осуществление кодирующего устройства, в котором предпочтительно применяется данное изобретение; и

Фиг.11B - иллюстрирует предпочтительный декодер, в котором предпочтительно применяется данное изобретение.

Фиг.11A иллюстрирует осуществление изобретения, имеющего два каскадных переключателя.

Моно сигнал, сигнал стерео или многоканальный сигнал вводятся в переключатель 200. Переключатель 200 управляется стадией принятия решения 300. Стадия принятия решения получает, в качестве входа, вход сигнала в блок 200. Альтернативно, стадия принятия решения 300 может также получать дополнительную информацию, которая включается в моно сигнал, стерео сигнал или многоканальный сигнал или, по крайней мере, связанный с таким сигналом, где существует информация, которая была, например, получена при первоначальном производстве моно сигнала, стерео сигнала или многоканального сигнала.

Стадия принятия решения 300 приводит в действие переключатель 200, чтобы подавать сигнал или в частотно-кодирующую часть 400, проиллюстрированную в верхней ветви фиг.11A, или в кодирующую часть LPC-области 500, проиллюстрированную в нижней ветви фиг.11A. Ключевым элементом кодирующей ветви частотной области является спектральный блок преобразования 411, предназначенный для преобразования обычного выходного сигнала стадии предварительной обработки (как будет обсуждено позже) в спектральную область. Спектральный блок преобразования может включать алгоритм MDCT, QMF, алгоритм FFT, вейвлет-анализ или гребенку фильтров, такую как критически выбранная гребенка фильтров, имеющая определенное число каналов гребенки фильтров, где сигналы поддиапазона в этой гребенке фильтров могут быть действительнозначными сигналами, или комплекснозначными сигналами. Выход спектрального блока преобразования 411 кодируется посредством использования спектрального звукового кодирующего устройства 421, которое может включать блоки обработки, как известно из AAC схемы кодирования.

Обычно, обработка в ветви 400 является обработкой в модели, основывающейся на восприятии, или информационной стоковой модели. Таким образом, эта ветвь моделирует слуховую систему человека, получающую звук. В противоположность этому, обработка в ветви 500 должна генерировать сигнал в области возбуждения, остаточной или LPC области. Обычно, обработка в ветви 500 является обработкой в речевой модели или информационной генерационной модели. Для речевых сигналов эта модель - модель генерационной речевой/звуковой системы человека, генерирующей звук. Если, однако, должен быть закодирован звук из другого источника, для чего требуется другая звуковая генерационная модели, то обработка в ветви 500 может быть другой.

В нижней ветви кодирования 500, ключевой элемент - устройство LPC 510, которое производит LPC информацию, которая используется для управления характеристиками LPC фильтра. Эта LPC информация передается декодеру. Выходной сигнал LPC стадии 510 - сигнал LPC-области, который состоит из сигнала возбуждения и/или взвешенного сигнала.

Устройство LPC обычно производит сигнал LPC области, который может быть любым сигналом в LPC области, таким как сигнал возбуждения или взвешенный (ТСХ) сигнал или любой другой сигнал, который был произведен посредством применения LPC коэффициентов фильтрации к звуковому сигналу. Кроме того, LPC устройство также может определять эти коэффициенты и может также квантовать/кодировать эти коэффициенты.

Решение на стадии принятия решения может быть сигнально-адаптивным, так чтобы стадия принятия решения выполняла дифференциацию музыки/речи и управляла переключателем 200 таким образом, чтобы музыкальные сигналы вводились в верхнюю ветвь 400, а речевые сигналы вводились в нижнюю ветвь 500. В одном осуществлении стадия принятия решения подает свою информацию о принятии решения в выходной битовый поток так, чтобы декодер мог использовать эту информацию о принятии решения для выполнения корректной операции декодирования.

Такой декодер проиллюстрирован на фиг.11B. Сигнал, произведенный спектральным звуковым кодирующим устройством 421, после передачи вводится в спектральный звуковой декодер 431. Выход спектрального звукового декодера 431 вводится в преобразователь временной области 440. Аналогично, выход ветви кодирования LPC области 500 на фиг.11A получается на стороне декодера и обрабатывается элементами 536 и 537 для получения LPC сигнала возбуждения. LPC сигнал возбуждения вводится в LPC стадию синтеза 540, которая получает, в качестве следующего входа, LPC информацию, генерированную соответствующей LPC стадией анализа 510. Выход преобразователя временной области 440 и/или выход LPC стадии синтеза 540 вводятся в переключатель 600. Переключатель 600 регулируется управляющим сигналом переключателя, который был, например, генерирован стадией принятия решения 300, или который внешне предоставлялся, как произведенный создателем оригинального моно сигнала, стерео сигнала или многоканального сигнала. Выход переключателя 600 является полностью моно сигналом, стерео сигналом или многоканальным сигналом.

Входной сигнал в переключатель 200 и стадию принятия решения 300 может быть моно сигналом, стерео сигналом, многоканальным сигналом или, обычно, звуковым сигналом. В зависимости от решения, которое может быть получено из входного сигнала переключателя 200 или из любого внешнего источника, такого как производитель оригинального звукового сигнала, лежащего в основе входного сигнала в стадию 200, переключатель переключается между частотной кодирующей ветвью 400 и LPC кодирующей ветвью 500. Частотная кодирующая ветвь 400 включает спектральную стадию преобразования 411 и, впоследствии, связанную со стадией квантования/кодирования 421. Стадия квантования/кодирования может включать любую из функциональных возможностей, как известно из современных кодирующих устройств частотной области, таких как кодирующее устройство AAC. Кроме того, операция квантизации на стадии квантования/кодирования 421 может регулироваться психоакустическим модулем, который производит психоакустическую информацию, такую как психоакустический порог маскировки по частоте, где эта информация вводится в стадию 421.

В LPC кодирующей ветви, выходной сигнал переключателя обрабатывается на LPC стадии анализа 510, производящей LPC дополнительную информацию и сигнал LPC-области. Кодирующее устройство возбуждения включает дополнительный переключатель 521 для переключения последующей обработки сигнала LPC-области между операцией квантизации/кодирования 526 в LPC-области или стадией квантизации/кодирования 527, которая обрабатывает значения в LPC-спектральной области. В завершение, предоставляется спектральный преобразователь 527. Переключатель 521 регулируется способом разомкнутого контура или способом замкнутого контура в зависимости от определенных параметров настройки как, например, описано в AMR-WB+технической спецификации.

Для режима управления замкнутым контуром кодирующее устройство дополнительно включает инверсный квантизатор/кодирующее устройство для сигнала LPC области, инверсный квантизатор/кодирующее устройство для сигнала LPC спектральной области и инверсный спектральный преобразователь для выхода инверсного квантизатора/кодирующего устройства. И закодированные и снова декодированные сигналы в ветвях обработки второй ветви кодирования вводятся в управляющее устройство переключателя. В управляющем устройстве переключателя эти два выходных сигнала сравниваются друг с другом и/или с целевой функцией, или вычисляется целевая функция, которая может основываться на сравнении искажения в обоих сигналах так, чтобы сигнал, имеющий более низкое искажение, использовался для принятия решения о том, какое положение должен занимать переключатель 521. Альтернативно, в случае, если обе ветви обеспечивают непостоянные скорости передачи битов (битрейт), ветвь, обеспечивающая более низкую скорость передачи битов (битрейт), может выбираться, даже когда отношение сигнала к шуму этой ветви ниже чем отношение сигнала к шуму другой ветви. Альтернативно, целевая функция может использовать, в качестве входа, отношение сигнала к шуму каждого сигнала и скорость передачи битов (битрейт) каждого сигнала и/или дополнительные критерии, чтобы найти лучшее решение для конкретной цели. Если, например, цель такова, что скорость передачи битов (битрейт) должна быть насколько возможно низкой, то целевая функция будет в большой мере основываться на скорость передачи битов (битрейт) двух сигналов, произведенных инверсным квантизатором/кодирующим устройством и инверсным спектральным преобразователем. Однако, когда главная цель состоит в том, чтобы иметь лучшее качество при определенной скорости передачи битов (битрейт), тогда управление переключателем может, например, отбрасывать каждый сигнал, скорость передачи битов (битрейт) которого выше допустимой скорости передачи битов (битрейт), и когда скорость передачи битов (битрейт) обоих сигналов ниже допустимой скорости передачи битов (битрейт), управление переключателем выберет сигнал, имеющий лучшее отношение сигнала к шуму, то есть, имеющий меньшие искажения квантизации/кодирования.

Схема декодирования в соответствии с данным изобретением, как указано выше, проиллюстрирована на фиг.11В. Для каждого из трех возможных видов выходного сигнала существует определенная стадия декодирования/реквантизации 431, 536 или 537. В то время как стадия 431 производит частотный спектр, который может также быть назван «временным спектром» (частотный спектр сигнала временной области) и который преобразуется во временную область посредством преобразователя частоты/времени 440, стадия 536 производит сигнал LPC-области, и позиция 537 получает частотный спектр сигнала LPC-области, который может также быть назван «LPC-спектром». Чтобы удостовериться, что сигналы, входящие в переключатель 532, оба находятся в LPC-области, преобразователь частоты/времени 537 предоставляется в LPC области. Выходные данные переключателя 532 преобразуются обратно во временную область посредством LPC стадии синтеза 540, которая управляется произведенной и переданной на стороне кодирующего устройства LPC информацией. Затем, вслед за блоком 540, обе ветви имеют информацию временной области, которая переключается в соответствии с управляющим сигналом переключателя, чтобы, в конечно итоге, получить звуковой сигнал, такой как моно сигнал, стерео сигнал или многоканальный сигнал, который зависит от сигнала, входящего в схему кодирования фиг.11A.

Фиг.11A. поэтому иллюстрирует предпочтительную схему кодирования в соответствии с изобретением. Общая схема предварительной обработки, соединенная с входом переключателя 200, может включать блок окружения/совместного стерео 101, который генерирует, в качестве выхода, объединенные стерео параметры и моно выходной сигнал, который генерируется посредством понижающего микширования входного сигнала, который является сигналом, имеющим два или больше каналов. Обычно, сигнал на выходе блока 101 может также быть сигналом, имеющим больше каналов, но, благодаря функциональным возможностям понижающего микширования блока 101, число каналов на выходе блока 101 будет меньше, чем число каналов, входящих в блок 101.

Общая схема предварительной обработки может включать, альтернативно блоку 101 или в дополнение к блоку 101, стадию расширения полосы пропускания 102. В осуществлении фиг.11A выход блока 101 вводится в блок расширения полосы пропускания 102, который, в кодирующем устройстве фиг.11A, производит сигнал с ограниченной полосой, такой как сигнал низкой полосы или сигнал низкой частоты на его выходе. Предпочтительно, чтобы этот сигнал также дискретизировался с пониженной частотой (например, с коэффициентом два). Кроме того, для высокой полосы сигнала, входящего в блок 102, параметры расширения полосы пропускания, такие как параметры огибающей спектра, параметры инверсной фильтрации, параметры минимального уровня шума и т.д., как известно из HE-AAC профиля MPEG-4, генерируются и направляются в мультиплексор битового потока 800.

Предпочтительно, чтобы стадия принятия решения 300 получала сигнал, входящий в блок 101 или входящий в блок 102, чтобы сделать выбор между, например, музыкальным режимом или речевым режимом. В музыкальном режиме выбирается верхняя ветвь кодирования 400, в то время как в речевом режиме выбирается более низкая ветвь кодирования 500. Предпочтительно, чтобы стадия принятия решения дополнительно управляла блоком стерео объединения 101, и/или блоком расширения полосы пропускания 102, чтобы приспособить функциональные возможности этих блоков к конкретному сигналу. Таким образом, когда стадия принятия решения решает, что определенная временная часть входного сигнала относится к первому режиму, такому как музыкальный режим, тогда определенные характеристики блока 101 и/или блока 102 могут управляться стадией принятия решения 300. Альтернативно, когда стадия принятия решения 300 решает, что сигнал относится к речевому режиму или, обычно, ко второму режиму LPC-области, тогда определенные характеристики блоков 101 и 102 могут управляться в соответствии с выходом стадии принятия решения.

Предпочтительно, чтобы спектральное преобразование ветви кодирования 400 выполнялось посредством операции MDCT, которая, еще более предпочтительно, является операцией MDCT с деформацией времени, где сила или, обычно, сила деформации может регулироваться между нулем и высокой силой деформации. При нулевой силе деформации, операция MDCT в блоке 411 является непосредственно операцией MDCT, известной в этой области техники. Сила деформации времени вместе с дополнительной информацией о деформации времени может передаваться/вводиться в мультиплексор битового потока 800 как дополнительная информация.

В LPC ветви кодирования, кодирующее устройство LPC-области может включать ACELP основное 526 вычисление усиления основного тона, информацию о задержке основного тона и/или шифровальной книге, такую как индекс шифровальной книги и эффективность. Режим ТСХ, как известно из 3GPP TS 26.290, несет ответственность за обработку перцепционно взвешенного сигнала в области преобразования. Фурье-преобразованный взвешенный сигнал квантуется посредством расщепленной многоскоростной решеточной квантизации (алгебраический VQ) с квантизацией шум-фактора. Преобразование вычисляется в 1024, 512 или 256 окнах выборки. Сигнал возбуждения восстанавливается инверсной фильтрацией квантованного взвешенного сигнала посредством инверсного взвешивающего фильтра.

В первой ветви кодирования 400, спектральный преобразователь предпочтительно включает специально приспособленную MDCT операцию, имеющую определенные функции окна, за которой следует кодирующая стадия квантизации/энтропии, которая может состоять из единственной стадии векторной квантизации, но, предпочтительно, является объединенным скалярным квантизатором/энтропийным кодирующим устройством, подобным квантизатору/кодирующему устройству в ветви кодирования частотной области, то есть, в позиции 421 фиг.11A.

Во второй ветви кодирования имеется LPC блок 510, за которым следует переключатель 521, за которым следует ACELP блок 526, или ТСХ блок 527. ACELP описан в 3GPP, TS 26.190, а TCX описан в 3GPP TS 26.290. В общем, ACELP блок 526 получает LPC сигнал возбуждения. TCX блок 527 получает взвешенный сигнал.

В ТСХ преобразование применяется к взвешенному сигналу, вычисленному фильтрованием входного сигнала посредством взвешивающего фильтра на LPC-основе. Взвешивающий фильтр, используемый в предпочтительных осуществлениях изобретения, представлен формулой (1-A(z/γ))/(1-µz-1). Таким образом, взвешенный сигнал - сигнал LPC области, а его преобразование - LPC-спектральная область. Сигнал, обработанный ACELP блоком 526, является сигналом возбуждения и отличается от сигнала, обработанного блоком 527, но оба сигнала находятся в LPC области. Сигнал возбуждения получается фильтрованием входного сигнала посредством (1-A(z/γ)) анализирующего фильтра.

На стороне декодера, проиллюстрированной на фиг.11В, после инверсного спектрального преобразования в блоке 537 применяется инверсный взвешивающий фильтр, то есть (1-µz-1)/(1-A(z/γ)). По выбору, сигнал может дополнительно фильтроваться через (1-A(z)), чтобы попасть в LPC область возбуждения. Таким образом, сигнал от ТСХ-1 блока 537 может быть преобразован из взвешенной области в область возбуждения фильтрованием посредством ( 1 − μz − 1 ) ( 1 − A ( z/γ ) ) ( 1 − A ( z ) ) и затем использоваться в блоке 536. Это типичное фильтрование выполняется в AMR-WB+ в конце инверсного ТСХ (537) для питания адаптивной шифровальной книги ACELP в случае, если это последнее кодирование выбрано для следующего фрейма.

Хотя позиция 510 на фиг.11А иллюстрирует единственный блок, блок 510 может производить различные сигналы, пока эти сигналы находятся в LPC области. Фактический режим блока 510, такой как режим сигнала возбуждения или режим взвешенного сигнала, может зависеть от фактического состояния переключателя. Альтернативно, блок 510 может иметь два параллельных устройства обработки. Следовательно, LPC обла