Адаптивное остаточное аудиокодирование

Иллюстрации

Показать все

Изобретение относится к кодированию и декодированию аудиосигналов и, в частности, к эффективному высококачественному кодированию пары аудиоканалов. Аудиосигнал, имеющий, по меньшей мере, два канала, может быть эффективно микширован с уменьшением числа каналов в сигнал понижающего микширования и остаточный сигнал, когда используемое правило понижающего микширования зависит от пространственного параметра, который получен из аудиосигнала и который подвергнут постобработке ограничителем, чтобы наложить ограничение на полученный пространственный параметр. При наличии правила понижающего микширования, которое динамически зависит от параметров, описывающих взаимосвязь между каналами аудио, можно гарантировать, что энергия в остаточном сигнале понижающего микширования является настолько минимальной, насколько возможно для эффективности кодирования. Посредством постобработки пространственного параметра с помощью ограничителя перед использованием его в понижающем микшировании можно избежать неустойчивости при повышающем микшировании или понижающем микшировании, которое иначе может приводить к искажению пространственного восприятия закодированного или декодированного аудиосигнала. Технический результат - обеспечение высококачественного кодирования аудиосигналов для выдачи сжатого представления аудиосигнала, одновременно более эффективно избегая артефактов, вносимых кодированием или декодированием. 17 н. и 28 з.п. ф-лы, 14 ил.

Реферат

Область техники

Настоящее изобретение относится к кодированию и декодированию аудиосигналов и, в частности, к эффективному высококачественному кодированию пары аудиоканалов.

Предшествующий уровень техники

В последнее время эффективное высококачественное кодирование аудиосигналов становится все более важным, поскольку широко используется цифровое распространение сжатого аудио- и видеоконтента, например, посредством спутника или наземного цифрового аудио- или видеовещания. Известная MP3 методика, например, предусматривает удобную передачу аудиотитров по Интернету или другим каналам передачи, имеющим ограниченную полосу частот.

В дополнение к MP3 несколько других схем кодирования аудио стремятся максимизировать качество аудио для заданного коэффициента сжатия или скорости передачи данных. В "Efficient and scalable Parametric Stereo Coding for Low Bit rate Audio Coding Applications", PCT/SE02/01372, показано, что возможно восстановить стереосигнал, который очень похож на лежащий в основе первоначальный "стереообраз" из моносигнала, когда дополнительно используется очень компактное представление стереосигнала, обычно называемого "пространственный сигнал". Этот раскрытый принцип заключается в разделении входного стереосигнала на диапазоны частот и оценке параметров, называемых межканальными разностями в интенсивности (IID) и межканальной когерентностью (ICC) отдельно для каждого из диапазонов частот. Первый параметр описывает меру распределения мощности между этими двумя каналами в конкретном диапазоне частот, а второй параметр описывает оценку корреляции между этими двумя каналами. Более полное описание пространственных параметров может быть найдено в "High-quality parametric spatial audio coding at low bit rates" J. Breebaart, S. van de Par, A. Kohlrausch and E. Schuijers, Proc. 116th AES Convention, Berlin (Germany), May 8-11, 2004. На основании этих пространственных сигналов входной стереосигнал адаптивно комбинируют в моносигнал. И пространственные сигналы и моносигнал кодируют и кодированное представление мультиплексируют в битовый поток, который передают к декодеру. На стороне декодера стереообраз воссоздают из моносигнала посредством распределения энергии моносигнала между двумя выходными каналами в соответствии с данными IID и посредством добавления декоррелированного сигнала, чтобы сохранить канальную корреляцию первоначальных стереоканалов, как она описана параметрами IIC.

Когда доступна большая полоса частот передачи, может быть достигнуто более высокое качество аудио посредством замены декоррелированного моносигнала в декодере переданным остаточным сигналом. То есть требуется передача дополнительного остаточного сигнала к декодеру. Имеет место также случай с срединным кодированием (MS), где кодируются сумма и разность каналов стереосигнала вместо непосредственно левого и правого каналов. Описание методики MS может быть найдено в "Sum-difference stereo transform coding", Proc. Int. Conf. Acoust. Speech Signal Process. (ICASSP), San Francisco, USA, 1992, стр.II 569 - 572. MS кодирование основано на обнаружении того факта, что левый и правый канал стереосигнала являются достаточно аналогичными с высокой вероятностью. Поэтому разность левого и правого канала дает сигнал, имеющий сравнительно низкий уровень большую часть времени, то есть амплитуда разностного сигнала будет довольно малой. Следовательно, можно сохранить значительную величину скорости передачи в битах, кодируя разностный сигнал, так как параметры, описывающие разностный сигнал, могут быть грубо квантованы. Для суммарного сигнала очевидно необходима приблизительно та же самая полоса частот, что и при кодировании одиночного левого или правого канала. Поэтому можно экономить существенную величину полосы частот в целом при использовании схемы MS кодирования. Когда имеется большая разность в уровне между левым и правым каналом, способ MS имеет свои пределы, так как также разность каналов будет содержать существенное количество энергии и поэтому нуждается в более высокой полосе частот. Следует отметить, однако, что в обычных реализациях стереокодирования MS кодирование не будет применяться в этом случае из-за высоких затрат на кодирование. В этих случаях выгодно иметь возможность переключаться между обычным стереокодированием и кодированием MS, в зависимости от уровня (интенсивности), присущего первоначальным аудиоканалам, которые должны быть закодированы.

Заменяя статическую концепцию построения суммы и разности двух стереоканалов, которые должны быть закодированы, посредством предложения матрицы поворота декодера с элементами матрицы, которые описывают композицию двух промежуточных каналов, которые являются комбинацией двух стереоканалов, можно преодолеть вышеупомянутую проблему. Элементы матрицы являются зависимыми от параметров параметрического стерео (ПС), которые извлекают из левого и правого каналов стереосигнала. Адаптивное остаточное кодирование является таким образом способным динамически адаптировать правило комбинирования для генерирования промежуточных каналов к свойствам текущего сигнала, достигая существенного выигрыша в эффективности перед MS кодированием.

При выборе подходящей зависимости элементов матрицы так называемой матрицы поворота от параметров параметрического стерео можно достичь того, что энергия в разностном канале остается настолько минимальной, насколько это возможно, как уже показано в невыложенной заявке на Европейский патент EP 04103168.3. Когда вводят матрицу поворота, чтобы преобразовать (смешение с уменьшением числа каналов (понижающее микширование) или смешение с увеличением числа каналов (повышающее микширование)) стереосигнал в сигналы m и s (промежуточные сигналы, то есть сигнал m понижающего микширования и остаточный сигнал s), критичным для работы способа является то, что матрицы поворота (матрица поворота декодера и матрица поворота кодера) являются ограниченными. Это означает, что элементы матрицы в этих матрицах не отклоняются до бесконечности во всем диапазоне возможных параметров кодирования параметрического стерео. Другими словами, обе матрицы поворота должны быть ограничены в том смысле, что число обусловленности матрицы должно быть достаточно малым, чтобы разрешить свободное от проблем инвертирование матрицы для всего диапазона параметров кодирования параметрического стерео, что не имеет места для реализаций согласно способам предшествующего уровня техники.

Сущность изобретения

Задачей настоящего изобретения является обеспечение концепции для высококачественного кодирования аудио, для выдачи сильно сжатого представления аудиосигнала, одновременно более эффективно избегая артефактов, вносимых кодированием или декодированием.

Согласно первому аспекту настоящего изобретения эта задача достигается аудиокодером для кодирования аудиосигнала, имеющего по меньшей мере два канала, содержащим: блок извлечения параметров для получения пространственного параметра из аудиосигнала, при этом пространственный параметр описывает взаимосвязь между по меньшей мере двумя каналами; ограничитель для ограничения упомянутого пространственного параметра, используя правило ограничения, чтобы получить ограниченный пространственный параметр, причем правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и блок понижающего микширования для получения сигнала понижающего микширования и остаточного сигнала из аудиосигнала, используя правило понижающего микширования, зависящее от ограниченного пространственного параметра.

Согласно второму аспекту настоящего изобретения эта задача достигается аудиодекодером для декодирования кодированного аудиосигнала, представляющего первоначальный аудиосигнал, имеющий по меньшей мере два канала, причем кодированный аудиосигнал имеет сигнал понижающего микширования, остаточный сигнал и пространственный параметр, описывающий взаимосвязь между по меньшей мере двумя каналами, содержащим: ограничитель для ограничения пространственного параметра, чтобы получить ограниченный пространственный параметр, используя правило ограничения, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и блок повышающего микширования для получения реконструкции первоначального аудиосигнала из сигнала понижающего микширования и остаточного сигнала, используя правило смешения, зависящее от ограниченного пространственного параметра.

Согласно третьему аспекту настоящего изобретения эта задача достигается способом кодирования аудиосигнала, имеющего по меньшей мере два канала, при этом способ содержит этапы: получение пространственного параметра из аудиосигнала, в котором пространственный параметр описывает взаимосвязь между по меньшей мере двумя каналами; ограничение пространственного параметра, используя правило ограничения, чтобы получить ограниченный пространственный параметр, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и получение сигнала понижающего микширования и остаточного сигнала из аудиосигнала, используя правило понижающего микширования, зависящее от ограниченного пространственного параметра.

Согласно четвертому аспекту настоящего изобретения эта задача достигается способом для декодирования закодированного аудиосигнала, представляющего первоначальный аудиосигнал, имеющий по меньшей мере два канала, при этом закодированный аудиосигнал имеет сигнал понижающего микширования, остаточный сигнал и пространственный параметр, описывающий взаимосвязь между по меньшей мере двумя каналами, при этом способ содержит этапы: ограничение пространственного параметра, чтобы получить ограниченный пространственный параметр, используя правило ограничения, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и получение реконструкции первоначального аудиосигнала из сигнала понижающего микширования и остаточного сигнала, используя правило смешения, зависящее от ограниченного пространственного параметра.

Согласно пятому аспекту настоящего изобретения эта задача достигается передатчиком или блоком записи аудио, имеющим аудиокодер для кодирования аудиосигнала, имеющего по меньшей мере два канала, содержащим: блок извлечения параметров для получения пространственного параметра из аудиосигнала, при этом пространственный параметр описывает взаимосвязь между по меньшей мере двумя каналами; ограничитель для ограничения пространственного параметра, используя правило ограничения, чтобы получить ограниченный пространственный параметр, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и блок понижающего микширования для получения сигнала понижающего микширования и остаточного сигнала из аудиосигнала, используя правило понижающего микширования, зависящее от ограниченного пространственного параметра.

Согласно шестому аспекту настоящего изобретения эта задача достигается приемником или блоком воспроизведения аудио, имеющим аудиодекодер для декодирования закодированного аудиосигнала, представляющего первоначальный аудиосигнал, имеющий по меньшей мере два канала, причем закодированный аудиосигнал имеет сигнал понижающего микширования, остаточный сигнал и пространственный параметр, описывающий взаимосвязь между по меньшей мере двумя каналами, содержащим: ограничитель для ограничения пространственного параметра, чтобы получить ограниченный пространственный параметр, используя правило ограничения, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и блок повышающего микширования для получения реконструкции первоначального аудиосигнала из сигнала понижающего микширования и остаточного сигнала, используя правило повышающего микширования, зависящее от ограниченного пространственного параметра.

Согласно седьмому аспекту настоящего изобретения эта задача достигается способом передачи или записи аудио, при этом способ содержит способ формирования кодированного сигнала, упомянутый способ содержит способ для кодирования аудиосигнала, имеющего по меньшей мере два канала, при этом упомянутый способ содержит этапы: получение пространственного параметра из аудиосигнала, в котором пространственный параметр описывает взаимосвязь между по меньшей мере двумя каналами; ограничение пространственного параметра, используя правило ограничения, чтобы получить ограниченный пространственный параметр, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; получение сигнала понижающего микширования и остаточного сигнала из аудиосигнала, используя правило понижающего микширования, зависящее от ограниченного пространственного параметра.

Согласно восьмому аспекту настоящего изобретения эта задача достигается способом приема или воспроизведения аудио, причем упомянутый способ имеет способ для декодирования закодированного аудиосигнала, упомянутый способ содержит способ для декодирования закодированного аудиосигнала, представляющего первоначальный аудиосигнал, имеющий по меньшей мере два канала, при этом закодированный аудиосигнал имеет сигнал понижающего микширования, остаточный сигнал и пространственный параметр, описывающий взаимосвязь между по меньшей мере двумя каналами, при этом способ содержит этапы: ограничение пространственного параметра, чтобы получить ограниченный пространственный параметр, используя правило ограничения, в котором правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и получение реконструкции первоначального аудиосигнала из сигнала понижающего микширования и остаточного сигнала, используя правило повышающего микширования, зависящее от ограниченного пространственного параметра.

Согласно девятому аспекту настоящего изобретения эта задача достигается системой передачи, имеющей передатчик и приемник, причем передатчик имеет аудиокодер для кодирования аудиосигнала, имеющего по меньшей мере два канала, содержащий: блок извлечения параметров для получения пространственного параметра из аудиосигнала, причем пространственный параметр описывает взаимосвязь между по меньшей мере двумя каналами; ограничитель для ограничения пространственного параметра, используя правило ограничения, чтобы получить ограниченный пространственный параметр, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и блок понижающего микширования для получения сигнала понижающего микширования и остаточного сигнала из аудиосигнала, используя правило понижающего микширования, зависящее от ограниченного пространственного параметра; и приемник, имеющий аудиодекодер для декодирования закодированного аудиосигнала, представляющего первоначальный аудиосигнал, имеющий по меньшей мере два канала, причем закодированный аудиосигнал имеет сигнал понижающего микширования, остаточный сигнал и пространственный параметр, описывающий взаимосвязь между по меньшей мере двумя каналами, содержащий: ограничитель для ограничения пространственного параметра, чтобы получить ограниченный пространственный параметр, используя правило ограничения, причем правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и блок повышающего микширования для получения реконструкции первоначального аудиосигнала из сигнала понижающего микширования и остаточного сигнала, используя правило повышающего микширования, зависящее от ограниченного пространственного параметра.

Согласно десятому аспекту настоящего изобретения эта задача достигается способом передачи и приема, причем способ включает в себя способ передачи, имеющий способ формирования кодированного сигнала аудиосигнала, имеющего по меньшей мере два канала, при этом упомянутый способ содержит этапы: получение пространственного параметра из аудиосигнала, при этом пространственный параметр описывает взаимосвязь между по меньшей мере двумя каналами; ограничение пространственного параметра, используя правило ограничения, чтобы получить ограниченный пространственный параметр, причем правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и получение сигнала понижающего микширования и остаточного сигнала из аудиосигнала, используя правило понижающего микширования, зависящее от ограниченного пространственного параметра; и способ приема, имеющий способ для декодирования закодированного аудиосигнала, при этом упомянутый способ содержит этапы: ограничение пространственного параметра, чтобы получить ограниченный пространственный параметр, используя правило ограничения, при этом правило ограничения зависит от взаимосвязи между по меньшей мере двумя каналами; и получение реконструкции первоначального аудиосигнала из сигнала понижающего микширования и остаточного сигнала, используя правило повышающего микширования, зависящее от ограниченного пространственного параметра.

Согласно одиннадцатому аспекту настоящего изобретения эта задача достигается закодированным аудиосигналом, являющимся представлением аудиосигнала, имеющего по меньшей мере два канала, причем закодированный аудиосигнал имеет пространственный параметр, описывающий взаимосвязь между по меньшей мере двумя каналами, сигнал понижающего микширования и остаточный сигнал, при этом сигнал понижающего микширования и остаточный сигнал получены из аудиосигнала, используя правило понижающего микширования, зависящее от ограниченного пространственного параметра, полученного с использованием правила ограничения, зависящего от взаимосвязи по меньшей мере между двумя каналами.

Настоящее изобретение основано на обнаружении того факта, что аудиосигнал, имеющий по меньшей мере два канала, может быть эффективно подвергнут понижающему микшированию для получения сигнала понижающего микширования и остаточного сигнала, когда используемое правило понижающего микширования зависит от пространственного параметра, который получен из аудиосигнала и который подвергается постобработке ограничителем, чтобы применить некоторое ограничение к полученному пространственному параметру с целью ухода от неустойчивостей в течение процесса повышающего микширования или понижающего микширования. Имея правило понижающего микширования, которое динамически зависит от параметров, описывающих взаимосвязь между аудиоканалами, можно гарантировать, что энергия в остаточном сигнале понижающего микширования является настолько минимальной, насколько это возможно, что является выгодным ввиду эффективности кодирования. Посредством постобработки пространственного параметра ограничителем перед его использованием в понижающем микшировании, можно избегать неустойчивостей в процессе понижающего микширования или повышающего микширования, что иначе может приводить к возмущению пространственного восприятия кодированного или декодированного аудиосигнала.

В одном варианте осуществления настоящего изобретения первоначальный стереосигнал, имеющий левый и правый канал, подается на блок понижающего микширования и блок извлечения параметров. Блок извлечения параметров выводит (получает) широко известные пространственные параметры ICC (межканальную корреляцию) и IID (межканальную разность в интенсивности). Блок понижающего микширования способен выполнять понижающее микширование левого и правого каналов в сигнал понижающего микширования и остаточный сигнал, причем правило понижающего микширования является таким, что результирующий остаточный сигнал несет минимальную достижимую энергию. Поэтому последующее сжатие результирующего остаточного сигнала стандартным аудиокодером приведет к чрезвычайно компактному коду. Это может быть достигнуто посредством формулирования правила понижающего микширования, зависящего от пространственных параметров ICC и IID, так как оба эти параметра описывают отношения интенсивности или амплитуды первоначальных стереоканалов. Общая проблема во время кодирования заключается в сохранении энергии. Необходимо, чтобы и исходный сигнал и кодированный сигнал содержали одну и ту же энергию, так как нарушение сохранения энергии может привести к различному восприятию громкости кодированных сигналов или даже к не поддающимся контролю скачкам в громкости кодированного сигнала. Поэтому в вышеупомянутой схеме кодирования сигнал понижающего микширования и остаточный сигнал должны быть масштабированы масштабным коэффициентом, который гарантирует правило сохранения энергии.

Если первоначальный аудиосигнал, который должен быть закодирован, имеет специальные свойства, этот масштабный коэффициент может отличаться, в частности, когда левый и правый первоначальный канал совершенно антикоррелированы, то есть когда они имеют одни и те же амплитуды и фазовый сдвиг точно 180°. Этой неустойчивости избегают в пределах предлагаемой концепции, применяя функцию ограничения к параметру ICC, при этом функция ограничения зависит от максимального приемлемого масштабного коэффициента и параметра IID. Чтобы избежать возможного расхождения, правило, которое описывает понижающее микширование, изменяется непосредственно, в то время как в уровне техники масштабный коэффициент просто ограничивался посредством установки порога, и где масштабный коэффициент заменялся пороговым значением при превышении порога.

Большим преимуществом предлагаемой концепции является то, что сигнал и в канале понижающего микширования и в остаточном канале изменяется посредством изменения параметров, которые лежат в основе процесса понижающего микширования. Согласно предшествующему уровню техники только на сигнал в канале понижающего микширования можно повлиять при применении порога, таким образом лучшее сохранение взаимосвязи между исходным, левым и правым каналом может быть достигнуто при следовании предлагаемой концепции.

Другим преимуществом концепции, описанной выше, является то, что используемые пространственные параметры обычно выводятся в течение процесса кодирования. Поэтому можно осуществлять необходимую логику ограничения без необходимости вводить новые параметры.

В другом варианте осуществления настоящего изобретения ограничитель применяется на стороне декодера, имея то же самое правило ограничения, что и ограничитель на стороне кодера. Это означает, что на стороне декодера принимают сигнал понижающего микширования и остаточный сигнал, а также пространственные параметры IID и ICC, и принятые пространственные параметры ограничивают, используя то же самое правило ограничения, что и используемое в течение процесса кодирования. Тогда повышающее микширование зависит от ограниченных пространственных параметров, гарантируя, что расхождение в процессе повышающего микширования не будет иметь места. Преимущество наличия одних и тех же правил ограничения при кодировании и декодировании очевидно, так как необходимо один раз разработать аппаратные схемы или однократно выполнить программный алгоритм. Аппаратное или программное обеспечение, имеющее функциональные возможности как кодирования, так и декодирования, могут быть разработаны с более низкими затратами, так как возможно многократно использовать одно и то же аппаратное или программное обеспечение для функциональных возможностей ограничения.

В следующем варианте осуществления настоящего изобретения сигналы понижающего микширования и пространственные параметры сжимают после их формирования, получая два битовых потока аудио для сигналов понижающего микширования и битовый поток параметров, имеющий сжатые пространственные параметры. Это уменьшает размер закодированного представления, подлежащего передаче, дополнительно экономя полосу частот, при этом кодирование может быть с потерями или без потерь, так как само правило кодирования является независимым от предлагаемой концепции. Предлагаемый декодер согласно предлагаемой концепции также содержит каскад декомпрессии, где сжатые представления декомпрессируют в пространственные параметры, канал понижающего микширования и остаточный канал перед повышающим микшированием.

В другом варианте осуществления настоящего изобретения уже сжатые битовые потоки аудио и битовый поток параметров объединяют в объединенный битовый поток, например, посредством мультиплексирования, предусматривая подходящее сохранение сформированного файла на носителе данных. Это также предусматривает приложения потоковой передачи данных, например передачу закодированного контента в виде потока через Интернет, так как вся релевантная информация содержится в одном единственном файле или битовом потоке, обеспечивая более удобную обработку, чем в случае, когда могут быть переданы три отдельных битовых потока. Соответствующий предлагаемый декодер также имеет каскад декомбинирования, которым может быть, например, демультиплексор, чтобы декомбинировать битовый поток на три отдельных битовых потока, а именно два битовых потока аудио и битовый поток параметров.

Должно быть отмечено, что предлагаемая концепция обеспечивает превосходную обратную совместимость с известным остаточным кодированием, где пространственные параметры не ограничены, и даже с известным кодированием параметрического стерео, где декодер не использует остаточный сигнал. Это, конечно, является главным преимуществом, так как предлагаемые закодированные данные аудио могут быть воспроизведены с максимальным возможным качеством предлагаемыми декодерами, в то время как они могут быть также воспроизведены уже существующими декодерами согласно предшествующему уровню техники.

В следующем варианте осуществления настоящего изобретения три предлагаемых кодера объединены для кодирования многоканального аудиосигнала, содержащего шесть индивидуальных каналов, при этом каждый из трех предлагаемых кодеров кодирует пару каналов, получая пространственные параметры, сигнал понижающего микширования и остаточный сигнал для каждой из пар канала. Предлагаемая концепция может, таким образом, также использоваться, чтобы кодировать многоканальные аудиосигналы, где эффективность кодирования и компактность результирующего представления имеет даже более высокий приоритет, так как общая сумма данных, которые должны быть закодированы и переданы, намного выше, чем для стереосигнала. В принципе, произвольное количество предлагаемых аудиокодеров может быть объединено, чтобы одновременно кодировать многоканальный аудиосигнал, имеющий в основном любое количество одиночных аудиоканалов. В следующем варианте осуществления многоканального аудиокодера отдельные сигналы понижающего микширования и остаточные сигналы, так же как и отдельные битовые потоки параметров объединяются с помощью блока понижающего микширования 3-в-2, чтобы принять обычный левый сигнал, обычный правый сигнал, обычный остаточный сигнал и объединенный битовый поток параметров, дополнительно сокращая величину требуемой полосы частот. Соответствующие декодеры далее непосредственно содержат блок повышающего микширования 2-в-3.

В другом варианте осуществления настоящего изобретения передатчик или блок записи аудио содержит предлагаемый согласно настоящему изобретению кодер, обеспечивающий компактную, высококачественную запись или передачу аудио, в котором размер переданного или сохраненного аудиоконтента может быть значительно уменьшен. Такой аудиоконтент может быть сохранен на носителе данных заданной емкости, или меньшая величина полосы частот используется в течение передачи аудиосигнала.

В другом варианте осуществления приемник или блок воспроизведения аудио имеет предлагаемый декодер, предусматривая потоковые приложения в средах с ограниченной полосой частот, такие как мобильные телефоны, или предусматривая конструкцию маленьких портативных устройств воспроизведения, использующих носители данных ограниченной емкости.

Комбинация предлагаемого в настоящем изобретении передатчика и приемника дает систему передачи, позволяющую удобно передавать аудиоконтент через проводные или беспроводные интерфейсы связи, такие как беспроводная локальная сеть, Bluetooth, проводная локальная сеть, технологии линии питания, передача радиосигналов или любой другой тип передачи данных.

Краткое описание чертежей

Предпочтительные варианты осуществления настоящего изобретения описаны ниже со ссылками на прилагаемые чертежи, на которых:

Фиг.1 иллюстрирует блок-схему предлагаемого в настоящем изобретении кодера;

Фиг.2 иллюстрирует блок-схему предлагаемого в настоящем изобретении принципа кодирования;

Фиг.3 иллюстрирует другой вариант осуществления предлагаемого в настоящем изобретении кодера;

Фиг.4 иллюстрирует обратную совместимость предлагаемой схемы кодирования с декодерами согласно уровню техники;

Фиг.5 иллюстрирует предлагаемый многоканальный аудиокодер;

Фиг.6 иллюстрирует блок-схему предлагаемого в настоящем изобретении аудиодекодера;

Фиг.7 иллюстрирует блок-схему предлагаемой концепции декодирования;

Фиг.8 иллюстрирует другой вариант осуществления предлагаемого в настоящем изобретении декодера;

Фиг.9 иллюстрирует вариант осуществления предлагаемого в настоящем изобретении многоканального аудиодекодера;

Фиг.10 иллюстрирует альтернативный вариант осуществления предлагаемого в настоящем изобретении аудиокодера;

Фиг.11 иллюстрирует альтернативный вариант осуществления предлагаемого в настоящем изобретении аудиодекодера;

Фиг.12 иллюстрирует предлагаемый согласно изобретению передатчик/блок записи аудио;

Фиг.13 иллюстрирует предлагаемый согласно изобретению приемник/блок воспроизведения аудио;

Фиг.14 иллюстрирует предлагаемую согласно изобретению систему передачи.

Подробное описание предпочтительных вариантов осуществления

Фиг.1 иллюстрирует блок-схему предлагаемого в настоящем изобретении аудиокодера 10, содержащего блок 12 понижающего микширования (уменьшения числа каналов), ограничитель 14 и блок 16 извлечения параметра.

Стереосигнал 18, имеющий левый и правый канал, одновременно подают в блок 12 понижающего микширования и в блок 16 извлечения параметров. Блок 16 извлечения параметров извлекает пространственные параметры 19, описывающие взаимосвязь между левым и правым каналом стереосигнала 18. Эти параметры, с одной стороны, являются доступными для передачи и, с другой стороны, подают в ограничитель 14. Ограничитель 14 применяет правило ограничения к этим параметрам. Подробности соответствующего правила ограничения раскрыты в следующих абзацах.

Ограничитель выводит (получает) ограниченные пространственные параметры, и они подаются в блок 12 понижающего микширования, причем блок 12 понижающего микширования применяет правило понижающего микширования к левому и правому каналам стереосигнала 18, чтобы получить сигнал 20 понижающего микширования и остаточный сигнал 22 из левого и правого каналов стереосигнала. Правило понижающего микширования является дополнительно зависимым от ограниченного пространственного параметра.

При выборе соответствующего правила ограничения для ограничителя на блок 12 понижающего микширования подают только ограниченные параметры, которые ограничены способом, при котором правило понижающего микширования не дает расхождения или не формирует выходной результат, который ухудшает пространственную взаимосвязь левого и правого канал из-за понижающего микширования.

В результате стереосигнал 18 представлен сигналом 20 понижающего микширования, остаточным сигналом 22 и пространственными параметрами 19 после процесса кодирования, выполненного аудиокодером 10.

Чтобы понять, как правило понижающего микширования и правило ограничения должны взаимодействовать, чтобы обеспечить результирующий остаточный сигнал 22, содержащий минимальную возможную энергию при одновременном ограничении пространственного параметра, так что правило понижающего микширования не вызывает каких-либо расхождений, основная концепция, лежащая в основе настоящего изобретения, описана более подробно в следующих нескольких абзацах.

Параметры, извлеченные блоком 16 извлечения параметра, обычно получают из одного временного и частотного интервала выборок в поддиапазоне на основе анализа комплексно модулированных дискретных временных сигналов посредством набора фильтров. Это означает, что аудиосигнал левого и правого канала стереосигнала 18 сначала разделяют на временные кадры заданной длины и в пределах одного временного кадра частотный спектр подразделяют на ряд выборок поддиапазона. Для каждого одного поддиапазона блок 16 извлечения параметра затем получает пространственный параметр посредством сравнения левого и правого каналов стереосигнала в пределах поддиапазона, представляющего интерес. Поэтому левый и правый каналы стереосигнала 18, сигнал m понижающего микширования и остаточный сигнал s согласно фиг.1 должны пониматься как векторы дискретной и конечной длины, описывающие лежащие в основе сигналы в дискретном временном интервале. Как упомянуто выше, во время понижающего микширования должно быть обеспечено сохранение энергии. Для дискретных комплексных векторов x, y, комплексное внутреннее произведение и квадратичная норма (сопоставимая энергии) определяется как

Следуя обычному соглашению, "*" обозначает комплексное сопряжение. Отсюда, буквы верхнего регистра описывают возведенную в квадрат сумму или энергию соответствующих комплексных векторов конечной длины, обозначенных буквами нижнего регистра.

Согласно настоящему изобретению, канал m понижающего микширования, полученный из адаптивного понижающего микширования, является взвешенной суммой энергий исходного левого и правого каналов, и, таким образом, определенный как

m=g·(l+r) (2)

где g - вещественный и положительный коэффициент усиления, настроенный так, что энергия понижающего микширования (M) равняется сумме энергий векторов сигналов левого (L) и правого (R) каналов (М=L+R).

Поскольку этот коэффициент усиления отклоняется к бесконечности, когда l и r не совпадают по фазе и имеют сопоставимую энергию (то есть l+r=0 в уравнении 2), необходимо ограничить этот коэффициент максимальным коэффициентом усиления g0, который обычно находится в интервале [1,2]. Блок 16 извлечения параметров, как показано на фиг.1, извлекает пространственные аудиопараметры IID (межканальная разность интенсивностей) и ICC (межканальная когерентность), которые представлены здесь как

здесь c обозначает IID-параметр, и ρ обозначает ICC-параметр. Коэффициент усиления g может быть выражен зависящим от параметров ICC и IID, и такое требуемое ограничение коэффициента усиления может быть записано следующим образом:

Обычно, так как |ρ|≤1, мы имеем 2pc≤c2+1, так что

Чтобы достигать максимальной эффективности кодирования, желательно, чтобы энергия в остаточном сигнале 22 была минимальна. Следующий вывод решает более общую проблему оптимизации, заключающуюся в дополнительном остаточном сигнале t, который затем оказывается лишним из-за (9). Рассматривая проблему со стороны декодера, необходимо определить усиление a, b, так чтобы остаточные сигналы s, t при повышающем микшировании

имели минимальную энергию. Решение задается посредством

где

Та же самая проблема с дополнительным ограничением, таким что коэффициенты a, b являются вещественными, дает решение, заданное взятием вещественной части (7) и подстановкой ее в (6). В этом случае p может быть выражено в терминах PS параметров c, p, следующим образом: