Манипулирование зоной наилучшего восприятия для многоканального сигнала

Иллюстрации

Показать все

Изобретение относится к манипулированию зоной наилучшего восприятия для многоканального сигнала, в частности, для многоканального сигнала MPEG системы «окружающего звука». Техническим результатом является возможность осуществлять манипулирования уменьшенной сложности зоной наилучшего восприятия. Указанный результат достигается тем, что устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала содержит приемник (201) для приема N-канального аудиосигнала, N<M, параметрическое средство (203) для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, модифицирующее средство (207) для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство (205) генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования. 7 н. и 13 з.п. ф-лы, 5 ил., 2 табл.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Данное изобретение относится к манипулированию зоной наилучшего восприятия для многоканального сигнала и, в частности, но не исключительно, к манипулированию зоной наилучшего восприятия для многоканального сигнала MPEG системы «окружающего звука».

УРОВЕНЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ

Цифровое кодирование сигналов из различных источников становилось все более важным на протяжении последних десятилетий, по мере того как цифровое представление и передача сигналов все более заменяло аналоговое представление и передачу. Например, распространение мультимедийного контента, такого как видео и музыка, все более основывается на цифровом кодировании контента.

Кроме того, в последнее десятилетие наблюдается тенденция к многоканальному звуку и, в частности, к пространственному звуку, простирающемуся за пределы стандартных стереосигналов. Например, традиционные стереозаписи содержат только два канала, тогда как современные продвинутые аудиосистемы обычно используют пять или шесть каналов, как в популярных системах окружающего звука 5.1. Это обеспечивает опыт более включенного прослушивания, когда пользователь может быть окружен источниками звука.

Были разработаны различные способы и стандарты для передачи таких многоканальных сигналов. Например, шесть дискретных каналов, представляющих систему окружающего звука 5.1, могут передаваться в соответствии с такими стандартами, как продвинутое кодирование звука (AAC) или Dolby Digital.

Однако для обеспечения обратной совместимости, как известно, необходимо уменьшить большее число каналов до меньшего числа каналов, т.е. осуществить понижающее микширование, и, в частности, это часто используется для понижающего микширования сигнала окружающего звука 5.1 до стереосигнала, что позволяет воспроизводить стереосигнал обычными (стерео)декодерами, а 5.1 сигнал - декодерами окружающего звука.

Одним примером является способ обратно совместимого кодирования MPEG2. Многоканальный сигнал низводится в стереосигнал. Дополнительные сигналы кодируются во вспомогательный участок данных, позволяющий многоканальному MPEG2 декодеру генерировать представление многоканального сигнала. MPEG1 декодер проигнорирует эти вспомогательные данные и, таким образом, декодирует только стереопонижение. Основной недостаток этого способа кодирования, применяемого в MPEG2, состоит в том, что скорость передачи дополнительных данных, требуемая для дополнительных данных, имеет тот же самый порядок величины, что и скорость передачи данных, требуемая для кодирования стереосигнала. Дополнительная скорость передачи битов для расширения стерео до многоканального аудио, следовательно, является значительной.

Другие существующие способы обратно совместимой многоканальной передачи без дополнительной многоканальной информации могут быть охарактеризованы как матричные способы системы окружающего звука. Примеры матричного кодирования окружающего звука включают в себя такие способы, как Dolby Prologic II и Logic-7. Общий принцип этих способов состоит в том, что они матрично умножают множественные каналы входного сигнала посредством подходящей неквадратичной матрицы, тем самым генерируя выходной сигнал с меньшим числом каналов. В частности, матричный кодер обычно применяет фазовые сдвиги к каналам окружения перед микшированием их с передним и центральным каналами.

Другой причиной преобразования каналов является эффективность кодирования. Было обнаружено, что, например, сигналы окружающего звука могут быть кодированы как аудиосигналы стереоканалов, комбинированные с параметрическим потоком битов, описывающим пространственные свойства аудиосигнала. Этот декодер может воспроизводить звуковые стереосигналы с очень удовлетворительной степенью точности. Таким образом, может быть получена существенная экономия скорости передачи битов.

Таким образом, в (параметрических) пространственных аудиокодерах параметры извлекаются из первоначального аудиосигнала таким образом, чтобы сформировать аудиосигнал, имеющий уменьшенное число каналов, например только один канал, плюс множество параметров, описывающих пространственные свойства первоначального аудиосигнала. В (параметрических) пространственных аудиокодерах пространственные свойства, описываемые переданными пространственными параметрами, используются для воссоздания первоначального пространственного многоканального сигнала. Имеется несколько параметров, которые могут использоваться для описания пространственных свойств аудиосигналов. Одним таким параметром является межканальная кросс-корреляция, как, например, кросс-корреляция между левым каналом и правым каналом для стереосигналов. Другим параметром является отношение мощностей этих каналов.

Конкретным примером такого способа является подход MPEG Surround (окружающего звука) для эффективного кодирования многоканальных аудиосигналов.

MPEG Surround кодер низводит М-канальный входной сигнал к N-канальному сигналу понижающего микширования, где N<M, и извлекает пространственные параметры. Сигнал понижающего микширования обычно кодируется с использованием обычного кодера, такого как, например, MP3 или AAC кодер. Пространственные параметры кодируются и встраиваются в поток битов обратно совместимым образом таким образом, что обычные декодеры все же могут декодировать лежащий в основе сигнал понижающего микширования.

В MPEG Surround кодере сигнал понижающего микширования сначала декодируется с использованием обычного декодера. Многоканальный сигнал затем восстанавливается посредством пространственных параметров, которые извлекаются из потока битов.

Кроме типичного многоканального кодирования, описанного выше, MPEG Surround предлагает богатый набор дополнительных характеристик, например:

- Неуправляемое декодирование - MPEG Surround декодер способен создавать многоканальное повышающее микширование стереосигналов, когда пространственная боковая информация является недоступной. В этом режиме декодер вычисляет отношение мощностей и корреляцию стереосигнала, и эти характеристики используются для получения требуемых пространственных параметров посредством просмотра таблицы.

- Матричная совместимость - MPEG Surround кодер способен генерировать понижающее микширование, которое может быть декодировано с использованием схем матричного декодирования. Матричное понижающее микширование окружающего звука создается таким образом, что оно может быть инвертировано MPEG Surround декодером без уступок восприятия для работы декодера. Кроме того, матричное понижающее микширование окружающего звука улучшает работу неуправляемого режима.

- Бинауральное (стереофоническое) декодирование - MPEG Surround декодер способен трансформировать моно- или стереосигнал понижающего микширования непосредственно в трехмерный бинауральный стереосигнал с использованием пространственных параметров вместо вычисления многоканального сигнала в качестве промежуточной стадии.

- Высокопрофессиональное понижающее микширование - MPEG Surround дает возможность передавать созданное вручную понижающее микширование вместо автоматизированного MPEG Surround понижающего микширования.

- Произвольные деревья - MPEG Surround битовый поток поддерживает определение произвольных структур повышающего микширования, позволяющее иметь произвольное число выходных каналов.

MPEG Surround кодер нацелен на представление первоначального многоканального сигнала так точно, насколько это возможно для заданной настройки громкоговорителей, такой как, например, настройки 5.1. Однако он не позволяет иметь какую-либо гибкость по отношению к различным позициям прослушивания и окружениям, таким, которые обычно присутствуют дома или в транспортном средстве.

Воспроизведение для альтернативных позиций и окружений прослушивания может быть усовершенствовано посредством манипулирования зоной наилучшего восприятия (например, перемещения и/или расширения). Однако, хотя манипулирование зоной наилучшего восприятия является известным, стандартные подходы являются неоптимальными и обычно применяются как стадия окончательной обработки, требующая обработки высокой сложности индивидуальных выходных каналов.

Следовательно, усовершенствованная система для манипулирования зоной наилучшего восприятия была бы выгодной, и в частности, была бы выгодна система, обладающая увеличенной гибкостью, улучшенным качеством, улучшенным опытом прослушивания, уменьшенной сложностью, облегченной обработкой и/или улучшенной производительностью.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Соответственно, данное изобретение предпочтительно стремится к ослаблению, смягчению или устранению одного или нескольких вышеупомянутых недостатков по одному или в любой комбинации.

Согласно первому аспекту изобретения обеспечено устройство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем это устройство содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Данное изобретение может обеспечить улучшенный опыт прослушивания. Данное изобретение может дать возможность осуществлять манипулирование уменьшенной сложности зоной наилучшего восприятия посредством прямой модификации пространственных параметров как части процесса декодирования. Может быть достигнута облегченная обработка уменьшенной вычислительной сложности. Этим устройством может быть, в частности, декодер. Изобретение может позволить осуществить улучшенную производительность посредством интеграции декодирования и манипулирования зоной наилучшего восприятия выгодным образом.

N-канальным сигналом может быть, в частности, моно- или стереосигнал, а М-канальным сигналом может быть, в частности, сигнал окружающего звука 5.1, 6.1 или 7.1. Пространственными параметрами могут быть, в частности, параметры, отличающиеся временем и частотой, связывающие характеристики различных каналов пространственного М-канального аудиосигнала с сигналами N-канального сигнала (или наоборот). Например, пространственные параметры могут включать в себя параметры уровня и/или корреляции для индивидуальных временных частотных блоков. Повышающим микшированием N-канального аудиосигнала в пространственный М-канальный аудиосигнал может быть каскадное (последовательное) повышающее микширование.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации баланса переднего канала с задним каналом посредством модификации первого пространственного параметра повышающего микширования, указывающего разность интенсивности между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать улучшенный опыт прослушивания для (передних/задних) нецентральных позиций посредством простой и несложной обработки.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является межканальная разность интенсивности между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра повышающего микширования, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации показателя квантования межканальной разности интенсивностей.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию и может, в частности, дать возможность осуществить облегченное и более дружественное пользователю манипулирование при отражении восприятия звука человеком. Показатель квантования может быть модифицирован перед декодированием.

Согласно возможной особенности изобретения, модифицирующее средство дополнительно выполнено с возможностью масштабирования по меньшей мере одного переднего канала таким образом, что вариация отношения энергии переднего бокового канала к энергии центрального канала для пространственного М-канального аудиосигнала, вызванная модификацией первого параметра, уменьшена.

Это может дать возможность осуществить улучшенный опыт прослушивания и может во многих случаях дать возможность осуществить манипулируемую зону наилучшего восприятия с минимальным искажением восприятия. Модифицирующее средство может, в частности, по существу поддерживать то же самое отношение энергии переднего бокового канала к энергии центрального канала после модификации параметров, что и перед модификацией. Модифицирующее средство может, в частности, масштабировать центральный канал или может, например, масштабировать боковые каналы по существу равным образом относительно центрального канала и/или может масштабировать боковые каналы по-разному.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации рассредоточения центра посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала n-канального аудиосигнала между центральным каналом и по меньшей мере одним боковым каналом.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить увеличенный пространственный опыт прослушивания.

В некоторых вариантах осуществления модифицирующее средство выполнено с возможностью модификации рассредоточения центра посредством модификации первого пространственного параметра, указывающего величину масштабирования между по меньшей мере одним каналом N-канального аудиосигнала и по меньшей мере одним передним каналом пространственного М-канального аудиосигнала.

Повышающее микширование N-канального аудиосигнала может, в частности, включать в себя повышающее микширование N-канального аудиосигнала в К-канальный сигнал (N<K<=M) посредством (К, N) матричного умножения повышающего микширования значений сигналов для N-канальных сигналов, и первым пространственным параметром повышающего микширования может быть матричный коэффициент матрицы повышающего микширования.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, обычно уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации баланса левого с правым посредством модификации первого пространственного параметра повышающего микширования, указывающего относительное распределение сигнала по меньшей мере одного канала N-канального аудиосигнала между по меньшей мере одним правым боковым каналом и по меньшей мере одним левым боковым каналом.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания для (левых/правых) нецентральных позиций прослушивания посредством простой обработки низкой сложности.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент предсказания каналов.

Это может дать возможность осуществить реализацию особенно низкой сложности и/или эффективную реализацию. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, модифицирующее средство выполнено с возможностью модификации дисперсии спереди назад посредством модификации первого пространственного параметра повышающего микширования, указывающего относительную корреляцию между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом пространственного М-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить увеличенный пространственный опыт прослушивания.

Согласно возможной особенности изобретения, первым пространственным параметром повышающего микширования является коэффициент межканальной корреляции между по меньшей мере одним передним каналом и по меньшей мере одним задним каналом.

Это может дать возможность осуществить реализацию особенно низкой сложности. В частности, зона наилучшего восприятия может быть модифицирована с использованием простой модификации пространственного параметра, уже используемого в операции декодирования.

Согласно возможной особенности изобретения, N-канальный аудиосигнал соответствует понижающему микшированию пространственного М-канального аудиосигнала, и приемник выполнен с возможностью принятия пространственных параметров повышающего микширования кодера, связывающих низведенный N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, и параметрическое средство выполнено с возможностью определения пространственных параметров повышающего микширования из пространственных параметров повышающего микширования кодера.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания в системе, содержащей параметрический кодер, генерирующий N-канальный аудиосигнал.

Этот кодер может генерировать данные пространственных параметров при понижающем микшировании пространственного М-канального аудиосигнала в N-канальный аудиосигнал. Эти данные пространственных параметров могут быть переданы к устройству, и зона наилучшего восприятия может быть модифицирована посредством модификации этих данных. Пространственные параметры могут, в частности, содержать пространственные параметры кодера. N-канальным аудиосигналом может, в частности, быть MPEG Surround сигнал, содержащий параметрические данные.

Согласно возможной особенности изобретения, параметрическое средство выполнено с возможностью определения пространственных параметров повышающего микширования из характеристик сигналов каналов N-канального аудиосигнала.

Это может обеспечить улучшенный опыт прослушивания и/или облегченное манипулирование зоной наилучшего восприятия. В частности, эта особенность может дать возможность осуществить улучшенный опыт прослушивания в системе, не использующей явные параметрические кодеры, которые не передают параметрические данные для пространственного М-канального аудиосигнала. N-канальным аудиосигналом может быть, в частности, неуправляемый MPEG Surround сигнал, такой как матричный совместимый сигнал понижающего микширования. N-канальным аудиосигналом может также быть обычный стереосигнал, например стерео MP3 декодированный сигнал, или стерео FM сигнал.

Согласно другому аспекту изобретения, обеспечен приемник для принятия пространственного М-канального аудиосигнала, причем этот приемник содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечена система передачи для передачи аудиосигнала, причем эта система содержит: передатчик, выполненный с возможностью передачи N-канального аудиосигнала; и приемник, содержащий: приемник для принятия N-канального аудиосигнала; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечено воспроизводящее звук устройство для воспроизведения пространственного М-канального аудиосигнала, причем это воспроизводящее звук устройство содержит: приемник для принятия N-канального аудиосигнала, N<M; параметрическое средство для определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модифицирующее средство для модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; средство генерации для генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала, причем этот способ предусматривает: принятие N-канального аудиосигнала, N<M; определение пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модификацию зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерацию пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ принятия пространственного М-канального аудиосигнала, причем этот способ предусматривает: принятие N-канального аудиосигнала, N<M; определение пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом; модификацию зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерацию пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Согласно другому аспекту изобретения, обеспечен способ передачи и приема аудиосигнала, причем этот способ содержит: передатчик, передающий N-канальный аудиосигнал; и приемник, выполняющий стадии: принятия N-канального аудиосигнала; определения пространственных параметров повышающего микширования, связывающих N-канальный аудиосигнал с пространственным М-канальным аудиосигналом, N<M; модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала посредством модификации по меньшей мере одного из пространственных параметров повышающего микширования; генерации пространственного М-канального аудиосигнала посредством повышающего микширования N-канального аудиосигнала с использованием по меньшей мере одного модифицированного пространственного параметра повышающего микширования.

Эти и другие аспекты, особенности и преимущества изобретения явствуют и разъясняются со ссылкой на вариант (варианты) осуществления, описываемые далее.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления изобретения будут описаны только посредством примера, со ссылкой на чертежи, в которых:

Фиг. 1 является иллюстрацией системы передачи для передачи аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 2 является иллюстрацией декодера, способного модифицировать зону наилучшего восприятия пространственного М-канального аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 3 является иллюстрацией настройки громкоговорителей для MPEG системы окружающего звука;

Фиг. 4 является иллюстрацией структуры MPEG Surround декодера; и

Фиг. 5 является иллюстрацией способа модификации зоны наилучшего восприятия пространственного М-канального аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения.

ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Следующее описание фокусируется на вариантах осуществления изобретения, применимых к MPEG аудиосистеме окружающего звука. Однако будет ясно, что изобретение не ограничено этим применением, а может быть применено ко многим другим многоканальным аудиосистемам и стандартам.

Фиг. 1 иллюстрирует систему 100 передачи для передачи аудиосигнала в соответствии с некоторыми вариантами осуществления изобретения. Система 100 передачи содержит передатчик 101, который подключен к приемнику 103 через сеть 105, которой, в частности, может быть Интернет.

В этом конкретном примере передатчиком 101 является устройство записи сигналов, а приемником 103 является устройство воспроизведения сигналов, но будет ясно, что в других вариантах осуществления передатчик и приемник могут использоваться в других приложениях и с другими целями. Например, передатчик 101 и/или приемник 103 могут быть частью функциональности транскодирования и могут, например, обеспечивать сопряжение с другими источниками или назначениями сигналов.

В этом конкретном примере, когда поддерживается функция записи сигналов, передатчик 101 содержит дискретизатор 107, который принимает аналоговый многоканальный сигнал, который преобразуется в цифровой PCM (модулированный импульсным кодом) сигнал посредством дискретизации и аналого-цифрового преобразования.

Дискретизатор 107 подключен к кодеру 109 фиг. 1, который кодирует PCM сигнал в соответствии с алгоритмом кодирования. В этом примере кодером 109 является MPEG Surround кодер, который кодирует М-канальный сигнал как N-канальный сигнал, где M>N. MPEG Surround декодер, таким образом, генерирует N-канальный сигнал, а также пространственные параметрические данные, которые позволяют декодеру генерировать М-канальный сигнал. Кодер 109 может, например, кодировать 5.1, 6.1 или 7.1 сигнал окружающего звука как стереосигнал плюс пространственные параметрические данные. Следующее описание будет фокусироваться на сценарии, в котором 5.1 стереосигнал кодируется как стереосигнал плюс пространственные параметрические данные.

Кодер 109 подключен к сетевому передатчику 111, который принимает кодированный сигнал и сопрягается с Интернетом 105. Сетевой передатчик может передавать кодированный сигнал к приемнику 103 через Интернет 105.

Приемник 103 содержит сетевой приемник 113, который сопрягается с Интернетом 105 и который выполнен с возможностью принятия кодированного сигнала от передатчика 101.

Сетевой приемник 113 подключен к декодеру 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования. В этом примере декодер декодирует М-канальный сигнал из N-канального сигнала с использованием принятых параметрических данных после того, как они были модифицированы для того, чтобы модифицировать зону наилучшего восприятия первоначального сигнала. Зоной наилучшего восприятия пространственного многоканального сигнала является область/местоположения, в которой пространственное восприятие не отклоняется значительно от заданного пространственного восприятия, например заданного студийными инженерами для стандартизованной настройки многоканальных громкоговорителей.

В частности, в этом примере декодером 115 является MPEG Surround декодер, работающий в управляемом режиме, когда декодирование основано на пространственных параметрических данных, генерируемых кодером 109. Однако будет ясно, что в других вариантах осуществления пространственные параметрические данные могут генерироваться самим декодером и что декодером 115 может, в частности, быть MPEG Surround декодер, работающий в неуправляемом режиме.

В этом конкретном примере, когда поддерживается функция воспроизведения сигналов, приемник 103 дополнительно содержит проигрыватель 117 сигналов, который принимает декодированный аудиосигнал от декодера 115 и предоставляет его пользователю. В частности, проигрыватель 117 сигналов может содержать цифро-аналоговый преобразователь, усилители и громкоговорители, требуемые для выдачи декодированного аудиосигнала.

Фиг. 2 иллюстрирует декодер 115 более подробно.

Декодер 115 содержит блок 201 приемника, который принимает битовый поток от сетевого приемника 113. Этот приемник содержит как кодированный стереосигнал, так и параметрические данные.

Блок 201 приемника подключен к параметрическому блоку 203, который определяет пространственные параметры, которые должны быть использованы для генерации окружающего сигнала из стереосигнала. Этими пространственными параметрами являются, таким образом, параметрические данные, которые описывают характеристику канального сигнала М-канального сигнала относительно характеристики канального сигнала N-канального сигнала. Пространственные параметры могут, в частности, указывать, как N-канальный сигнал должен быть обработан для генерации М-канального сигнала.

В этом основном примере пространственные параметры просто генерируются посредством извлечения этих параметров из принимаемого битового потока, т.е. используются пространственные параметры, генерируемые кодером 109. Однако будет ясно, что в других вариантах осуществления пространственные параметры могут, например, определяться самим декодером, например, посредством оценки этих параметров из принимаемого сигнала. В частности, декодер 115 может быть MPEG Surround декодером, работающим в неуправляемом режиме, и может соответственно генерировать пространственные параметры из некоторых характеристик N-канального сигнала, таких как разность интенсивностей каналов и характеристики корреляции принимаемого стереосигнала.

Блок 201 приемника также подключен к декодирующему блоку 205, который декодирует стереосигнал и увеличивает число его каналов для генерации 5.1 канального окружающего сигнала. Повышающее микширование в этом примере выполняется в соответствии со стандартом MPEG Surround и основывается на определенных пространственных параметрах. Однако пространственные параметры не используются непосредственно, а декодер 115 содержит модифицирующий блок 207, который подключен к параметрическому блоку 203 и декодирующему блоку 205 и который изменяет один или несколько пространственных параметров для того, чтобы модифицировать зону наилучшего восприятия генерируемого окружающего сигнала.

Таким образом, декодер 115 фиг. 2 позволяет осуществить простое, эффективное, высокопроизводительное и несложное манипулирование зоной наилучшего восприятия выходного сигнала окружающего звука посредством модификации одного или нескольких пространственных параметров, используемых в процессе декодирования/повышающего микширования. Таким образом, путем интеграции манипулирования и декодирования/повышающего микширования может быть достигнута по существу облегченная и улучшенная работа.

Этот подход может использоваться для эффективной модификации формы и местоположения зоны наилучшего восприятия. Это особенно полезно для домашнего применения и применения в автомобиле, когда позиция слушателя отличается от первоначальной позиции зоны наилучшего восприятия. Это может быть также полезно для создания схожих восприятий звукового образа для множественных слушателей с различными позициями. Таким образом, этот подход позволяет осуществить легкое манипулирование наиболее желательными особенностями для управления звуковой сценой, включающими в себя:

- Управление передне-задним балансом может быть применено для постепенного акцентирования пространственного образа к передней части или к задней части.

- Управление центральной дисперсией может быть применено для создания менее (или более) направленного восприятия центрального канала.

- Управление лево-правым балансом может быть применено для обеспечения постепенного сдвига акцента влево или вправо.

- Управление корреляцией или передне-задней дисперсией может быть применено для осуществления управления передне-задней корреляцией, которая дает вклад в воспринимаемую ширину звука.

Этот подход приводит к очень не сложным решениям для манипулирования зоной наилучшего восприятия, и является выгодным то, что этот подход может применяться во всех рабочих режимах MPEG Surround. Кроме того, как будет описано далее, можно также улучшить пространственный образ при декодировании сигналов понижающего микширования ограниченного качества, таких как сигналы в FM и AM радиопередачах.

Далее более подробный пример различных манипуляций зоной наилучшего восприятия будет описан со ссылкой на 5.1 MPEG Surround систему.

Фиг. 3 иллюстрирует настройку громкоговорителей, на которой основаны 6-канальные выходные конфигурации MPEG Surround алгоритма.

Фиг. 4 иллюстрирует MPEG Surround структуру повышающего микширования для генерации 5.1 сигнала окружающего звука из принимаемого стереосигнала и пространственных параметров. В MPEG Surround повышающее микширование выполняется в каскадном процессе, где первоначально два коэффициента предсказания каналов (CPC) используются для создания левого, центрального и правого сигнала (L, C и R) в первой стадии повышающего микширования с использованием матрицы (3х2) предварительного усиления, заданной следующим образом:

.

Каждый из этих трех промежуточных каналов затем преобразуется в два дополнительных канала. В частности, промежуточный центральный канал разделяется на центральный канал и канал улучшения низких частот