Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов

Иллюстрации

Показать все

Изобретение относится к средствам для пространственного кодирования аудиообъектов. Технический результат заключается в повышении качества кодированного аудиосигнала. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования. Декодер содержит первый модуль анализа для преобразования сигнала понижающего микширования, чтобы получить первое преобразованное понижающее микширование, содержащее множество каналов первого поддиапазона. Декодер содержит второй модуль анализа для формирования второго преобразованного понижающего микширования путем преобразования по меньшей мере одного из каналов первого поддиапазона, чтобы получить множество каналов второго поддиапазона, где второе преобразованное понижающее микширование содержит каналы первого поддиапазона, которые не были преобразованы вторым модулем анализа, и каналы второго поддиапазона. Декодер содержит блок повышающего микширования, сконфигурированный для повышающего микширования второго преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутом одном или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал. 6 н. и 10 з.п. ф-лы, 22 ил.

Реферат

Настоящее изобретение относится к кодированию аудиосигнала, декодированию аудиосигнала и обработке аудиосигнала, и в частности, к кодеру, декодеру и способам для обратно совместимой динамической адаптации разрешения по времени/частоте при пространственном кодировании аудиообъектов (SAOC).

В современных системах цифрового аудио главным направлением является создание возможности связанных с аудиообъектом модификаций переданного контента на стороне приемника. Эти модификации включают в себя модификации усиления выбранных частей аудиосигнала и/или пространственную перестановку выделенных аудиообъектов в случае многоканального воспроизведения посредством рассредоточенных в пространстве динамиков. Это может достигаться путем индивидуальной доставки разных частей аудиоконтента в разные динамики.

Другими словами, в области обработки аудио, передачи аудио и хранения аудио существует растущая потребность в разрешении взаимодействия с пользователем касательно объектно-ориентированного воспроизведения аудиоконтента, а также необходимость использовать расширенные возможности многоканального воспроизведения для индивидуального воспроизведения аудиоконтента или его частей, чтобы улучшить слуховое ощущение. К тому же использование многоканального аудиоконтента приносит пользователю значительные улучшения. Например, можно получить трехмерное слуховое ощущение, которое способствует большей удовлетворенности пользователя в развлекательных приложениях. Однако многоканальный аудиоконтент также полезен в профессиональных средах, например, в приложениях телефонной конференц-связи, поскольку можно улучшить разборчивость речи говорящего с использованием многоканального воспроизведения аудио. Другим возможным применением является предложение слушателю музыкального произведения индивидуально регулировать уровень воспроизведения и/или пространственное положение разных частей (также называемых "аудиообъектами") либо дорожек, например вокальную часть или разные инструменты. Пользователь может выполнять такую регулировку исходя из личного вкуса, для более простой расшифровки одной или более частей музыкального произведения, для образовательных целей, караоке, репетиции и т. п.

Прямая дискретная передача всего цифрового многоканального или многообъектного аудиоконтента, например, в виде данных импульсно-кодовой модуляции (PCM) или даже форматов сжатого аудио, требует очень высоких скоростей передачи разрядов. Однако также желательно передавать и хранить аудиоданные эффективным по скорости передачи разрядов способом. Поэтому есть желание принять разумный компромисс между качеством аудио и требованиями к скорости передачи разрядов, чтобы избежать чрезмерной загрузки ресурсов, вызванной многоканальными/многообъектными приложениями.

В последнее время в области кодирования аудио Экспертной группой по движущимся изображениям (MPEG) и другими предложены параметрические методики для эффективной по скорости передачи/хранения многоканальных/многообъектных аудиосигналов. Одним примером является MPEG Surround (MPS) в качестве канально-ориентированного подхода [MPS, BCC], или Пространственное кодирование аудиообъектов MPEG (SAOC) в качестве объектно-ориентированного подхода [JSC, SAOC, SAOC1, SAOC2]. Другой объектно-ориентированный подход называется "информированным разделением источников" [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6]. Эти методики направлены на восстановление нужной выходной аудиосцены или нужного объекта источника аудио на основе понижающего микширования каналов/объектов и дополнительной информации, описывающей переданную/сохраненную аудиосцену и/или объекты источников аудио в аудиосцене.

В таких системах оценка и применение связанной с каналом/объектом дополнительной информации выполняется избирательным по времени-частоте способом. Поэтому такие системы применяют частотно-временные преобразования, например дискретное преобразование Фурье (DFT), оконное преобразование Фурье (STFT) или гребенки фильтров типа гребенок квадратурного зеркального фильтра (QMF), и т.п. Основной принцип таких систем изображается на фиг. 3 с использованием примера SAOC MPEG.

В случае STFT временная размерность представляется номером временного блока, а спектральная размерность охватывается номером спектрального коэффициента ("элемента разрешения"). В случае QMF временная размерность представляется номером временного интервала, а спектральная размерность охватывается номером поддиапазона. Если спектральное разрешение QMF повышается путем последующего применения второго каскада фильтра, то вся гребенка фильтров называется гибридным QMF, а поддиапазоны высокого разрешения называются гибридными поддиапазонами.

Как уже упоминалось выше, в SAOC общая обработка осуществляется избирательным по времени-частоте способом и может описываться в каждом диапазоне частот следующим образом, как изображено на фиг. 3:

- N сигналов s1…sN входных аудиообъектов подвергаются понижающему микшированию в P каналов x1…xP как часть обработки кодера с использованием матрицы понижающего микширования, состоящей из элементов d1,1…dN,P. К тому же кодер извлекает дополнительную информацию, описывающую характеристики входных аудиообъектов (модуль оценки дополнительной информации (SIE)). Для SAOC MPEG зависимости мощностей объектов друг от друга являются основным видом такой дополнительной информации.

- Сигнал понижающего микширования (сигналы) и дополнительная информация передаются/сохраняются. С этой целью аудиосигнал (сигналы) понижающего микширования можно сжимать, например, с использованием общеизвестных кодеров воспринимаемого аудио, таких как Уровень II или III MPEG-1/2 (также известный как .mp3), Усовершенствованное аудиокодирование (AAC) MPEG-2/4 и т.п.

- На принимающей стороне декодер концептуально пытается восстановить исходные сигналы объектов ("разделение объектов") из (декодированных) сигналов понижающего микширования, используя переданную дополнительную информацию. Эти приблизительные сигналы ŝ1…ŝN объектов затем подвергаются микшированию в целевую сцену, представленную M каналами ŷ1…ŷM вывода аудио, используя матрицу воспроизведения, описанную коэффициентами r1,1…rN,M на фиг. 3. Нужная целевая сцена в предельном случае может быть воспроизведением лишь одного сигнала источника из смеси (сценарий разделения источников), но также любой другой произвольной акустической сценой, состоящей из переданных объектов. Например, результатом может быть одноканальная, 2-канальная (стерео) или многоканальная (5.1) целевая сцена.

Частотно-временные системы могут использовать частотно-временное (t/f) преобразование со статическим разрешением по времени и частоте. Выбор определенной сетки фиксированного t/f-разрешения обычно включает в себя компромисс между разрешением по времени и частоте.

Эффект фиксированного t/f-разрешения можно продемонстрировать на примере типичных сигналов объектов в смеси аудиосигналов. Например, спектры тональных звуков показывают гармонически связанную структуру с основной частотой и несколькими обертонами. Энергия таких сигналов сосредоточена в определенных областях частот. Для таких сигналов высокое разрешение по частоте у используемого t/f-представления выгодно для выделения узкополосных тональных спектральных областей из смеси сигналов. Наоборот, сигналы перехода типа звуков ударных часто имеют четкую временную структуру: существенная энергия присутствует только в коротких периодах времени и распространяется на широкий диапазон частот. Для этих сигналов высокое разрешение по времени у используемого t/f-представления выгодно для выделения части с сигналами перехода из смеси сигналов.

Имеющиеся схемы кодирования аудиообъектов предлагают лишь ограниченную изменчивость в избирательности по времени-частоте в обработке SAOC. Например, SAOC MPEG [SAOC][SAOC1][SAOC2] ограничивается разрешением по времени-частоте, которое можно получить с использованием так называемой гребенки гибридного квадратурного зеркального фильтра (Гибридный QMF), и его последующего группирования в параметрические диапазоны. Поэтому восстановление объекта при стандартном SAOC (SAOC MPEG, которое стандартизовано в [SAOC]) часто страдает от низкого разрешения по частоте у Гибридного QMF, приводящего к слышимым модулированным перекрестным помехам от других аудиообъектов (например, артефактам неразборчивости в речи или артефактам резкости для слуха в музыке).

Схемы кодирования аудиообъектов, например бинауральное кодирование с метками [BCC] и параметрическое совместное кодирование источников аудио [JSC], также ограничены использованием одной гребенки фильтров с фиксированным разрешением. Фактический выбор гребенки фильтров с фиксированным разрешением или преобразования всегда включает в себя предопределенный компромисс в части оптимальности между временными и спектральными свойствами схемы кодирования.

В области информированного разделения источников (ISS) предложено динамически адаптировать длину частотно-временного преобразования к свойствам сигнала [ISS7], что известно из схем кодирования воспринимаемого аудио, например, усовершенствованного аудиокодирования (AAC)[AAC].

Цель настоящего изобретения – предоставить усовершенствованные идеи для кодирования аудиообъектов. Цель настоящего изобретения достигается с помощью декодера по п. 1, кодера по п. 7, способа декодирования по п. 13, способа кодирования по п. 14 и компьютерной программы по п. 15.

В отличие от современного SAOC варианты осуществления предоставляются для динамической адаптации разрешения по времени-частоте к сигналу обратно совместимым способом, так что

- потоки двоичных сигналов параметров SAOC, исходящие из кодера стандартного SAOC (SAOC MPEG, которое стандартизовано в [SAOC]), по-прежнему можно декодировать с помощью улучшенного декодера с воспринимаемым качеством, сопоставимым с получаемым от стандартного декодера,

- потоки двоичных сигналов параметров улучшенного SAOC можно декодировать с оптимальным качеством с помощью улучшенного декодера, и

- потоки двоичных сигналов параметров стандартного и улучшенного SAOC можно смешивать, например, в сценарии многоточечного блока управления (MCU), в один общий поток двоичных сигналов, который можно декодировать с помощью стандартного или улучшенного декодера.

Для вышеупомянутых свойств полезно предусмотреть общее представление гребенки фильтров/преобразования, которое можно динамически адаптировать в части разрешения по времени-частоте к поддержке декодирования данных нового улучшенного SAOC и, одновременно, обратно совместимого отображения данных традиционного, стандартного SAOC. Объединение данных улучшенного SAOC и данных стандартного SAOC возможно при условии такого общего представления.

Воспринимаемое качество улучшенного SAOC можно получить путем динамической адаптации разрешения по времени-частоте у гребенки фильтров или преобразования, которое применяется для оценки или используется для синтеза меток аудиообъекта, к характерным свойствам входного аудиообъекта. Например, если аудиообъект является квазистационарным в течение некоторого промежутка времени, то оценку параметров и синтез выгодно выполнять при низком разрешении по времени и высоком разрешении по частоте. Если аудиообъект содержит переходы или нестабильности в течение некоторого промежутка времени, то оценку параметров и синтез предпочтительно выполнять с использованием высокого разрешения по времени и низкого разрешения по частоте. В силу этого динамическая адаптация гребенки фильтров или преобразования допускает

- высокую избирательность по частоте при спектральном разделении квазистационарных сигналов, чтобы избежать перекрестных помех между объектами, и

- высокую временную точность для наслоений объектов или событий переходов, чтобы минимизировать опережающие и запаздывающие эхо.

Одновременно можно получить качество традиционного SAOC путем отображения данных стандартного SAOC на частотно-временную сетку, предоставленную обладающим признаками изобретения, обратно совместимым адаптивным к сигналу преобразованием, которое зависит от дополнительной информации, описывающей характеристики сигналов объектов.

Возможность декодировать данные стандартного и улучшенного SAOC с использованием одного общего преобразования дает возможность прямой и обратной совместимости для приложений, которые выполняют смешивание данных стандартного и нового улучшенного SAOC.

Предоставляется декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области. Сигнал понижающего микширования кодирует два или более сигналов аудиообъектов.

Декодер содержит генератор последовательности окон, определяющий множество окон анализа, где каждое из окон анализа содержит множество выборок понижающего микширования временной области у сигнала понижающего микширования. Каждое окно анализа из множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области в упомянутом окне анализа. Генератор последовательности окон сконфигурирован для определения множества окон анализа, чтобы длина окна у каждого из окон анализа зависела от свойства сигнала у по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов.

Кроме того, декодер содержит модуль t/f-анализа для преобразования множества выборок понижающего микширования временной области в каждом окне анализа в множестве окон анализа из временной области в частотно-временную область в зависимости от длины окна у упомянутого окна анализа, чтобы получить преобразованное понижающее микширование.

Кроме того, декодер содержит блок повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

В соответствии с вариантом осуществления генератор последовательности окон может быть сконфигурирован для определения множества окон анализа, чтобы переход, указывающий изменение сигнала у по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов, кодируемых сигналом понижающего микширования, был составлен первым окном анализа из множества окон анализа и вторым окном анализа из множества окон анализа, где центр ck первого окна анализа задается местоположением t перехода в соответствии с ck=t-lb, а центр ck+1 первого окна анализа задается местоположением t перехода в соответствии с ck+1=t+la, где la и lb являются числами.

В варианте осуществления генератор последовательности окон может быть сконфигурирован для определения множества окон анализа, чтобы переход, указывающий изменение сигнала у по меньшей мере одного из двух или более сигналов аудиообъектов, кодируемых сигналом понижающего микширования, был составлен первым окном анализа из множества окон анализа, где центр ck первого окна анализа задается местоположением t перехода в соответствии с ck=t, где центр ck-1 второго окна анализа из множества окон анализа задается местоположением t перехода в соответствии с ck-1=t-lb, и где центр ck+1 третьего окна анализа из множества окон анализа задается местоположением t перехода в соответствии с ck+1=t+la, где la и lb являются числами.

В соответствии с вариантом осуществления генератор последовательности окон может быть сконфигурирован для определения множества окон анализа, чтобы каждое из множества окон анализа содержало либо первое количество выборок сигнала временной области, либо второе количество выборок сигнала временной области, где второе количество выборок сигнала временной области больше первого количества выборок сигнала временной области, и где каждое из окон анализа в множестве окон анализа содержит первое количество выборок сигнала временной области, когда упомянутое окно анализа содержит переход, указывающий изменение сигнала у по меньшей мере одного из двух или более сигналов аудиообъектов, кодируемых сигналом понижающего микширования.

В варианте осуществления модуль t/f-анализа может быть сконфигурирован для преобразования выборок понижающего микширования временной области в каждом из окон анализа из временной области в частотно-временную область путем применения гребенки фильтров QMF и гребенки фильтров Найквиста, где блок t/f-анализа (135) сконфигурирован для преобразования множества выборок сигнала временной области в каждом из окон анализа в зависимости от длины окна у упомянутого окна анализа.

Кроме того, предоставляется кодер для кодирования двух или более сигналов входных аудиообъектов. Каждый из двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области. Кодер содержит блок последовательности окон для определения множества окон анализа. Каждое из окон анализа содержит множество выборок сигнала временной области в одном из сигналов входных аудиообъектов, где каждое из окон анализа имеет длину окна, указывающую количество выборок сигнала временной области у упомянутого окна анализа. Блок последовательности окон сконфигурирован для определения множества окон анализа, чтобы длина окна у каждого из окон анализа зависела от свойства сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов.

Кроме того, кодер содержит блок t/f-анализа для преобразования выборок сигнала временной области в каждом из окон анализа из временной области в частотно-временную область, чтобы получить преобразованные выборки сигнала. Блок t/f-анализа может быть сконфигурирован для преобразования множества выборок сигнала временной области в каждом из окон анализа в зависимости от длины окна у упомянутого окна анализа.

Кроме того, кодер содержит блок оценки PSI для определения параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.

В варианте осуществления кодер может дополнительно содержать блок обнаружения перехода, конфигурируемый для определения множества разностей уровней объектов у двух или более сигналов входных аудиообъектов и конфигурируемый для определения, больше ли порогового значения разница между первой из разностей уровней объектов и второй из разностей уровней объектов, чтобы для каждого из окон анализа определить, содержит ли упомянутое окно анализа переход, указывающий изменение сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов.

В соответствии с вариантом осуществления блок обнаружения перехода может быть сконфигурирован для применения функции d(n) обнаружения, чтобы определить, больше ли порогового значения разница между первой из разностей уровней объектов и второй из разностей уровней объектов, где функция d(n) обнаружения задается в виде:

где n указывает индекс, i указывает первый объект, j указывает второй объект, а b указывает параметрический диапазон. OLD может указывать, например, разность уровней объектов.

В варианте осуществления блок последовательности окон может быть сконфигурирован для определения множества окон анализа, чтобы переход, указывающий изменение сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов, был составлен первым окном анализа из множества окон анализа и вторым окном анализа из множества окон анализа, где центр ck первого окна анализа задается местоположением t перехода в соответствии с ck=t-lb, а центр ck+1 первого окна анализа задается местоположением t перехода в соответствии с ck+1=t+la, где la и lb являются числами.

В соответствии с вариантом осуществления блок последовательности окон может быть сконфигурирован для определения множества окон анализа, чтобы переход, указывающий изменение сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов, был составлен первым окном анализа из множества окон анализа, где центр ck первого окна анализа задается местоположением t перехода в соответствии с ck=t, где центр ck-1 второго окна анализа из множества окон анализа задается местоположением t перехода в соответствии с ck-1=t-lb, и где центр ck+1 третьего окна анализа из множества окон анализа задается местоположением t перехода в соответствии с ck+1=t+la, где la и lb являются числами.

В варианте осуществления блок последовательности окон может быть сконфигурирован для определения множества окон анализа, чтобы каждое из множества окон анализа содержало либо первое количество выборок сигнала временной области, либо второе количество выборок сигнала временной области, где второе количество выборок сигнала временной области больше первого количества выборок сигнала временной области, и где каждое из окон анализа в множестве окон анализа содержит первое количество выборок сигнала временной области, когда упомянутое окно анализа содержит переход, указывающий изменение сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов.

В соответствии с вариантом осуществления блок t/f-анализа может быть сконфигурирован для преобразования выборок сигнала временной области в каждом из окон анализа из временной области в частотно-временную область путем применения гребенки фильтров QMF и гребенки фильтров Найквиста, где блок t/f-анализа может быть сконфигурирован для преобразования множества выборок сигнала временной области в каждом из окон анализа в зависимости от длины окна у упомянутого окна анализа.

Кроме того, предоставляется декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области. Сигнал понижающего микширования кодирует два или более сигналов аудиообъектов. Декодер содержит первый подмодуль анализа для преобразования множества выборок понижающего микширования временной области, чтобы получить множество поддиапазонов, содержащее множество выборок поддиапазонов. Кроме того, декодер содержит генератор последовательности окон для определения множества окон анализа, где каждое из окон анализа содержит множество выборок поддиапазонов в одном из множества поддиапазонов, где каждое окно анализа из множества окон анализа имеет длину окна, указывающую количество выборок поддиапазонов в упомянутом окне анализа, где генератор последовательности окон сконфигурирован для определения множества окон анализа, чтобы длина окна у каждого из окон анализа зависела от свойства сигнала у по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов. Кроме того, декодер содержит второй модуль анализа для преобразования множества выборок поддиапазонов в каждом окне анализа в множестве окон анализа в зависимости от длины окна у упомянутого окна анализа, чтобы получить преобразованное понижающее микширование. Кроме того, декодер содержит блок повышающего микширования для повышающего микширования преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

Кроме того, предоставляется кодер для кодирования двух или более сигналов входных аудиообъектов. Каждый из двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области. Кодер содержит первый подмодуль анализа для преобразования множества выборок сигнала временной области, чтобы получить множество поддиапазонов, содержащее множество выборок поддиапазонов. Кроме того, кодер содержит блок последовательности окон для определения множества окон анализа, где каждое из окон анализа содержит множество выборок поддиапазонов в одном из множества поддиапазонов, где каждое из окон анализа имеет длину окна, указывающую количество выборок поддиапазонов в упомянутом окне анализа, где блок последовательности окон сконфигурирован для определения множества окон анализа, чтобы длина окна у каждого из окон анализа зависела от свойства сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов. Кроме того, кодер содержит второй модуль анализа для преобразования множества выборок поддиапазонов в каждом окне анализа в множестве окон анализа в зависимости от длины окна у упомянутого окна анализа, чтобы получить преобразованные выборки сигнала. Кроме того, кодер содержит блок оценки PSI для определения параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.

Кроме того, предоставляется декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования. Сигнал понижающего микширования кодирует один или более сигналов аудиообъектов. Декодер содержит блок управления для установки указания активизации в состояние активизации в зависимости от свойства сигнала у по меньшей мере одного из упомянутого одного или более сигналов аудиообъектов. Кроме того, декодер содержит первый модуль анализа для преобразования сигнала понижающего микширования, чтобы получить первое преобразованное понижающее микширование, содержащее множество каналов первого поддиапазона. Кроме того, декодер содержит второй модуль анализа для формирования второго преобразованного понижающего микширования, когда указание активизации установлено в состояние активизации, путем преобразования по меньшей мере одного из каналов первого поддиапазона, чтобы получить множество каналов второго поддиапазона, где второе преобразованное понижающее микширование содержит каналы первого поддиапазона, которые не были преобразованы вторым модулем анализа, и каналы второго поддиапазона. Кроме того, декодер содержит блок повышающего микширования, где блок повышающего микширования сконфигурирован для повышающего микширования второго преобразованного понижающего микширования, когда указание активизации установлено в состояние активизации, на основе параметрической дополнительной информации об упомянутом одном или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал, и повышающего микширования первого преобразованного понижающего микширования, когда указание активизации не установлено в состояние активизации, на основе параметрической дополнительной информации об упомянутом одном или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

Кроме того, предоставляется кодер для кодирования сигнала входного аудиообъекта. Кодер содержит блок управления для установки указания активизации в состояние активизации в зависимости от свойства сигнала у сигнала входного аудиообъекта. Кроме того, кодер содержит первый модуль анализа для преобразования сигнала входного аудиообъекта, чтобы получить первый преобразованный сигнал аудиообъекта, где первый преобразованный сигнал аудиообъекта содержит множество каналов первого поддиапазона. Кроме того, кодер содержит второй модуль анализа для формирования второго преобразованного сигнала аудиообъекта, когда указание активизации установлено в состояние активизации, путем преобразования по меньшей мере одного из упомянутого множества каналов первого поддиапазона, чтобы получить множество каналов второго поддиапазона, где второй преобразованный сигнал аудиообъекта содержит каналы первого поддиапазона, которые не были преобразованы вторым модулем анализа, и каналы второго поддиапазона. Кроме того, кодер содержит блок оценки PSI, где блок оценки PSI сконфигурирован для определения параметрической дополнительной информации на основе второго преобразованного сигнала аудиообъекта, когда указание активизации установлено в состояние активизации, и определения параметрической дополнительной информации на основе первого преобразованного сигнала аудиообъекта, когда указание активизации не установлено в состояние активизации.

Кроме того, предоставляется способ декодирования для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области. Сигнал понижающего микширования кодирует два или более сигналов аудиообъектов. Способ содержит:

- Определение множества окон анализа, где каждое из окон анализа содержит множество выборок понижающего микширования временной области у сигнала понижающего микширования, где каждое окно анализа из множества окон анализа имеет длину окна, указывающую количество выборок понижающего микширования временной области в упомянутом окне анализа, где определение множества окон анализа проводится так, что длина окна у каждого из окон анализа зависит от свойства сигнала у по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов.

- Преобразование множества выборок понижающего микширования временной области в каждом окне анализа в множестве окон анализа из временной области в частотно-временную область в зависимости от длины окна у упомянутого окна анализа, чтобы получить преобразованное понижающее микширование, и

- Повышающее микширование преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

Кроме того, предоставляется способ кодирования двух или более сигналов входных аудиообъектов. Каждый из двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области. Способ содержит:

- Определение множества окон анализа, где каждое из окон анализа содержит множество выборок сигнала временной области в одном из сигналов входных аудиообъектов, где каждое из окон анализа имеет длину окна, указывающую количество выборок сигнала временной области у упомянутого окна анализа, где определение множества окон анализа проводится так, что длина окна у каждого из окон анализа зависит от свойства сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов.

- Преобразование выборок сигнала временной области в каждом из окон анализа из временной области в частотно-временную область, чтобы получить преобразованные выборки сигнала, где преобразование множества выборок сигнала временной области в каждом из окон анализа зависит от длины окна у упомянутого окна анализа. И:

- Определение параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.

Кроме того, предоставляется способ декодирования путем формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, содержащего множество выборок понижающего микширования временной области, где сигнал понижающего микширования кодирует два или более сигналов аудиообъектов. Способ содержит:

- Преобразование множества выборок понижающего микширования временной области для получения множества поддиапазонов, содержащего множество выборок поддиапазонов.

- Определение множества окон анализа, где каждое из окон анализа содержит множество выборок поддиапазонов в одном из множества поддиапазонов, где каждое окно анализа из множества окон анализа имеет длину окна, указывающую количество выборок поддиапазонов в упомянутом окне анализа, где определение множества окон анализа проводится так, что длина окна у каждого из окон анализа зависит от свойства сигнала у по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов.

- Преобразование множества выборок поддиапазонов в каждом окне анализа в множестве окон анализа в зависимости от длины окна у упомянутого окна анализа, чтобы получить преобразованное понижающее микширование. И:

- Повышающее микширование преобразованного понижающего микширования на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

Кроме того, предоставляется способ кодирования двух или более сигналов входных аудиообъектов, где каждый из двух или более сигналов входных аудиообъектов содержит множество выборок сигнала временной области. Способ содержит:

- Преобразование множества выборок сигнала временной области для получения множества поддиапазонов, содержащего множество выборок поддиапазонов.

- Определение множества окон анализа, где каждое из окон анализа содержит множество выборок поддиапазонов в одном из множества поддиапазонов, где каждое из окон анализа имеет длину окна, указывающую количество выборок поддиапазонов в упомянутом окне анализа, где определение множества окон анализа проводится так, что длина окна у каждого из окон анализа зависит от свойства сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов.

- Преобразование множества выборок поддиапазонов в каждом окне анализа в множестве окон анализа в зависимости от длины окна у упомянутого окна анализа, чтобы получить преобразованные выборки сигнала. И

- Определение параметрической дополнительной информации в зависимости от преобразованных выборок сигнала.

Кроме того, предоставляется способ декодирования путем формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего микширования, где сигнал понижающего микширования кодирует два или более сигналов аудиообъектов. Способ содержит:

- Установку указания активизации в состояние активизации в зависимости от свойства сигнала у по меньшей мере одного из упомянутых двух или более сигналов аудиообъектов.

- Преобразование сигнала понижающего микширования для получения первого преобразованного понижающего микширования, содержащего множество каналов первого поддиапазона.

- Формирование второго преобразованного понижающего микширования, когда указание активизации установлено в состояние активизации, путем преобразования по меньшей мере одного из каналов первого поддиапазона, чтобы получить множество каналов второго поддиапазона, где второе преобразованное понижающее микширование содержит каналы первого поддиапазона, которые не были преобразованы вторым модулем анализа, и каналы второго поддиапазона. И:

- Повышающее микширование второго преобразованного понижающего микширования, когда указание активизации установлено в состояние активизации, на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал, и повышающее микширование первого преобразованного понижающего микширования, когда указание активизации не установлено в состояние активизации, на основе параметрической дополнительной информации об упомянутых двух или более сигналах аудиообъектов, чтобы получить выходной аудиосигнал.

Кроме того, предоставляется способ кодирования двух или более сигналов входных аудиообъектов. Способ содержит:

- Установку указания активизации в состояние активизации в зависимости от свойства сигнала у по меньшей мере одного из двух или более сигналов входных аудиообъектов.

- Преобразование каждого из сигналов входных аудиообъектов для получения первого преобразованного сигнала аудиообъекта в упомянутом сигнале входного аудиообъекта, где упомянутый первый преобразованный сигнал аудиообъекта содержит множество каналов первого поддиапазона.

- Формирование для каждого из сигналов входных аудиообъектов второго преобразованного сигнала аудиообъекта, когда указание активизации установлено в состояние активизации, путем преобразования по меньшей мере одного из кан