2665917 - Многоканальный аудиодекодер, многоканальный аудиокодер, способы, компьютерная программа и кодированное аудиопредставление с использованием декорреляции представленных посредством рендеринга аудиосигналов

Многоканальный аудиодекодер, многоканальный аудиокодер, способы, компьютерная программа и кодированное аудиопредставление с использованием декорреляции представленных посредством рендеринга аудиосигналов

Иллюстрации

Показать все

Изобретение относится к средствам для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования трехмерных аудиосцен. Предоставляют один или более сигналов понижающего микширования на основе, по меньшей мере, двух входных аудиосигналов. Предоставляют один или более параметров, описывающих взаимосвязь между входными аудиосигналами. Предоставляют параметр способа декорреляции, описывающий то, какой режим декорреляции должен использоваться на стороне аудиодекодера. Избирательно предоставляют параметр способа декорреляции для того, чтобы сигнализировать один из трех режимов работы аудиодекодера. Первый режим, в котором разрешается микширование между различными представленными посредством рендеринга аудиосигналами при комбинировании этих аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами. Второй режим, в котором не разрешается микширование между различными представленными посредством рендеринга аудиосигналами при комбинировании этих аудиосигналов или их масштабированной версии с декоррелированными аудиосигналами. 10 н. и 38 з.п. ф-лы, 50 ил.

Реферат

Область техники, к которой относится изобретение

Варианты осуществления согласно изобретению относятся к многоканальному аудиодекодеру для предоставления, по меньшей мере, двух выходных аудиосигналов на основе кодированного представления.

Дополнительные варианты осуществления согласно изобретению относятся к многоканальному аудиокодеру для предоставления кодированного представления на основе, по меньшей мере, двух входных аудиосигналов.

Дополнительные варианты осуществления согласно изобретению относятся к способу для предоставления, по меньшей мере, двух выходных аудиосигналов на основе кодированного представления.

Дополнительные варианты осуществления согласно изобретению относятся к способу для предоставления кодированного представления на основе, по меньшей мере, двух входных аудиосигналов.

Дополнительные варианты осуществления согласно изобретению относятся к компьютерной программе для осуществления одного из упомянутых способов.

Дополнительные варианты осуществления согласно изобретению относятся к кодированному аудиопредставлению.

Вообще говоря, варианты осуществления согласно настоящему изобретению относятся к принципу декорреляции для систем многоканального параметрического кодирования аудиообъектов с понижающим микшированием/повышающим микшированием.

Уровень техники

В последние годы, спрос на хранение и передачу аудиоконтента постоянно растет. Кроме того, также постоянно растут требования к качеству для хранения и передачи аудиоконтента. Соответственно, совершенствуются принципы для кодирования и декодирования аудиоконтента.

Например, разработано так называемое "усовершенствованное кодирование аудио" (AAC), которое описывается, например, в международном стандарте ISO/IEC 13818-7:2003. Кроме того, созданы некоторые пространственные расширения, такие как, например, так называемый принцип "на основе стандарта объемного звучания MPEG", который описывается, например, в международном стандарте ISO/IEC 23003-1:2007. Кроме того, дополнительные улучшения для кодирования и декодирования пространственной информации аудиосигналов описываются в международном стандарте ISO/IEC 23003-2:2010, который относится к так называемому "пространственному кодированию аудиообъектов".

Кроме того, принцип переключаемого кодирования/декодирования аудио, который предоставляет возможность кодировать как общие аудиосигналы, так и речевые сигналы с хорошей эффективностью кодирования и обрабатывать многоканальные аудиосигналы, задается в международном стандарте ISO/IEC 23003-3:2012, который описывает так называемый принцип "стандартизированного кодирования речи и аудио".

Кроме того, дополнительные традиционные принципы описываются в ссылочных материалах, которые упоминаются в конце настоящего описания.

Тем не менее, желательно предоставлять еще более усовершенствованный принцип для эффективного кодирования и декодирования трехмерных аудиосцен.

Сущность изобретения

Вариант осуществления согласно изобретению создает многоканальный аудиодекодер для предоставления, по меньшей мере, двух выходных аудиосигналов на основе кодированного представления. Многоканальный аудиодекодер выполнен с возможностью осуществлять рендеринг множества декодированных аудиосигналов, которые получаются на основе кодированного представления, в зависимости от одного или более параметров рендеринга, чтобы получать множество представленных посредством рендеринга аудиосигналов. Многоканальный аудиодекодер выполнен с возможностью извлекать один или более декоррелированных аудиосигналов из представленных посредством рендеринга аудиосигналов. Кроме того, многоканальный аудиодекодер выполнен с возможностью комбинировать представленные посредством рендеринга аудиосигналы или их масштабированную версию с одним или более декоррелированными аудиосигналами для того, чтобы получать выходные аудиосигналы.

Этот вариант осуществления согласно изобретению основан на таких выявленных сведениях, что качество звука может повышаться в многоканальном аудиодекодере посредством извлечения одного или более декоррелированных аудиосигналов из представленных посредством рендеринга аудиосигналов, которые получаются на основе множества декодированных аудиосигналов, и посредством комбинирования представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами для того, чтобы получать выходные аудиосигналы. Обнаружено, что более эффективно регулировать характеристики корреляции или характеристики ковариантности выходных аудиосигналов посредством суммирования декоррелированных сигналов после рендеринга по сравнению с суммированием декоррелированных сигналов перед рендерингом или во время рендеринга. Обнаружено, что этот принцип является более эффективным в общих случаях, в которых предусмотрено большее число декодированных аудиосигналов, которые вводятся в рендеринг, чем представленных посредством рендеринга аудиосигналов, поскольку большее число декорреляторов требуется в том случае, если декорреляция выполняется перед рендерингом или во время рендеринга. Кроме того, обнаружено, что зачастую предоставляются артефакты, когда декоррелированные сигналы суммируются с декодированными аудиосигналами перед рендерингом, поскольку рендеринг типично способствует комбинации декодированных аудиосигналов. Соответственно, принцип согласно настоящему варианту осуществления изобретения превосходит традиционные подходы, в которых декоррелированные сигналы суммируются перед рендерингом. Например, можно непосредственно оценивать требуемые характеристики корреляции или характеристики ковариантности представленных посредством рендеринга сигналов и адаптировать инициализацию декоррелированных аудиосигналов к фактически представленным посредством рендеринга сигналам, что приводит к лучшему компромиссу между эффективностью и качеством звука и зачастую даже приводит к повышенной эффективности и лучшему качеству одновременно.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью получать декодированные аудиосигналы, которые представляются посредством рендеринга, чтобы получать множество представленных посредством рендеринга аудиосигналов, с использованием параметрического восстановления. Обнаружено, что принцип согласно настоящему изобретению способствует преимуществам в комбинации с параметрическим восстановлением аудиосигналов, при этом параметрическое восстановление, например, основано на вспомогательной информации, описывающей сигналы объектов и/или взаимосвязь между сигналами объектов (при этом сигналы объектов могут составлять декодированные аудиосигналы). Например, может быть сравнительно большое число сигналов объектов (декодированных аудиосигналов) в таком принципе, и обнаружено, что применение декорреляции на основе представленных посредством рендеринга аудиосигналов является очень эффективным и исключает артефакты в таком сценарии.

В предпочтительном варианте осуществления, декодированные аудиосигналы представляют собой восстановленные сигналы объектов (например, параметрически восстановленные сигналы объектов), и многоканальный аудиодекодер выполнен с возможностью извлекать восстановленные сигналы объектов из одного или более сигналов понижающего микширования с использованием вспомогательной информации. Соответственно, комбинация представленных посредством рендеринга аудиосигналов с одним или более декоррелированными аудиосигналами, которые основаны на представленных посредством рендеринга аудиосигналах, предоставляет возможность эффективного восстановления характеристик корреляции или характеристик ковариантности в выходных аудиосигналах, даже если предусмотрено сравнительно большое число восстановленных сигналов объектов (которое может превышать число представленных посредством рендеринга аудиосигналов или выходных аудиосигналов).

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью извлекать коэффициенты обратного микширования из вспомогательной информации и применять коэффициенты обратного микширования, чтобы извлекать (параметрически) восстановленные сигналы объектов из одного или более сигналов понижающего микширования с использованием коэффициентов обратного микширования. Соответственно, входные сигналы для рендеринга могут извлекаться из вспомогательной информации, которая, например, может быть связанной с объектами вспомогательной информацией (такой как, например, информация межобъектной корреляции или информация разности уровней объектов, при этом идентичный результат может получаться посредством использования абсолютных энергий).

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью комбинировать представленные посредством рендеринга аудиосигналы с одним или более декоррелированными аудиосигналами для того, чтобы, по меньшей мере, частично достигать требуемых характеристик корреляции или характеристик ковариантности выходных аудиосигналов. Обнаружено, что комбинация представленных посредством рендеринга аудиосигналов с одним или более декоррелированными аудиосигналами, которые извлекаются из представленных посредством рендеринга аудиосигналов, предоставляет возможность регулирования (или восстановления) требуемых характеристик корреляции или характеристик ковариантности. Кроме того, обнаружено, что важно для слухового впечатления иметь надлежащие характеристики корреляции или характеристики ковариантности в выходном аудиосигнале, и что это может достигаться лучше всего посредством модификации представленных посредством рендеринга аудиосигналов с использованием декоррелированных аудиосигналов. Например, все ухудшения, вызываемые на предыдущих стадиях обработки, также могут учитываться при комбинировании представленных посредством рендеринга аудиосигналов и декоррелированных аудиосигналов на основе представленных посредством рендеринга аудиосигналов.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью комбинировать представленные посредством рендеринга аудиосигналы с одним или более декоррелированными аудиосигналами для того, чтобы, по меньшей мере, частично компенсировать энергетические потери во время параметрического восстановления декодированных аудиосигналов, которые представляются посредством рендеринга, чтобы получать множество представленных посредством рендеринга аудиосигналов. Обнаружено, что применение для пострендеринга декоррелированных аудиосигналов дает возможность корректировать дефекты сигналов, которые вызываются посредством обработки перед рендерингом, например, посредством параметрического восстановления декодированных аудиосигналов. Следовательно, необязательно восстанавливать характеристики корреляции или характеристики ковариантности декодированных аудиосигналов, которые вводятся в рендеринг, с высокой точностью. Это упрощает восстановление декодированных аудиосигналов и, следовательно, способствует высокой эффективности.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью определять требуемые характеристики корреляции характеристик ковариантности выходных аудиосигналов. Кроме того, многоканальный аудиодекодер выполнен с возможностью регулировать комбинацию представленных посредством рендеринга аудиосигналов с одним или более декоррелированными аудиосигналами для того, чтобы получать выходные аудиосигналы, так что характеристики корреляции или характеристики ковариантности полученных выходных аудиосигналов аппроксимируют или равны требуемым характеристикам корреляции или требуемым характеристикам ковариантности. Посредством вычисления (или определения) требуемых характеристик корреляции или характеристик ковариантности выходных аудиосигналов (которые должны быть достигнуты после комбинирования представленных посредством рендеринга аудиосигналов с декоррелированными аудиосигналами), можно регулировать характеристики корреляции или характеристики ковариантности на последующей стадии обработки, что, в свою очередь, обеспечивает возможность относительно точного восстановления. Соответственно, пространственное впечатление от прослушивания выходных аудиосигналов хорошо адаптировано к требуемому впечатлению от прослушивания.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью определять требуемые характеристики корреляции или требуемые характеристики ковариантности в зависимости от информации рендеринга, описывающей рендеринг множества декодированных аудиосигналов, которые получаются на основе кодированного представления, чтобы получать множество представленных посредством рендеринга аудиосигналов. Посредством учета процесса рендеринга в определении требуемых характеристик корреляции или требуемых характеристик ковариантности, можно достигать точной информации для регулирования комбинации представленных посредством рендеринга аудиосигналов с одним или более декоррелированными аудиосигналами, что способствует возможности иметь выходные аудиосигналы, которые совпадают с требуемым впечатлением от прослушивания.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью определять требуемые характеристики корреляции или требуемые характеристики ковариантности в зависимости от информации корреляции объектов или информации ковариантности объектов, описывающей характеристики множества аудиообъектов и/или взаимосвязь между множеством аудиообъектов. Соответственно, можно восстанавливать характеристики корреляции или характеристики ковариантности, которые адаптированы к аудиообъектам, на последней стадии обработки, а именно, после рендеринга. Соответственно, уменьшается сложность для декодирования аудиообъектов. Кроме того, посредством учета характеристик корреляции или характеристик ковариантности аудиообъектов после рендеринга, может исключаться негативное влияние рендеринга, и характеристики корреляции или характеристики ковариантности могут быть восстановлены с хорошей точностью.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью определять информацию корреляции объектов или информацию ковариантности объектов на основе вспомогательной информации, включенной в кодированное представление. Соответственно, принцип может быть хорошо адаптирован к подходу на основе пространственного кодирования аудиообъектов, который использует вспомогательную информацию.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью определять фактические характеристики корреляции или характеристики ковариантности представленных посредством рендеринга аудиосигналов и регулировать комбинацию представленных посредством рендеринга аудиосигналов с одним или более декоррелированными аудиосигналами для того, чтобы получать выходные аудиосигналы в зависимости от фактических характеристик корреляции или характеристик ковариантности представленных посредством рендеринга аудиосигналов. Соответственно, можно добиться того, что могут учитываться неидеальности на более ранних стадиях обработки, такие как, например, энергетические потери при восстановлении аудиообъектов или неидеальности, вызываемые посредством рендеринга. Таким образом, комбинация представленных посредством рендеринга аудиосигналов с одним или более декоррелированными аудиосигналами может очень точно регулироваться согласно потребностям таким образом, что комбинация фактических представленных посредством рендеринга аудиосигналов с декоррелированными аудиосигналами приводит к требуемым характеристикам.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью комбинировать представленные посредством рендеринга аудиосигналы с одним или более декоррелированными аудиосигналами, при этом представленные посредством рендеринга аудиосигналы взвешены с использованием первой матрицы P микширования, и при этом один или более декоррелированных аудиосигналов взвешены с использованием второй матрицы M микширования. Это предоставляет возможность простого извлечения выходных аудиосигналов, при этом выполняется операция линейного комбинирования, которая описывается посредством матрицы P микширования, которая применяется к представленным посредством рендеринга аудиосигналам, и матрицы M микширования, которая применяется к одному или более декоррелированным аудиосигналам.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью регулировать, по меньшей мере, одну из матрицы P микширования и матрицы M микширования таким образом, что характеристики корреляции или характеристики ковариантности полученных выходных аудиосигналов аппроксимируют или равны требуемым характеристикам корреляции или требуемым характеристикам ковариантности. Таким образом, предусмотрен способ регулировать одну или более матриц микширования, что типично возможно с небольшими усилиями и хорошими результатами.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью объединенно вычислять матрицу P микширования и матрицу M микширования. Соответственно, можно получать матрицы микширования таким образом, что характеристики корреляции или характеристики ковариантности полученных выходных аудиосигналов могут задаваться таким образом, чтобы аппроксимировать или быть равными требуемым характеристикам корреляции или требуемым характеристикам ковариантности. Кроме того, при объединенном вычислении матрицы P микширования и матрицы M микширования, типично доступны определенные степени свободы, так что можно обеспечивать наилучшее соответствие матрицы P микширования и матрицы M микширования требованиям.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью получать комбинированную матрицу F микширования, которая содержит матрицу P микширования и матрицу M микширования, так что ковариационная матрица полученных выходных аудиосигналов равна требуемой ковариационной матрице.

В предпочтительном варианте осуществления, комбинированная матрица микширования может вычисляться в соответствии с уравнениями, описанными ниже.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью определять комбинированную матрицу F микширования с использованием матриц, которые определяются с использованием разложения по сингулярным значениям первой ковариационной матрицы, которая описывает представленный посредством рендеринга аудиосигнал и декоррелированный аудиосигнал, и второй ковариационной матрицы, которая описывает требуемые характеристики ковариантности выходных аудиосигналов. Использование такого разложения по сингулярным значениям составляет численно эффективное решение для определения комбинированной матрицы микширования.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью задавать матрицу P микширования как единичную матрицу или ее кратное и вычислять матрицу M микширования. Это исключает микширование различных представленных посредством рендеринга аудиосигналов, что помогает сохранять требуемое пространственное впечатление. Кроме того, уменьшается количество степеней свободы.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью определять матрицу M микширования таким образом, что разность между требуемой ковариационной матрицей и ковариационной матрицей представленных посредством рендеринга аудиосигналов аппроксимирует или равна ковариантности одного или более декоррелированных сигналов после микширования с матрицей M микширования. Таким образом, предусмотрен вычислительно простой принцип для получения матрицы M микширования.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью определять матрицу WI микширования с использованием матриц, которые определяются с использованием разложения по сингулярным значениям разности между требуемой ковариационной матрицей и ковариационной матрицей представленных посредством рендеринга аудиосигналов и ковариационной матрицы одного или более декоррелированных сигналов. Оно представляет собой вычислительно очень эффективный подход для определения матрицы M микширования.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью определять матрицы P, M микширования в соответствии с таким ограничением, что данный представленный посредством рендеринга аудиосигнал микшируется только с декоррелированной версией самого данного представленного посредством рендеринга аудиосигнала. Этот принцип ограничивается небольшой модификацией (например, при наличии неидеальных декорреляторов) или предотвращает модификацию характеристик взаимной корреляции или характеристик взаимной ковариантности (например, в случае идеальных декорреляторов) и может, следовательно, требоваться в некоторых случаях, чтобы исключать изменение воспринимаемой позиции объекта. Тем не менее, при наличии неидеальных декорреляторов, значения автокорреляции (или значения автоковариации) явно модифицируются, и изменения перекрестных членов игнорируются.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью комбинировать представленные посредством рендеринга аудиосигналы с одним или более декоррелированными аудиосигналами таким образом, что только значения автокорреляции или значения автоковариации представленных посредством рендеринга аудиосигналов модифицируются, в то время как характеристики взаимной корреляции или характеристики взаимной ковариантности остаются немодифицированными или модифицированными с небольшим значением (например, при наличии неидеальных декорреляторов). С другой стороны, может исключаться ухудшение воспринимаемой позиции аудиообъектов. Кроме того, может уменьшаться вычислительная сложность. Тем не менее, например, значения взаимной ковариантности модифицируются как следствие модификации энергий (значений автокорреляции), но значения взаимной корреляции остаются немодифицированными (они представляют нормализованную версию значений взаимной ковариантности).

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью задавать матрицу P микширования как единичную матрицу или ее кратное и вычислять матрицу M микширования в соответствии с таким ограничением, что M является диагональной матрицей. Таким образом, модификация характеристик взаимной корреляции или характеристик взаимной ковариантности может исключаться или ограничиваться небольшим значением (например, при наличии неидеальных декорреляторов).

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью комбинировать представленные посредством рендеринга аудиосигналы с одним или более декоррелированными аудиосигналами для того, чтобы получать выходной аудиосигнал, при этом диагональная матрица M применяется к одному или более декоррелированным аудиосигналам W. В этом случае, многоканальный аудиодекодер выполнен с возможностью вычислять диагональные элементы матрицы M микширования таким образом, что диагональные элементы ковариационной матрицы выходных аудиосигналов равны требуемым энергиям. Соответственно, энергетические потери, которые могут получаться посредством операции рендеринга и/или посредством восстановления аудиообъектов на основе одного или более сигналов понижающего микширования и вспомогательной пространственной информации, могут компенсироваться. Таким образом, может достигаться надлежащая интенсивность выходных аудиосигналов.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью вычислять элементы матрицы M микширования в зависимости от диагональных элементов требуемой ковариационной матрицы, диагональных элементов ковариационной матрицы представленных посредством рендеринга аудиосигналов и диагональных элементов ковариационной матрицы одного или более декоррелированных сигналов. Внедиагональные элементы матрицы WI микширования могут задаваться равными нулю, и требуемая ковариационная матрица может вычисляться на основе матрицы рендеринга, используемой для операции рендеринга и ковариационной матрицы объектов. Кроме того, пороговое значение может использоваться для того, чтобы ограничивать величину декорреляции, суммируемой с сигналами. Этот принцип предусматривает очень вычислительно эффективное определение элементов матрицы M микширования.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью учитывать характеристики корреляции или характеристики ковариантности декоррелированных аудиосигналов при определении того, как комбинировать представленные посредством рендеринга аудиосигналы или их масштабированную версию с одним или более декоррелированными аудиосигналами. Соответственно, могут учитываться неидеальности декорреляции.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью микшировать представленные посредством рендеринга аудиосигналы и декоррелированные аудиосигналы, так что данный выходной аудиосигнал предоставляется на основе двух или более представленных посредством рендеринга аудиосигналов и, по меньшей мере, одного декоррелированного аудиосигнала. Посредством использования этого принципа, характеристики взаимной корреляции могут эффективно регулироваться без необходимости вводить большие количества декоррелированных сигналов (что может ухудшать слуховое пространственное впечатление).

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью переключаться между различными режимами, в которых различные ограничения применяются для определения того, как комбинировать представленные посредством рендеринга аудиосигналы или их масштабированную версию с одним или более декоррелированными аудиосигналами для того, чтобы получать выходные аудиосигналы. Соответственно, сложность и характеристики обработки могут регулироваться для сигналов, которые обрабатываются.

В предпочтительном варианте осуществления, многоканальный аудиодекодер может быть выполнен с возможностью переключаться между первым режимом, в котором разрешается микширование между различными представленными посредством рендеринга аудиосигналами при комбинировании представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами, вторым режимом, в котором не разрешается микширование между различными представленными посредством рендеринга аудиосигналами при комбинировании представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами, и в котором разрешается комбинирование данного декоррелированного сигнала, с идентичным или различным масштабированием, с множеством представленных посредством рендеринга аудиосигналов или их масштабированной версией, чтобы регулировать характеристики взаимной корреляции или характеристики взаимной ковариантности выходных аудиосигналов, и третьим режимом, в котором не разрешается микширование между различными представленными посредством рендеринга аудиосигналами при комбинировании представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами, и в котором не разрешается комбинирование данного декоррелированного сигнала с представленными посредством рендеринга аудиосигналами, за исключением представленного посредством рендеринга аудиосигнала, из которого извлекается данный декоррелированный сигнал. Таким образом, как сложность, так и характеристики обработки могут регулироваться согласно типу аудиосигнала, который в данный момент представляется посредством рендеринга. Модификация только характеристик автокорреляции или характеристик автоковариантности и отсутствие явной модификации характеристик взаимной корреляции или характеристик взаимной ковариантности, например, могут быть полезными, если пространственное впечатление аудиосигналов ухудшается посредством такой модификации, при этом, тем не менее, желательно регулировать интенсивность выходных аудиосигналов. С другой стороны, возникают случаи, в которых желательно регулировать характеристики взаимной корреляции или характеристики взаимной ковариантности выходных аудиосигналов. Многоканальный аудиодекодер, упомянутый здесь, предоставляет возможность такого регулирования, при котором в первом режиме, можно комбинировать представленные посредством рендеринга аудиосигналы таким образом, что величина (или интенсивность) декоррелированных компонентов сигналов, которая требуется для регулирования характеристик взаимной корреляции или характеристик взаимной ковариантности, является сравнительно небольшой. Таким образом, "локализуемые" компоненты сигналов используются в первом режиме, чтобы регулировать характеристики взаимной корреляции или характеристики взаимной ковариантности. Напротив, во втором режиме, декоррелированные сигналы используются для того, чтобы регулировать характеристики взаимной корреляции или характеристики взаимной ковариантности, что естественно способствует различному впечатлению от прослушивания. Соответственно, посредством предоставления трех различных режимов, аудиодекодер может быть хорошо адаптирован к обрабатываемому аудиоконтенту.

В предпочтительном варианте осуществления, многоканальный аудиодекодер выполнен с возможностью оценивать элемент потока битов кодированного представления, указывающего то, какой из трех режимов для комбинирования представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами должен использоваться, и выбирать режим в зависимости от упомянутого элемента потока битов. Соответственно, аудиокодер может сигнализировать надлежащий режим в зависимости от своих знаний аудиоконтента. Таким образом, максимальное качество выходных аудиосигналов может достигаться при любых обстоятельствах.

Вариант осуществления согласно изобретению создает многоканальный аудиокодер для предоставления кодированного представления на основе, по меньшей мере, двух входных аудиосигналов. Многоканальный аудиокодер выполнен с возможностью предоставлять один или более сигналов понижающего микширования на основе, по меньшей мере, двух входных аудиосигналов. Кроме того, многоканальный аудиокодер выполнен с возможностью предоставлять один или более параметров, описывающих взаимосвязь, по меньшей мере, между двумя входными аудиосигналами. Помимо этого, многоканальный аудиокодер выполнен с возможностью предоставлять параметр способа декорреляции, описывающий то, какой режим декорреляции из множества режимов декорреляции должен использоваться на стороне аудиокодера. Соответственно, многоканальный аудиокодер может управлять аудиодекодером, чтобы использовать надлежащий режим декорреляции, который хорошо адаптирован к типу аудиосигнала, который в данный момент кодируется. Таким образом, многоканальный аудиокодер, описанный здесь, хорошо адаптирован для взаимодействия с многоканальным аудиодекодером, поясненным выше.

В предпочтительном варианте осуществления, многоканальный аудиокодер выполнен с возможностью избирательно предоставлять параметр способа декорреляции для того, чтобы сигнализировать один из следующих трех режимов для работы аудиодекодера: первый режим, в котором разрешается микширование между различными представленными посредством рендеринга аудиосигналами при комбинировании представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами, второй режим, в котором не разрешается микширование между различными из представленных посредством рендеринга аудиосигналов при комбинировании представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами, и в котором разрешается комбинирование данного декоррелированного аудиосигнала, с идентичным или различным масштабированием, с множеством представленных посредством рендеринга аудиосигналов или их масштабированной версией, чтобы регулировать характеристики взаимной корреляции или характеристики взаимной ковариантности выходных аудиосигналов, и третий режим, в котором не разрешается микширование между различными из представленных посредством рендеринга аудиосигналов при комбинировании представленных посредством рендеринга аудиосигналов или их масштабированной версии с одним или более декоррелированными аудиосигналами, и в котором не разрешается комбинирование данного декоррелированного аудиосигнала с представленными посредством рендеринга аудиосигналами, за исключением представленного посредством рендеринга аудиосигнала, из которого извлекается данный декоррелированный аудиосигнал. Таким образом, многоканальный аудиокодер может переключать многоканальный аудиодекодер через вышеописанные три режима в зависимости от аудиоконтента, при этом режим, в котором работает многоканальный аудиодекодер, может быть хорошо адаптирован посредством многоканального аудиокодера к типу текущего кодированного аудиоконтента. Тем не менее, в некоторых вариантах осуществления, могут использоваться (или могут быть доступными) только один или два из вышеуказанных трех режимов для работы аудиодекодера.

В предпочтительном варианте осуществления, многоканальный аудиокодер выполнен с возможностью выбирать параметр способа декорреляции в зависимости от того, содержат входные аудиосигналы сравнительно высокую корреляцию или сравнительно более низкую корреляцию. Таким образом, адаптация декорреляции, которая используется в декодере, может выполняться на основе важной характеристики аудиосигналов, которые в данный момент кодируются.

В предпочтительном варианте осуществления, многоканальный аудиокодер выполнен с возможностью выбирать параметр способа декорреляции для того, чтобы обозначать первый режим или второй режим, если корреляция или ковариантность между входными аудиосигналами является сравнительно высокой, и выбирать параметр способа декорреляции для того, чтобы обозначать третий режим, если корреляция или ковариантность между входными аудиосигналами является сравнительно более низкой. Соответственно, в случае сравнительно небольшой корреляции или ковариантности между входными аудиосигналами, выбирается режим декодирования, в котором отсутствует коррекция характеристик взаимной ковариантности или характеристик взаимной корреляции. Обнаружено, что это представляет собой эффективный выбор для сигналов, имеющих сравнительно низкую корреляцию (или ковариантность), поскольку такие сигналы являются практически независимыми, что исключает необходимость адаптации взаимных корреляций или взаимных ковариантностей. Наоборот, регулирование взаимных к

Патент 2665917