Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов

Иллюстрации

Показать все

Изобретение относится к способам и устройствам кодирования и декодирования аудиосигнала, в которых звуковые образы могут быть локализованы в любой требуемой позиции для каждого объектного аудиосигнала. Техническим результатом является обеспечение более реалистичного воспроизведения объектных аудиосигналов. Указанный результат достигается тем, что способ декодирования аудиосигнала включает в себя извлечение из аудиосигнала сигнала понижающего микширования и объектно-ориентированной дополнительной информации; формирование модифицированного сигнала понижающего микширования на основе сигнала понижающего микширования и извлеченной информации, которую извлекают из объектно-ориентированной дополнительной информации; формирование канально-ориентированной дополнительной информации на основе объектно-ориентированной дополнительной информации и управляющих данных для воспроизведения сигнала понижающего микширования; и формирование многоканального аудиосигнала на основе модифицированного сигнала понижающего микширования и канально-ориентированной дополнительной информации. Объектно-ориентированная дополнительная информация содержит по меньшей мере одну из информации разностей уровней объектов, информации взаимной корреляции между объектами, информации усиления понижающего микширования, информации разностей уровней каналов понижающего микширования и информации абсолютной энергии объектов. 3 н. и 6 з.п. ф-лы, 21 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу и устройству кодирования аудиосигнала и способу и устройству декодирования аудиосигнала, в которых звуковые образы могут быть локализованы в любой требуемой позиции для каждого объектного аудиосигнала.

Уровень техники

В общем, в методиках кодирования и декодирования многоканального аудиосигнала некоторое число канальных сигналов в многоканальном сигнале микшируют с понижением до меньшего числа канальных сигналов, передают дополнительную информацию, относящуюся к исходным канальным сигналам, и восстанавливают многоканальный сигнал, имеющий столько же каналов, что и исходный многоканальный сигнал.

Методы кодирования и декодирования объектно-ориентированного аудиосигнала по сути аналогичны методикам кодирования и декодирования многоканального аудиосигнала в отношении понижающего микширования нескольких источников звука в меньшее число сигналов источника звука и передачи дополнительной информации, относящейся к исходным источникам звука. Тем не менее, в методах кодирования и декодирования объектно-ориентированного аудиосигнала объектные сигналы, которые являются базовыми сигналами (к примеру, музыкальный инструмент или человеческий голос) канального сигнала, интерпретируются так же, как канальные сигналы в методиках кодирования и декодирования многоканального аудиосигнала, и тем самым могут быть кодированы.

Другими словами, в методах кодирования и декодирования объектно-ориентированного аудиосигнала каждый объектный сигнал считается объектом, который должен быть кодирован. В этом смысле методы кодирования и декодирования объектно-ориентированного аудиосигнала отличаются от методов кодирования и декодирования многоканального аудиосигнала, в которых операция кодирования многоканального аудиосигнала выполняется просто на основе межканальной информации независимо от числа элементов канального сигнала, которые должны быть кодированы.

Раскрытие изобретения

Техническая задача

Настоящее изобретение предоставляет способ и устройство кодирования аудиосигнала и способ и устройство декодирования аудиосигнала, в которых аудиосигналы могут быть кодированы или декодированы так, что звуковые образы могут быть локализованы в любой требуемой позиции для каждого объектного аудиосигнала.

Техническое решение

Согласно аспекту настоящего изобретения предусмотрен способ декодирования аудиосигнала, включающий в себя извлечение сигнала понижающего микширования и объектно-ориентированной дополнительной информации из аудиосигнала; формирование модифицированного сигнала понижающего микширования на основе сигнала понижающего микширования и извлеченной информации, которая извлекается из объектно-ориентированной дополнительной информации; формирование канально-ориентированной дополнительной информации на основе объектно-ориентированной дополнительной информации и управляющих данных для воспроизведения сигнала понижающего микширования; и формирование многоканального аудиосигнала на основе модифицированного сигнала понижающего микширования и канально-ориентированной дополнительной информации.

Согласно другому аспекту настоящего изобретения предусмотрено устройство декодирования аудиосигнала, включающее в себя демультиплексор, который извлекает сигнал понижающего микширования и объектно-ориентированную дополнительную информацию из аудиосигнала; объектный декодер, который формирует модифицированный сигнал понижающего микширования на основе сигнала понижающего микширования и заданной информации и формирует канально-ориентированную дополнительную информацию на основе объектно-ориентированной дополнительной информации и управляющих данных для воспроизведения сигнала понижающего микширования, при этом заданная информация извлекается из объектно-ориентированной дополнительной информации; и многоканальный декодер, который формирует многоканальный аудиосигнал на основе модифицированного сигнала понижающего микширования и канально-ориентированной дополнительной информации.

Согласно аспекту настоящего изобретения предусмотрен машиночитаемый носитель записи, имеющий записанную на нем компьютерную программу для выполнения способа декодирования аудиосигнала, при этом способ декодирования аудиосигнала включает в себя извлечение сигнала понижающего микширования и объектно-ориентированной дополнительной информации из аудиосигнала; формирование модифицированного сигнала понижающего микширования на основе сигнала понижающего микширования и заданной информации, которая извлекается из объектно-ориентированной дополнительной информации; формирование канально-ориентированной дополнительной информации на основе объектно-ориентированной дополнительной информации и управляющих данных для воспроизведения сигнала понижающего микширования; и формирование многоканального аудиосигнала на основе модифицированного сигнала понижающего микширования и канально-ориентированной дополнительной информации.

Согласно аспекту настоящего изобретения предусмотрен машиночитаемый носитель записи, имеющий записанную на нем компьютерную программу для выполнения способа декодирования аудиосигнала, при этом способ декодирования аудиосигнала включает в себя формирование сигнала понижающего микширования путем понижающего микширования объектного аудиосигнала; формирование объектно-ориентированной дополнительной информации путем извлечения информации, относящейся к объектному аудиосигналу, и вставки заданной информации для модификации сигнала понижающего микширования в объектно-ориентированную дополнительную информацию; и формирование потока битов путем комбинирования объектно-ориентированной дополнительной информации с вставленной в него заданной информацией, и сигнала понижающего микширования.

Преимущества

Способ декодирования аудиосигнала включает в себя этапы извлечения сигнала понижающего микширования и объектно-ориентированной дополнительной информации из аудиосигнала; формирования модифицированного сигнала понижающего микширования на основе сигнала понижающего микширования и извлеченной информации, которая извлекается из объектно-ориентированной дополнительной информации; формирования канально-ориентированной дополнительной информации на основе объектно-ориентированной дополнительной информации и управляющих данных для воспроизведения сигнала понижающего микширования; и формирования многоканального аудиосигнала на основе модифицированного сигнала понижающего микширования и канально-ориентированной дополнительной информации.

Краткое описание чертежей

Настоящее изобретение будет более понятным из подробного описания, представленного далее в настоящем документе, и сопровождающих чертежей, которые представлены лишь в целях иллюстрации и поэтому не должны рассматриваться как ограничивающие настоящее изобретение, и на которых приведено следующее:

Фиг.1 - блок-схема обычной системы кодирования/декодирования объектно-ориентированного аудиосигнала;

Фиг.2 - блок-схема устройства декодирования аудиосигнала согласно первому варианту осуществления настоящего изобретения;

Фиг.3 - блок-схема устройства декодирования аудиосигнала согласно второму варианту осуществления настоящего изобретения;

Фиг.4 - график для пояснения влияния разности амплитуд и разности времени, которые независимы друг от друга, на локализацию звуковых образов;

Фиг.5 - график функций, иллюстрирующий соответствие между разностью амплитуд и разностью времени, которые требуются для того, чтобы локализовать звуковые образы в заданной позиции;

Фиг.6 иллюстрирует формат управляющих данных, включающих в себя информацию гармоник;

Фиг.7 - блок-схема устройства декодирования аудиосигнала согласно третьему варианту осуществления настоящего изобретения;

Фиг.8 - блок-схема модуля художественного усиления при понижающем микшировании (ADG), который может быть использован в модуле декодирования аудиосигнала, проиллюстрированном на фиг.7;

Фиг.9 - блок-схема устройства декодирования аудиосигнала согласно четвертому варианту осуществления настоящего изобретения;

Фиг.10 - блок-схема устройства декодирования аудиосигнала согласно пятому варианту осуществления настоящего изобретения;

Фиг.11 - блок-схема устройства декодирования аудиосигнала согласно шестому варианту осуществления настоящего изобретения;

Фиг.12 - блок-схема устройства декодирования аудиосигнала согласно седьмому варианту осуществления настоящего изобретения;

Фиг.13 - блок-схема устройства декодирования аудиосигнала согласно восьмому варианту осуществления настоящего изобретения;

Фиг.14 - схема для пояснения применения трехмерной (3D) информации к кадру устройством декодирования аудиосигнала, проиллюстрированным на фиг.13;

Фиг.15 - блок-схема устройства декодирования аудиосигнала согласно девятому варианту осуществления настоящего изобретения;

Фиг.16 - блок-схема устройства декодирования аудиосигнала согласно десятому варианту осуществления настоящего изобретения;

Фиг.17-19 - схемы для пояснения способа декодирования аудиосигнала согласно варианту осуществления настоящего изобретения; и

Фиг.20 - блок-схема устройства кодирования аудиосигнала согласно варианту осуществления настоящего изобретения.

Осуществление изобретения

Далее настоящее изобретение будет более подробно описано со ссылкой на сопровождающие чертежи, на которых показаны примерные варианты осуществления изобретения.

Способ и устройство кодирования аудиосигнала и способ и устройство декодирования аудиосигнала согласно настоящему изобретению могут быть применены к операциям обработки объектно-ориентированного аудиосигнала, но настоящее изобретение не ограничено этим. Другими словами, способ и устройство кодирования аудиосигнала и способ и устройство декодирования аудиосигнала могут быть применены к различным операциям обработки сигналов, отличным от операций обработки объектно-ориентированного аудиосигнала.

На фиг.1 показана блок-схема обычной системы кодирования/декодирования объектно-ориентированного аудиосигнала. В общем, аудиосигналы, вводимые в устройство кодирования объектно-ориентированного аудиосигнала, не соответствуют каналам многоканального сигнала, а являются независимыми объектными сигналами. В этом смысле устройство кодирования объектно-ориентированного аудиосигнала отличается от устройства кодирования многоканального аудиосигнала, в которое вводятся канальные сигналы многоканального сигнала.

Например, канальные сигналы, такие как сигнал переднего левого канала и сигнал переднего правого канала для 5.1-канального сигнала, могут быть введены в многоканальный аудиосигнал, тогда как объектные аудиосигналы, такие как человеческий голос или звук музыкального инструмента (к примеру, звук скрипки или пианино), которые являются меньшими объектами, чем канальные сигналы, могут быть введены в устройство кодирования объектно-ориентированного аудиосигнала.

Как показано на фиг.1, система кодирования/декодирования объектно-ориентированного аудиосигнала включает в себя устройство кодирования объектно-ориентированного аудиосигнала и устройство декодирования объектно-ориентированного аудиосигнала. Устройство кодирования объектно-ориентированного аудиосигнала включает в себя объектный кодер 100, а устройство декодирования объектно-ориентированного аудиосигнала включает в себя объектный декодер 111 и блок 113 воспроизведения.

Объектный кодер 100 принимает N объектных аудиосигналов и формирует объектно-ориентированный сигнал понижающего микширования с одним или более каналами и дополнительной информацией, включающей в себя ряд фрагментов информации, извлеченных из N объектных сигналов, таких как информация разности энергии, информация разности фаз и значение корреляции. Дополнительная информация и объектно-ориентированный сигнал понижающего микширования объединяются в один поток битов, и поток битов передается в объектно-ориентированное устройство декодирования.

Дополнительная информация может включать в себя флаг, указывающий то, следует ли выполнять кодирование канально-ориентированного аудиосигнала или кодирование объектно-ориентированного аудиосигнала, и тем самым на основе флага дополнительной информации может быть определено, следует ли выполнять кодирование канально-ориентированного аудиосигнала или кодирование объектно-ориентированного аудиосигнала. Дополнительная информация также может включать в себя информацию огибающей, информацию группировки, информацию периода молчания и информацию задержки, относящуюся к объектным сигналам. Дополнительная информация может также включать информацию разности уровней объектов, информацию корреляции между объектами, информацию усиления при понижающем микшировании, информацию разности уровней каналов понижающего микширования и информацию абсолютной энергии объекта.

Объектный декодер 111 принимает объектно-ориентированный сигнал понижающего микширования и дополнительную информацию из устройства кодирования объектно-ориентированного аудиосигнала и восстанавливает объектные сигналы, имеющие свойства, аналогичные свойствам N объектных аудиосигналов, на основе объектно-ориентированного сигнала понижающего микширования и дополнительной информации. Объектные сигналы, формируемые объектным декодером 111, еще не назначены на какую-либо позицию в многоканальном пространстве. Таким образом, блок 113 воспроизведения назначает каждый из объектных сигналов, сформированных объектным декодером 111, на заданную позицию в многоканальном пространстве и определяет уровни объектных сигналов так, что объектные сигналы могут быть воспроизведены из надлежащих соответствующих позиций, указанных блоком 113 воспроизведения, с надлежащими соответствующими уровнями, определенными блоком 113 воспроизведения. Управляющая информация относительно каждого из объектных сигналов, сформированных объектным декодером 111, может варьироваться во времени, и тем самым пространственные позиции и уровни объектных сигналов, сформированных объектным декодером 111, могут варьироваться согласно управляющей информации.

Фиг.2 представляет собой блок-схему устройства 120 декодирования аудиосигнала согласно первому варианту осуществления настоящего изобретения. Как показано на фиг.2, устройство 120 декодирования аудиосигнала включает в себя объектный декодер 121, блок 123 воспроизведения и преобразователь 125 параметров. Устройство 120 декодирования аудиосигнала также может включать в себя демультиплексор (не показан), который извлекает сигнал понижающего микширования и дополнительную информацию из вводимого в него потока битов, причем вышеуказанное относится ко всем устройствам декодирования аудиосигнала согласно другим вариантам осуществления настоящего изобретения.

Объектный декодер 121 формирует ряд объектных сигналов на основе сигнала понижающего микширования и модифицированной дополнительной информации, обеспеченной преобразователем 125 параметров. Блок 123 воспроизведения назначает каждый из объектных сигналов, сформированных объектным декодером 121, на заданную позицию в многоканальном пространстве и определяет уровни объектных сигналов, сформированных объектным декодером 121, согласно управляющей информации.

Преобразователь 125 параметров формирует модифицированную дополнительную информацию путем комбинирования дополнительной информации и управляющей информации. Затем преобразователь 125 параметров передает модифицированную дополнительную информацию в объектный декодер 121.

Объектный декодер 121 может быть выполнен с возможностью выполнения адаптивного декодирования путем анализа управляющей информации в модифицированной дополнительной информации.

Например, если управляющая информация указывает, что первый объектный сигнал и второй объектный сигнал назначены на одну позицию в многоканальном пространстве и имеют одинаковый уровень, обычное устройство декодирования аудиосигнала может декодировать первый и второй объектные сигналы отдельно, а затем компоновать их в многоканальном пространстве путем операции микширования/воспроизведения.

С другой стороны, объектный декодер 121 устройства 120 декодирования аудиосигнала узнает из управляющей информации в модифицированной дополнительной информации, что первый и второй объектные сигналы назначены на одну позицию в многоканальном пространстве и имеют одинаковый уровень, как если бы они были одним источником звука. Соответственно, объектный декодер 121 декодирует первый и второй объектные сигналы путем интерпретации их как одного источника звука без раздельного их декодирования. В результате снижается сложность декодирования. Помимо этого, вследствие уменьшения числа источников звука, которые должны быть обработаны, также снижается сложность микширования/воспроизведения.

Устройство 120 декодирования аудиосигнала может быть эффективно использовано в ситуации, когда число объектных сигналов больше числа выходных каналов, поскольку множество объектных сигналов с большой вероятностью должны быть назначены на одну пространственную позицию.

В качестве альтернативы устройство 120 декодирования аудиосигнала может быть использовано в ситуации, когда первый объектный сигнал и второй объектный сигнал назначаются одной позиции в многоканальном пространстве, но имеют различные уровни. В этом случае устройство 120 декодирования аудиосигнала декодирует первый и второй объектные сигналы путем интерпретации первого и второго объектных сигналов как одного сигнала, вместо декодирования первого и второго объектных сигналов по отдельности и передачи декодированных первого и второго объектных сигналов в блок 123 воспроизведения. Более конкретно, объектный декодер 121 может получать информацию, относящуюся к разности между уровнями первого и второго объектных сигналов, из управляющей информации в модифицированной дополнительной информации, и декодировать первый и второй объектные сигналы на основе полученной информации. В результате, даже если первый и второй объектные сигналы имеют различные уровни, первый и второй объектные сигналы могут быть декодированы так, как если бы они являлись одним источником звука.

В качестве еще одной альтернативы, объектный декодер 121 может регулировать уровни объектных сигналов, сформированных объектным декодером 121 согласно управляющей информации. Далее объектный декодер 121 может декодировать объектные сигналы, уровни которых отрегулированы. Соответственно, блок 123 воспроизведения не должен регулировать уровни декодированных объектных сигналов, обеспечиваемых объектным декодером 121, а просто компонует декодированные объектные сигналы, обеспечиваемые объектным декодером 121, в многоканальном пространстве. Вкратце, поскольку объектный декодер 121 регулирует уровни объектных сигналов, формируемых объектным декодером 121, согласно управляющей информации, блок 123 воспроизведения может легко располагать объектные сигналы, формируемые объектным декодером 121, в многоканальном пространстве без необходимости дополнительного регулирования уровней объектных сигналов, формируемых объектным декодером 121. Следовательно, возможно снижение сложности микширования/воспроизведения.

Согласно варианту осуществления по фиг.2 объектный декодер устройства 120 декодирования аудиосигнала может адаптивно выполнять операцию декодирования путем анализа управляющей информации, тем самым снижая сложность декодирования и сложность микширования/воспроизведения. Может быть использована комбинация вышеописанных способов, выполняемых устройством 120 декодирования аудиосигнала.

Фиг.3 представляет собой блок-схему устройства 130 декодирования аудиосигнала согласно второму варианту осуществления настоящего изобретения. Как показано на фиг.3, устройство 130 декодирования аудиосигнала включает в себя объектный декодер 131 и блок 133 воспроизведения. Устройство 130 декодирования аудиосигнала отличается тем, что оно обеспечивает дополнительную информацию не только объектному декодеру 131, но также блоку 133 воспроизведения.

Устройство 130 декодирования аудиосигнала может эффективно выполнять операцию декодирования, даже когда имеется объектный сигнал, соответствующий периоду молчания. Например, сигналы второго-четвертого объектов могут соответствовать периоду воспроизведения музыки, в течение которого играют музыкальные инструменты, а сигнал первого объекта может соответствовать периоду молчания, в течение которого играется аккомпанемент. В этом случае информация, указывающая то, какой из множества объектных сигналов соответствует периоду молчания, может быть включена в дополнительную информацию, и дополнительная информация может быть обеспечена блоку 123 воспроизведения, а также объектному декодеру 131.

Объектный декодер 131 может минимизировать скорость декодирования не только путем декодирования объектного сигнала, соответствующего периоду молчания. Объектный декодер 131 задает объектный сигнал, соответствующий значению, равному 0, и передает уровень объектного сигнала в блок воспроизведения 133. В общем, объектные сигналы, имеющие значение, равное 0, интерпретируются так же, как и объектные сигналы, имеющие значение, отличное от 0, и тем самым подвергаются операции микширования/воспроизведения.

С другой стороны, устройство 130 декодирования аудиосигнала передает дополнительную информацию, включающую в себя информацию, указывающую, какой из множества объектных сигналов соответствует периоду молчания, в блок воспроизведения 133, и тем самым не допускает обработки объектного сигнала, соответствующего периоду молчания, путем операции микширования/воспроизведения, выполняемой блоком 133 воспроизведения. Следовательно, устройство 130 декодирования аудиосигнала может препятствовать излишнему возрастанию сложности микширования/воспроизведения.

Блок 133 воспроизведения может использовать информацию параметров микширования, которая включена в управляющую информацию, для локализации звукового образа каждого объектного сигнала в стереосцене. Информация параметров микширования может включать в себя только информацию амплитуды, либо информацию амплитуды и информацию времени. Информация параметров микширования влияет не только на локализацию звуковых стереообразов, но также на психоакустическое восприятие пространственного качества звука пользователем.

Например, при сравнении двух звуковых образов, которые сформированы с помощью способа временного панорамирования и способа амплитудного панорамирования соответственно и воспроизводятся в одном месте с помощью 2-канального стереогромкоговорителя, обнаруживается, что способ амплитудного панорамирования может способствовать точной локализации звуковых образов, и что способ временного панорамирования может обеспечивать естественные звуки с сильным ощущением пространства. Таким образом, если блок воспроизведения 133 использует только способ амплитудного панорамирования для расположения объектных сигналов в многоканальном пространстве, блок воспроизведения 133 может иметь возможность точно локализовать каждый звуковой образ, но может не иметь возможности обеспечивать настолько сильное ощущение звука, как при использовании способа временного панорамирования. Пользователи могут иногда предпочитать точную локализацию звуковых образов сильному ощущению звука, или наоборот, согласно типу источников звука.

Фиг.4(a) и 4(b) поясняют влияние интенсивности (разности амплитуд) и разности времени на локализацию звуковых образов, выполняемую при воспроизведении сигналов с помощью 2-канального стереогромкоговорителя. Как показано на фиг.4(a) и 4(b), звуковой образ может быть локализован под заданным углом согласно разности амплитуд и разности времен, которые независимы друг от друга. Например, для того чтобы локализовать звуковой образ под углом в 20°, может быть использована разность амплитуд примерно в 8 дБ или разность времени примерно в 0,5 мс, которая эквивалентна разности амплитуд в 8 дБ. Следовательно, даже если в качестве информации параметров микширования обеспечена только разность амплитуд, можно получать различные звуки с различными свойствами путем преобразования разности амплитуд в разность времен, которая эквивалента разности амплитуд, в ходе локализации звуковых образов.

Фиг.5 иллюстрирует функции, относящиеся к соответствию между разностями амплитуд и разностями времени, которые требуются для локализации звуковых образов под углами 10°, 20° и 30°. Функция, проиллюстрированная на фиг.5, может быть получена на основе фиг.4(a) и 4(b). Как показано на фиг.5, могут быть обеспечены различные комбинации разности амплитуд - разности времени для локализации звукового образа в заданной позиции. Например, допустим, что в качестве информации параметров микширования представлена разность амплитуд в 8 дБ, чтобы локализовать звуковой образ под углом в 20°. Согласно функции, проиллюстрированной на фиг.5, звуковой образ также может быть локализован под углом 20° с помощью комбинации разности амплитуд в 3 дБ и разности времени в 0,3 мс. В этом случае не только информация разности амплитуд, а также информация разности времени может быть представлена в качестве информации параметров микширования, тем самым улучшая ощущение пространства.

Следовательно, для формирования звуков со свойствами, требуемыми пользователем, в ходе операции микширования/воспроизведения, информация параметров микширования может быть надлежащим образом преобразована так, что может быть выполнено либо панорамирование амплитуды, либо панорамирование времени в зависимости от того, что подходит пользователю. То есть, если информация параметров микширования включает в себя только информацию разности амплитуд, и пользователю нужны звуки с сильным ощущением пространства, информация разности амплитуд может быть преобразована в информацию разности времени, эквивалентную информации разности амплитуд с учетом психоакустических данных. В качестве альтернативы, если пользователю требуются звуки как с сильным ощущением пространства, так и с точной локализацией звуковых образов, информация разности амплитуд может быть преобразована в комбинацию информации разности амплитуд и информации разности времени, эквивалентную исходной информации амплитуд. В качестве альтернативны, если информация параметров микширования включает в себя только информацию разности времени, и пользователь предпочитает точную локализацию звуковых образов, информация разности времени может быть преобразована в информацию разности амплитуд, эквивалентную информации разности времени, или может быть преобразована в комбинацию информации разности времени и информации разности амплитуд, которая может удовлетворять предпочтениям пользователя при повышении как точности локализации звуковых образов, так и ощущения пространства.

В качестве еще одной альтернативы, если информация параметров микширования включает в себя и информацию разности амплитуд, и информацию разности времени, и пользователь предпочитает точную локализацию звуковых образов, комбинация информации разности амплитуд и информации разности времени может быть преобразована в информацию разности амплитуд, эквивалентную комбинации исходной информации разности амплитуд и информации разности времени. С другой стороны, если информация параметров микширования включает в себя и информацию разности амплитуд, и информацию разности времени, и пользователь предпочитает улучшение ощущения пространства, комбинация информации разности амплитуд и информации разности времени может быть преобразована в информацию разности времени, эквивалентную комбинации информации разности амплитуд и исходной информации разности времени. Как показано на фиг.6, управляющая информация может включать в себя информацию микширования/воспроизведения и информацию гармоник, относящуюся к одному или более объектным сигналам. Информация гармоник может включать в себя по меньшей мере одно из информации основного тона, информации собственной частоты и информации преобладающей полосы частот, относящейся к одному или более объектных сигналов, и описаний энергии и спектра каждого поддиапазона каждого из объектных сигналов.

Информация гармоник может быть использована для обработки объектного сигнала в ходе операции воспроизведения, поскольку разрешение блока воспроизведения, который выполняет эту операцию в единицах поддиапазонов, является недостаточным.

Если информация гармоник включает в себя информацию основного тона, относящуюся к одному или более объектным сигналам, усиление каждого из объектных сигналов может быть скорректировано путем ослабления или усиления заданной частотной области с помощью гребенчатого фильтра или обратного гребенчатого фильтра. Например, если один из множества объектных сигналов является вокальным сигналом, объектные сигналы могут быть использованы в качестве караоке путем ослабления только вокального сигнала. В качестве альтернативы, если информация гармоник включает в себя информацию преобладающей частотной области, относящуюся к одному или более объектным сигналам, может быть выполнен процесс ослабления или усиления преобладающей частотной области. В качестве еще одной альтернативы, если информация гармоник включает в себя информацию спектра, относящуюся к одному или более объектным сигналам, усиление каждого из объектных сигналов можно контролировать путем выполнения ослабления или усиления без ограничения какими-либо границами поддиапазонов.

Фиг.7 представляет собой блок-схему устройства 140 декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения. Как показано на фиг.7, устройство 140 декодирования аудиосигнала вместо объектного декодера и блока воспроизведения использует многоканальный декодер 141 и декодирует ряд объектных сигналов после того, как объектные сигналы надлежащим образом расположены в многоканальном пространстве.

Более конкретно, устройство 140 декодирования аудиосигнала включает в себя многоканальный декодер 141 и преобразователь 145 параметров. Многоканальный декодер 141 формирует многоканальный сигнал, объектные сигналы которого уже расположены в многоканальном пространстве, на основе сигнала понижающего микширования и информации пространственных параметров, которая является канально-ориентированной дополнительной информацией, обеспечиваемой преобразователем 145 параметров. Преобразователь 145 параметров анализирует дополнительную информацию и управляющую информацию, передаваемую устройством кодирования аудиосигнала (не показано), и формирует информацию пространственных параметров на основе результата анализа. Более конкретно, преобразователь 145 параметров формирует информацию пространственных параметров путем комбинирования дополнительной информации и управляющей информации, которая включает в себя информацию настроек воспроизведения и информацию микширования. То есть преобразователь 145 параметров выполняет преобразование комбинации дополнительной информации и управляющей информации в пространственные данные соответственно модулю «один к двум» (OTT) или модулю «два к трем» (TTT).

Устройство 140 декодирования аудиосигнала может выполнять операцию многоканального декодирования, в которую объединены операция объектно-ориентированного декодирования и операция микширования/воспроизведения, и тем самым можно избежать декодирования каждого объектного сигнала. Таким образом, можно снижать сложность декодирования и/или микширования/воспроизведения.

Например, когда имеется 10 объектных сигналов, и многоканальный сигнал, полученный на основе 10 объектных сигналов, должен быть воспроизведен 5.1-канальной акустической системой воспроизведения, обычное устройство декодирования объектно-ориентированного аудиосигнала формирует декодированные сигналы, надлежащим образом соответствующие 10 объектным сигналам, на основе сигнала понижающего микширования и дополнительной информации, и затем формирует 5.1-канальный сигнал посредством надлежащего расположения 10 объектных сигналов в многоканальном пространстве, так что объектные сигналы могут стать пригодными для 5.1-канального акустического окружения. Тем не менее, формирование 10 объектных сигналов в ходе формирования 5.1-канального сигнала является неэффективным, и эта проблема становится более серьезной по мере того, как возрастает разность между числом объектных сигналов и числом каналов многоканального сигнала, который должен быть сформирован.

С другой стороны, согласно варианту осуществления по фиг.7 устройство 140 декодирования аудиосигнала формирует информацию пространственных параметров, подходящую для 5.1-канального сигнала, на основе дополнительной информации и управляющей информации, и представляет информацию пространственных параметров и сигнал понижающего микширования в многоканальный декодер 141. Затем многоканальный декодер 141 формирует 5.1-канальный сигнал на основе информации пространственных параметров и сигнала понижающего микширования. Другими словами, когда число каналов, которые должны быть выведены, составляет 5.1 каналов, устройство 140 декодирования аудиосигнала может легко сформировать 5.1-канальный сигнал на основе сигнала понижающего микширования без необходимости формирования 10 объектных сигналов и поэтому является более эффективным в отношении сложности, чем обычное устройство декодирования аудиосигнала.

Устройство 140 декодирования аудиосигнала считается эффективным, когда объем вычислений, требуемых для вычисления информации пространственных параметров, соответствующей каждому из OTT-модуля и TTT-модуля, путем анализа дополнительной информации и управляющей информации, передаваемой устройством кодирования аудиосигнала, меньше объема вычислений, требуемого для выполнения операции микширования/воспроизведения после декодирования каждого объектного сигнала.

Устройство 140 декодирования аудиосигнала может быть получено путем добавления в обычное устройство декодирования многоканального аудиосигнала модуля для формирования информации пространственных параметров посредством анализа дополнительной информации и управляющей информации, и, таким образом, оно может сохранять совместимость с обычным устройством декодирования многоканального аудиосигнала. Устройство 140 декодирования также может повышать качество звука с использованием существующих средств обычного устройства декодирования многоканального аудиосигнала, таких как формирователь огибающей, средство временной обработки поддиапазонов (STP) и декоррелятор. С учетом всего этого следует сделать вывод о том, что все преимущества обычного способа декодирования многоканального аудиосигнала могут быть легко использованы в способе декодирования объектного аудиосигнала.

Информация пространственных параметров, передаваемая в многоканальный декодер 141 преобразователем 145 параметров, может быть сжата, чтобы упомянутая информация была подходящей для передачи. В качестве альтернативы, информация пространственных параметров может иметь тот же формат, что и формат данных, передаваемых обычным устройством многоканального кодирования. То есть информация пространственных параметров может быть подвергнута операции декодирования Хаффмана или операции контрольного декодирования и тем самым может быть передана в каждый модуль как несжатые данные пространственных меток. Первое подходит для передачи информации пространственных параметров в устройство декодирования многоканального аудиосигнала в удаленном месте, а второе удобно, поскольку не требуется, чтобы устройство декодирования мног