Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов

Иллюстрации

Показать все

Изобретение относится к кодированию и декодированию аудиосигнала, в которых звуковые образы для каждого объектного аудиосигнала могут быть локализованы в любой требуемой позиции. Технический результат - повышение точности воспроизведения объектных аудиосигналов. Для этого в способе и устройстве кодирования аудиосигнала и в способе и устройстве декодирования аудиосигнала аудиосигналы могут быть кодированы или декодированы так, что звуковые образы могут быть локализованы в любой требуемой позиции для каждого объектного аудиосигнала. Способ декодирования аудиосигнала включает в себя извлечение из аудиосигнала сигнала понижающего микширования и объектно-ориентированной дополнительной информации; формирование канально-ориентированной дополнительной информации на основе объектно-ориентированной дополнительной информации и управляющей информации для воспроизведения сигнала понижающего микширования; обработку сигнала понижающего микширования с использованием декоррелированного канального сигнала; и формирование многоканального аудиосигнала с использованием обработанного сигнала понижающего микширования и канально-ориентированной дополнительной информации. 3 н. и 4 з.п. ф-лы, 20 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу и устройству кодирования аудиосигнала и способу и устройству декодирования аудиосигнала, в которых звуковые образы для каждого объектного аудиосигнала могут быть локализованы в любой требуемой позиции.

Уровень техники

Согласно методам кодирования и декодирования многоканального аудиосигнала некоторое количество канальных сигналов в многоканальном сигнале в общем микшируют с понижением до меньшего числа канальных сигналов, передают дополнительную информацию, относящуюся к исходным канальным сигналам, и восстанавливают многоканальный сигнал, имеющий столько же каналов, что и исходный многоканальный сигнал.

Методики кодирования и декодирования объектно-ориентированного аудиосигнала по сути аналогичны методикам кодирования и декодирования многоканального аудиосигнала в отношении понижающего микширования нескольких источников звука в меньшее число сигналов источника звука и передачи дополнительной информации, относящейся к исходным источникам звука. Тем не менее, в методах кодирования и декодирования объектно-ориентированного аудиосигнала объектные сигналы, которые являются базовыми сигналами (к примеру, музыкальный инструмент или человеческий голос) канального сигнала, интерпретируют так же, как и канальные сигналы в методах кодирования и декодирования многоканального аудиосигнала, и таким образом упомянутые сигналы могут быть кодированы.

Другими словами, в методах кодирования и декодирования объектно-ориентированного аудиосигнала каждый объектный сигнал считается объектом, который должен быть кодирован. В этом смысле методы кодирования и декодирования объектно-ориентированного аудиосигнала отличаются от методов кодирования и декодирования многоканального аудиосигнала, в которых операция кодирования многоканального аудиосигнала выполняется просто на основе межканальной информации независимо от числа элементов канального сигнала, которые должны быть кодированы.

Раскрытие изобретения

Техническая задача

Согласно настоящему изобретению предлагаются способ и устройство кодирования аудиосигнала и способ и устройство декодирования аудиосигнала, в которых аудиосигналы могут быть кодированы или декодированы таким образом, что звуковые образы могут быть локализованы в любой требуемой позиции для каждого объектного аудиосигнала.

Техническое решение

Согласно аспекту настоящего изобретения, предусмотрен способ декодирования аудиосигнала, включающий в себя этапы, на которых извлекают сигнал понижающего микширования и объектно-ориентированной дополнительной информации из аудиосигнала; формируют канально-ориентированную дополнительную информацию на основе объектно-ориентированной дополнительной информации и управляющей информации для воспроизведения сигнала понижающего микширования; обрабатывают сигнал понижающего микширования с использованием декоррелированного канального сигнала; и формируют многоканальный аудиосигнал с использованием обработанного сигнала понижающего микширования и канально-ориентированной дополнительной информации.

Согласно аспекту настоящего изобретения, предусмотрено устройство декодирования аудиосигнала, включающее в себя демультиплексор, который извлекает из аудиосигнала сигнал понижающего микширования и объектно-ориентированную дополнительную информацию; преобразователь параметров, который формирует канально-ориентированную дополнительную информацию и управляющую информацию для воспроизведения сигнала понижающего микширования; процессор понижающего микширования, который модифицирует сигнал понижающего микширования через декоррелированный сигнал понижающего микширования, если сигнал понижающего микширования является стереосигналом понижающего микширования; и многоканальный декодер, который формирует многоканальный аудиосигнал с использованием модифицированного сигнала понижающего микширования, полученного процессором понижающего микширования, и канально-ориентированной дополнительной информации.

Согласно другому аспекту настоящего изобретения, предусмотрен способ декодирования аудиосигнала, включающий в себя этапы, на которых извлекают из аудиосигнала сигнал понижающего микширования и объектно-ориентированную дополнительную информацию; формируют канально-ориентированную дополнительную информацию и один или более параметров обработки на основе объектно-ориентированной дополнительной информации и управляющей информации для воспроизведения сигнала понижающего микширования; формируют многоканальный аудиосигнал с использованием сигнала понижающего микширования и канально-ориентированной дополнительной информации; и модифицируют многоканальный сигнал с использованием параметров обработки.

Согласно другому аспекту настоящего изобретения, предусмотрено устройство декодирования аудиосигнала, включающее в себя демультиплексор, который извлекает из аудиосигнала сигнал понижающего микширования и объектно-ориентированную дополнительную информацию; преобразователь параметров, который формирует канально-ориентированную дополнительную информацию и один или более параметров обработки на основе объектно-ориентированной дополнительной информации и управляющей информации для воспроизведения сигнала понижающего микширования; многоканальный декодер, который формирует многоканальный аудиосигнал с использованием сигнала понижающего микширования и канально-ориентированной дополнительной информации; и канальный процессор, который модифицирует многоканальный сигнал с использованием параметров обработки.

Согласно другому аспекту настоящего изобретения, предусмотрен машиночитаемый носитель записи, на котором сохранен способ декодирования аудиосигнала, включающий в себя этапы, на которых извлекают из аудиосигнала сигнал понижающего микширования и объектно-ориентированную дополнительную информацию; формируют канально-ориентированную дополнительную информацию на основе объектно-ориентированной дополнительной информации и управляющей информации для воспроизведения сигнала понижающего микширования; обрабатывают сигнал понижающего микширования с использованием декоррелированного канального сигнала; и формируют многоканальный аудиосигнал с использованием обработанного сигнала понижающего микширования, полученного путем перестановки, и канально-ориентированной дополнительной информации.

Согласно другому аспекту настоящего изобретения, предусмотрен машиночитаемый носитель записи, на котором сохранен способ декодирования аудиосигнала, включающий в себя этапы, на которых извлекают из аудиосигнала сигнал понижающего микширования и объектно-ориентированную дополнительную информацию; формируют канально-ориентированную дополнительную информацию и один или более параметров обработки на основе объектно-ориентированной дополнительной информации и управляющей информации для воспроизведения сигнала понижающего микширования; формируют многоканальный аудиосигнал с использованием сигнала понижающего микширования и канально-ориентированной дополнительной информации; и модифицируют многоканальный сигнал с использованием параметров обработки.

Преимущества

Предусмотрены способ и устройство кодирования аудиосигнала и способ и устройство декодирования аудиосигнала, в которых аудиосигналы могут быть кодированы или декодированы так, что звуковые образы могут быть локализованы в любой требуемой позиции для каждого объектного аудиосигнала.

Краткое описание чертежей

Настоящее изобретение станет более понятным из нижеприведенного подробного описания и сопровождающих чертежей, которые приведены только в целях иллюстрации и поэтому не должны рассматриваться как ограничивающие настоящее изобретение, на которых:

Фиг.1 - блок-схема обычной системы кодирования/декодирования объектно-ориентированного аудиосигнала;

Фиг.2 - блок-схема устройства декодирования аудиосигнала согласно первому варианту осуществления настоящего изобретения;

Фиг.3 - блок-схема устройства декодирования аудиосигнала согласно второму варианту осуществления настоящего изобретения;

Фиг.4 - график для пояснения влияния разности амплитуд и разности времени, которые независимы друг от друга, на локализацию звуковых образов;

Фиг.5 - график функций, относящийся к соответствию между разностью амплитуд и разностью времени, которые требуются для локализации звуковых образов в заданной позиции;

Фиг.6 иллюстрирует формат управляющих данных, включающих в себя информацию гармоник;

Фиг.7 - блок-схема устройства декодирования аудиосигнала согласно третьему варианту осуществления настоящего изобретения;

Фиг.8 - блок-схема модуля художественного усиления при понижающем микшировании (ADG), который может быть использован в модуле декодирования аудиосигнала, проиллюстрированном на фиг. 7;

Фиг.9 - блок-схема устройства декодирования аудиосигнала согласно четвертому варианту осуществления настоящего изобретения;

Фиг.10 - блок-схема устройства декодирования аудиосигнала согласно пятому варианту осуществления настоящего изобретения;

Фиг.11 - блок-схема устройства декодирования аудиосигнала согласно шестому варианту осуществления настоящего изобретения;

Фиг.12 - блок-схема устройства декодирования аудиосигнала согласно седьмому варианту осуществления настоящего изобретения;

Фиг.13 - блок-схема устройства декодирования аудиосигнала согласно восьмому варианту осуществления настоящего изобретения;

Фиг.14 - схема, поясняющая применение трехмерной (3D) информации к кадру устройством декодирования аудиосигнала, проиллюстрированным на фиг. 13;

Фиг.15 - блок-схема устройства декодирования аудиосигнала согласно девятому варианту осуществления настоящего изобретения;

Фиг.16 - блок-схема устройства декодирования аудиосигнала согласно десятому варианту осуществления настоящего изобретения;

Фиг.17-19 - схемы, поясняющие способ декодирования аудиосигнала согласно варианту осуществления настоящего изобретения; и

Фиг.20 - блок-схема устройства кодирования аудиосигнала согласно варианту осуществления настоящего изобретения.

Осуществление изобретения

Далее настоящее изобретение будет описано более подробно со ссылкой на сопровождающие чертежи, на которых показаны примерные варианты осуществления изобретения.

Способ и устройство кодирования аудиосигнала и способ и устройство декодирования аудиосигнала согласно настоящему изобретению могут быть применены к операциям обработки объектно-ориентированного аудиосигнала, но настоящее изобретение не ограничено этим. Другими словами, способ и устройство кодирования аудиосигнала и способ и устройство декодирования аудиосигнала могут быть применены к различным операциям обработки сигналов, отличным от операций обработки объектно-ориентированного аудиосигнала.

Фиг.1 иллюстрирует блок-схему обычной системы кодирования/декодирования объектно-ориентированного аудиосигнала. Аудиосигналы, вводимые в устройство кодирования объектно-ориентированного аудиосигнала, в общем не соответствуют каналам многоканального сигнала, а являются независимыми объектными сигналами. В этом смысле, устройство кодирования объектно-ориентированного аудиосигнала отличается от устройства кодирования многоканального аудиосигнала, в которое вводят канальные сигналы многоканального сигнала.

Например, канальные сигналы, такие как сигнал переднего левого канала и сигнал переднего правого канала для 5.1-канального сигнала, могут быть введены в многоканальный аудиосигнал, тогда как объектные аудиосигналы, такие как человеческий голос или звук музыкального инструмента (к примеру, звук скрипки или пианино), которые являются меньшими объектами, чем канальные сигналы, могут быть введены в устройство кодирования объектно-ориентированного аудиосигнала.

Как показано на фиг. 1, система кодирования/декодирования объектно-ориентированного аудиосигнала включает в себя устройство кодирования объектно-ориентированного аудиосигнала и устройство декодирования объектно-ориентированного аудиосигнала. Устройство кодирования объектно-ориентированного аудиосигнала включает в себя объектный кодер 100, а устройство декодирования объектно-ориентированного аудиосигнала включает в себя объектный декодер 111 и блок 113 воспроизведения.

Объектный кодер 100 принимает N объектных аудиосигналов и формирует объектно-ориентированный сигнал понижающего микширования с одним или более каналами и дополнительной информацией, включающей в себя ряд извлеченных из N объектных сигналов фрагментов информации, таких как информация разности энергии, информация разности фаз и значение корреляции. Дополнительная информация и объектно-ориентированный сигнал понижающего микширования объединяются в один поток битов, и поток битов передается в объектно-ориентированное устройство декодирования.

Дополнительная информация может включать в себя флаг, указывающий, что следует выполнять кодирование канально-ориентированного аудиосигнала, либо что следует выполнять кодирование объектно-ориентированного аудиосигнала, и тем самым на основе флага дополнительной информации может быть определено, следует ли выполнять кодирование канально-ориентированного аудиосигнала или кодирование объектно-ориентированного аудиосигнала. Дополнительная информация также может включать в себя информацию огибающей, информацию группировки, информацию периода молчания и информацию задержки, относящуюся к объектным сигналам. Дополнительная информация может также включать в себя информацию разности уровней объектов, информацию корреляции между объектами, информацию усиления при понижающем микшировании, информацию разности уровней каналов понижающего микширования и информацию абсолютной энергии объекта.

Объектный декодер 111 принимает объектно-ориентированный сигнал понижающего микширования и дополнительную информацию из устройства кодирования объектно-ориентированного аудиосигнала и восстанавливает объектные сигналы, имеющие свойства, аналогичные свойствам N объектных аудиосигналов, на основе объектно-ориентированного сигнала понижающего микширования и дополнительной информации. Объектные сигналы, формируемые объектным декодером 111, еще не назначены на какую-либо позицию в многоканальном пространстве. Таким образом, блок 113 воспроизведения назначает каждый из объектных сигналов, сформированных объектным декодером 111, на заданную позицию в многоканальном пространстве и определяет уровни объектных сигналов так, что объектные сигналы могут быть воспроизведены из надлежащих соответствующих позиций, указанных блоком 113 воспроизведения, с надлежащими соответствующими уровнями, определенными блоком 113 воспроизведения. Управляющая информация, относящаяся к каждому из объектных сигналов, сформированных объектным декодером 111, может варьироваться во времени, и тем самым пространственные позиции и уровни объектных сигналов, сформированных объектным декодером 111, могут варьироваться согласно управляющей информации.

Фиг. 2 представляет собой блок-схему устройства 120 декодирования аудиосигнала согласно первому варианту осуществления настоящего изобретения. Как показано на фиг. 2, устройство 120 декодирования аудиосигнала включает в себя объектный декодер 121, блок 123 воспроизведения и преобразователь 125 параметров. Устройство 120 декодирования аудиосигнала также может включать в себя демультиплексор (не показан), который извлекает сигнал понижающего микширования и дополнительную информацию из вводимого в него потока битов, и он применяется ко всем устройствам декодирования аудиосигнала согласно другим вариантам осуществления настоящего изобретения.

Объектный декодер 121 формирует ряд объектных сигналов на основе сигнала понижающего микширования и модифицированной дополнительной информации, обеспеченной преобразователем 125 параметров. Блок 123 воспроизведения назначает каждый из объектных сигналов, сформированных объектным декодером 121, на заданную позицию в многоканальном пространстве и определяет уровни объектных сигналов, сформированных объектным декодером 121, согласно управляющей информации. Преобразователь 125 параметров формирует модифицированную дополнительную информацию путем комбинирования дополнительной информации и управляющей информации. Затем преобразователь 125 параметров передает модифицированную дополнительную информацию в объектный декодер 121.

Объектный декодер 121 может иметь возможность выполнять адаптивное декодирование путем анализа управляющей информации в модифицированной дополнительной информации.

Например, если управляющая информация указывает то, что первый объектный сигнал и второй объектный сигнал назначены на одну позицию в многоканальном пространстве и имеют одинаковый уровень, обычное устройство декодирования аудиосигнала может декодировать первый и второй объектные сигналы отдельно, а затем компоновать их в многоканальном пространстве посредством операции микширования/воспроизведения.

С другой стороны, объектный декодер 121 устройства 120 декодирования аудиосигнала узнает из управляющей информации в модифицированной дополнительной информации то, что первый и второй объектные сигналы назначены на одну позицию в многоканальном пространстве и имеют одинаковый уровень, как если бы они были одним источником звука. Соответственно, объектный декодер 121 декодирует первый и второй объектные сигналы путем интерпретации их как одного источника звука без отдельного их декодирования. Как результат, сложность декодирования снижается. Помимо этого, вследствие уменьшения числа источников звука, которые должны быть обработаны, сложность микширования/воспроизведения также снижается.

Устройство 120 декодирования аудиосигнала может быть эффективно использовано в ситуации, когда число объектных сигналов больше числа выходных каналов, поскольку множество объектных сигналов с большой вероятностью должны быть назначены на одну пространственную позицию.

В качестве альтернативы, устройство 120 декодирования аудиосигнала может быть использовано в ситуации, когда первый объектный сигнал и второй объектный сигнал назначены на одну позицию в многоканальном пространстве, но имеют различные уровни. В этом случае, устройство 120 декодирования аудиосигнала декодирует первый и второй объектные сигналы путем интерпретации первого и второго объектных сигналов как одного сигнала, вместо декодирования первого и второго объектных сигналов отдельно и передачи декодированных первого и второго объектных сигналов в блок 123 воспроизведения. Более конкретно, объектный декодер 121 может получать информацию, относящуюся к разности между уровнями первого и второго объектных сигналов, из управляющей информации в модифицированной дополнительной информации, и декодировать первый и второй объектные сигналы на основе полученной информации. Как результат, даже если первый и второй объектные сигналы имеют различные уровни, первый и второй объектные сигналы могут быть декодированы, как если бы они являлись одним источником звука.

В качестве еще одной альтернативы, объектный декодер 121 может регулировать уровни объектных сигналов, сформированных объектным декодером 121 согласно управляющей информации. Далее объектный декодер 121 может декодировать объектные сигналы, уровни которых отрегулированы. Соответственно, блок 123 воспроизведения не должен регулировать уровни декодированных объектных сигналов, обеспеченных объектным декодером 121, а просто компонует декодированные объектные сигналы, обеспеченные объектным декодером 121, в многоканальном пространстве. Вкратце, поскольку объектный декодер 121 регулирует уровни объектных сигналов, формируемых объектным декодером 121, согласно управляющей информации, блок 123 воспроизведения может легко компоновать объектные сигналы, формируемые объектным декодером 121, в многоканальном пространстве без необходимости дополнительно регулировать уровни объектных сигналов, формируемых объектным декодером 121. Следовательно, можно снижать сложность микширования/воспроизведения.

Согласно варианту осуществления по фиг. 2, объектный декодер устройства 120 декодирования аудиосигнала может адаптивно выполнять операцию декодирования путем анализа управляющей информации, тем самым снижая сложность декодирования и сложность микширования/воспроизведения. Может быть использована комбинация вышеописанных способов, выполняемых устройством 120 декодирования аудиосигнала.

Фиг. 3 представляет собой блок-схему устройства 130 декодирования аудиосигнала согласно второму варианту осуществления настоящего изобретения. Как показано на фиг. 3, устройство 130 декодирования аудиосигнала включает в себя объектный декодер 131 и блок 133 воспроизведения. Устройство 130 декодирования аудиосигнала отличается тем, что дополнительную информацию в нем передают не только в объектный декодер 131, но также в блок 133 воспроизведения.

Устройство 130 декодирования аудиосигнала может эффективно выполнять операцию декодирования, даже когда имеется объектный сигнал, соответствующий периоду молчания. Например, сигналы второго - четвертого объектов могут соответствовать периоду воспроизведения музыки, в течение которого играют музыкальные инструменты, а сигнал первого объекта может соответствовать периоду молчания, в течение которого играется аккомпанемент. В этом случае информация, указывающая то, какой из множества объектных сигналов соответствует периоду молчания, может быть включена в дополнительную информацию, и дополнительная информация может быть передана в блок 133 воспроизведения, а также в объектный декодер 131.

Объектный декодер 131 может минимизировать скорость декодирования не только путем декодирования объектного сигнала, соответствующего периоду молчания. Объектный декодер 131 задает объектный сигнал, соответствующий значению в 0, и передает уровень объектного сигнала в блок 133 воспроизведения. Объектные сигналы, имеющие значение в 0, в общем интерпретируются так же, как и объектные сигналы, имеющие значение, отличное от 0, и тем самым подвергаются операции микширования/воспроизведения.

С другой стороны, устройство 130 декодирования аудиосигнала передает дополнительную информацию, включающую в себя информацию, указывающую то, какой из множества объектных сигналов соответствует периоду молчания, в блок 133 воспроизведения, и тем самым не допускает обработки объектного сигнала, соответствующего периоду молчания, посредством операции микширования/воспроизведения, выполняемой блоком 133 воспроизведения. Следовательно, устройство 130 декодирования аудиосигнала может препятствовать излишнему возрастанию сложности микширования/воспроизведения.

Блок 133 воспроизведения может использовать информацию параметров микширования, которая включена в управляющую информацию, для того чтобы локализовать звуковой образ каждого объектного сигнала в стерео сцене. Информация параметров микширования может включать в себя только информацию амплитуды либо информацию амплитуды и информацию времени. Информация параметров микширования влияет не только на локализацию звуковых стерео образов, но также на психоакустическое восприятие пространственного качества звука пользователем.

Например, при сравнении двух звуковых образов, которые сформированы с использованием способа временного панорамирования и способа амплитудного панорамирования, соответственно, и воспроизводятся в одном месте с использованием 2-канального стерео громкоговорителя, обнаруживается, что способ амплитудного панорамирования может способствовать точной локализации звуковых образов, и что с использованием способа временного панорамирования можно формировать естественные звуки с сильным ощущением пространства. Таким образом, если блок 133 воспроизведения использует только способ амплитудного панорамирования для того, чтобы компоновать объектные сигналы в многоканальном пространстве, блок 133 воспроизведения может иметь возможность точно локализовать каждый звуковой образ, но может не иметь возможности создавать настолько сильное ощущение звука, как при использовании способа временного панорамирования. Пользователи могут иногда предпочитать локализацию звуковых образов до сильного ощущения звука или наоборот согласно типу звуковых источников.

Фиг. 4(a) и 4(b) поясняют влияние интенсивности (разности амплитуд) и разности времени на локализацию звуковых образов, выполняемую при воспроизведении сигналов с использованием 2-канального стерео громкоговорителя. Как показано на фиг. 4(a) и 4(b), звуковой образ может быть локализован под заданным углом согласно разности амплитуд и разности времени, которые независимы друг от друга. Например, разность амплитуд примерно в 8 дБ или разность времени примерно в 0,5 мс, которая эквивалентна разности амплитуд в 8 дБ, может быть использована для того, чтобы локализовать звуковой образ под углом в 20°. Следовательно, даже если в качестве информации параметров микширования обеспечена только разность амплитуд, можно получать различные звуки с различными свойствами путем преобразования разности амплитуд в разность времени, которая эквивалента разности амплитуд, в ходе локализации звуковых образов.

Фиг. 5 иллюстрирует функции, касающиеся соответствия между разностями амплитуд и разностями времени, которые требуются для того, чтобы локализовать звуковые образы под углами 10°, 20° и 30°. Функция, проиллюстрированная на фиг. 5, может быть получена на основе показанного на фиг. 4(a) и 4(b). Как показано на фиг. 5, для локализации звукового образа в заданной позиции могут быть обеспечены различные комбинации разности амплитуд - разности времени. Например, допустим, что в качестве информации параметров микширования для локализации звукового образа под углом в 20° обеспечена разность амплитуд в 8 дБ. Согласно функции, проиллюстрированной на фиг. 5, звуковой образ также может быть локализован под углом 20° с использованием комбинации разности амплитуд в 3 дБ и разности времени в 0,3 мс. В этом случае в качестве информации параметров микширования может быть обеспечена не только информация разности амплитуд, но также информация разности времени, за счет чего улучшается ощущение пространства.

Следовательно, чтобы сформировать звуки со свойствами, требуемыми пользователем, в ходе операции микширования/воспроизведения, информация параметров микширования может быть надлежащим образом преобразована так, что то, что из панорамирования амплитуды и панорамирования времени подходит пользователю, может быть выполнено. Т.е., если информация параметров микширования включает в себя только информацию разности амплитуд и пользователю нужны звуки с сильным ощущением пространства, информация разности амплитуд может быть преобразована в информацию разности времени, эквивалентную информации разности времени, со ссылкой на психоакустические данные. В качестве альтернативы, если пользователю требуются звуки как с сильным ощущением пространства, так и с точной локализацией звуковых образов, информация разности амплитуд может быть преобразована в комбинацию информации разности амплитуд и информации разности времени, эквивалентную исходной информации амплитуд. В качестве альтернативы, если информация параметров микширования включает в себя только информацию разности времени, и пользователь предпочитает точную локализацию звуковых образов, информация разности времени может быть преобразована в информацию разности амплитуд, эквивалентную информации разности времени, или может быть преобразована в комбинацию информации разности времени и информации разности амплитуд, которая может удовлетворять предпочтению пользователя путем повышения точности локализации звуковых образов и ощущения пространства.

В качестве еще одной альтернативы, если информация параметров микширования включает в себя и информацию разности амплитуд, и информацию разности времени, и пользователь предпочитает точную локализацию звуковых образов, комбинация информации разности амплитуд и информации разности времени может быть преобразована в информацию разности амплитуд, эквивалентную комбинации исходной информации разности амплитуд и информации разности времени. С другой стороны, если информация параметров микширования включает в себя и информацию разности амплитуд, и информацию разности времени, и пользователь предпочитает улучшение ощущения пространства, комбинация информации разности амплитуд и информации разности времени может быть преобразована в информацию разности времени, эквивалентную комбинации информации разности амплитуд и исходной информации разности времени. Как показано на фиг. 6, управляющая информация может включать в себя информацию микширования/воспроизведения и информацию гармоник, относящуюся к одному или более объектным сигналам. Информация гармоник может включать в себя по меньшей мере одно из информации основного тона, информации собственной частоты и информации преобладающей полосы частот, относящейся к одному или более объектным сигналам, и описаний энергии и спектра каждого поддиапазона каждого из объектных сигналов.

Информация гармоник может быть использована для того, чтобы обрабатывать объектный сигнал в ходе операции воспроизведения, поскольку разрешение блока воспроизведения, который выполняет эту операцию, в единицах поддиапазонов является недостаточным.

Если информация гармоник включает в себя информацию основного тона, относящуюся к одному или более объектным сигналам, усиление каждого из объектных сигналов может быть скорректировано путем ослабления или усиления заданной частотной области с использованием гребенчатого фильтра или обратного гребенчатого фильтра. Например, если один из множества объектных сигналов является вокальным сигналом, объектные сигналы могут быть использованы в качестве караоке путем ослабления только вокального сигнала. В качестве альтернативы, если информация гармоник включает в себя информацию преобладающей частотной области, относящуюся к одному или более объектным сигналам, может быть выполнен процесс ослабления или усиления преобладающей частотной области. В качестве еще одной альтернативы, если информация гармоник включает в себя информацию спектра, относящуюся к одному или более объектным сигналам, усиление каждого из объектных сигналов может контролироваться путем выполнения ослабления или усиления без ограничения какими-либо границами поддиапазонов.

Фиг. 7 представляет собой блок-схему устройства 140 декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения. Как показано на фиг. 7, устройство 140 декодирования аудиосигнала использует многоканальный декодер 141 вместо объектного декодера и блока воспроизведения, и декодирует ряд объектных сигналов после того, как объектные сигналы надлежащим образом скомпонованы в многоканальном пространстве.

Более конкретно, устройство 140 декодирования аудиосигнала включает в себя многоканальный декодер 141 и преобразователь 145 параметров. Многоканальный 141 декодер формирует многоканальный сигнал, объектные сигналы которого уже скомпонованы в многоканальном пространстве, на основе сигнала понижающего микширования и информации пространственных параметров, которая является канально-ориентированной дополнительной информацией, обеспечиваемой преобразователем 145 параметров. Преобразователь 145 параметров анализирует дополнительную информацию и управляющую информацию, передаваемую устройством кодирования аудиосигнала (не показано), и формирует информацию пространственных параметров на основе результата анализа. Более конкретно, преобразователь 145 параметров формирует информацию пространственных параметров путем комбинирования дополнительной информации и управляющей информации, которая включает в себя информацию настроек воспроизведения и информацию микширования. Т.е. преобразователь 145 параметров выполняет преобразование комбинации дополнительной информации и управляющей информации в пространственные данные, соответственно модулю «один к двум» (OTT) или модулю «два к трем» (TTT).

Устройство 140 декодирования аудиосигнала может выполнять операцию многоканального декодирования, в которую объединены операция объектно-ориентированного декодирования и операция микширования/воспроизведения, и тем самым может пропускать декодирование каждого объектного сигнала. Следовательно, можно снижать сложность декодирования и/или микширования/воспроизведения.

Например, когда имеется 10 объектных сигналов, и многоканальный сигнал, полученный на основе 10 объектных сигналов, должен быть воспроизведен 5.1-канальной акустической системой воспроизведения, обычное устройство декодирования объектно-ориентированного аудиосигнала формирует декодированные сигналы, надлежащим образом соответствующие 10 объектным сигналам, на основе сигнала понижающего микширования и дополнительной информации, и затем формирует 5.1-канальный сигнал путем надлежащей компоновки 10 объектных сигналов в многоканальное пространство, так что объектные сигналы могут стать подходящими для 5.1-канального акустического окружения. Тем не менее, недостаточно сформировать 10 объектных сигналов в ходе формирования 5.1-канального сигнала, и эта проблема становится более серьезной по мере того, как разность между числом объектных сигналов и числом каналов многоканального сигнала, который должен быть сформирован, возрастает.

С другой стороны, согласно варианту осуществления по фиг. 7 устройство 140 декодирования аудиосигнала формирует информацию пространственных параметров, подходящую для 5.1-канального сигнала, на основе дополнительной информации и управляющей информации и передает информацию пространственных параметров и сигнал понижающего микширования в многоканальный декодер 141. Затем многоканальный декодер 141 формирует 5.1-канальный сигнал на основе информации пространственных параметров и сигнала понижающего микширования. Другими словами, когда число каналов, которые должны быть выведены, составляет 5.1 каналов, устройство 140 декодирования аудиосигнала может просто сформировать 5.1-канальный сигнал на основе сигнала понижающего микширования без необходимости формировать 10 объектных сигналов и, таким образом, является более эффективным, чем традиционное устройство декодирования аудиосигнала, в отношении сложности.

Устройство 140 декодирования аудиосигнала считается эффективным, когда объем вычислений, требуемых для того, чтобы вычислять информацию пространственных параметров, соответствующую каждому из OTT-модуля и TTT-модуля путем анализа дополнительной информации и управляющей информации, передаваемой устройством кодирования аудиосигнала, меньше объема вычислений, требуемого для того, чтобы выполнять операцию микширования/воспроизведения после декодирования каждого объектного сигнала.

Устройство 140 декодирования аудиосигнала может быть получено путем добавления модуля для формирования информации пространственных параметров путем анализа дополнительной информации и управляющей информации в обычное устройство декодирования многоканального аудиосигнала и поэтому может сохранять совместимость с обычным устройством декодирования многоканального аудиосигнала. Также устройство 140 декодирования может повышать качество звука с использованием существующих средств обычного устройства декодирования многоканального аудиосигнала, таких как формирователь огибающей, средство временной обработки поддиапазонов (STP) и декоррелятор. С учетом всего этого следует сделать вывод о том, что все преимущества обычного способа декодирования многоканального аудиосигнала могут быть легко применены к с