Способы и устройства для кодирования и декодирования аудиосигналов на основе объектов

Иллюстрации

Показать все

Изобретение относится к декодированию аудиосигналов. Представлены способ и устройство кодирования аудиосигналов и способ и устройство декодирования аудиосигналов. Способ декодирования аудио включает в себя извлечение понижающего сигнала и дополнительной информации на основе объекта из входящего сигнала аудио, формирование информации воспроизведения на основе входящих данных управления и формирование пространственной информации на основе информации воспроизведения и дополнительной информации на основе объекта. Технический результат - обеспечение декодирования аудиосигналов, при котором образы звука можно располагать в любом желаемом положении для каждого объектного аудиосигнала. 3 н. и 8 з.п. ф-лы, 20 ил.

Реферат

Область техники, к которой относится изобретение

Способ декодирования аудиосигнала содержит извлечение из аудиосигнала понижающего сигнала и дополнительной информации на основе объектов, формирование измененного понижающего сигнала, основанного на понижающем сигнале и извлеченной информации, которая была извлечена из дополнительной информации на основе объектов, формирование дополнительной информации на основе канала, полагаясь на дополнительную информацию на основе объектов и данные управления для воспроизведения понижающего сигнала, а также формирование многоканального аудиосигнала на основе измененного понижающего сигнала и дополнительной информации на основе объектов.

Уровень техники

Главным образом, в методиках кодирования и декодирования многоканального аудио ряд канальных сигналов многоканального сигнала понижается до сигналов с меньшим числом каналов, передается дополнительная информация, касающаяся исходных сигналов канала, и восстанавливается многоканальный сигнал, имеющий столько каналов, сколько и исходный многоканальный сигнал.

В основном, методики кодирования и декодирования аудио на основе объектов схожи с методиками кодирования и декодирования многоканального аудио, что касается, например, понижения нескольких источников звука в сигналах с меньшим количеством источников звука и передачи дополнительной информации, относящейся к исходным источникам звука. Однако в методиках кодирования и декодирования аудиосигналов на основе объектов сигналы объектов, являющиеся базовыми элементами (например, звук музыкального инструмента или человеческого голоса) канального сигнала, обрабатываются так же, как канальные сигналы в методиках кодирования и декодирования многоканального аудио, и могут таким образом быть закодированы.

Другими словами, в методиках кодирования и декодирования аудио на основе объектов каждый сигнал объекта считают сущностью, которая будет закодирована. В этом отношении технологии кодирования и декодирования аудиосигнала на основе объектов отличаются от технологий кодирования и декодирования многоканального аудио, в которых операция кодирования многоканального аудио выполняется просто, основываясь на межканальной информации независимо от ряда элементов канального сигнала, который будет закодирован.

Раскрытие изобретения

Техническая задача

Данное изобретение обеспечивает способ и устройство для кодирования аудио, а также способ и устройство декодирования аудио, в которых аудиосигналы могут быть закодированы или декодированы так, что образы звука можно располагать в любом желаемом месте для каждого объектного аудиосигнала.

Сущность изобретения

Согласно одному варианту данного изобретения, обеспечивается способ кодирования аудио, включающий в себя извлечение из входящего сигнала понижающего сигнала и основанной на объекте дополнительной информации, формирование информации воспроизведения на основе входящих данных управления, и формирование пространственной информации на основе информации воспроизведения и дополнительной информации на основе объекта.

Согласно другому аспекту данного изобретения, обеспечивается устройство кодирования аудио, включающее в себя демультиплексор, который извлекает из входящего сигнала понижающий сигнал и дополнительную информацию на основе объекта, а также рендерер, который формирует информацию воспроизведения на основе входящих данных управления, и транскодер, который формирует пространственную информацию на основе информации воспроизведения и дополнительной информации на основе объекта.

Согласно одному варианту данного изобретения, обеспечивается компьютерно-читаемый записываемый носитель, имеющий записанную компьютерную программу для выполнения способа кодирования аудио, причем способ кодирования аудио включает в себя извлечение из входящего аудиосигнала понижающего сигнала и дополнительной информации на основе объекта, формирование информации воспроизведения на основе входящих данных управления, а также формирование пространственной информации на основе информации воспроизведения и дополнительной информации на основе объекта.

Преимущества результата

Обеспечены способ и устройство кодирования аудио, а также способ и устройство декодирования аудио, в которых аудиосигналы могут быть закодированы или декодированы так, что образы звука можно располагать в любой желаемой позиции для каждого объектного аудиосигнала.

Краткое описание чертежей

Данное изобретение станет более понятным из детального описания, приведенного ниже, и сопроводительных чертежей, которые даны только с целью иллюстрации, чем не ограничивают данное изобретении, и в которых:

ФИГ.1 - блок-схема типовой системы кодирования/декодирования аудио на основе объекта;

ФИГ.2 - блок-схема устройства декодирования аудио согласно первому варианту осуществления данного изобретения;

ФИГ.3 - блок-схема устройства декодирования аудио согласно второму варианту осуществления данного изобретения;

ФИГ.4 - график, объясняющий влияние разницы амплитуд и разницы времени, которые независимы друг от друга, на местоположение образов звука;

ФИГ.5 - график функций, касающихся соответствия между разницей амплитуд и разницей времени, которые требуются для расположения образов звука в предопределенной позиции;

ФИГ.6 показывает формат данных управления, включающих в себя информацию гармоник;

ФИГ.7 - блок-схема устройства декодирования аудио согласно третьему варианту осуществления данного изобретения;

ФИГ.8 - блок-схема профессионального модуля усиления понижения(ADG), который может использоваться в устройстве декодирования аудио, показанном на ФИГ.7;

ФИГ.9 - блок-схема устройства декодирования аудио согласно четвертому варианту осуществления данного изобретения;

ФИГ.10 - блок-схема устройства декодирования аудио согласно пятому варианту осуществления данного изобретения;

ФИГ.11 - блок-схема устройства декодирования аудио согласно шестому варианту осуществления данного изобретения;

ФИГ.12 - блок-схема устройства декодирования аудио согласно седьмому варианту осуществления данного изобретения;

ФИГ.13 - блок-схема устройства декодирования аудио согласно восьмому варианту осуществления данного изобретения;

ФИГ.14 - блок-схема для объяснения применения трехмерной (3D) информации к кадру устройством декодирования аудио, показанным на ФИГ.13;

ФИГ.15 - блок-схема устройства декодирования аудио согласно девятому варианту осуществления данного изобретения;

ФИГ.16 - блок-схема устройства декодирования аудио согласно десятому варианту осуществления данного изобретения;

ФИГ.17-ФИГ.19 - диаграммы для объяснения способа декодирования аудио согласно одному варианту осуществления данного изобретения, и

ФИГ.20 - блок-схема устройства кодирования аудио согласно одному варианту осуществления данного изобретения.

Лучший способ выполнения изобретения

Здесь и далее данное изобретение будет описано подробно со ссылками на сопутствующие чертежи, в которых показаны характерные варианты осуществления.

Способ и устройство кодирования аудио и способ и устройство декодирования аудио согласно данному изобретению могут использоваться в операциях обработки аудио на основе объекта, но данное изобретение не ограничивается этим. Другими словами, способ и устройство кодирования аудио и способ и устройство декодирования аудио могут применяться в различных операциях обработки сигналов, а не только в операциях обработки аудио на основе объекта.

ФИГ.1 - это блок-схема типичной системы кодирования/декодирования аудио на основе объекта. В основном, аудиосигналы, вводимые в устройство кодирования аудио на основе объекта, не соответствуют каналам многоканального сигнала, а являются независимыми объектными сигналами. В этом смысле, устройство кодирования аудио на основе объекта отличается от устройства кодирования многоканального аудио, в которое вводятся канальные сигналы многоканального сигнала.

Например, канальные сигналы, такие как фронтальный сигнал левого канала и фронтальный сигнал правого канала 5.1-канального сигнала могут быть введены в многоканальный аудиосигнал, тогда как объектные аудиосигналы, как человеческий голос или звук музыкального инструмента (например, звук виолончели или пианино), которые меньше, чем канальные сигналы, могут быть введены в устройство кодирования аудио на основе объекта.

Ссылаясь на ФИГ.1, система кодирования/декодирования аудио на основе объекта, содержит устройство кодирования аудио на основе объекта и устройство декодирования аудио на основе объекта. Устройство кодирования аудио на основе объекта содержит объектный кодер 100, а устройство декодирования аудио на основе объекта содержит объектный декодер 111 и рендерер 113.

Объектный кодировщик 100 принимает N объектных аудиосигналов и формирует понижающий сигнал на основе объекта с одним или более каналов и дополнительную информацию, содержащую ряд кусочков информации, извлеченной из N объектных аудиосигналов, например разницу энергий, разницу фаз и уровень корреляции. Дополнительная информация и понижающий сигнал на основе объекта объединяются в единый битовый поток, и этот поток передается в устройство декодирования на основе объекта.

Дополнительная информация может содержать флаг, указывающий производить ли кодирование аудио на основе канала или кодирование аудио на основе объекта, таким образом можно определить, производить ли кодирование аудио на основе канала или кодирование аудио на основе объекта, ориентируясь по флагу дополнительной информации. Дополнительная информация также может содержать информацию огибающей, информацию группировки, информацию периода тишины и информацию о задержках относительно объектных сигналов. Дополнительная информация может также содержать информацию о разнице объектных уровней, информацию о внутриобъектной кросс-корреляции, информацию об усилении понижения, информацию о разнице в уровнях канала понижения и информацию об абсолютной энергии объекта.

Объектный декодер 111 принимает понижающий сигнал на основе объекта и дополнительную информацию из устройства кодирования аудио на основе объекта и хранит объектные сигналы, имеющие схожие свойства с N объектными сигналами, основанными на понижающем сигнале на основе объекта и дополнительной информации. Объектные сигналы, формируемые объектным декодером 111, еще не были распределены на какую-либо позицию в многоканальном пространстве. Таким образом, рендерер 113 распределяет каждый из объектных сигналов, сформированных объектным декодером 111, на предопределенные позиции в многоканальном пространстве и определяет уровни объектных сигналов так, что объектные сигналы можно воспроизводить из соответствующих позиций, обозначенных рендерером 113 с соответствующими уровнями, определенными рендерером 113. Информация управления относительно каждого из объектных сигналов, сформированных объектным декодером 111, может изменяться во времени, таким образом, пространственные позиции и уровни объектных сигналов, сформированных объектным декодером 111, могут изменяться согласно информации управления.

ФИГ.2 - это блок-схема устройства 120 декодирования аудио согласно первому варианту осуществления данного изобретения. Ссылаясь на ФИГ.2, устройство 120 декодирования аудио включает в себя объектный декодер 121, рендерер 123 и преобразователь 125 параметров. Устройство 120 декодирования аудио также может содержать демультиплексор (не показан), который извлекает понижающий сигнал и дополнительную информацию из битового потока, вводимого в него, и это применимо ко всем устройствам декодирования аудио согласно другим вариантам исполнения данного изобретения.

Объектный декодер 121 формирует ряд объектных сигналов на основе понижающего сигнала и измененной дополнительной информации, обеспеченной преобразователем 125 параметров. Рендерер 123 распределяет каждый из объектных сигналов, сформированных объектным декодером 121 по предопределенным позициям в многоканальном пространстве, и определяет уровни объектных сигналов, сформированных объектным декодером 121 согласно информации управления. Преобразователь 125 параметров формирует измененную дополнительную информацию, объединяя дополнительную и контрольную информацию. Затем преобразователь 125 параметров передает измененную дополнительную информацию в объектный декодер 121.

Объектный декодер 121 может производить адаптивное декодирование, анализируя информацию управления в измененной дополнительной информации.

Например, если информация управления показывает, что первый объектный сигнал и второй объектный сигнал распределены на одну позицию в многоканальном пространстве и имеют один уровень, обычное устройство аудиодекодирования может декодировать первый и второй объектный сигнал отдельно, а затем соединить их в многоканальном пространстве, используя операцию смешивания/воспроизведения.

С другой стороны, объектный декодер 121 устройства 120 кодирования аудио узнает из информации управления в измененной дополнительной информации, что первый и второй объектный сигналы распределены на одну позицию в многоканальном пространстве и имеют такой же уровень, как если б они были одним звуковым источником. Соответственно, объектный декодер 121 декодирует первый и второй объектный сигнал, обрабатывая их как один звуковой источник без декодирования их раздельно. В результате уменьшается сложность декодирования. В добавок, из-за уменьшения числа источников звука, требующих обработки, сложность смешивания/воспроизведения тоже снижается.

Устройство 120 декодирования аудио можно эффективно использовать в случае, когда число объектных сигналов значительно больше, чем число выходящих каналов, так как множество объектных сигналов с большей вероятностью будут распределены на одну пространственную позицию.

С другой стороны, устройство 120 декодирования аудио можно использовать в случае, когда первый объектный сигнал и второй объектный сигнал распределены на одной позиции в многоканальном пространстве, но имеют разные уровни. В этом случае, устройство 120 декодирования аудио декодирует первый и второй объектный сигнал, обрабатывая первый и второй объектный сигнал как один, вместо обработки первого и второго объектного сигнала отдельно, и направляет декодированный первый и второй объектный сигнал в рендерер 123. Более точно объектный декодер 121 может получать информацию, касающуюся разницы между уровнями первого и второго объектного сигнала из информации управления в измененной дополнительной информации и декодировать первый и второй объектный сигнал, основываясь на полученной информации. В результате, даже если первый и второй объектный сигналы имеют разные уровни, первый и второй объектные уровни могут быть декодированы, как если бы они были одним звуковым источником.

В другой ситуации, объектный декодер 121 может настраивать уровни объектных сигналов, сформированных объектным декодером 121 согласно информации управления. Кроме того, объектный декодер 121 может декодировать объектные сигналы, уровни которых настроены. Соответственно, рендереру 123 не нужно настраивать уровни декодируемых объектных сигналов, поступающих от декодера 121, а просто собрать декодируемые объектные сигналы, поступающие от декодера 121 в многоканальном пространстве. Вкратце, так как объектный декодер 121 настраивает уровни объектных сигналов, формируемых объектным декодером 121 согласно информации управления, рендерер 123 может собирать готовые объектные сигналы, сформированные объектным декодером 121 в многоканальном пространстве без необходимости дополнительно настраивать уровни объектных сигналов, сформированных объектным декодером 121. Таким образом, возможно снизить сложность смешивания/воспроизведения.

Согласно варианту исполнения на ФИГ.2, объектный декодер устройства 120 декодирования аудио может адаптивно выполнять операцию декодирования с помощью анализа информации управления, таким образом уменьшая сложность декодирования и сложность смешивания/воспроизведения. Можно использовать сочетание вышеописанных способов, выполняемых устройством 120 декодирования аудио.

ФИГ.3 - это блок-схема устройства 130 декодирования аудио согласно второму варианту выполнения данного изобретения. Ссылаясь на ФИГ.3, устройство 130 декодирования аудио содержит объектный декодер 131 и рендерер 133. Устройство 130 декодирования аудио характеризуется обеспечением дополнительной информацией не только объектного декодера 131, но также и рендерера 133.

Устройство 130 декодирования аудио может эффективно выполнять операцию декодирования, даже если существует объектный сигнал, относящийся к периоду тишины. Например, со второго по четвертый объектные сигналы могут относиться к периоду воспроизведения музыки, в течение которого музыкальный инструмент играет, а первый объектный сигнал может относиться к периоду тишины, в течение которого играет сопровождение. В таком случае, информация, указывающая какой из множества объектных сигналов относится к периоду тишины, может содержаться в дополнительной информации, причем дополнительная информация может предоставляться в рендерер 133 так же, как и в объектный декодер 131.

Объектный декодер 131 может минимизировать сложность декодирования, не кодируя объектный сигнал, относящийся к периоду молчания. Объектный декодер 131 устанавливает объектный сигнал, относящийся к значению 0, и передает уровень объектного сигнала на рендерер 133. В основном, объектные сигналы, имеющие уровень со значением 0, обрабатываются так же, как объектные сигналы, имеющие уровень, отличный от нуля, то есть операцией смешивания/воспроизведения.

С другой стороны, устройство 130 декодирования аудио передает дополнительную информацию, включая информацию, указывающую, какой из множества объектных сигналов относится к периоду тишины, рендереру 133, и таким образом предотвращать обработку объектного сигнала, относящегося к периоду тишины, операцией смешивания/воспроизведения, выполняемой рендерером 133. Таким образом, устройство 130 декодирования аудио может предотвращать ненужное усиление сложности в смешивании/воспроизведении.

Рендерер 133 может использовать информацию о параметрах смешивания, которая содержится в информации управления, для определения места образа звука каждого объектного сигнала в стереоокружении. Информация о параметрах смешивания может содержать только информацию об амплитуде или как информацию об амплитуде, так и информацию о времени. Информация о параметрах смешивания влияет не только на определение места стереозвуковых образов, но также и на психоакустическое восприятие пространственного качества звука слушателем.

Например, при сравнении двух звуковых образов, которые были получены при помощи способа временного панорамирования и способа амплитудного панорамирования и воспроизведены с использованием 2-канального стереодинамика, выяснили, что способ амплитудного панорамирования может обеспечивать точную локализацию звукового образа, в то время как способ временного панорамирования обеспечивает естественный звук с совершенным чувством пространства. Таким образом, если рендерер 133 использует только способ амплитудного панорамирования для объединения объектных сигналов в многоканальном пространстве, рендерер 133 сможет точнее локализовать каждый звуковой образ, но не сможет обеспечить совершенное чувство звука, как при использовании способа временного панорамирования. Иногда пользователи предпочитают точную локализацию звукового образа совершенному чувству звука, или, в зависимости от источников звука, наоборот.

ФИГ.4, (a) и ФИГ.4, (b) объясняют воздействие интенсивности (разницы амплитуд) и разницы во времени на локализацию звуковых образов при воспроизведении сигнала в двухканальном аудиодинамике. Ссылаясь на ФИГ.4, (a) и ФИГ.4, (b), звуковой образ может быть локализован под заданным углом согласно разницы амплитуд и разницы во времени, независимых друг от друга. Например, разницу амплитуд около 8 дБ, или разницу во времени около 0,5 мсек, что эквивалентно разнице амплитуд в 8 дБ, можно использовать для локализации звукового образа под углом 20. Следовательно, если информацией о параметрах смешивания обеспечивается только разница амплитуд, возможно получить различные звуки с различными свойствами, преобразуя разницу амплитуд в разницу во времени, которая эквивалентна разнице амплитуд в период локализации звукового образа.

ФИГ.5 показывает функции, касающиеся связи между разницей амплитуд и разницей во времени, которые требуются для локализации звуковых образов под углами 10, 20 и 30. Функция, показанная на ФИГ.5, может быть получена, основываясь на ФИГ.4, (a) и ФИГ.4, (b). Согласно ФИГ.5, различные сочетания разницы амплитуд и разницы во времени могут обеспечиваться для локализации звукового образа в предопределенной позиции. Для примера примем, что смешанной информацией о параметрах обеспечивается разница амплитуд 8 дБ для локализации звукового образа под углом 20. Согласно функции, показанной на ФИГ.5, звуковой образ может быть также локализован под углом 20 при помощи сочетания разницы амплитуд в 3 дБ и разницы во времени 0,3 мсек. В этом случае, не только информация о разнице амплитуд, но и информация о разнице во времени может предоставляться как информация о параметрах смешивания, усиливая таким образом, ощущение пространства.

Следовательно, для того чтобы сформировать звуки с желаемыми пользователем характеристиками в течение операции смешивания/воспроизведения, информация о параметрах смешивания может быть, соответственно, преобразована так, что можно произвести амплитудное панорамирование или временное панорамирование, смотря что подходит пользователю. Это значит, если информация о параметрах смешивания включает в себя только информацию о разнице амплитуд, и пользователь желает услышать звуки с совершенным ощущением пространства, информация о разнице амплитуд может быть преобразована в эквивалентную информацию о разнице во времени, со ссылкой на психоакустические данные. Или если пользователь желает как услышать звуки с совершенным ощущением пространства, так и точной локализации звукового образа, информация о разнице амплитуд может быть преобразована в сочетание информации о разнице амплитуд и информации о разнице во времени, эквивалентной первоначальной информации о разнице амплитуд. Или если смешанная информация о параметрах содержит только информацию о разнице во времени и пользователь предпочитает точную локализацию звукового образа, информация о разнице во времени может быть преобразована в информацию о разнице амплитуд, эквивалентную информации о разнице во времени, или может быть преобразована в сочетание информации о разнице амплитуд и информации о разнице во времени, что сможет удовлетворить потребности пользователя, увеличением как точности локализации звукового образа, так и ощущения пространства.

Или если смешанная информация о параметрах содержит как информацию о разнице амплитуд, так и информацию о разнице во времени, а пользователь предпочитает точную локализацию звукового образа, сочетание информации о разнице амплитуд и информации о разнице во времени может быть преобразовано в информацию о разнице амплитуд, эквивалентную сочетанию информации о разнице амплитуд и информации о разнице во времени. С другой стороны, если смешанная информацию о параметрах содержит как информацию о разнице амплитуд, так и информацию о разнице во времени, и пользователь предпочитает усиление ощущения пространства, сочетание информации о разнице амплитуд и информации о разнице во времени может быть преобразовано в информацию о разнице во времени, эквивалентную сочетанию информации о разнице амплитуд и информации о разнице во времени. Согласно ФИГ.6, информация управления может содержать информацию смешивания/воспроизведения и информацию гармоник относительно одного или более объектных сигналов. Информация гармоник может содержать по меньшей мере одно из информации о тоне, информацию об основной частоте или информацию о преобладающей полосе частот относительно одного или более объектных сигналов и описания энергии и спектра каждой подполосы каждого объектного сигнала.

Информация гармоник может использоваться для обработки объектных сигналов во время операции воспроизведения, так как разрешение рендерера, который производит эту операцию, в единицах подполос недостаточно.

Если информация гармоник содержит информацию тона, касающуюся одного или более объектных сигналов, усиление каждого объектного сигнала можно настроить ослаблением или усилением предопределенной области частот, используя гребенчатый фильтр или обратный гребенчатый фильтр. Например, если один из множества объектных сигналов - звук голоса, объектные сигналы могут использоваться как караоке, путем ослабления только звука голоса. Или если информация гармоник содержит информацию о преобладающей области частот, касающуюся одного или более объектных сигналов, можно производить процесс ослабления или усиления преобладающей области частот. Или если информация гармоник содержит информацию о спектре, касающуюся одного или более объектных сигналов, усиление каждого объектного сигнала можно контролировать выполнением ослабления или усиления без ограничения какой-либо подполосой.

ФИГ.7 - это блок-схема устройства 140 декодирования аудио, согласно другому варианту осуществления данного изобретения. Согласно ФИГ.7, устройство 140 декодирования аудио использует многоканальный декодер 141 взамен объектного декодера и рендерера и декодирует ряд объектных сигналов после того, как они надлежащим образом собраны в многоканальном пространстве.

Более точно, устройство 140 декодирования аудио содержит многоканальный декодер 141 и преобразователь 145 параметров. Многоканальный декодер 141 формирует многоканальный сигнал, чьи объектные сигналы уже собраны в многоканальном пространстве на основе понижающего сигнала и пространственной информации о параметрах, которая является дополнительной информацией на основе канала, обеспечиваемой преобразователем 145 параметров. Преобразователь 145 параметров анализирует дополнительную информацию и информацию управления, передающуюся устройством кодирования аудио (не показан), и формирует пространственную информацию о параметрах на основе результатов анализа. Более точно, преобразователь 145 параметров формирует пространственную информацию о параметрах с помощью сочетания дополнительной информации и информации управления, которая содержит информацию о запуске воспроизведения и информацию о смешивании. Значит, преобразователь 145 параметров выполняет преобразование сочетания дополнительной информации и информации управления в пространственных данных, относящихся к приставкам OTT (One-To-Two) или TTT (Two-To-Three).

Устройство 140 декодирования аудио может производить операцию многоканального декодирования, в которой объединены операция декодирования на основе объекта и операция смешивания/воспроизведения и может таким образом пропускать декодирование каждого объектного сигнала. Следовательно, возможно уменьшить сложность декодирования и смешивания/воспроизведения.

Например, когда 10 объектных сигналов и многоканальный сигнал, полученный на основе 10 объектных сигналов, необходимо воспроизвести 5.1-канальной акустической системой, обычное устройство декодирования аудио на основе объекта декодирует сигналы в указанном порядке соответственно 10 объектным сигналам на основе понижающего сигнала и дополнительной информации, а затем формирует 5.1-канальный сигнал, соответствующим образом собирая 10 объектных сигналов в многоканальном пространстве так, что объектные сигналы смогут стать подходящими для 5.1-канального окружения. Однако неэффективно формировать 10 объектных сигналов во время формирования 5.1-канального сигнала, и эта проблема становится более серьезной по мере того, как разница между количеством объектных сигналов и количеством каналов многоканального сигнала для формирования возрастает.

С другой стороны, согласно варианту исполнения на ФИГ.7, устройство 140 декодирования аудио формирует информацию о пространственных параметрах, подходящую для 5.1-канального сигнала, основываясь на дополнительной информации и понижающий сигнал в многоканальный декодер 141. Затем, многоканальный декодер 141 формирует 5.1-канальный сигнал на основе пространственной информации о параметрах и понижающего сигнала. Другими словами, когда число каналов на выходе равно 5.1, устройство 140 декодирования аудио может без труда сформировать 5.1-канальный сигнал на основе понижающего сигнала без необходимости формировать 10 объектных сигналов и, таким образом, работать в смысле сложности более эффективно, чем традиционное устройство декодирования аудио.

Устройство 140 декодирования аудио считается эффективным, когда число вычислений, требуемых для вычисления пространственной информации о параметрах, относящейся как к OTT, так и TTT, через анализ дополнительной информации и информации управления, переданной устройством кодирования аудио, меньше, чем число вычислений, необходимых для выполнения операции смешивания/воспроизведения после декодирования каждого объектного сигнала.

Устройство 140 декодирования аудио может быть получено простым добавлением модуля для формирования пространственной информации о параметрах через анализ дополнительной информации и информации управления к типичному устройству декодирования многоканального аудио и может таким образом поддержать совместимость с типичным устройством декодирования многоканального аудио. Кроме того, устройство 140 декодирования аудио может улучшить качество звука, используя существующие инструменты типичного устройства декодирования многоканального аудио, такие как формирователь огибающей, инструмент временной обработки подполосы (STP) и декоррелятор. Учитывая все это, можно сделать заключение, что все преимущества типичного способа декодирования многоканального аудио могут быть с готовностью применены к способу декодирования объектного аудио.

Пространственная информация о параметрах, переданная многоканальному декодеру 141 преобразователем 145 параметров, возможно, была сжата, чтобы быть подходящей для того, чтобы быть переданной. Альтернативно, у пространственной информации о параметрах может быть тот же самый формат, как у данных, переданных типичным многоканальным устройством кодирования. Таким образом, пространственная информация о параметрах, возможно, была подвергнута операции декодирования Хаффмана или операции декодирования пилот-сигнала и может таким образом быть передана каждому модулю как ключевые несжатые пространственные данные. Первый вариант является подходящим для передачи пространственной информации о параметрах устройству декодирования многоканального аудио в удаленном месте, а последнее подходит, потому что не существует никакой потребности в устройстве декодирования многоканального аудио, чтобы преобразовывать ключевые сжатые пространственные данные в ключевые несжатые пространственные данные, которые могут с готовностью использоваться в операции декодирования.

Конфигурирование пространственной информации о параметрах на основе анализа дополнительной информации и информации управления может вызвать задержку между понижающим сигналом и пространственной информацией о параметрах. Чтобы избежать этого, дополнительный буфер может быть предоставлен или для понижающего сигнала, или для пространственной информации о параметрах так, чтобы понижающий сигнал и пространственная информация о параметрах могли быть синхронизированы друг с другом. Эти способы, однако, неудобны из-за требования обеспечить дополнительный буфер. Альтернативно, дополнительная информация может быть передана перед понижающим сигналом с учетом возможности возникновения задержки между понижающим сигналом и пространственной информацией о параметрах. В этом случае, пространственная информация о параметрах, полученная сочетанием дополнительной информации и информации управления, не требует настройки и может сразу использоваться.

Если у множества объектных сигналов понижающего сигнала различные уровни, профессиональный модуль усиления понижения (ADG), который может непосредственно влиять на понижающий сигнал, может определить относительные уровни объектных сигналов, и каждый из объектных сигналов может быть расположен в предопределенном положении в многоканальном пространстве, используя ключевые пространственные данные, такие как информация различия уровня канала, информация о межканальной корреляции (ICC) и информация о коэффициенте предсказания канала (CPC).

Например, если информация управления указывает, что предопределенный объектный сигнал должен быть размещен в предопределенном положении в многоканальном пространстве и имеет более высокий уровень, чем другие объектные сигналы, типичный многоканальный декодер может вычислить различие между энергиями каналов понижающего сигнала и разделить понижающий сигнал на несколько исходящих каналов на основе результатов вычисления. Однако типичный многоканальный декодер не может увеличить или уменьшить громкость определенного звука в понижающем сигнале. Другими словами, типичный многоканальный декодер просто распределяет понижающий сигнал по нескольким исходящим каналам и таким образом не может увеличить или уменьшить громкость звука в понижающем сигнале.

Относительно легко разместить каждый из нескольких объектных сигналов понижающего сигнала, сформированного объектным кодером, в предопределенном положении в многоканальном пространстве согласно информации управления. Однако специальные методики требуются для увеличения или уменьшения амплитуды предопределенного объектного сигнала. Другими словами, если понижающий сигнал, сформированный объектным кодером, используется в этом качестве, трудно уменьшить амплитуду каждого объектного сигнала понижающего сигнала.

Поэтому, согласно этому варианту осуществления данного изобретения, относительные амплитуды объектных сигналов могут быть изменены согласно информации управления, используя модуль 147 ADG, показанный на ФИГ.8. Более определенно, амплитуда любого из множества объектных сигналов понижающего сигнала, переданного объектным кодером, может быть увеличена или уменьшена, используя модуль 147 ADG. Понижающий сигнал, полученный компенсацией, выполненной модулем 147 ADG, может быть подвергнут многоканальному декодированию.

Если относительные амплитуды объектных сигналов понижающего сигнала соответственно настроены, используя модуль 147 ADG, возможно выполнить объектное декодирование, используя типичный многоканальный декодер. Если понижающий сигнал, сформированный объектным кодировщиком, является сигналом моно или стерео или многоканальным сигналом с тремя или больше каналами, понижающий сигнал может быть обработан модулем 147 ADG. Если у понижающего сигнала, сформированного объектным кодировщиком, есть два или больше канала, а предопределенный объектный сигнал, который должен быть настроен модулем 147 ADG, только существует в одном из каналов понижающего сигнала, модуль 147 ADG может быть применен только к каналу, включающему предопределенный объектный сигнал, вместо того, чтобы быть примененным ко всем каналам понижающего сигнала. Понижающий сигнал, обработанный модулем 147 ADG вышеописанным образом, может быть без труда обработан, используя типичный многоканальный декодер без потребности изменять структуру многоканального декодера.

Даже когда заключительный выходящий сигнал не является многоканальным, который может быть воспроизведен многоканальным громкоговорителем, но является стереофоническим сигналом, модуль 147 ADG может и