2394283 - Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов

Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов

Иллюстрации

Показать все

Изобретение относится к устройствам кодирования и декодирования аудиосигналов, в которых объектно-базированные аудиосигналы могут эффективно обрабатываться посредством выполнения операций кодирования и декодирования. Технический результат - повышение точности кодирования и декодирования аудиосигналов. Способ и устройство декодирования аудиосигналов и способ и устройство кодирования аудиосигналов могут эффективно обрабатывать объектно-базированные аудиосигналы. Способ декодирования аудио включает в себя прием первого и второго аудиосигналов, которые являются объектно-кодированными; генерирование третьей информации об энергии объекта на основе первой информации об энергии объекта, включенной в первый аудиосигнал, и второй информации об энергии объекта, включенной во второй аудиосигнал; и генерирование третьего аудиосигнала посредством комбинирования первого и второго сигналов объекта и третьей информации об энергии объекта. 5 н. и 10 з.п. ф-лы, 33 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу и устройству кодирования аудио и способу и устройству декодирования аудио, в которых объектно-базированные аудиосигналы могут эффективно обрабатываться посредством выполнения операций кодирования и декодирования.

Уровень техники

В общем, в методах кодирования и декодирования многоканального аудио некоторое количество сигналов канала многоканального сигнала смешиваются с понижением в меньшее число сигналов каналов, передается дополнительная информация, касающаяся исходных сигналов канала, и восстанавливается многоканальный сигнал, имеющий столько каналов, сколько имеет исходный многоканальный сигнал.

Методы объектно-базированного кодирования и декодирования аудио, в основном, аналогичны методам кодирования и декодирования многоканального аудио в терминах понижающего смешивания нескольких источников звука в меньшее количество сигналов источников звука и передачи дополнительной информации, касающейся исходных источников звука. Однако в методах объектно-базированного кодирования и декодирования аудио сигналы объекта, которые представляют собой базовые элементы (например, звук музыкального инструмента или голос человека) сигнала канала, рассматриваются также как сигналы канала в методах кодирования и декодирования многоканального аудио и могут, таким образом, кодироваться.

Другими словами, в методах объектно-базированного кодирования и декодирования аудио считается, что сигналы объекта представляют собой сущности, подлежащие кодированию. В этом отношении методы объектно-базированного кодирования и декодирования аудио отличаются от методов многоканального кодирования и декодирования аудио, в которых операция многоканального кодирования аудио выполняется, просто основываясь на межканальной информации, независимо от количества элементов сигнала канала, подлежащего кодированию.

Описание изобретения

Техническая задача

Настоящее изобретение обеспечивает способ и устройство кодирования аудио и способ и устройство декодирования аудио, в которых аудиосигналы могут кодироваться или декодироваться, так что аудиосигналы могут применяться в различных окружающих средах.

Техническое решение

Согласно аспекту настоящего изобретения обеспечивается способ декодирования аудио, включающий в себя: прием первого и второго аудиосигналов, которые являются объектно-кодированными; генерирование третьей информации об энергии объекта на основе первой информации об энергии объекта, включенной в первый аудиосигнал, и второй информации об энергии объекта, включенной во второй аудиосигнал; и генерирование третьего аудиосигнала посредством комбинирования первого и второго сигналов объекта и третьей информации об энергии объекта.

Согласно другому аспекту настоящего изобретения обеспечивается устройство декодирования аудио, включающее в себя демультиплексор, выполненный с возможностью извлечения первого сигнала понижающего смешивания и первой объектно-базированной дополнительной информации из первого аудиосигнала и извлечения второго сигнала понижающего смешивания и второй объектно-базированной дополнительной информации из второго аудиосигнала; и контроллер с многими указателями, выполненный с возможностью генерирования третьей информации об энергии объекта посредством комбинирования первой информации об энергии объекта, включенной в первую объектно-базированную дополнительную информацию, и второй информации об энергии объекта, включенной во вторую объектно-базированную дополнительную информацию, которое генерирует третью объектно-базированную дополнительную информацию посредством комбинирования первой объектно-базированной дополнительной информации и второй объектно-базированной дополнительной информации, и генерирует третий сигнал понижающего смешивания посредством комбинирования первого сигнала понижающего смешивания и второго сигнала понижающего смешивания, причем третья объектно-базированная дополнительная информация включает в себя третью информацию об энергии объекта.

Согласно другому аспекту настоящего изобретения обеспечивается считываемая компьютером среда записи, имеющая записанную на ней компьютерную программу для исполнения способа декодирования аудио, причем способ декодирования аудио включает в себя прием первого и второго аудиосигналов, которые являются объектно-кодированными; генерирование третьей информации об энергии объекта на основе первой информации об энергии объекта, включенной в первый аудиосигнал, и второй информации об энергии объекта, включенной во второй аудиосигнал; и генерирование третьего аудиосигнала посредством комбинирования первого и второго сигналов объекта и третьей информации об энергии объекта.

Краткое описание чертежей

Фиг.1 иллюстрирует блок-схему типовой системы объектно-базированного кодирования/декодирования аудио;

фиг.2 иллюстрирует блок-схему устройства декодирования аудио согласно первому варианту осуществления настоящего изобретения;

фиг.3 иллюстрирует блок-схему устройства декодирования аудио согласно второму варианту осуществления настоящего изобретения;

фиг.4 иллюстрирует блок-схему устройства декодирования аудио согласно третьему варианту осуществления настоящего изобретения;

фиг.5 иллюстрирует блок-схему модуля произвольного коэффициента усиления понижающего смешивания (ADG), который может использоваться в устройстве декодирования аудио, изображенном на фиг.4;

фиг.6 иллюстрирует блок-схему устройства декодирования аудио согласно четвертому варианту осуществления настоящего изобретения;

фиг.7 иллюстрирует блок-схему устройства декодирования аудио согласно пятому варианту осуществления настоящего изобретения;

фиг.8 иллюстрирует блок-схему устройства декодирования аудио согласно шестому варианту осуществления настоящего изобретения;

фиг.9 иллюстрирует блок-схему устройства декодирования аудио согласно седьмому варианту осуществления настоящего изобретения;

фиг.10 иллюстрирует блок-схему устройства декодирования аудио согласно восьмому варианту осуществления настоящего изобретения;

фиг.11 и 12 иллюстрируют схемы для объяснения работы транскодера;

фиг.13-16 иллюстрируют схемы для объяснения конфигурации объектно-базированной дополнительной информации;

фиг.17-22 иллюстрируют схемы для объяснения объединения множества порций объектно-базированной дополнительной информации в одну порцию дополнительной информации;

фиг.23-27 иллюстрируют схемы для объяснения операции предварительной обработки; и

фиг.28-33 представляют собой схемы, иллюстрирующие случай комбинирования множества декодируемых битовых потоков с объектно-базированными сигналами в один битовый поток.

Лучший вариант осуществления изобретения

Настоящее изобретение ниже в данном документе подробно описывается с ссылкой на прилагаемые чертежи, на которых показаны примерные варианты осуществления изобретения.

Способ и устройство кодирования аудио и способ и устройство декодирования аудио согласно настоящему изобретению могут применяться к операциям объектно-базированной обработки аудио, но настоящее изобретение не ограничивается этим. Другими словами, способ и устройство кодирования аудио и способ и устройство декодирования аудио могут применяться в различных операциях по обработке сигналов, кроме операций объектно-базированной обработки аудио.

Фиг.1 иллюстрирует блок-схему типовой системы объектно-базированного кодирования/декодирования аудио. Как правило, аудиосигналы, вводимые в устройство объектно-базированного кодирования аудио, не соответствуют каналам многоканального сигнала, но являются независимыми сигналами объекта. В этом отношении устройство объектно-базированного кодирования аудио отличается от устройства многоканального кодирования аудио, в которое вводятся сигналы канала многоканального сигнала.

Например, сигналы канала, такие как сигнал переднего левого канала и сигнал переднего правого канала 5.1-канального сигнала, могут вводиться в многоканальный аудиосигнал, тогда как сигналы объекта, такие как голос человека или звук музыкального инструмента (например, звук скрипки или фортепьяно), которые представляют собой меньшие сущности, чем сигналы канала, могут вводиться в устройство объектно-базированного кодирования аудио.

Ссылаясь на фиг.1, система объектно-базированного кодирования/декодирования аудио включает в себя устройство объектно-базированного кодирования аудио и устройство объектно-базированного декодирования аудио. Устройство объектно-базированного кодирования аудио включает в себя кодер 100 объектов, и устройство объектно-базированного декодирования аудио включает в себя декодер 111 объектов и смеситель/рендерер 113.

Кодер 100 объектов принимает N сигналов объекта и генерирует объектно-базированный сигнал понижающего смешивания с одним или несколькими каналами и дополнительной информацией, включающей в себя некоторое количество порций информации, извлеченных из N сигналов объекта, такой как информация о разности энергий, информация о разности фаз и информация о корреляции. Дополнительная информация и объектно-базированный сигнал понижающего смешивания объединяются в единственный битовый поток, и битовый поток передается на устройство объектно-базированного декодирования.

Дополнительная информация может включать в себя флаг, указывающий, выполнять ли каналобазированное кодирование аудио или объектно-базированное кодирование аудио, и, таким образом, может определяться, выполнять ли каналобазированное кодирование аудио или объектно-базированное кодирование аудио, основываясь на флаге дополнительной информации. Дополнительная информация также может включать в себя информацию об энергии, информацию о группировании, информацию о периоде молчания, информацию о коэффициенте усиления понижающего смешивания и информацию о задержке, касающиеся сигналов объекта.

Дополнительная информация и объектно-базированный сигнал понижающего смешивания могут быть объединены в единственный битовый поток, и единственный битовый поток может передаваться на устройство объектно-базированного декодирования аудио.

Декодер 111 объектов принимает объектно-базированный сигнал понижающего смешивания и дополнительную информацию от устройства объектно-базированного кодирования аудио и восстанавливает сигналы объекта, имеющие свойства, подобные свойствам N сигналов объекта, основанные на объектно-базированном сигнале понижающего смешивания и дополнительной информации. Сигналам объекта, генерируемым декодером 111 объектов, не было еще распределено никакое положение в многоканальном пространстве. Таким образом, смеситель/рендерер 113 распределяет каждый сигнал объекта, генерируемый декодером 111 объектов, в предварительно определенное положение в многоканальном пространстве и определяет уровни сигналов объекта, так что сигналы объекта могут воспроизводиться из, соответственно, соответствующих положений, обозначаемых смесителем/рендерером 113, соответственно, с соответствующими уровнями, определенными смесителем/рендерером 113. Управляющая информация, касающаяся каждого сигнала объекта, генерируемого декодером 111 объектов, может изменяться во времени, и, таким образом, пространственные положения и уровни сигналов объекта, генерируемых декодером 111 объектов, могут изменяться в соответствии с управляющей информацией.

Фиг.2 иллюстрирует блок-схему устройства 120 декодирования аудио согласно первому варианту осуществления настоящего изобретения. Как показано на фиг.2, устройство 120 декодирования аудио может иметь возможность выполнения адаптивного декодирования посредством анализа управляющей информации.

Как показано на фиг.2, устройство 120 декодирования аудио включает в себя декодер 121 объектов, смеситель/рендерер 123 и преобразователь 125 параметров. Устройство 120 декодирования аудио также может включать в себя демультиплексор (не показан), который извлекает сигнал понижающего смешивания и дополнительную информацию из введенного в него битового потока, и он будет применяться ко всем устройствам декодирования аудио согласно другим вариантам осуществления настоящего изобретения.

Декодер 121 объектов генерирует некоторое количество сигналов объекта на основе сигнала понижающего смешивания и модифицированной дополнительной информации, предоставляемой преобразователем 125 параметров. Смеситель/рендерер 123 распределяет каждый сигнал объекта, генерируемый декодером 121 объектов, в предварительно определенное положение в многоканальном пространстве и определяет уровни сигналов объекта, генерируемых декодером 121 объектов в соответствии с управляющей информацией. Преобразователь 125 параметров генерирует модифицированную дополнительную информацию посредством комбинирования дополнительной информации и управляющей информации. Затем преобразователь 125 параметров передает модифицированную дополнительную информацию на декодер 121 объектов.

Декодер 121 объектов может иметь возможность выполнять адаптивное декодирование посредством анализа управляющей информации в модифицированной дополнительной информации.

Например, если управляющая информация указывает, что первый сигнал объекта и второй сигнал объекта распределяются в одно и то же положение в многоканальном пространстве и имеют одинаковый уровень, типовое устройство декодирования аудио может декодировать первый и второй сигналы объекта отдельно и затем размещать их в многоканальном пространстве при помощи операции смешивания/рендеринга.

С другой стороны, декодер 121 объектов устройства 120 декодирования аудио узнает из управляющей информации в модифицированной дополнительной информации, что первый и второй сигналы объекта распределяются в одно и то же положение в многоканальном пространстве и имеют одинаковый уровень, как если бы они были единственным источником звука. Следовательно, декодер 121 объектов декодирует первый и второй сигналы объекта, рассматривая их как единственный источник звука без декодирования их отдельно. В результате, уменьшается сложность декодирования. Кроме того, вследствие уменьшения числа источников звука, которые необходимо обрабатывать, также уменьшается сложность смешивания/рендеринга.

Устройство 120 декодирования аудио может эффективно использоваться, когда количество сигналов объекта больше, чем количество выходных каналов, так как существует большая вероятность, что множество сигналов объекта будет распределяться в одно и то же пространственное положение.

Альтернативно, устройство 120 декодирования аудио может использоваться, когда первый сигнал объекта и второй сигнал объекта распределяются в одно и то же положение в многоканальном пространстве, но имеют различные уровни. В данном случае, устройство 120 декодирования аудио декодирует первый и второй сигналы объекта, рассматривая первый и второй сигналы объекта как единственный сигнал, вместо декодирования первого и второго сигналов объекта отдельно и передачи декодированных первого и второго сигналов объекта на смеситель/рендерер 123. Более конкретно, декодер 121 объектов может получать информацию, касающуюся разности между уровнями первого и второго сигналов объекта из управляющей информации в модифицированной дополнительной информации и декодировать первый и второй сигналы объекта, основываясь на полученной информации. В результате, даже если первый и второй сигналы объекта имеют различные уровни, первый и второй сигналы объекта могут декодироваться, как если бы они были единственным источником звука.

Еще в качестве альтернативы декодер 121 объектов может регулировать уровни сигналов объекта, генерируемых декодером 121 объектов в соответствии с управляющей информацией. Затем декодер 121 объектов может декодировать сигналы объекта, уровни которых регулируются. Следовательно, смесителю/рендереру 123 нет необходимости регулировать уровни декодированных сигналов объекта, предоставленных декодером 121 объектов, но он просто расставляет декодированные сигналы объекта, представленные декодером 121 объектов, в многоканальном пространстве. Так как декодер 121 объектов регулирует уровни сигналов объекта, генерируемых декодером 121 объектов в соответствие с управляющей информацией, смеситель/рендерер 123 легко может расставить сигналы объекта, генерируемые декодером 121 объектов, в многоканальном пространстве без необходимости дополнительной регулировки уровней сигналов объекта, генерируемых декодером 121 объектов. Поэтому можно уменьшить сложность смешивания/рендеринга.

Согласно варианту осуществления по фиг.2 декодер объектов устройства 120 декодирования аудио может адаптивно выполнять операцию декодирования при помощи анализа управляющей информации, тем самым уменьшая сложность декодирования и сложность смешивания/рендеринга. Может использоваться комбинация вышеописанных способов, выполняемых устройством 120 декодирования аудио.

Фиг.3 иллюстрирует блок-схему устройства 130 декодирования аудио согласно второму варианту осуществления настоящего изобретения. Как показано на фиг.3, устройство 130 декодирования аудио включает в себя декодер 131 объектов и смеситель/рендерер 133. Устройство 130 декодирования аудио характеризуется предоставлением дополнительной информации не только декодеру 131 объектов, но также смесителю/рендереру 133.

Устройство 130 декодирования аудио может эффективно выполнять операцию декодирования даже тогда, когда имеется сигнал объекта, соответствующий периоду молчания. Например, второй-четвертый сигналы объекта могут соответствовать периоду проигрывания музыки, во время которого проигрывается музыкальный инструмент, и первый сигнал объекта может соответствовать периоду приглушения, во время которого проигрывается только фоновая музыка, и первый сигнал объекта может соответствовать периоду молчания, во время которого проигрывается аккомпанемент. В данном случае информация, указывающая, какой из множества сигналов объекта соответствует периоду молчания, может быть включена в дополнительную информацию, и дополнительная информация может подаваться на смеситель/рендерер 133, а также на декодер 131 объектов.

Декодер 131 объектов может минимизировать сложность декодирования посредством недекодирования сигнала объекта, соответствующего периоду молчания. Декодер 131 объектов устанавливает сигнал объекта, соответствующий значению 0, и передает уровень сигнала объекта на смеситель/рендерер 133. В основном, сигналы объекта, имеющие значение 0, рассматриваются также, как сигналы объекта, имеющие значение, отличное от 0, и, таким образом, подвергаются операции смешивания/рендеринга.

С другой стороны, устройство 130 декодирования аудио передает дополнительную информацию, включающую в себя информацию, указывающую, какой из множества сигналов объекта соответствует периоду молчания, на смеситель/рендерер 133 и может, таким образом, предотвращать то, что сигнал объекта, соответствующий периоду молчания, подвергается операции смешивания/рендеринга, выполняемой смесителем/рендерером 133. Поэтому устройство 130 декодирования аудио может предотвращать нежелательное повышение сложности смешивания/рендеринга.

Фиг.4 иллюстрирует блок-схему устройства 140 декодирования аудио согласно третьему варианту осуществления настоящего изобретения. Как показано на фиг.4, устройство 140 декодирования аудио использует многоканальный декодер 141 вместо декодера объектов и смесителя/рендерера и декодирует некоторое количество сигналов объекта, после того как сигналы объекта будут расставлены надлежащим образом в многоканальном пространстве.

Более конкретно, устройство 140 декодирования аудио включает в себя многоканальный декодер 141 и преобразователь 145 параметров. Многоканальный декодер 141 генерирует многоканальный сигнал, сигналы объекта которого уже были расставлены в многоканальном пространстве, на основе сигнала понижающего смешивания и информации о пространственных параметрах, которая представляет собой информацию о каналобазированных параметрах, представляемую преобразователем 145 параметров. Преобразователь 145 параметров анализирует дополнительную информацию и управляющую информацию, переданную устройством кодирования аудио (не показано), и генерирует информацию о пространственных параметрах на основе результата анализа. Более конкретно, преобразователь 145 параметров генерирует информацию о пространственных параметрах посредством комбинирования дополнительной информации и управляющей информации, которая включает в себя информацию об установке проигрывания и информацию о смешивании. Т.е. преобразователь 145 параметров выполняет преобразование комбинации дополнительной информации и управляющей информации в пространственные данные, соответствующие блоку один-в-два (OTT) или блоку два-в-три (TTT).

Устройство 140 декодирования аудио может выполнять операцию многоканального декодирования, в которую встроена операция объектно-базированного декодирования и операция смешивания/рендеринга, и может, таким образом пропускать декодирование каждого сигнала объекта. Поэтому можно снизить сложность декодирования и/или смешивания/рендеринга.

Например, когда имеется 10 сигналов объекта, и многоканальный сигнал, полученный на основе 10 сигналов объекта, должен воспроизводиться 5.1-канальной системой громкоговорителей, типовое устройство объектно-базированного декодирования аудио генерирует декодированные сигналы, соответствующие, соответственно, 10 сигналам объекта, на основе сигнала понижающего смешивания и дополнительной информации и затем генерирует 5.1-канальный сигнал посредством расстановки соответствующим образом 10 сигналов объекта в многоканальном пространстве, так что сигналы объекта могут становиться пригодными для 5.1-канального окружения громкоговорителей. Однако неэффективно генерировать 10 сигналов объекта во время генерирования 5.1-канального сигнала, и эта проблема становится более серьезной, когда увеличивается разность между количеством сигналов объекта и количеством каналов многоканального сигнала, подлежащего генерированию.

С другой стороны, в варианте осуществления по фиг.4 устройство 140 декодирования аудио генерирует информацию о пространственных параметрах, пригодную для 5.1-канального сигнала, на основе дополнительной информации и управляющей информации и подает информацию о пространственных параметрах и сигнал понижающего смешивания на многоканальный декодер 141. Затем многоканальный декодер 141 генерирует 5.1-канальный сигнал на основе информации о пространственных параметрах и сигнале понижающего смешивания. Другими словами, когда количество каналов, подлежащих выводу, равно 5.1 каналам, устройство 140 декодирования аудио легко может генерировать 5.1-канальный сигнал на основе сигнала понижающего смешивания без необходимости генерирования 10 сигналов объекта, и, таким образом, является более эффективным, чем обычное устройство декодирования аудио с точки зрения сложности.

Устройство 140 декодирования аудио считается эффективным, когда количество вычислений, необходимых для вычисления информации о пространственных параметрах, соответствующей каждому блоку ОТТ и блоку ТТТ, посредством анализа дополнительной информации и управляющей информации, переданной устройством кодирования аудио, меньше количества вычислений, необходимых для выполнения операции смешивания/рендеринга после декодирования каждого сигнала объекта.

Устройство 140 декодирования аудио может быть получено просто добавлением модуля для генерирования информации о пространственных параметрах посредством анализа дополнительной информации и управляющей информации к типовому устройству многоканального декодирования аудио и, таким образом, может сохранять совместимость с типовым устройством многоканального декодирования аудио. Также устройство 140 декодирования аудио может улучшать качество звука, используя существующие инструментальные средства типового устройства многоканального декодирования аудио, такие как формирователь огибающей, инструментальное средство субполосной временной обработки (STP) и декоррелятор. При наличии всего этого делается вывод, что все преимущества типового способа многоканального декодирования аудио легко могут быть применены к способу декодирования объектного аудио.

Информация о пространственных параметрах, переданная на многоканальный декодер 141 преобразователем 145 параметров, может быть сжата, чтобы она была подходящей для передачи. Альтернативно, информация о пространственных параметрах может иметь такой же формат, что и формат данных, передаваемых типовым устройством многоканального кодирования. Т.е. информация о пространственных параметрах возможно подвергалась операции декодирования методом Хаффмана или операции декодирования по пилот-сигналу и, таким образом, может передаваться на каждый модуль в качестве несжатых данных пространственных меток. Первый подходит для передачи информации о пространственных параметрах на устройство многоканального декодирования аудио в удаленном месте, и второе является удобным, так как нет необходимости в устройстве многоканального декодирования аудио для преобразования сжатых данных пространственных меток в несжатые данные пространственных меток, которые легко могут использоваться в операции декодирования.

Конфигурирование информации о пространственных параметрах на основе анализа дополнительной информации и управляющей информации может вызвать задержку. Чтобы компенсировать такую задержку, может быть предусмотрен дополнительный буфер для сигнала понижающего смешивания, так что может компенсироваться задержка между сигналом понижающего смешивания и битовым потоком. Альтернативно, дополнительный буфер может быть предусмотрен для информации о пространственных параметрах, полученной из управляющей информации, так что может компенсироваться задержка между информацией о пространственных параметрах и битовым потоком. Эти способы, однако, являются неудобными из-за необходимости обеспечения дополнительного буфера. Альтернативно, дополнительная информация может передаваться перед сигналом понижающего смешивания, учитывая возможность появления задержки между сигналом понижающего смешивания и информацией о пространственных параметрах. В этом случае нет необходимости регулировать информацию о пространственных параметрах, полученную посредством комбинирования дополнительной информации и управляющей информации, но она легко может использоваться.

Если множество сигналов объекта сигнала понижающего смешивания имеют различные уровни, модуль произвольного коэффициента усиления понижающего смешивания (ADG), который может непосредственно компенсировать сигнал понижающего смешивания, может определять относительные уровни сигналов объекта, и каждый из сигналов объекта может расставляться в предварительно определенное положение в многоканальном пространстве, используя данные пространственных меток, такие как информация о разности уровней каналов (CLD), информация о межканальной корреляции (ICC) и информация о коэффициенте предсказания канала (CPC).

Например, если управляющая информация указывает, что предварительно определенный сигнал объекта должен быть распределен в предварительно определенное положение в многоканальном пространстве и имеет более высокий уровень, чем другие сигналы объекта, типовой многоканальный декодер может вычислить разность между энергиями каналов сигнала понижающего смешивания и разделить сигнал понижающего смешивания на некоторое количество выходных каналов, основываясь на результатах вычисления. Однако типовой многоканальный декодер не может увеличить или уменьшить громкость некоторого звука в сигнале понижающего смешивания. Другими словами, типовой многоканальный декодер просто распределяет сигнал понижающего смешивания по некоторому количеству выходных каналов и, таким образом, не может увеличить или уменьшить громкость звука в сигнале понижающего смешивания.

Относительно легко распределить каждый из некоторого количества сигналов объекта сигнала понижающего смешивания, генерируемого кодером объектов, в предварительно определенное положение в многоканальном пространстве в соответствии с управляющей информацией. Однако необходимы специальные методы для увеличения или уменьшения амплитуды предварительно определенного сигнала объекта. Другими словами, если сигнал понижающего смешивания, генерируемый кодером объектов, используется как есть, то трудно уменьшить амплитуду каждого сигнала объекта сигнала понижающего смешивания.

Поэтому согласно варианту осуществления настоящего изобретения относительные амплитуды сигналов объекта могут изменяться в соответствии с управляющей информацией посредством использования модуля 147 ADG, изображенного на фиг.5. Модуль 147 ADG может быть установлен в многоканальном декодере 141 или может быть отдельным от многоканального декодера 141.

Если относительные амплитуды сигналов объекта сигнала понижающего смешивания регулируются соответствующим образом с использованием модуля 147 ADG, то можно выполнять декодирование объекта, используя типовой многоканальный декодер. Если сигнал понижающего смешивания, генерируемый кодером объекта, является монофоническим или стереофоническим сигналом или многоканальным сигналом с тремя или более каналами, сигнал понижающего смешивания может обрабатываться модулем 147 ADG. Если сигнал понижающего смешивания, генерируемый кодером объекта, имеет два или более каналов, и предварительно определенный сигнал объекта, который требует регулировки модулем 147 ADG, существует только в одном из каналов сигнала понижающего смешивания, модуль 147 ADG может применяться только к каналу, включающему в себя предварительно определенный сигнал объекта, вместо применения ко всем каналам сигнала понижающего смешивания. Сигнал понижающего смешивания, обработанный модулем 147 ADG вышеописанным образом, легко может обрабатываться с использованием типового многоканального декодера без необходимости модифицирования конструкции многоканального декодера.

Даже если окончательный выходной сигнал не является многоканальным сигналом, который может воспроизводиться многоканальным громкоговорителем, но является бинауральным сигналом, модуль 147 ADG может использоваться для регулировки относительных амплитуд сигналов объекта окончательного выходного сигнала.

Альтернативно использованию модуля 147 ADG информация о коэффициенте усиления, задающая значение коэффициента усиления, подлежащего применению для каждого сигнала объекта, может включаться в управляющую информацию во время генерирования некоторого количества сигналов объекта. Для этого может модифицироваться конструкция типового многоканального декодера, даже если, требуя модифицирование конструкции существующего многоканального декодера, этот способ является удобным в смысле снижения сложности декодирования посредством применения значения коэффициента усиления к каждому сигналу объекта во время операции декодирования без необходимости вычисления ADG и компенсирования каждого сигнала объекта.

Модуль 147 ADG может использоваться не только для регулировки уровней сигналов объекта, но также для модифицирования спектральной информации некоторого сигнала объекта. Более конкретно, модуль 147 ADG может использоваться не только для увеличения или уменьшения уровня некоторого сигнала объекта, но также для модифицирования спектральной информации некоторого сигнала объекта, например усиления части с высоким или низким тоном некоторого сигнала объекта. Нельзя модифицировать спектральную информацию без использования модуля 147 ADG.

Фиг.6 иллюстрирует блок-схему устройства 150 декодирования аудио согласно четвертому варианту осуществления настоящего изобретения. Как показано на фиг.6, устройство 150 декодирования аудио включает в себя многоканальный бинауральный декодер 151, первый преобразователь 157 параметров и второй преобразователь 159 параметров.

Второй преобразователь 159 параметров анализирует дополнительную информацию и управляющую информацию, которая предоставляется устройством кодирования аудио, и конфигурирует информацию о пространственных параметрах на основе результата анализа. Первый преобразователь 157 параметров конфигурирует информацию о виртуальных трехмерных (3D) параметрах, которая может использоваться многоканальным бинауральным декодером 151, посредством добавления трехмерной (3D) информации, такой как параметры функции моделирования восприятия звука (HRTF), к информации о пространственных параметрах. Многоканальный бинауральный декодер 151 генерирует бинауральный сигнал посредством применения информации о бинауральных параметрах к сигналу понижающего смешивания.

Первый преобразователь 157 параметров и второй преобразователь 159 параметров могут быть заменены одним модулем, т.е. модулем 155 преобразования параметров, который принимает дополнительную информацию, управляющую информацию и трехмерную информацию и конфигурирует информацию о бинауральных параметрах на основе дополнительной информации, управляющей информации и параметрах HRTF.

Обычно, чтобы генерировать бинауральный сигнал для проигрывания сигнала понижающего смешивания, включающего в себя 10 сигналов объекта, при помощи головного телефона, сигнал объекта должен генерировать 10 декодированных сигналов, соответствующих, соответственно, 10 сигналам объекта, на основе сигнала понижающего смешивания и дополнительной информации. После этого смеситель/рендерер распределяет каждый из 10 сигналов объекта в предварительно определенное положение в многоканальном пространстве с ссылкой на управляющую информацию, чтобы удовлетворять требованиям окружения 5-канального громкоговорителя. После этого смеситель/рендерер генерирует 5-канальный сигнал, который может воспроизводиться 5-канальным громкоговорителем. После этого смеситель/рендерер применяет трехмерную информацию к 5-канальному сигналу, таким образом генерируя 2-канальный сигнал. Вышеупомянутый обычный способ декодирования аудио включает в себя воспроизведение 10 сигналов объекта, преобразование 10 сигналов объекта в 5-канальный сигнал и генерирование 2-канального сигнала на основе 5-канального сигнала и, таким образом, является неэффективным.

С другой стороны, устройство 150 декодирования аудио может легко генерировать бинауральный сигнал, который может воспроизводиться с использованием головных телефонов, основываясь на сигналах объекта. Кроме того, устройство 150 декодирования аудио конфигурирует информацию о пространственных параметрах посредством анализа дополнительной информации и управляющей информации и может, таким образом, генерировать бинауральный сигнал, используя типовой многоканальный бинауральный декодер. Кроме того, устройство 150 декодирования аудио все же может использовать типовой многоканальный бинауральный декодер даже тогда, когда он оснащен встроенным преобразователем параметров, который принимает дополнительную информацию, управляющую информацию и параметры HRTF и конфигурирует информацию о бинауральных параметрах на основе дополнительной информации, управляющей информации и параметрах HRTF.

Фиг.7 иллюстрирует блок-схему устройства 160 декодирования аудио согласно пятому варианту осуществления настоящего изобретения. Как показано на фиг.7, устройство 160 декодирования аудио включает в себя препроцессор 161, многоканальный декодер 163 и преобразователь 165 параметров.

Преобразователь 165 параметров генерирует информацию о пространственных параметрах, которая может использоваться многоканальным декодером 163, и информацию о параметрах, которая может использоваться препроцессоро

Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов

Патент 2394283