2635244 - Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов

Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов

Иллюстрации

Показать все

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в повышении качества воспроизведения целевых аудиосцен. Технический результат достигается за счет устройства, которое содержит блок понижающего микширования для понижающего микширования одного или более аудиообъектов для получения одного или более необработанных микшированных с понижением сигналов, модуль обработки для обработки одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов, блок вычисления сигналов для вычисления одного или более дополнительных сигналов, причем блок вычисления сигналов выполнен с возможностью вычислять каждый из одного или более дополнительных сигналов на основе различия между одним из одного или более обработанных микшированных с понижением сигналов и одним из одного или более необработанных микшированных с понижением сигналов, генератор информации объектов для формирования параметрической информации аудиообъектов для одного или более аудиообъектов и дополнительной параметрической информации для дополнительного сигнала. 7 н. и 9 з.п. ф-лы, 11 ил.

Реферат

Настоящее изобретение относится к обработке аудиосигнала и, в частности, к декодеру, кодеру, системе, способам и компьютерной программе для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов.

Обработка аудиосигналов становится все более важной. Недавно были предложены параметрические методики для передачи и/или сохранения с эффективной битовой скоростью аудиосцен, содержащих множественные аудиообъекты, в области аудиокодирования (BCC, АО, SAOC, SAOC1, SAOC2) и, кроме того, в области разделения источника информации (ISS1, ISS2, ISS3, ISS4, ISS5, ISS6). Эти методики стремятся воссоздавать желаемую выходную аудиосцену или желаемый объект аудиоисточника на основе дополнительной вспомогательной информации, описывающей переданную и/или сохраненную аудиосцену и/или объекты аудиоисточников в аудиосцене.

Фиг. 11 изображает систему в соответствии с существующим уровнем техники, иллюстрирующую пример MPEG SAOC (MPEG = экспертная группа в области движущихся изображений; SAOC = пространственное кодирование аудиообъектов). В частности, фиг. 11 иллюстрирует обзор системы MPEG SAOC.

В соответствии с существующим уровнем техники общая обработка часто выполняется частотно-избирательным образом и, например, может быть описана следующим образом в пределах каждой полосы частот.

N входных сигналов аудиообъектов s₁,..., s_N микшируются c понижением в P каналов x₁,..., x_P как часть обработки микшера 912 кодера 910 SAOC существующего уровня техники. Может использоваться матрица понижающего микширования, содержащая элементы d_1,1,..., d_N,P. Кроме того, блок 914 оценки вспомогательной информации кодера 910 SAOC извлекает вспомогательную информацию, описывающую характеристики входных аудиообъектов. Для MPEG SAOC отношения мощностей объектов относительно друг друга являются базовой формой такой вспомогательной информации.

Затем микшированный с понижением сигнал (сигналы) и вспомогательная информация могут быть переданы и/или сохранены. С этой целью микшированный с понижением аудиосигнал может быть закодирован, например, сжат, посредством перцепционного аудиокодера 920 существующего уровня техники, такого как аудиокодер MPEG-1 уровня II или III (также известный как mp3) или аудиокодер усовершенствованного аудиокодирования (AAC) MPEG, и т. д.

На принимающей стороне закодированные сигналы сначала могут быть декодированы, например, посредством перцепционного аудиодекодера 940, такого как аудиодекодер MPEG-1 уровня II или III, аудиодекодер усовершенствованного аудиокодирования (AAC) MPEG.

Затем декодер 950 SAOC существующего уровня техники концептуально пытается восстановить сигналы исходного объекта, например, проводя "разделение объектов" из (декодированных) микшированных с понижением сигналов с использованием переданной вспомогательной информации, которая, например, могла быть сформирована блоком 914 оценки вспомогательной информации кодера 910 SAOC, как объяснено выше. В целях восстановления сигналов первоначальных объектов посредством проведения разделения объектов декодер 950 SAOC содержит разделитель 952 объектов, например, разделитель виртуальных объектов.

Затем разделитель 952 объектов может обеспечить приближенные сигналы объектов блоку 954 воспроизведения декодера 950 SAOC, причем блок 954 воспроизведения затем микширует приближенные сигналы объектов в целевую сцену, представленную M выходными аудиоканалами , например, с использованием матрицы воспроизведения. Коэффициенты r_1,1, …, r_N,M на фиг. 11, например, могут указывать некоторые коэффициенты матрицы воспроизведения. Желаемая целевая сцена в конкретном случае может представлять собой воспроизведение только одного сигнала источника из микшированного сигнала (сценарий разделения источников), но также может являться любой другой произвольной акустической сценой.

Однако обработка в соответствии с существующим уровнем техники имеет несколько недостатков.

Системы существующего уровня техники ограничены обработкой только сигналов аудиоисточников. Обработка сигналов в кодере и декодере выполняется в предположении, что никакая дополнительная обработка сигналов не применяется к микшированным сигналам или к сигналам объекта первоначального источника. Рабочие характеристики таких систем ухудшаются, если это предположение больше не поддерживается.

Заметным примером, который нарушает это предположение, является использование аудиокодера в цепи обработки для уменьшения объема данных, которые будут сохранены и/или переданы, для эффективного переноса микшированных с понижением сигналов. Сжатие сигнала перцепционно изменяет микшированные с понижением сигналы. Это имеет эффект, в котором рабочие характеристики разделителя объектов в системе декодирования ухудшаются, и, таким образом, воспринимаемое качество воспроизведенных целевых сцен также ухудшается (ISS5, ISS6).

Задача настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для аудиокодирования и аудиодекодирования. Задача настоящего изобретения решена посредством устройства по пункту 1, устройства по пункту 8, системы по пункту 12, способа по пункту 13, способа по пункту 14, компьютерно-читаемый носитель по пункту 15 и компьютерно-читаемый носитель по пункту 16 формулы изобретения.

Обеспечено устройство для кодирования одного или более аудиообъектов для получения закодированного сигнала. Устройство содержит блок понижающего микширования для понижающего микширования одного или более аудиообъектов для получения одного или более необработанных микшированных с понижением сигналов. Кроме того, устройство содержит модуль обработки для обработки одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов. Кроме того, устройство содержит блок вычисления сигналов для вычисления одного или более дополнительных сигналов, причем блок вычисления сигналов выполнен с возможностью вычислять каждый из одного или более дополнительных сигналов на основе различия между одним из одного или более обработанных микшированных с понижением сигналов и одним из одного или более необработанных микшированных с понижением сигналов. Кроме того, устройство содержит генератор информации объектов для генерации параметрической информации аудиообъектов для одного или более аудиообъектов и дополнительной параметрической информации для дополнительного сигнала. Кроме того, устройство содержит интерфейс вывода для вывода закодированного сигнала, закодированный сигнал содержит параметрическую информацию аудиообъектов для одного или более аудиообъектов и дополнительную параметрическую информацию для одного или более дополнительных сигналов.

В соответствии с вариантом осуществления модуль обработки может быть выполнен с возможностью обрабатывать один или более необработанных микшированных с понижением сигналов посредством кодирования одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов.

В варианте осуществления блок вычисления сигналов может содержать модуль декодирования и блок объединения. Модуль декодирования может быть выполнен с возможностью декодировать один или более обработанных микшированных с понижением сигналов для получения одного или более декодированных сигналов. Кроме того, блок объединения может быть выполнен с возможностью формировать каждый из одного или более дополнительных сигналов посредством формирования разностного сигнала между одним из одного или более декодированных сигналов и одним из одного или более необработанных микшированных с понижением сигналов.

В соответствии с вариантом осуществления каждый из одного или более необработанных микшированных с понижением сигналов может содержать множество первых сигнальных отсчетов, каждый из первых сигнальных отсчетов присвоен одному из множества моментов времени. Каждый из одного или более декодированных сигналов может содержать множество вторых сигнальных отсчетов, каждый из вторых сигнальных отсчетов присвоен одному из множества моментов времени. Блок вычисления сигналов, кроме того, может содержать блок выравнивания по времени, выполненный с возможностью выравнивать по времени один из одного или более декодированных сигналов и один из одного или более необработанных микшированных с понижением сигналов таким образом, что один из первых сигнальных отсчетов упомянутого необработанного микшированного с понижением сигнала присвоен одному из вторых сигнальных отсчетов упомянутого декодированного сигнала, упомянутый первый сигнальный отсчет упомянутого необработанного микшированного с понижением сигнала и упомянутый второй сигнальный отсчет упомянутого декодированного сигнала присвоены одному и тому же моменту времени из множества моментов времени.

В варианте осуществления модуль обработки может быть выполнен с возможностью обрабатывать один или более необработанных микшированных с понижением сигналов посредством применения аудиоэффекта по меньшей мере к одному из одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов.

В соответствии с вариантом осуществления значение энергии аудиообъекта может быть присвоено каждому одному из одного или более аудиообъектов, и дополнительное значение энергии может быть присвоено каждому одному из одного или более дополнительных сигналов. Генератор информации объектов может быть выполнен с возможностью определять опорное значение энергии таким образом, что опорное значение энергии больше или равно значению энергии аудиообъекта каждого из одного или более аудиообъектов, и таким образом, что опорное значение энергии больше или равно дополнительному значению энергии каждого из одного или более дополнительных сигналов. Кроме того, генератор информации объектов может быть выполнен с возможностью определять параметрическую информацию аудиообъектов посредством определения различия уровней аудиообъектов для каждого аудиообъекта из одного или более аудиообъектов таким образом, что упомянутое различие уровней аудиообъектов указывает отношение значения энергии аудиообъекта упомянутого аудиообъекта к опорному значению энергии, или таким образом, что упомянутое различие уровней аудиообъектов указывает разность между опорным значением энергии и значением энергии аудиообъекта упомянутого аудиообъекта. Кроме того, генератор информации объектов может быть выполнен с возможностью определять дополнительную информацию объекта посредством определения дополнительного различия уровней объектов для каждого дополнительного сигнала из одного или более дополнительных сигналов таким образом, что упомянутое дополнительное различие уровней объектов указывает отношение дополнительного значения энергии упомянутого дополнительного сигнала к опорному значению энергии, или таким образом, чтоб упомянутое дополнительное различие уровней объектов указывает разность между опорным значением энергии и дополнительным значением энергии упомянутого дополнительного сигнала.

В варианте осуществления модуль обработки может содержать модуль акустического эффекта и модуль кодирования. Модуль акустического эффекта может быть выполнен с возможностью применять акустический эффект по меньшей мере к одному из одного или более необработанных микшированных с понижением сигналов для получения одного или более акустически скорректированных микшированных с понижением сигналов. Кроме того, модуль кодирования может быть выполнен с возможностью кодировать один или более акустически скорректированных микшированных с понижением сигналов для получения одного или более обработанных сигналов.

Кроме того, обеспечено устройство для декодирования закодированного сигнала, в котором закодированный сигнал содержит параметрическую информацию аудиообъектов для одного или более аудиообъектов и дополнительную параметрическую информацию. Устройство содержит интерфейс для приема одного или более обработанных микшированных с понижением сигналов и для приема закодированного сигнала, причем дополнительная параметрическая информация отражает обработку, выполненную над одним или более необработанными микшированными с понижением сигналами, для получения одного или более обработанных микшированных с понижением сигналов. Кроме того, устройство содержит генератор аудиосцены для формирования аудиосцены, содержащей множество пространственных аудиосигналов, на основе одного или более обработанных микшированных с понижением сигналов, параметрической информации аудиообъектов, дополнительной параметрической информации и информации воспроизведения, указывающей размещение одного или более аудиообъектов в аудиосцене, причем генератор аудиосцены выполнен с возможностью ослаблять или устранять выходной сигнал, представленный дополнительной параметрической информацией, в аудиосцене.

В соответствии с вариантом осуществления дополнительная параметрическая информация может зависеть от одного или более дополнительных сигналов, причем дополнительные сигналы указывают различие между одним из одного или более обработанных микшированных с понижением сигналов и одним из одного или более необработанных микшированных с понижением сигналов, причем один или более необработанных микшированных с понижением сигналов указывает понижающее микширование одного или более аудиообъектов, и причем один или более обработанных микшированных с понижением сигналов получаются в результате обработки одного или более необработанных микшированных с понижением сигналов.

В варианте осуществления генератор аудиосцены может содержать генератор аудиообъектов и блок воспроизведения. Генератор аудиообъектов может быть выполнен с возможностью формировать один или более аудиообъектов на основе одного или более обработанных микшированных с понижением сигналов, параметрической информации аудиообъектов и дополнительной параметрической информации. Блок воспроизведения может быть выполнен с возможностью формировать множество пространственных аудиосигналов аудиосцены на основе одного или более аудиообъектов, параметрической информации аудиообъектов и информации воспроизведения.

В соответствии с вариантом осуществления блок воспроизведения может быть выполнен с возможностью формировать множество пространственных аудиосигналов аудиосцены на основе одного или более аудиообъектов, дополнительной параметрической информации и информации воспроизведения, причем блок воспроизведения может быть выполнен с возможностью ослаблять или устранять выходной сигнал, представленный дополнительной параметрической информацией в аудиосцене, в зависимости от одного или более коэффициентов воспроизведения, содержащихся в информации воспроизведения.

В варианте осуществления устройство может дополнительно содержать пользовательский интерфейс для установки одного или более коэффициентов воспроизведения для регулирования, является ли выходной сигнал, представленный дополнительной параметрической информацией, ослабленным или устраненным в аудиосцене.

В соответствии с вариантом осуществления генератор аудиосцены может быть выполнен с возможностью формировать аудиосцену, содержащую множество пространственных аудиосигналов, на основе одного или более обработанных микшированных с понижением сигналов, параметрической информации аудиообъектов, дополнительной параметрической информации и информации воспроизведения, указывающей размещение одного или более аудиообъектов в аудиосцене, причем генератор аудиосцены может быть выполнен с возможностью не формировать один или более аудиообъектов для формирования аудиосцены.

В варианте осуществления устройство, кроме того, может содержать аудиодекодер для декодирования одного или более обработанных микшированных с понижением сигналов для получения одного или более декодированных сигналов, причем генератор аудиосцены может быть выполнен с возможностью формировать аудиосцену, содержащую множество пространственных аудиосигналов, на основе одного или более декодированных сигналов, параметрической информации аудиообъектов, дополнительной параметрической информации и информации воспроизведения.

В другом варианте осуществления генератор аудиосцены может быть выполнен с возможностью формировать аудиосцену с используем формул

, и

где - первая матрица, указывающая аудиосцену, причем содержит множество строк, указывающих множество пространственных аудиосигналов, где R' - вторая матрица, указывающая информацию воспроизведения, где - третья матрица, где X' - четвертая матрица, указывающая один или более обработанных микшированных с понижением сигналов, где G' - пятая матрица, где D' - шестая матрицей, являющаяся матрицей понижающего микширования, и где E' - седьмая матрица, содержащая множество коэффициентов седьмой матрицы, причем коэффициенты седьмой матрицы определены формулой:

где E'_i,j - один из коэффициентов седьмой матрицы в строке i и в столбце j, i - индекс строки, и j - индекс столбца, где IOC'_i,j указывает значение взаимной корреляции, и где OLD'_i указывает первое относящееся к энергии значение, и OLD'_j указывает второе относящееся к энергии значение

Кроме того, обеспечена система. Система содержит устройство для кодирования в соответствии с одним из описанных выше вариантов осуществления и устройство для декодирования в соответствии с одним из описанных выше вариантов осуществления. Устройство для кодирования выполнено с возможностью обеспечивать один или более обработанных микшированных с понижением сигналов и закодированный сигнал устройству для декодирования, закодированный сигнал содержит параметрическую информацию аудиообъектов для одного или более аудиообъектов и дополнительную параметрическую информацию для одного или более дополнительных сигналов. Устройство для декодирования выполнено с возможностью формировать аудиосцену, содержащую множество пространственных аудиосигналов, на основе параметрической информации аудиообъектов, дополнительной параметрической информации и информации воспроизведения, указывающей размещение одного или более аудиообъектов в аудиосцене.

Кроме того, обеспечен способ кодирования одного или более аудиообъектов для получения закодированного сигнала. Способ содержит:

- понижающее микширование одного или более аудиообъектов для получения одного или более необработанных микшированных с понижением сигналов.

- Обработку одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов.

- Вычисление одного или более дополнительных сигналов посредством вычисления каждого из одного или более дополнительных сигналов на основе различия между одним из одного или более обработанных микшированных с понижением сигналов и одним из одного или более необработанных микшированных с понижением сигналов.

- Формирование параметрической информации аудиообъектов для одного или более аудиообъектов и дополнительной параметрической информации для одного или более дополнительных сигналов. И:

- Вывод закодированного сигнала, закодированный сигнал содержит параметрическую информацию аудиообъектов для одного или более аудиообъектов и дополнительную параметрическую информацию для одного или более дополнительных сигналов.

Кроме того, обеспечен способ декодирования закодированного сигнала, закодированный сигнал содержит параметрическую информацию аудиообъектов об одном или более аудиообъектах и дополнительную параметрическую информацию. Способ содержит:

- прием одного или более обработанных микшированных с понижением сигналов для получения закодированного сигнала, причем дополнительная параметрическая информация отражает обработку, выполненную над одним или более необработанными микшированными с понижением сигналами, для получения одного или более обработанных микшированных с понижением сигналов.

- Формирование аудиосцены, содержащей множество пространственных аудиосигналов, на основе одного или более обработанных микшированных с понижением сигналов, параметрической информации аудиообъектов, дополнительной параметрической информации и информации воспроизведения, указывающей размещение одного или более аудиообъектов в аудиосцене. И:

- ослабление или устранение выходного сигнала, представленного дополнительной параметрической информацией в аудиосцене.

Кроме того, обеспечена компьютерная программа для реализации одного из описанных выше способов, когда она исполняется на процессоре компьютера или процессоре сигналов.

В соответствии с вариантами осуществления понятие параметрического кодирования объектов улучшено/расширено посредством обеспечения изменений/манипуляций исходного объекта или микшированных сигналов в качестве дополнительных скрытых объектов. Включение этих скрытых объектов в процесс оценки вспомогательной информации и в разделение (виртуальных) объектов приводит к улучшенному воспринимаемому качеству воспроизведенной акустической сцены. Скрытые объекты, например, могут описывать искусственно сформированные сигналы, такие как сигнал ошибки кодирования от перцепционного аудиокодера, которые применяются к микшированным с понижением сигналам, но также могут, например, являться описанием другой нелинейной обработки, которая применена к микшированным с понижением сигналам, например, реверберации.

Вследствие характера этих скрытых объектов они изначально не предназначены для воспроизведения на стороне декодирования, а используются для улучшения процесса разделения (виртуальных) объектов и, таким образом, для улучшения воспринимаемого качества воспроизведенной акустической сцены. Это достигается посредством воспроизведения скрытого объекта (объектов) с нулевым уровнем воспроизведения ("тишина"). Таким образом, процессом воспроизведения в декодере автоматически управляют таким образом, что он имеет тенденцию подавлять нежелательные компоненты, представленные скрытым объектом (объектами), и, таким образом, улучшать субъективное качество воспроизведенной сцены/сигнала.

В соответствии с вариантом осуществления модуль кодирования может являться перцепционным аудиокодером.

Обеспеченные концепции среди прочего являются выгодными, поскольку они могут обеспечить улучшение качества аудио посредством включения информации скрытого объекта полностью совместимым с декодером образом. Это означает, что описанные улучшения качества выходного сигнала могут быть получены без какой-либо необходимости изменяться существующие/развернутые декодеры (например, SAOC), которые были стандартизированы посредством ISO/MPEG и не могут быть изменены без нарушения соответствия стандартной спецификации SAOC (или перевыпуска стандарта, что являлось бы отнимающим много времени и дорогостоящим процессом).

Далее будет делаться ссылка на "скрытые объекты". Следует отметить, что в некоторых вариантах осуществления дополнительная параметрическая информация, например, может представлять один или более скрытых объектов.

Далее варианты осуществления настоящего изобретения описаны более подробно со ссылкой на следующие фигуры.

Фиг. 1 иллюстрирует устройство для кодирования одного или более аудиообъектов для получения закодированного сигнала в соответствии с вариантом осуществления.

Фиг. 2 иллюстрирует устройство для кодирования одного или более аудиообъектов для получения закодированного сигнала в соответствии с другим вариантом осуществления.

Фиг. 3 иллюстрирует устройство для кодирования одного или более аудиообъектов для получения закодированного сигнала в соответствии с дополнительным вариантом осуществления.

Фиг. 4 иллюстрирует устройство для кодирования одного или более аудиообъектов для получения закодированного сигнала в соответствии с другим вариантом осуществления.

Фиг. 5 иллюстрирует модуль 120 обработки устройства для кодирования в соответствии с вариантом осуществления.

Фиг. 6 иллюстрирует устройство для декодирования закодированного сигнала в соответствии с вариантом осуществления.

Фиг. 7 иллюстрирует устройство для декодирования закодированного сигнала в соответствии с другим вариантом осуществления.

Фиг. 8 иллюстрирует устройство для декодирования закодированного сигнала в соответствии с о дополнительным вариантом осуществления.

Фиг. 9 иллюстрирует устройство для декодирования закодированного сигнала в соответствии с другим вариантом осуществления.

Фиг. 10 иллюстрирует систему в соответствии с вариантом осуществления.

Фиг. 11 иллюстрирует систему в соответствии с существующим уровнем техники, иллюстрирующую пример MPEG SAOC.

Устройство содержит блок 110 понижающего микширования для понижающего микширования одного или более аудиообъектов для получения одного или более необработанных микшированных с понижением сигналов. С этой целью блок понижающего микширования на фиг. 1 принимает один или более аудиообъектов и подвергает их понижающему микшированию, например, применяя матрицу понижающего микширования, для получения одного или более необработанных микшированных с понижением сигналов.

Кроме того, устройство содержит модуль 120 обработки для обработки одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов. Модуль 120 обработки принимает один или более необработанных микшированных с понижением сигналов от блока понижающего микширования и обрабатывает их для получения одного или более обработанных сигналов.

Например, модуль 120 обработки может являться модулем кодирования, например, перцепционным кодером, и он может быть выполнен с возможностью обрабатывать один или более необработанных микшированных с понижением сигналов посредством кодирования одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов. Модуль 120 обработки, например, может являться перцепционным аудиокодером, например, аудиокодером MPEG-1 уровня II или III (также известным как mp3) или усовершенствованным аудиокодером (AAC) MPEG и т. д.

Или, например, модуль 120 обработки может являться модулем аудиоэффекта и может быть выполнен с возможностью обрабатывать один или более необработанных микшированных с понижением сигналов посредством применения аудиоэффекта по меньшей мере к одному из одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов.

Кроме того, устройство содержит блок 130 вычисления сигналов для вычисления одного или более дополнительных сигналов. Блок 130 вычисления сигналов выполнен с возможностью вычислять каждый из одного или более дополнительных сигналов на основе разности между одним из одного или более обработанных микшированных с понижением сигналов и одним из одного или более необработанных микшированных с понижением сигналов.

Блок 130 вычисления сигналов, например, может вычислять разностный сигнал между одним из одного или более обработанных микшированных с понижением сигналов и одним из одного или более необработанных микшированных с понижением сигналов для формирования одного из одного или более дополнительных сигналов.

Однако в других вариантах осуществления вместо определения разностного сигнала блок 130 вычисления сигналов может определять любой другой вид различия между упомянутым одним из одного или более обработанными микшированными с понижением сигналами и упомянутым одним из одного или более необработанными микшированными с понижением сигналами для формирования одного из одного или более дополнительных сигналов. Тогда блок 130 вычисления сигналов может вычислить дополнительный сигнал на основе определенного различия между двумя сигналами.

Кроме того, устройство содержит генератор 140 информации объектов для формирования параметрической информации аудиообъектов для одного или более аудиообъектов и дополнительной параметрической информации для дополнительного сигнала.

Например, для определения параметрической информации аудиообъектов и дополнительной параметрической информации могут быть определены различия уровней объектов. Например, значение энергии аудиообъекта может быть присвоено каждому одному из одного или более аудиообъектов, и дополнительное значение энергии может быть присвоено каждому одному из одного или более дополнительных сигналов.

Генератор 140 информации объектов может быть выполнен с возможностью определять опорное значение энергии таким образом, что опорное значение энергии больше или равно значению энергии аудиообъекта каждого из одного или более аудиообъектов, и что опорное значение энергии больше или равно дополнительному значению энергии каждого из одного или более дополнительных сигналов.

Кроме того, генератор 140 информации объектов может быть выполнен с возможностью определять параметрическую информацию аудиообъектов посредством определения различия уровней аудиообъектов для каждого аудиообъекта из одного или более аудиообъектов таким образом, что упомянутое различие уровней аудиообъектов указывает отношение значения энергии аудиообъекта упомянутого аудиообъекта к опорному значению энергии, или таким образом, что упомянутое различие уровней аудиообъектов указывает разность между опорным значением энергии и значением энергии аудиообъекта упомянутого аудиообъекта.

Кроме того, генератор 140 информации объектов может быть выполнен с возможностью определять дополнительную информацию объекта посредством определения дополнительного различия уровней объектов для каждого дополнительного сигнала из одного или более дополнительных сигналов таким образом, что упомянутое дополнительное различие уровней объектов указывает отношение дополнительного значения энергии упомянутого дополнительного сигнала к опорному значению энергии, или таким образом, что упомянутое дополнительное различие уровней объектов указывает разность между опорным значением энергии и дополнительным значением энергии упомянутого дополнительного сигнала.

Например, значение энергии аудиообъекта каждого из аудиообъектов может быть передано генератору 140 информации объектов как вспомогательная информация. Значение энергии каждого из дополнительных сигналов также может быть передано генератору 140 информации объектов как вспомогательная информация. Или в других вариантах осуществления генератор 140 информации объектов может самостоятельно вычислять значения энергии каждого из дополнительных сигналов, например, вычисляя квадрат каждого из значений отсчетов одного из дополнительных сигналов, суммируя упомянутые значения отсчетов для получения промежуточного результата и вычисляя квадратный корень из промежуточного результата для получения значения энергии упомянутого дополнительного сигнала. Тогда генератор 140 информации объектов, например, может определить самое большое значение энергии всех аудиообъектов и всех дополнительных сигналов как опорное значение энергии.

Затем генератор 140 информации объектов, например, может определить отношение дополнительного значения энергии дополнительного сигнала и опорного значения энергии как дополнительное различие уровней объектов. Например, если дополнительное значение энергии составляет 3,0, и опорное значение энергии составляет 6,0, то дополнительное различие уровней объектов составляет 0,5.

В качестве альтернативы, генератор 140 информации объектов, например, может определить разность опорного значения энергии и дополнительного значения энергии дополнительного сигнала как дополнительное различие уровней объектов. Например, если дополнительное значение энергии составляет 7,0, и опорное значение энергии составляет 10,0, то дополнительное различие уровней объектов составляет 3,0. Вычисление дополнительного различия уровней объектов посредством определения разности является особенно подходящим, если значения энергии выражены относительно логарифмического масштаба.

В других вариантах осуществления параметрическая информация также может содержать информацию о межобъектной когерентности между пространственными аудиообъектами и/или скрытыми объектами.

Кроме того, устройство содержит интерфейс 150 вывода для вывода закодированного сигнала. Закодированный сигнал содержит параметрическую информацию аудиообъектов для одного или более аудиообъектов и дополнительную параметрическую информацию для одного или более дополнительных сигналов. С этой целью в некоторых вариантах осуществления интерфейс 150 вывода может быть выполнен с возможностью формировать закодированный сигнал таким образом, что закодированный сигнал содержит параметрическую информацию аудиообъектов для одного или более аудиообъектов и дополнительную параметрическую информацию для одного или более дополнительных сигналов. Или в других вариантах осуществления генератор 140 информации объектов может формировать уже закодированный сигнал таким образом, что закодированный сигнал содержит параметрическую информацию аудиообъектов для одного или более аудиообъектов и дополнительную параметрическую информацию для одного или более дополнительных сигналов и передает закодированный сигнал на интерфейс 150 вывода.

Фиг. 2 иллюстрирует устройство для кодирования одного или более аудиообъектов для получения закодированного сигнала в соответствии с другим вариантом осуществления. В варианте осуществления на фиг. 2 модуль 120 выполнен с возможностью обрабатывать один или более необработанных микшированных с понижением сигналов посредством кодирования одного или более необработанных микшированных с понижением сигналов для получения одного или более обработанных микшированных с понижением сигналов. Блок 130 вычисления сигналов на фиг. 2 содержит модуль 240 декодирования и блок 250 объединения. Модуль 240 декодирования выполнен с возможностью декодировать один или более обработанных микшированных с понижением сигналов для получения одного или более декодированных сигналов. Кроме того, блок 250 объединения выполнен с возможностью формировать каждый из одного или более дополнительных сигналов посредством формирования разностного сигнала между одним из одного или более декодированных сигналов и одним из одного или более необработанных микшированных с понижением сигналов.

Варианты осуществления основаны на обнаружении того, что после микширования с понижением пространственных аудиообъектов полученные в результате микшированные с понижением сигналы могут быть (непреднамеренно или преднамеренно) модифицированы последующим модулем обработки. Посредством обеспечения генератора вспомогательной информации, который кодирует информацию о модификациях микшированных с понижением сигналов как вспомогательную информацию скрытого объекта, например, как скрытые объе

Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов

Патент 2635244