2573738 - Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации

Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации

Иллюстрации

Показать все

Изобретение относится к средствам оптимизации одного и более параметров для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-ориентированной параметрической информации. Технический результат заключается в уменьшении акустических искажений при повышающем микшировании аудиосигнала. Средство включает в себя регулятор параметров. Регулятор параметров принимает один или более входных параметров, на основе которых генерирует один или более скорректированных параметров. Регулятор параметров генерирует один или более скорректированных параметров с использованием одного или более входных параметров и объектно-ориентированной параметрической информации таким образом, что искажение представления сигнала повышающего микширования, вызванного использованием неоптимальных параметров, уменьшается по крайней мере для входных параметров, отклоняющихся от оптимальных параметров на величину, превышающую заданный предел отклонений.13 н. и 23 з.п. ф-лы, 12 ил.

Реферат

Область техники

Конструктивные решения, основанные на заявляемом изобретении, относятся к устройству оптимизации одного или более параметров представления микшированного с повышением сигнала [апмикса] на основе представления микшированного с понижением сигнала [даунмикса] и объектно-ориентированной параметрической информации.

Одно из технических решений по данному изобретению относится к декодеру аудиосигнала.

Другое техническое решение заявляемого изобретения связано с транскодером аудиосигнала.

Еще одно аппаратное исполнение предлагаемого изобретения относится к способу оптимизации одного или более параметров.

Кроме того, ряд конструктивных решений связан со способом представления в виде сигнала повышающего микширования [апмикс-сигнснала] множества аудиоканалов повышающего микширования на основе представления микшированного с понижением сигнала [даунмикс-сигнала], объектно-ориентированной параметрической информации и параметров задаваемого рендеринга [желаемого звучания].

Один из вариантов осуществления имеет отношение к способу представления в виде апмикс-сигнала представления даунмикс-сигнала и параметрических данных каналов, сформированных на базе представления даунмикс-сигнала, объектно-ориентированной параметрической информации и параметров задаваемого рендеринга.

Далее, реализации заявляемого изобретения относятся к кодеру аудиосигнала, способу кодированного представления аудиосигнала и двоичному потоку представления звука [аудиобитстрму].

Логическим оформлением указанных версий осуществления являются соответствующие компьютерные программы.

Помимо указанного, изобретение осуществлено в виде способов, устройства и компьютерных программ для обработки аудиосигнала с устранением искажений.

Уровень техники

Технология обработки, передачи и хранения звука все больше стремится к такому преобразованию многоканального аудиоконтента, которое совершенствует качество акустического образа. Использование многоканального аудиоконтента способствует значительному улучшению слухового восприятия. Можно получить, например, трехмерный акустический эффект, при котором возрастает степень удовлетворенности развлекательным приложением. Более того, многоканальный аудиоконтент применяют также в профессиональных средах, в частности, в телеконференцсвязи, где разборчивость речи говорящего может быть скорректирована путем многоканального воспроизведения звука.

При этом необходимо выбрать оптимальное соотношение качества звука и скорости передачи данных [битрейта] во избежание чрезмерной нагрузки на ресурс за счет многоканальных приложений.

В последнее время предложен ряд параметрических инструментов эффективной передачи и/или хранения многообъектных аудиосцен, куда можно причислить, например, кодирование бинаурального сигнала (Тип 1) (см., например, ссылку [ВСС]), кодирование совокупного источника (см., например, ссылку [JSC]), и пространственное кодирование аудиообъекта в стандарте MPEG (SAOC) (см., например, ссылки [SAOC1], [SAOC2]).

Эти инструментальные средства применяют с целью воссоздания выбранной звуковой сцены перцептуально, а не за счет волнового согласования.

На фиг.8 представлена общая схема подобной системы (здесь - системы пространственного кодирования аудиообъекта SAOC формата MPEG-MPEG SAOC). Система MPEG SAOC 800 на фиг.8 состоит из кодера SAOC 810 и декодера SAOC 820. Кодер SAOC 810 принимает множество сигналов объектов x₁-x_N, которые могут представлять собой, скажем, сигналы временной области или сигналы частотно-временной области (допустим, в виде набора коэффициентов одного из преобразований Фурье или в виде подполосовых сигналов КЗФ [квадратурно-зеркального фильтра]). Помимо этого, кодер SAOC 810 часто получает коэффициенты понижающего микширования [даунмикса] d₁-d_N, соотнесенные с сигналами объектов x₁ to x_N. Отдельные комбинации коэффициентов понижающего микширования [даунмикс-коэффициентов] можно применять для каждого канала микшированного с понижением сигнала [даунмикс-сигнала]. С помощью кодера SAOC 810 обычно формируют канал микшированного с понижением сигнала, комбинируя сигналы объектов x₁-x_N в соответствии с присвоенными коэффициентами понижающего микширования d₁-d_N. Типично, даунмикс-каналов меньше, чем сигналов объектов x₁-x_N. Предусматривая (хотя бы, приблизительное) разделение (или раздельное преобразование) сигналов объектов на стороне декодера SAOC 820, кодер SAOC 810 генерирует один или более даунмикс-сигналов (обозначенных как даунмикс-каналы) 812 и сопроводительную служебную информацию 814. Служебная информация 814 отражает характеристики сигналов объектов x₁-x_N, что обеспечивает объектно-ориентированную обработку на стороне декодера.

Декодер SAOC 820 предусматривает прием одного или более даунмикс-сигналов 812 и сопроводительной служебной информации 814. Кроме того, декодер SAOC 820, как правило, рассчитан на получение от пользователя интерактивной информации и/или управляющей информации 822, в которой описывается желаемый режим воспроизведения [рендеринг]. Так, предположим, информация от пользователя в реальном времени/пользовательские параметры управления 822 могут задавать параметры громкоговорителя и желаемое пространственное расположение объектов-источников сигналов x₁-x_N.

Декодер SAOC 820 предусматривает, например, генерирование множества декодированных сигналов канала повышающего микширования [апмикс-канала] y ^ 1 − y ^ M . Сигналы канала повышающего микширования могут, к примеру, быть привязаны к индивидуальным динамикам многоколоночной системы воспроизведения звука. Декодер SAOC 820 может, в частности, включать в себя разделитель объектов 820а, выполняющий, по крайней мере, приближенную, реконструкцию сигналов объектов x₁-x_N на основе одного или более микшированных с понижением сигналов 812 и служебной информации 814, получая в результате реконструированные сигналы объектов 820b. Однако, реконструированные сигналы объектов 820b могут иметь некоторые девиации относительно оригинальных сигналов объектов x₁-x_N потому, например, что сопроводительная служебная информация 814 не всегда достаточна для адекватного воссоздания исходного материала в силу ограничений по скорости передачи данных. Кроме того, декодер SAOC 820 может иметь в своем составе смеситель [микшер] 820 с, способный принимать реконструированные сигналы объектов 820b и информацию обратной связи с пользователем/управляющую информацию пользователя 822 и на их базе генерировать сигналы канала повышающего микширования y ^ 1 − y ^ M . Смеситель 820 предусматривает задействование интерактивной информации от пользователя/пользовательских управляющих данных 822 для расчета соотношения составляющих индивидуальных реконструированных сигналов объектов 820b в сигналах апмикс-каналов y ^ 1 − y ^ M . Интерактивная пользовательская информация/управляющая пользовательская информация 822 может, в частности, включать в себя параметры воспроизведения (называемые также коэффициентами рендеринга), которые определяют соотношение составляющих отдельных сигналов реконструируемых объектов 822 в сигналах каналов повышающего микширования y ^ 1 − y ^ M .

Здесь следует обратить внимание на то, что при реализации часто разделение объектов, обозначенное на фиг.8 как разделитель объектов 820а, и микширование, обозначенное на фиг.8 как смеситель 820 с, осуществляют за одну операцию. Для этого рассчитывают сводные параметры, описывающие прямое соотнесение одного или более микшированных с понижением сигналов 812 с сигналами каналов повышающего микширования y ^ 1 − y ^ M . Эти параметры могут быть рассчитаны, исходя из служебной информации и пользовательской информации обратной связи/управления 820.

Теперь, со ссылкой на фигуры 9а, 9b и 9c рассмотрим другой вариант реализации устройства, формирующего представления сигнала, микшированного с повышением на базе представления сигнала, микшированного с понижением, и объектно-ориентированной служебной информации. На фиг.9а дана принципиальная блочная схема системы MPEG SAOC 900, включающей в себя декодер SAOC 920. Декодер SAOC 920 в качестве самостоятельных функциональных блоков содержит декодер объекта 922 и смеситель/рендерер 926. Декодер объектов 922 генерирует множество восстановленных сигналов объектов 924, опираясь на полученное им представление даунмикс-сигнала (допустим, в виде одного или более сигналов понижающего микширования во временной области или в частотно-временной области) и на объектно-ориентированную сопутствующую информацию (допустим, в виде метаданных объекта). Смеситель/рендерер 924 получает восстановленные сигналы объектов 924, относящиеся к множеству N объектов, и на их основе формирует один или более сигналов апмикс-канала 928. В компоновке SAOC-декодера 920 экстракция сигналов объекта 924 выполняется отдельно от микширования/рендеринга, что позволяет разделить функции декодирования объекта и микширования/рендеринга, однако приводит к относительно высокой вычислительной сложности.

Далее, обратившись к фиг.9b, кратко обсудим еще одно конструктивное решение системы MPEG SAOC 930, куда введен декодер SAOC 950. Декодер SAOC 950 генерирует множество восстановленных сигналов объектов 958, опираясь на полученное им представление даунмикс-сигнала (допустим, в виде одного или более сигналов понижающего микширования) и на объектно-ориентированную служебную информацию (допустим, в виде метаданных объекта). Декодер SAOC 950 представляет собой интегрированный декодер и смеситель/рендерер объекта, выполненный с возможностью генерирования сигналов апмикс-каналов 958 в ходе комбинированного процесса микширования без разделения декодирования и микширования/рендеринга объектов, параметры которого строятся на объектно-ориентированный служебной информации и данных рендеринга. Комбинированный процесс повышающего микширования зависит также от информации понижающего микширования, которая рассматривается как часть объектно-ориентированной служебной информации.

Делая вывод из сказанного, сигналы каналов повышающего микширования 928, 958 могут быть сгенерированы в ходе одноэтапной или двухэтапной операции.

Теперь, обращаясь к фиг.9 с, охарактеризуем систему MPEG SAOC 960. Система [пространственного кодирования оудиообъекта] SAOC 960 предпочтительно включает в себя транскодер SAOC в MPEG Surround 980 вместо декодера SAOC.

Преобразователь кода [транскодер] SAOC в MPEG Surround состоит из перекодировщика [транскодера] служебной информации 982, который предназначен для приема объектно-ориентированной служебной информации (предположительно, в форме метаданных объекта) и, факультативно, информации об одном или более даунмикс-сигналов и параметров рендеринга. Перекодировщик служебной информации предназначен также для выработки на базе полученных данных служебной информации формата MPEG Surround (например, в форме битстрима MPEG Surround). Соответственно, транскодер служебной информации 982 выполняет функцию преобразования объектно-ориентированной (параметрической) служебной информации, поступающей от кодера объектов, в служебную (параметрическую) информацию, описывающую каналы с учетом параметров рендеринга и, произвольно, информации о контенте одного или более микшированных с понижением сигналов.

В качестве опции транскодер SAOC в MPEG Surround 980 может выполнять функцию манипулирования одним или более даунмикс-сигналами, описанными, например, посредством представления даунмикс-сигнала с получением видоизмененного [манипуляцией] представления сигнала понижающего микширования 988. Тем не менее, манипулятор даунмикс-сигналом 986 можно не включать в компоновку, в результате чего представление сигнала понижающего микширования 988 на выходе транскодера SAOC в MPEG Surround 980 будет идентичным представлению сигнала понижающего микширования на входе транскодера SAOC в MPEG Surround. Манипулятор даунмикс-сигналом 986 может найти применение, например, когда служебная информация MPEG Surround 984 с привязкой к каналам не позволяет создать желаемое слуховое впечатление на базе представления сигнала понижающего микширования на входе транскодера SAOC в MPEG Surround 980, что может иметь место при некоторых констелляциях [совокупностях факторов] акустического рендеринга.

Следовательно, транскодер SAOC в MPEG Surround 980 формирует представление сигнала понижающего микширования 988 и битстрим формата MPEG Surround 984 таким образом, что множество сигналов каналов повышающего микширования, отображающих аудиообъекты в соответствии с данными рендеринга, вводимыми в транскодер SAOC -MPEG Surround 980, могут быть сгенерированы с помощью декодера MPEG Surround, на который поступают битстрим MPEG Surround 984 и представление даунмикс-сигнала 988.

Из сказанного вытекает, что для декодирования аудиосигналов, закодированных в SAOC, можно применять различные подходы. В некоторых случаях используют декодер SAOC, который генерирует сигналы каналов повышающего микширования (например, сигналы апмикс-каналов 928, 958) на основе представления сигналов понижающего микширования и объектно-ориентированной служебной параметрической информации. Примеры такого подхода приведены на фиг.9а и 9b. В другом случае аудиоданные, закодированные в SAOC, могут быть перекодированы с получением представления сигнала понижающего микширования (например, представления даунмикс-сигнала 988) и сопроводительной информации, специфицирующей канал (например, битстрима MPEG Surround 984, характеризующего канал), которые будут использованы декодером MPEG Surround для выработки необходимых сигналов каналов повышающего микширования.

На фиг.8 показана общая схема системы MPEG SAOC 800, которая предусматривает частотно-избирательную обработку каждого частотного диапазона таким образом, что: кодер SAOC микширует с понижением N входных сигналов аудиообъектов x₁-x_N. Для понижающего монофонического микширования коэффициенты указаны как d₁-d_N. В дополнение к этому кодер SAOC 810 извлекает служебную информацию 814, описывающую входные аудиообъекты. Для процедуры пространственного кодирования оудиообъекта SAOC в формате MPEG базовым видом сопроводительной информации является соотношение мощностей объектов.

Микшированный с понижением сигнал (или сигналы) 812 и служебная информация 814 пересылают и/или вводят в память. Для этого микшированный с понижением аудиосигнал сжимают, используя такие известные аудиокодеры перцептуального типа, как MPEG-1 уровня II или III (также известный как „.mp3"), как Передовая технология аудиокодирования ААС формата MPEG, или любой другой аудиокодер.

Концептуальная задача декодера SAOC 820 на приемном конце - восстановить исходный сигнал объекта („дифференцировать объекты"), используя полученную служебную информацию 814 (и, естественно, один или более даунмикс-сигналов 812). Затем, из таких приближенных к оригиналам объектных сигналов (определяемых также как реконструированные сигналы объектов [/сигналы реконструированных объектов] 820b) микшируют целевую сцену, отображаемую посредством М выходных звуковых каналов (которые, например, могут быть представлены сигналами каналов повышающего микширования y ^ 1 − y ^ M ) с приложением матрицы аудиорендеринга. Для монофонического звукового выхода, коэффициенты матрицы аудиорендеринга представлены как r₁-r_N.

В действительности, сепарация [дифференциация] сигналов объекта выполняется редко (или даже никогда не выполняется), поскольку и шаг сепарации (обозначенный как разделитель объектов 820а), и шаг микширования (обозначенный как смеситель 820c), объединены в общую процедуру транскодирования, в результате которой зачастую происходит значительное снижение вычислительной сложности.

Было установлено, что такая схема чрезвычайно эффективна, как с точки зрения скорости передачи данных (когда необходимо передавать только несколько даунмикс-каналов и некоторую служебную информацию вместо N дискретных сигналов аудиообъектов или дискретной системы), так и с точки зрения вычислительной трудоемкости (трудоемкость обработки относится, больше, к числу выходных каналов, чем к количеству отображаемых аудиообъектов). Дополнительные преимущества пользователя на приемном конце состоят в свободе выбора воспроизводимого акустического образа (моно-, стереофония, охватывающее, виртуализированное [приближенное к реальности] звучание в наушниках и тому подобное) и в возможности непосредственного участия слушателя/слушательницы: матрица аудиорендеринга обеспечивает возможность адаптации звуковой сцены в режиме реального времени к запросам пользователя в соответствии с его/ее вкусами, личными предпочтениями или иными критериями. Например, можно пространственно ощутимо отделять собеседников одной группы в одной части звукового объема от других участников разговора. Такая интерактивность достигается за счет интерфейса пользователя с декодером:

Регулируются относительный уровень и (для немонофонического рендеринга) пространственное положение каждого звукового объекта. Пользователь может выполнять это в режиме реального времени, изменяя положение соответствующего ползунка устройства пользовательского графического интерфейса (GUI/ГИП) (например: уровень объекта = +5 дБ, положение объекта = -30°).

Тем не менее, было установлено, что в некоторых случаях на стороне декодера выбор параметров представления сигналов повышающего микширования (например, сигналов каналов повышающего микширования y ^ 1 − y ^ M ) ведет к искажениям звука.

Ввиду описанной ситуации целью заявляемого изобретения является создание концепции уменьшения или, возможно, устранения акустических искажений при повышающем микшировании аудиосигнала (например, в виде сигналов каналов повышающего микширования y ^ 1 − y ^ M ).

Сущность изобретения

Поставленная цель достигается с помощью устройства оптимизации одного и более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-ориентированной параметрической информации по пункту 1 формулы изобретения, декодера аудиосигнала по п.24, транскодера аудиосигнала по п.25, способов согласно пунктам 26, 27 и 28, кодера аудиосигнала по п.29, способа по п.31, аудиобитстрима по п.32 и компьютерной программы по п.34.

Заявляемое изобретение реализовано в виде устройства оптимизации одного и более параметров представления сигнала повышающего микширования [апмикс-сигнала] на базе представления сигнала понижающего микширования [даунмикс-сигнала] и объектно-ориентированной параметрической информации. Устройство имеет в своем составе регулятор параметров (например, регулятор коэффициентов рендеринга) выполненный с возможностью приема одного или более входных параметров (например, коэффициента рендеринга или описания задаваемой матрицы аудиорендеринга) и генерации на их основе одного или более скорректированных параметров. Регулятор параметров реализован с целью настройки одного или более параметров, исходя из одного или более входных параметров и объектно-ориентированной параметрической информации (например, в зависимости от одного или более коэффициентов понижающего микширования и/или одного или более показателей разности уровней объектов и/или одного или более значений межобъектной корреляции), таким образом, чтобы искажение представления микшированного с повышением сигнала, которое может быть вызвано использованием неоптимальных параметров, было ослаблено, по меньшей мере, для входных параметров, имеющих отклонение от оптимальных параметров на величину, превышающую расчетное отклонение.

Конструктивное исполнение изобретения базируется на идее, что искажения акустического сигнала, вызываемые выбором ненадлежащих входных параметров, могут быть уменьшены путем ввода откорректированных параметров представления апмикс-сигнала, и что корректировка параметров может быть выполнена с подобающей точностью, если в расчет принимать объектно-ориентированную параметрическую информацию. Установлено, что использование объектно-ориентированной параметрической информации позволяет оценивать меру акустических искажений, вызываемых входными параметрами, что, в свою очередь, дает возможность такой корректировки параметров, при которой искажения звука будут удерживаться в пределах заданного диапазона, или при которой искажения звука будут ослаблены по сравнению с входными параметрами. Объектно-ориентированная информация описывает, например, характеристики аудиообъектов и/или содержит параметры обработки объектов на стороне кодера.

Следовательно, нежелательные и часто раздражающие искажения аудиосигнала как следствие использования неадекватных характеристик (допустим, несоответствующих коэффициентов рендеринга) можно уменьшить или даже устранить за счет оптимизации одного или более параметров, выбор которых с использованием объектно-ориентированной параметрической информации обеспечивает эффективное ослабление и/или компенсацию искажений аудиосигнала благодаря достаточно достоверной оценке акустических искажений.

В предпочтительной версии исполнения устройство предусматривает получение в качестве входных характеристик желаемых параметров рендеринга, отражающих требуемый масштабируемый уровень интенсивности множества сигналов аудиообъектов по одному или более каналов, описанных в представлении апмикс-сигнала. В этом случае регулятор параметров выполняет функцию актуализации одного или более параметров рендеринга в зависимости от одного или более параметров рендеринга, выбранных по желанию. Было определено, что выбор несоответствующих параметров рендеринга влечет за собой существенную (и, часто, ощутимую на слух) деградацию представления сигнала повышающего микширования, являющуюся следствием приложения подобных неадекватно подобранных параметров рендеринга. Также установлено, что параметры рендеринга могут быть эффективно скорректированы на основе объектно-ориентированной параметрической информации, так как объектно-ориентированная параметрическая информация позволяет оценивать возможные искажения, вносимые выбранными параметрами рендеринга (которые могут быть заданы входными параметрами).

Предпочтительный вариант осуществления отличается тем, что регулятор параметров выполнен с возможностью выведения одного или более предельных значений параметров рендеринга в зависимости от объектно-ориентированной параметрической информации и данных понижающего микширования, характеризующих соотношение составляющих сигналов аудиообъектов в представлении сигнала понижающего микширования, причем, таким образом, что метрика искажения остается внутри заданного диапазона, ограничивающего значения параметров рендеринга. Для этого регулятор параметров реализован с возможностью актуализации параметров рендеринга в зависимости от желаемых параметров рендеринга и одного или более предельных значений параметров рендеринга таким образом, что актуализованные параметры рендеринга удовлетворяют условиям интервала значений, определенного предельными значениями параметров рендеринга. Расчет предельных значений параметров рендеринга представляет собой простой в вычислительном отношении и надежный механизм, обеспечивающий удержание акустических искажений в пределах допустимого диапазона в соответствии с метрикой искажений.

Предпочтительное техническое решение регулятора параметров характеризуется тем, что задает одну или более величин, ограничивающих параметры рендеринга таким образом, чтобы относительная составляющая сигнала объекта при наложении множества сигналов объектов с использованием параметра рендеринга, удовлетворяющего одной или более пороговых величин параметров рендеринга, отличалась от относительной составляющей сигнала этого объекта в микшированном с понижением сигнале не более, чем на заданную разность. Было определено, что искажения, как правило, достаточно невелики, если соотношение составляющих сигнала объекта во всей совокупности наложенных сигналов отображаемых объектов подобна соотношению составляющих сигнала этого объекта в даунмикс-сигнале, в то время как значительное расхождение указанных соотношений составляющих обычно способствует возникновению искажений звука. Это происходит вследствие того, что сильное изменение (относительного) уровня сигнала объекта по сравнению с (относительным) уровнем этого сигнала объекта в представлении сигнала понижающего микширования часто влечет за собой возникновение артефактов, ибо зачастую невозможно образцово точно разделить сигналы разных аудиообъектов. В результате установлено, что удовлетворительные результаты настройки параметров аудиорендеринга получают преимущественно за счет плавного изменения параметров рендеринга.

Другой вариант аппаратной реализации регулятора параметров отличается тем, что он задает одно или более пороговых значений параметров рендеринга таким образом, что мера искажения, отражающая соотношение между микшированным с понижением сигналом, описанным посредством представления микшированного с понижением сигнала, и сигналом, полученным в результате рендеринга с использованием одного или более параметров рендеринга, удовлетворяющих одному или более пороговых значений параметров рендеринга, находится в пределах заданного диапазона. Было установлено, что параметры рендеринга, выбранные по желанию как входные параметры регулятора параметров, должны подбираться с соблюдением достаточного „сходства" между даунмикс-сигналом, описанным посредством представления даунмикс-сигнала, и сигналом, полученным рендерингом, поскольку иначе возрастает риск возникновения слышимых артефактов при повышающем микшировании.

Еще один предпочтительный вариант осуществления регулятора параметров отличается тем, что вычисляет линейную комбинацию квадрата желаемого параметра рендеринга (как возможного входного параметра регулятора параметров) и квадрата оптимального параметра рендеринга (например, как возможного параметра рендеринга, минимизирующего уровень искажения) с выработкой актуализованного параметра рендеринга (как возможного отрегулированного выходного параметра устройства). В данном случае регулятор параметров выполняет функцию определения соотношения желаемых параметров рендеринга и оптимального параметра рендеринга в линейной комбинации в зависимости от заданного порогового параметра Т и метрики искажения, где метрика искажения [дальше см. 2.3., 2.3.1] отражает искажение, которое может возникнуть при использовании одного или более желаемых параметров рендеринга вместо оптимальных параметров рендеринга для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования. Такой подход позволяет уменьшить искажения до приемлемой меры при сохранении оптимального воздействия желаемых параметров рендеринга. Эта концепция позволяет найти разумный компромисс между оптимальными параметрами рендеринга и желаемыми параметрами рендеринга с учетом желаемой степени ограничения акустических искажений.

В предпочтительном варианте технического решения регулятор параметров реализован с возможностью генерировать один или более оптимизированных параметров в зависимости от вычислительной меры перцепционной деградации [меры расчета ухудшения качества звучания], чтобы ограничить воспринимаемые на слух искажения представления сигнала повышающего микширования, вызванные использованием неоптимальных параметров и представленные вычислительной мерой перцепционной деградации. Таким образом, параметры можно настраивать в соответствии со слуховым впечатлением, избегая неприемлемо плохого звучания, но добиваясь при этом достаточной глубины регулировки параметров в соответствии с желаниями пользователя.

В предпочтительной версии регулятор параметров отличается возможностью приема информации о свойствах объекта, описывающей характеристики одного или более оригинальных сигналов объекта, которые формируют основу даунмикс-сигнала, отображаемого представлением даунмикс-сигнала. В этом случае регулятор параметров выполнен с возможностью учета информации о свойствах объекта при формировании скорректированных параметров таким образом, чтобы искажение представления сигнала повышающего микширования по сравнению со свойствами сигналов объектов, входящих в представление сигнала повышающего микширования, понижалось, по меньшей мере, для входных параметров, отклоняющихся от оптимальных параметров, на величину, большую, чем заданное отклонение. Такой вариант реализации заявляемого изобретения основан на заключении, что свойства одного или более исходных сигналов объекта могут быть использованы для оценки того, отвечают ли входные параметры требованиям или должны быть откорректированы, поскольку микшированный с повышением сигнал должен быть сформирован так, чтобы его характеристики соответствовали свойствам одного или более исходных сигналов объекта, потому что в противном случае перцептивный образ будет значительно искажен по многим показателям.

В предпочтительной реализации регулятор параметров отличается тем, что принимает и учитывает в качестве информации о свойствах объекта тональные данные сигнала объекта для формирования одного или более отрегулированных параметров. Установлено, что тональные характеристики сигналов объекта - показатель, который существенно влияет на перцептивное впечатление, и что следует избегать выбор характеристик, которые значительно изменяют тональное восприятие, чтобы сохранить хорошее слуховое впечатление.

Предпочтительное конструктивное исполнение регулятора параметров характеризуется возможностью оценивания тональных особенностей для идеального рендеринга сигнала повышающего микширования, исходя из полученных тональных данных сигналов объектов и полученных уровней мощности объектов. В этом случае регулятор параметров выполняет функцию генерирования одного или более скорректированных параметров для нивелирования разницы между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием одного или более скорректированных параметров, относительно разницы между оцененной тональностью и тональностью апмикс-сигнала, сформированного с использованием входных параметров, или функцию сохранения разницы между оцененной тональностью и тональностью микшированного с повышением сигнала, образованного с использованием одного или более откорректированных параметров, в пределах заданного диапазона. Применение этой концепции обеспечивает высокую вычислительную эффективность оценивания меры деградации слухового восприятия, что позволяет сообразно регулировать параметры рендеринга.

Предпочтительное техническое решение регулятора параметров отличается тем, что предусматривает время-частотный вариант регулирования входных параметров. Благодаря этому настройку входных параметров с целью получения скорректированных параметров можно выполнять только для таких интервалов времени или таких частотных участков, где регулирование действительно способствует улучшению слухового впечатления или предотвращает выраженную деградацию акустического образа.

Еще один предпочтительный вариант реализации регулятора параметров выполнен с возможностью учета представления сигнала понижающего микширования для формирования одного или более скорректированных параметров. Беря в расчет представление даунмикс-сигнала, добиваются еще большей точности оценки потенциального искажения слухового восприятия.

Регулятор параметров в предпочтительной версии исполнения отличается тем, что способен рассчитывать совокупную меру искажения, то есть - сочетание мер искажения, отражающее множество типов артефактов. В таком варианте регулятор параметров выполнен с возможностью расчета совокупной меры искажения как комбинации мер искажений, которые могут быть вызваны использованием одного или более входных параметров рендеринга вместо оптимизированных параметров рендеринга для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования. Путем совмещения множества мер искажения, отражающих множество типов артефактов, можно создать хорошо управляемый механизм настройки слухового восприятия.

В другое конструктивное решение заявляемого изобретения введен декодер аудиосигналов, отличающийся тем, что формирует представление сигнала повышающего микширования из множества аудиоканалов повышающего микширования на базе представления сигнала понижающего микширования, объектно-ориентированной параметрической информации и параметров задаваемого рендеринга [желаемого звучания]. Декодер аудиосигнала включает в себя повышающий микшер, выполненный с возможностью формирования аудиоканалов повышающего микширования на базе представления сигнала понижающего микширования и в зависимости от объектно-ориентированной параметрической информации и актуализованных характеристик рендеринга, специфицирующих распределение по аудиоканалам повышающего микширования множества сигналов аудиообъектов, описанных объектно-ориентированной параметрической информацией. Декодер аудиосигнала также включает в себя устройство оптимизации одного и более параметров, как рассмотрено раньше. Устройство оптимизации одного или более параметров предусматривает прием произвольно задаваемых параметров рендеринга в виде одного или более входных параметров и выработку одного или более откорректированных параметров в виде актуализованных данных рендеринга. Кроме того, устройство оптимизации одного и более параметров выполнено с возможностью генерации одного или более скорректированных параметров таким образом, чтобы искажения по аудиоканалам повышающего микширования, вызванные использованием актуализованных параметров рендеринга с отклонением от оптимальных параметров рендеринга, были сокращены, по меньшей мере, для произвольно задаваемых (желаемых) параметров рендеринга, имеющих отклонения от оптимальных параметров рендеринга, на величину, превышающую заданное отклонение.

Использование устройства оптимизации одного и более параметров в составе декодера аудиосигнала дает возможность предотвращать возникновение сильных слышимых искажений, вызываемых декодированием аудиосигнала при неправильно выбранных данных задаваемого по желанию рендеринга.

Частью осуществления заявляемого изобретения является транскодер аудиосигнала, предназначенный для формирования в виде представления сигнала повышающего микширования информации о параметрах ка

Патент 2573738