Стереофоническая обработка аудиосигналов
Иллюстрации
Показать всеИзобретение относится к области стереофонического воспроизведения. Технический результат – обеспечение более гибкого распределения стереофонических передаточных функций с учетом положений головы. Устройство для обработки аудиосигнала содержит: приемник для приема входных данных, причем входные данные содержат множество наборов данных стереофонического воспроизведения, причем каждый набор данных стереофонического воспроизведения содержит данные, представляющие параметры для обработки стереофонического воспроизведения виртуального положения и обеспечивающие различное представление одной и той же лежащей в основе стереофонической передаточной функции с учетом положения головы, причем входные данные дополнительно содержат для каждого из наборов данных стереофонического воспроизведения указание представления, указывающее на представление для набора данных стереофонического воспроизведения; селектор для отбора выбранного набора данных стереофонического воспроизведения в ответ на указания представления и возможности устройства; и аудиопроцессор для обработки аудиосигнала в ответ на данные выбранного набора данных стереофонического воспроизведения. 4 н. и 11 з.п. ф-лы, 10 ил., 2 табл.
Реферат
Область техники, к которой относится изобретение
Изобретение относится к стереофоническому воспроизведению, и в частности, но не исключительно, к передаче и обработке данных стереофонической передаточной функции с учетом положения головы для приложений обработки аудиосигналов.
Уровень техники
Цифровое кодирование различных исходных сигналов становилось все более и более важным в последние десятилетия по мере того, как цифровое представление и передача сигнала все более и более замещали аналоговое представление и передачу. Например, аудиоконтент, такой как речь и музыка, все больше становится основанным на кодировании цифрового контента. Кроме того, потребление аудио все больше смещалось в сторону обволакивающих трехмерных переживаний с распространением, например, объемного звучания и домашних кинотеатров.
Были разработаны форматы кодирования аудиосигналов для того, чтобы обеспечить все более и более функциональные, разнообразные и гибкие аудиосервисы, и в частности были разработаны форматы аудиокодирования, поддерживающие пространственные аудиосервисы.
Известные технологии кодирования аудиосигналов, такие как DTS и Dolby Digital, производят закодированный многоканальный аудиосигнал, который представляет пространственный образ как множество каналов, которые размещаются вокруг слушателя в фиксированных положениях. Для установки динамика, которая отличается от установки, которая соответствует многоканальному сигналу, пространственный образ будет неоптимальным. Кроме того, основанные на каналах системы кодирования аудиосигналов, как правило, не способны справиться с различным количеством динамиков.
Стандарт (ISO/IEC MPEG-D) MPEG Surround обеспечивает инструмент кодирования многоканальных аудиосигналов, который позволяет расширить существующие моно- или стереокодировщики на многоканальные аудио приложения. Фиг. 1 иллюстрирует пример элементов системы MPEG Surround. Используя пространственные параметры, полученные путем анализа исходного многоканального входа, декодер MPEG Surround может воссоздать пространственный образ с помощью управляемого микширования с увеличением количества каналов моно- или стереосигнала для получения многоканального выходного сигнала.
Так как пространственный образ многоканального входного сигнала параметризован, стандарт MPEG Surround позволяет расшифровывать тот же самый многоканальный поток битов посредством воспроизводящих устройств, которые не используют многоканальную настройку динамиков. Примером этого является воспроизведение виртуального объемного звучания в наушниках, которое называется процессом стереофонического декодирования MPEG Surround. В этом режиме может быть обеспечено реалистическое объемное переживание при использовании обычных наушников. Другим примером является сокращение числа каналов в многоканальных выходах, например 7.1, до более низкого, например 5.1.
На самом деле, разнообразие и гибкость в конфигурациях воспроизведения, используемых для воспроизведения пространственного звука, значительно увеличились в последние годы, и все большее количество форматов воспроизведения становятся доступными рядовому потребителю. Это требует гибкого представления аудиосигнала. Важные шаги были сделаны с введением кодека MPEG Surround. Тем не менее, аудиоданные по-прежнему производятся и передаются для конкретной настройки громкоговорителей, например для ITU 5.1. Воспроизведение на различных настройках и на нестандартных (то есть гибких или определяемых пользователем) настройках динамиков не определено. Действительно, существует желание сделать аудиокодирование и представление все более и более независимыми от конкретных предопределенных и номинальных настроек динамиков. Все более предпочтительным становится, чтобы гибкая адаптация к широкому разнообразию различных настроек динамиков могла быть выполнена на стороне декодера/воспроизведения.
Для того, чтобы обеспечить более гибкое представление аудио, MPEG стандартизировал формат, известный как «Кодирование пространственных аудиообъектов» (ISO/IEC MPEG-D SAOC). В отличие от систем кодирования многоканальных аудиосигналов, таких как DTS, Dolby Digital и MPEG Surround, стандарт SAOC обеспечивает эффективное кодирование отдельных аудиообъектов вместо звуковых каналов. В то время как в стандарте MPEG Surround каждый канал динамика может рассматриваться как состоящий из различной смеси звуковых объектов, стандарт SAOC делает отдельные звуковые объекты доступными для интерактивной манипуляции на стороне декодирующего устройства, как проиллюстрировано на Фиг. 2. В стандарте SAOC множество звуковых объектов кодируется в моно- или стереоверсии вместе с параметрическими данными, позволяющими извлечь звуковые объекты на стороне воспроизведения, делая тем самым отдельные аудиообъекты доступными для манипуляции, например, конечным пользователем.
Действительно, аналогично стандарту MPEG Surround стандарт SAOC также создает моно или стерео версии сигнала с сокращенным количеством каналов. В дополнение к этому вычисляются и включаются параметры объекта. На стороне декодирующего устройства пользователь может манипулировать этими параметрами с тем, чтобы управлять различными признаками отдельных объектов, такими как положение, уровень, балансировка, или даже применять к ним эффекты, такие как реверберация. Фиг. 3 иллюстрирует интерактивный интерфейс, который позволяет пользователю управлять отдельными объектами, содержащимися в потоке битов SAOC. Посредством матрицы воспроизведения отдельные звуковые объекты отображаются на каналы динамиков.
Стандарт SAOC обеспечивает более гибкий подход, и в частности обеспечивает большую адаптируемость воспроизведения за счет передачи аудиообъектов в дополнение к каналам воспроизведения. Это позволяет декодирующей стороне помещать аудиообъекты в произвольных положениях в пространстве, при условии, что это пространство адекватно покрывается динамиками. Таким образом отсутствует какая-либо связь между передаваемым аудиосигналом и воспроизведением или настройкой воспроизведения, следовательно могут использоваться произвольные настройки динамиков. Это выгодно для, например, домашних кинотеатров в обычной жилой комнате, где динамики почти никогда не находятся в правильных положениях. В стандарте SAOC то, где именно объекты размещаются на звуковой сцене, решается на стороне декодирующего устройства, что часто является нежелательным с артистической точки зрения. Стандарт SAOC на самом деле обеспечивает способы передачи матрицы воспроизведения по умолчанию в потоке битов, устраняя ответственность декодера. Однако обеспечиваемые способы полагаются либо на фиксированные настройки воспроизведения, либо на неспецифицированный синтаксис. Таким образом, стандарт SAOC не обеспечивает нормативного средства для полной передачи аудиосцены независимо от настройки динамиков. Кроме того, SAOC не очень хорошо приспособлен для достоверного воспроизведения диффузных компонентов сигнала. Хотя в нем и имеется возможность включать так называемый многоканальный фоновый объект (MBO) для захвата диффузного звука, этот объект связан с одной конкретной конфигурацией динамиков.
Другая спецификация аудиоформата для трехмерного звука разрабатывается Союзом 3D-аудио (3DAA), который является промышленным альянсом. 3DAA ставит своей целью разработку стандартов для передачи трехмерного звука, которые «будут облегчать переход от текущей парадигмы питания динамиков к гибкому подходу на основе объектов». В 3DAA должен быть определен формат потока битов, который позволял бы передачу наследуемой многоканальной версии наряду с отдельными звуковыми объектами. В дополнение к этому, включаются данные о расположении объекта. Принцип формирования 3DAA аудиопотока проиллюстрирован на Фиг. 4.
В подходе 3DAA звуковые объекты получаются отдельно в расширении потока, и они могут быть извлечены из многоканальной версии. Результирующая многоканальная версия с сокращенным количеством каналов воспроизводится вместе с объектами, доступными по отдельности.
Эти объекты могут состоять из так называемых стволов. Эти стволы в основном представляют собой сгруппированные (смикшированные с уменьшением количества каналов) дорожки или объекты. Следовательно, объект может состоять из множества подобъектов, упакованных в ствол. В 3DAA многоканальное опорное микширование может быть передано с некоторым набором звуковых объектов. 3DAA передает данные о трехмерном положении для каждого объекта. Эти объекты могут быть затем извлечены с использованием данных о трехмерном положении. Альтернативно может быть передана обратная матрица микширования, описывающая соотношение между объектами и опорным микшированием.
Из описания 3DAA можно понять, что информация о звуковой сцене, вероятно, передается путем назначения угла и расстояния до каждого объекта, указывающих, где этот объект должен быть размещен относительно, например, направления вперед по умолчанию. Таким образом, информация о местонахождении передается для каждого объекта. Это является полезным для точечных источников, но не в состоянии описать широкие источники (такие как, например, хор или аплодисменты) или диффузные звуковые поля (такие как звуки окружающей среды). Когда все точечные источники извлекаются из опорного микширования, остается многоканальное микширование окружающей среды. Аналогично стандарту SAOC, остаток в 3DAA фиксируется для конкретной настройки динамиков.
Таким образом, как подход SAOC, так и подход 3DAA включают в себя передачу отдельных звуковых объектов, которыми можно манипулировать по отдельности на стороне декодирующего устройства. Разница между этими двумя подходами заключается в том, что стандарт SAOC обеспечивает информацию о звуковых объектах путем обеспечения параметров, характеризующих объекты относительно версии с сокращенным количеством каналов (то есть таким образом, что звуковые объекты формируются из версии с сокращенным количеством каналов на стороне декодирующего устройства), тогда как 3DAA обеспечивает звуковые объекты как полные и отдельные звуковые объекты (то есть, которые могут формироваться независимо от версии с сокращенным количеством каналов на стороне декодирующего устройства). Для обоих подходов могут быть сообщены данные о положении звуковых объектов.
Стереофоническая обработка, в которой пространственные переживания создаются за счет виртуального позиционирования звуковых источников с использованием отдельных сигналов для ушей слушателя, становится все более широко распространенной. Виртуальный объемный звук представляет собой способ воспроизведения звука таким образом, что источники звука воспринимаются расположенные в конкретном направлении, создавая тем самым иллюзию восприятия физически объемного звука (например, динамиков 5.1) или окружающей среды (концерт). С помощью подходящей обработки стереофонического воспроизведения могут быть вычислены сигналы, которые надо подать на барабанные перепонки слушателя для того, чтобы он воспринимал звук с любого направления, и эти сигналы воспроизводятся таким образом, что они обеспечивают желаемый эффект. Как проиллюстрировано на Фиг. 5, эти сигналы затем воссоздаются в барабанной перепонке с использованием наушников или способа устранения перекрестной связи (подходящего для воспроизведения с помощью близко расположенных динамиков).
Кроме непосредственного воспроизведения, изображенного на Фиг. 5, конкретные технологии, которые могут использоваться для воспроизведения виртуального объемного звука, включают в себя MPEG Surround и SAOC, а также планируемый этап работы по трехмерному звуку в MPEG. Эти технологии обеспечивают эффективное в вычислительном отношении воспроизведение виртуального объемного звука.
Стереофоническое воспроизведение основано на стереофонических фильтрах, которые изменяются от человека к человеку благодаря различным акустическим свойствам головы и отражающих поверхностей, таких как плечи. Например, стереофонические фильтры могут использоваться для создания стереофонической записи, моделирующей множество источников, находящихся в различных локализациях. Это может быть реализовано путем свертки каждого звукового источника с парой импульсных откликов с учетом положения головы (HRIR), которые соответствуют положению звукового источника.
Путем измерения, например, импульсных откликов от звукового источника, находящегося в конкретной локализации в двухмерном или трехмерном пространстве, с помощью микрофонов, размещенных внутри или около человеческих ушей, могут быть определены подходящие стереофонические фильтры. Как правило, такие измерения делаются, например, с использованием моделей головы человека, или в некоторых случаях измерения на самом деле могут быть сделаны путем прикрепления микрофонов вблизи от барабанных перепонок человека. Стереофонические фильтры могут использоваться для создания стереофонической записи, моделирующей множество источников, находящихся в различных локализациях. Это может быть реализовано, например, путем свертки каждого звукового источника с парой измеренных импульсных откликов для желаемого положения звукового источника. Чтобы создать иллюзию того, что звуковой источник перемещается вокруг слушателя, требуется большое количество стереофонических фильтров с соответствующим пространственным разрешением, например в 10 градусов.
Функции стереофонических фильтров могут быть представлены, например, как импульсные отклики с учетом положения головы (HRIR), или эквивалентно как передаточные функции с учетом положения головы (HRTF), или как стереофонический импульсный отклик помещения (BRIR), или как стереофоническая передаточная функция помещения (BRTF). Передаточная функция (например, оцененная или принятая) от данного положения до ушей (или барабанных перепонок) слушателя известна как стереофоническая передаточная функция с учетом положения головы. Эта функция может быть определена, например, в частотной области, и в этом случае она обычно называется HRTF или BRTF, или во временной области, и тогда она обычно упоминается как HRIR или BRIR. В некоторых сценариях стереофонические передаточные функции с учетом положения головы определяются как включающие в себя аспекты или коэффициенты свойств акустического окружения и конкретно того места, в котором делаются измерения, тогда как в других примерах рассматриваются только характеристики пользователя. Примерами первого типа функций являются функции BRIR и BRTF, а примерами второго типа функций являются функции HRIR и HRTF.
Соответственно, основная стереофоническая передаточная функция с учетом положения головы может быть представлена многими различными способами, включая HRIR, HRTF и т.д. Кроме того, для каждого из этих главных представлений существует большое количество различных способов представления конкретной функции, например с разными уровнями точности и сложности. Различные процессоры могут использовать разные подходы и таким образом могут быть основаны на различных представлениях. Таким образом, в любой аудиосистеме как правило требуется большое количество стереофонических передаточных функций с учетом положения головы. Действительно, существует большое разнообразие того, как представлять стереофонические передаточные функции с учетом положения головы, и это дополнительно усиливается большим разнообразием возможных параметров для каждой стереофонической передаточной функции с учетом положения головы. Например, функция BRIR иногда может быть представлена фильтром конечного импульсного отклика (FIR), имеющим, например, 9 выводов, но в других сценариях она может быть представлена фильтром FIR, имеющим, например, 16 выводов, и т.д. В качестве другого примера, функции HRTF могут быть представлены в частотной области с использованием параметризованного представления, где небольшой набор параметров используется для того, чтобы представить полный спектр частот.
Во многих сценариях желательно обеспечить передачу параметров желаемого стереофонического воспроизведения, таких как конкретные стереофонические передаточные функции с учетом положения головы, которые могут использоваться. Однако, благодаря большому разнообразию в возможных представлениях основной стереофонической передаточной функции с учетом положения головы может быть затруднительно гарантировать общность между порождающим и принимающим устройствами.
Технический комитет sc-02 Общества звукоинженеров (AES) недавно объявил о запуске нового проекта по стандартизации формата файла для обмена параметрами стереофонического прослушивания в форме стереофонических передаточных функций с учетом положения головы. Этот формат будет масштабируемым для того, чтобы соответствовать доступному процессу воспроизведения. Этот формат будет проектироваться так, чтобы включать исходные материалы из различных баз данных HRTF. Сложность заключается в том, как такие множество стереофонических передаточных функций с учетом положения головы могут быть наилучшим образом поддержаны, использованы и распределены в аудиосистеме.
Соответственно, желательным был бы улучшенный подход для поддержки стереофонической обработки, и особенно для передачи данных для стереофонического воспроизведения. В частности, выгодным был бы подход, обеспечивающий улучшенное представление и передачу данных стереофонического воспроизведения, уменьшенную скорость передачи данных, уменьшенные накладные расходы, облегченную реализацию и/или улучшенную эффективность.
Раскрытие изобретения
Соответственно, настоящее изобретение предпочтительно направлено на уменьшение, облегчение или устраните одного или более вышеупомянутых недостатков по отдельности или в любом их сочетании.
В соответствии с одним аспектом настоящего изобретения предложено устройство для обработки аудиосигнала, причем устройство содержит: приемник для приема входных данных, причем входные данные содержат множество наборов данных стереофонического воспроизведения, причем каждый набор данных стереофонического воспроизведения содержит данные, представляющие параметры для обработки виртуального положения стереофонического воспроизведения, причем входные данные дополнительно содержат указание представления для каждого из наборов данных стереофонического воспроизведения, указывающее на представление для набора данных стереофонического воспроизведения; селектор для выбора выбранного набора данных стереофонического воспроизведения в ответ на указания представления и возможности устройства; аудиопроцессор для обработки аудиосигнала в ответ на данные выбранного набора данных стереофонического воспроизведения.
Настоящее изобретение может обеспечить улучшенную и/или более гибкую и/или менее сложную стереофоническую обработку во многих сценариях. Данный подход может в частности обеспечить гибкий и/или простой подход для передачи и представления множества параметров стереофонического воспроизведения. Данный подход может обеспечить эффективное представление множества подходов стереофонического воспроизведения и параметров в одном и том же потоке битов/файле данных с использованием устройства, принимающего данные, способного выбирать подходящие данные и представления с низкой сложностью. В частности, подходящее стереофоническое воспроизведение, которое соответствует возможностям устройства, может быть легко идентифицировано и выбрано, не требуя полного декодирования всех данных, или на самом деле во многих вариантах осуществления вообще без какого бы то ни было декодирования данных любого набора данных стереофонического воспроизведения.
Обработка стереофонического воспроизведения виртуального положения может быть любой обработкой алгоритма или процесса, который для сигнала, представляющего звуковой источник, формирует аудиосигналы для двух ушей человека таким образом, чтобы звук воспринимался, как если бы он исходил из желаемого положения в трехмерном пространстве, и как правило из желаемого положения вне головы пользователя.
Каждый набор данных может включать в себя данные, представляющие параметры по меньшей мере одного виртуального положения для операции стереофонического воспроизведения. Каждый набор данных может относиться только к поднабору полных параметров, которые управляют или влияют на стереофоническое воспроизведение. Эти данные могут определять или описывать один или более параметров полностью, и/или могут например частично определять один или более параметров. В некоторых вариантах осуществления определенные параметры могут быть предпочтительными параметрами.
Указание представления может определять, какие параметры включаются в наборы данных и/или характеристику этих параметров, и/или как эти параметры описываются данными.
Возможности устройства могут, например, представлять собой вычислительные ограничения или ограничения ресурса памяти. Возможность устройства может определяться динамически или может быть статическим параметром.
В соответствии с признаком настоящего изобретения при необходимости наборы данных стереофонического воспроизведения включают в себя данные стереофонической передаточной функции с учетом положения головы.
Настоящее изобретение может обеспечить улучшенное и/или облегченное и более гибкое распределение стереофонических передаточных функций с учетом положения головы и/или обработку, основанную на стереофонических передаточных функциях с учетом положения головы. В частности, этот подход может позволить распределять данные, представляющие большое разнообразие стереофонических передаточных функций с учетом положения головы, с помощью отдельных обрабатывающих устройств, способных легко и эффективно идентифицировать и извлекать данные, подходящие конкретно для этого обрабатывающего устройства.
Указания представления могут представлять собой или могут содержать указания представления стереофонических передаточных функций с учетом положения головы, таких как природа стереофонической передаточной функции с учетом положения головы, а также ее отдельные параметры. Например, указание представления для данного набора данных стереофонического воспроизведения может указывать, обеспечивает ли набор данных представление стереофонической передаточной функции с учетом положения головы как функции HRTF, BRTF, HRIR или BRIR. Для представления в виде импульсного отклика указание представления может, например, указывать количество отводов (коэффициентов) для фильтра FIR, представляющего импульсный отклик, и/или количество битов, используемое для каждого отвода. Для представления в частотной области указание представления может, например, указывать количество частотных интервалов, для которых обеспечивается коэффициент, являются ли полосы частот линейны или, например, они являются полосами частот Барка, и т.д.
Обработка аудиосигнала может быть обработкой стереофонического воспроизведения виртуального положения на основании параметров стереофонической передаточной функции с учетом положения головы, восстановленной из выбранного набора данных стереофонического воспроизведения.
В соответствии с признаком настоящего изобретения при необходимости по меньшей мере один из наборов данных стереофонического воспроизведения содержит данные стереофонической передаточной функции с учетом положения головы для множества положений.
В некоторых вариантах осуществления каждый набор данных стереофонического воспроизведения может, например, определять полный набор стереофонических передаточных функций с учетом положения головы для двух- или трехмерного пространства воспроизведения источника звука. Указание представления, которое является общим для всех положений, может обеспечить эффективное представление и передачу.
В соответствии с признаком настоящего изобретения при необходимости указания представления дополнительно представляют упорядоченную последовательность набора данных стереофонического воспроизведения, упорядоченную с точки зрения по меньшей мере одного из качества и сложности стереофонического воспроизведения, представленного наборами данных стереофонического воспроизведения, и селектор выполнен с возможностью выбора выбранного набора данных стереофонического воспроизведения в ответ на положение выбранного набора данных стереофонического воспроизведения в упорядоченной последовательности.
Это может обеспечить особенно выгодную работу во многих вариантах осуществления. В частности, это может облегчить и/или улучшить процесс выбора выбранного набора данных стереофонического воспроизведения, поскольку это может быть сделано с учетом порядка указаний представления.
В некоторых вариантах осуществления порядок указаний представления представляется положениями указаний представления в потоке битов.
Это может облегчить процесс выбора. Например, указания представления могут быть оценены в соответствии с порядком, в котором они расположены в потоке битов входных данных, и набор данных выбранного подходящего указания представления может быть выбран без какого-либо рассмотрения дополнительных указаний представления. Если указания представления расположены в порядке уменьшения предпочтения (в соответствии с любым подходящим параметром), то это приведет к выбору указания предпочтительного представления и таким образом набора данных стереофонического воспроизведения.
В некоторых вариантах осуществления порядок указаний представления представляется указанием, содержащимся во входных данных. Это указание для каждого из указаний представления может содержаться в указании представления. Это указание может быть, например, указанием приоритета.
Это может облегчить процесс выбора. Например, приоритет может быть обеспечен как первые два бита каждого указания представления. Устройство может сначала просканировать поток битов для поиска максимально возможного приоритета, и может из этих указаний представления оценить, соответствуют ли они возможностям устройства. Если это так, то выбираются одно из указаний представления и соответствующий набор данных стереофонического воспроизведения. В противном случае устройство может продолжить сканировать поток битов для поиска второго максимально возможного приоритета, а затем выполнить ту же самую оценку для этих указаний представления. Этот процесс может продолжаться до тех пор, пока не будет идентифицирован подходящий набор данных стереофонического воспроизведения.
В некоторых вариантах осуществления наборы данных/указания представления могут быть упорядочены в порядке качества стереофонического воспроизведения, представленного параметрами связанного/соединенного набора данных стереофонического воспроизведения.
Этот порядок может соответствовать увеличению или уменьшению качества в зависимости от конкретных вариантов осуществления, предпочтений и приложений.
Это может обеспечить особенно эффективную систему. Например, устройство может просто обрабатывать указания представления в заданном порядке до тех пор, пока не встретится указание представления, указывающее представление набора данных стереофонического воспроизведения, которое соответствует возможностям устройства. Устройство может затем выбрать это указание представления и соответствующий набор данных стереофонического воспроизведения, поскольку это обеспечит наивысшее качество воспроизведения, возможное для конкретных данных и возможностей устройства.
В некоторых вариантах осуществления наборы данных/указания представления могут быть упорядочены в порядке сложности стереофонического воспроизведения, представленного параметрами набора данных стереофонического воспроизведения.
Этот порядок может соответствовать увеличению или уменьшению сложности в зависимости от конкретных вариантов осуществления, предпочтений и приложений.
Это может обеспечить особенно эффективную систему. Например, устройство может просто обрабатывать указания представления в заданном порядке до тех пор, пока не встретится указание представления, указывающее представление набора данных стереофонического воспроизведения, которое соответствует возможностям устройства. Устройство может затем выбрать это указание представления и соответствующий набор данных стереофонического воспроизведения, поскольку это обеспечит наименьшую сложность воспроизведения, возможную для конкретных данных и возможностей устройства.
В некоторых вариантах осуществления наборы данных/указания представления могут быть упорядочены в порядке комбинированной характеристики стереофонического воспроизведения, представленного параметрами набора данных стереофонического воспроизведения. Например, величина затрат может быть выражена как комбинация меры качества и меры сложности для каждого набора данных стереофонического воспроизведения, и указания представления могут быть упорядочены в соответствии с этой величиной затрат.
В соответствии с одним признаком настоящего изобретения при необходимости предусмотрен селектор для выбора выбранного набора данных стереофонического воспроизведения как набора данных стереофонического воспроизведения для первого указания представления в упорядоченной последовательности, который указывает обработку воспроизведения, которую может осуществить аудиопроцессор.
Это может уменьшить сложность и/или облегчить выбор.
В соответствии с одним признаком настоящего изобретения при необходимости настоящего изобретения указания представления включают в себя указание типа фильтра с учетом положения головы, представленного набором данных стереофонического воспроизведения.
В частности, указание представления для данного набора данных стереофонического воспроизведения может содержать указание, например, HRTF, BRTF, HRIR или BRIR, представленных набором данных стереофонического воспроизведения.
В соответствии с одним признаком настоящего изобретения при необходимости по меньшей мере некоторые из множества наборов данных стереофонического воспроизведения включают в себя по меньшей мере одну стереофоническую передаточную функцию с учетом положения головы, описываемую представлением, выбранным из группы, состоящей из: представления в виде импульсного отклика во временной области; представления передаточной функции фильтра в частотной области; параметрического представления; и представления фильтра в области поддиапазонов.
Это может обеспечить особенно выгодную систему во многих сценариях.
В некоторых вариантах осуществления значение указания представления является значением из набора вариантов. Входные данные могут содержать по меньшей мере два указания представления с различными значениями из набора вариантов. Эти варианты могут, например, включать в себя одно или более из: представления в виде импульсного отклика во временной области; представления передаточной функции фильтра в частотной области; параметрического представления; представления фильтра в области поддиапазонов и представления фильтра FIR.
В соответствии с одним признаком настоящего изобретения при необходимости по меньшей мере некоторые представления для наборов данных стереофонического воспроизведения соответствуют различным алгоритмам обработки стереофонических аудиосигналов, и выбор выбранного набора данных стереофонического воспроизведения зависит от алгоритма стереофонической обработки, используемого аудиопроцессором.
Это может обеспечить особенно эффективную работу во многих вариантах осуществления. Например, устройство может быть запрограммировано так, чтобы выполнять конкретный алгоритм воспроизведения на основе фильтров HRTF. В этом случае указания представления могут быть оценены для идентификации тех наборов данных стереофонического воспроизведения, которые включают в себя подходящие данные HRTF.
Аудиопроцессор выполнен с возможностью адаптации обработки аудиосигнала в зависимости от представления, используемого выбранным набором данных стереофонического воспроизведения. Например, количество коэффициентов в адаптируемом фильтре FIR, используемом для обработки HRTF, может быть адаптировано на основании указания количества коэффициентов, обеспечиваемых выбранным набором данных стереофонического воспроизведения.
В соответствии с одним признаком настоящего изобретения при необходимости по меньшей мере некоторые наборы данных стереофонического воспроизведения содержат реверберационные данные, и аудиопроцессор выполнен с возможностью адаптации обработки реверберации в зависимости от реверберационных данных выбранного набора данных стереофонического воспроизведения.
Это может обеспечить особенно выгодный стереофонический звук, и может обеспечить пользователю улучшенные переживания и восприятие звуковой сцены.
В соответствии с одним признаком настоящего изобретения при необходимости аудиопроцессор выполнен с возможностью выполнения обработки стереофонического воспроизведения, которая включает в себя формирование обработанного аудиосигнала как комбинации по меньшей мере сигнала, отфильтрованного стереофонической передаточной функцией с учетом положения головы, и реверберационного сигнала, причем реверберационный сигнал зависит от данных выбранного набора данных стереофонического воспроизведения.
Это может обеспечить особенно эффективную реализацию, и может обеспечить очень гибкую и адаптируемую обработку и предоставление данных обработки стереофонического воспроизведения.
Во многих вариантах осуществления сигнал, отфильтрованный стереофонической передаточной функцией с учетом положения головы, не зависит от данных выбранного набора данных стереофонического воспроизведения. На самом деле во многих вариантах осуществления входные данные могут включать в себя данные фильтра стереофонической передаточной функции с учетом положения головы, который является общим для множества наборов данных стереофонического воспроизведения, но с реверберационными данными, которые являются индивидуальными для отдельного набора данных стереофонического воспроизведения.
В соответствии с одним признаком настоящего изобретения при необходимости селектор выполнен с возможностью выбора выбранного набора данных стереофонического воспроизведения в ответ на указания представлений реверберационных данных, как обозначено указаниями представления.
Это может обеспечить особенно выгодный подход. В некоторых вариантах осуществления селектор может быть выполнен с возможностью выбора выбранного набора данных стереофонического воспроизведения в ответ на указания представлений реверберационных данных, обозначенные указаниями представления, но не в ответ на указания представлений фильтров стереофонической передаточной функции с учетом положения головы, обозначенных указаниями представления.
В соответствии с одним аспектом настоящего изобретения предложено устройство для формирования потока битов, причем устройство содержит: стереофоническую схему для обеспечения множества наборов данных стереофонического воспроизведения, причем каждый набор данных стереофонического воспроизведения содержит данные, представляющие параметры для обработки стереофонического воспроизведения виртуального положения, схему представления для обеспечения для каждого из наборов данных стереофонического воспроизведения указания представления, указывающего на представление набора данных стереофонического воспроизведения; и выходную схему для формирования потока битов, содержащего наборы данных стереофонического воспроизведения и указания представления.
Настоящее изобретение может обеспечить улучшенное и/или более гибкое и/или менее сложное формирование потока битов, обеспечивающего информацию о воспроизведении виртуального положения. Данный подход может в частности обеспечить гибкий