Устройство и способ для позиционирования микрофона, основываясь на пространственной плотности мощности

Иллюстрации

Показать все

Изобретение относится к обработке аудиосигналов. Заявлены устройство для позиционирования микрофона, устройство для генерации виртуального выходного сигнала, способ позиционирования микрофона, считываемый компьютером носитель для воплощения способа. Заявленное устройство для позиционирования микрофона содержит средство определения пространственной плотности мощности и средство оценки пространственной информации для оценки позиции микрофона, основываясь на пространственной плотности мощности, причем средство оценки пространственной информации содержит средство оценки центра звуковой сцены, причем средство оценки пространственной информации дополнительно содержит средство расчета позиции микрофона, в котором средство оценки пространственной информации содержит средство определения ориентации для определения ориентации микрофона, причем средство определения ориентации выполнено с возможностью определения ориентации микрофона, основываясь на пространственной плотности мощности. Техническим результатом является обеспечение более точного позиционирования микрофона. 4 н. и 7 з.п. ф-лы, 34 ил.

Реферат

Настоящее изобретение относится к обработке аудиосигналов и, в частности, к устройству и способу для автоматического позиционирования микрофона.

Обработка аудиосигналов становится более важной. В частности, запись пространственного звука используется во множестве применений. Целью записи пространственного звука является фиксация звукового поля с помощью множества микрофонов таким образом, чтобы на стороне воспроизведения слушатель воспринимал звуковое изображение таким, каким оно было в месте записи.

Стандартные подходы для записи пространственного звука обычно вовлекают разнесенные, всенаправленные микрофоны (например, для AB-стереофонии), совпадающие направленные микрофоны (например, в стереофонии интенсивного звучания) или более сложные микрофоны, такие как микрофон B-формата, например, в Ambisonics, см., например,

(1) Michael A. Gerzon. Ambisonics in multichannel broadcasting and video. J. Audio Eng. Soc, 33(11):859-871, 1985.

Пространственный микрофон, например направленные микрофоны, массивы микрофонов и т. д., способен записывать пространственный звук. Термин «пространственный микрофон» относится к любому устройству для направленно-выборочного получения пространственного звука (например, направленные микрофоны, массивы микрофонов и т. д.).

Для воспроизведения звука существующие непараметрические подходы извлекают необходимые аудиосигналы воспроизведения непосредственно из записанных сигналов микрофона. Главным недостатком этих подходов является то, что записанное пространственное изображение всегда связано с используемым пространственным микрофоном.

Во многих применениях невозможно или недопустимо размещать пространственный микрофон в необходимой позиции, которая, например, может быть позицией близко к одному или большему количеству источников звука. В этом случае было бы более выгодно разместить множество пространственных микрофонов еще дальше от активных источников звука и все равно иметь возможность зафиксировать звуковую сцену, как необходимо.

В некоторых применениях используют два или более реальных пространственных микрофона. Следует отметить, что термин «реальный пространственный микрофон» относится к микрофону необходимого типа или к комбинации микрофонов (например, направленный микрофон, пара направленных микрофонов, которые используются в обычных стереомикрофонах, а также и массив микрофонов), которые физически существуют.

Для каждого реального пространственного микрофона направление прибытия (DOA) может оцениваться в частотно-временной области. Используя информацию, собранную с помощью реальных пространственных микрофонов, вместе со знанием их относительной позиции, можно вычислять выходные сигналы **** пространственного микрофона, фактически размещенного в произвольной позиции (по желанию) в окружающей среде. Этот пространственный микрофон в последующем упоминается «как виртуальный пространственный микрофон».

В таких применениях позицию и ориентацию одного или более виртуальных микрофонов необходимо вводить вручную. Однако было бы высоко оценено, если бы оптимальная позиция и/или ориентация одного или более виртуальных микрофонов определялась автоматически.

Было бы предпочтительно, если бы были доступны устройство и способ для определения, где разместить виртуальный микрофон, где разместить физический микрофон или определить оптимальную позицию прослушивания. Кроме того, было бы предпочтительно определить, как разместить микрофон в оптимальной ориентации. Термины «позиционирование микрофона» и «информация позиционирования» относятся к тому, как определять подходящую позицию микрофона или слушателя, а так же, как определять подходящую ориентацию микрофона или слушателя.

Целью настоящего изобретения является обеспечение улучшенных концепций для позиционирования микрофона. Цель настоящего изобретения достигается с помощью устройства по п. 1, способа по п. 10 и компьютерной программы по п. 11.

Обеспечено устройство для определения оптимальной позиции микрофона или прослушивания. Устройство содержит средство определения пространственной плотности мощности и средство оценки пространственной информации. Средство определения пространственной плотности мощности выполнено с возможностью определения пространственной плотности мощности, указывающей значения мощности для множества местоположений в окружающей среде, основываясь на информации источника звука, которая указывает одно или более значений мощности и одно или более значений позиции одного или более источников звука, расположенных в окружающей среде. Средство оценки пространственной информации выполнено с возможностью оценки акустической пространственной информации, основываясь на пространственной плотности мощности.

В последующем термин «виртуальный микрофон» относится в общем случае к микрофону любого типа. В частности, термин «виртуальный микрофон» относится и к виртуальным пространственным, и к непространственным микрофонам, а также к физически существующим пространственным или непространственным микрофонам, для которых должна определяться информация позиционирования.

Средство оценки пространственной информации выполнено с возможностью определения оптимальной позиции виртуального микрофона или оптимальной ориентации виртуального микрофона в окружающей среде, основываясь на пространственной плотности мощности, определенной с помощью средства определения пространственной плотности мощности. Пространственная плотность мощности определяется с помощью средства определения пространственной плотности мощности, основываясь на значениях мощности источников звука и соответствующей информации позиции.

Обеспечен автоматический способ определения оптимальной позиции и/или ориентации одного или более микрофонов дляописания звуковой сцены, например, одного или более виртуальных микрофонов.

В некоторых вариантах осуществления средство определения пространственной плотности мощности может настраиваться для использования дополнительной информации, предоставленной показателем значимости, который, например, представляет критерий надежности для оценки позиций ESS.

Например, в некоторых вариантах осуществления рассеяние Psi звука может использоваться в качестве показателя значимости. Выражение (1-Psi) можно затем просто умножать на значения мощности источника, вычисляя пространственную плотность мощности, так что рассеянный звук будет иметь вклад меньше, чем прямой звук, при определении пространственной плотности мощности.

Важным преимуществом предложенных концепций является то, что они могут применяться независимо от условий в комнате и не запрашивают никакой предварительной информации, относящейся к количеству или позиции собеседников и/или физических источников звука. С помощью этого система является самодостаточной и может настраиваться для любого вида сценария, используя только анализ звука. Согласно уровню техники, предварительная информация должна быть доступной для определения оптимальной позиции и/или ориентации одного или более микрофонов. Это или ограничивает применение, или, если оценка должна быть сделана, ограничивает точность. Используя описанные выше варианты осуществления, это не является необходимым. Позиция виртуального микрофона (или множества виртуальных микрофонов) вычисляется с помощью выполнения «полуслепого» анализа сцены и затем изменения его согласно требованиям целевого применения.

В отличие от других способов для оценки оптимальной позиции и/или ориентации виртуальных микрофонов, предложенный способ не запрашивает информации о рассматриваемой геометрической сцене. Например, нет никакой потребности ни в предварительной информации о количестве активных источников звука (например, о количестве участников конференции), ни в какой-либо информации об относительных позициях активных источников звука (например, о расположении участников в зале заседаний). Информация о звуке получается только из свойств описывающих звуковую сцену активных источников звука, которые упоминаются как «эффективные источники звука» (ESS). ESS моделирует пространственную звуковую сцену, в которой один или более ESS активны в определенный момент времени или в определенном частотно-временном элементе. В последующем термин «физический источник» используется для описания реального источника звуковой сцены, например собеседника, тогда как термин «эффективный источник звука» (ESS) (также называют «источник звука») используется для описания звукового события, которое активно в один момент времени или частотно-временной элемент. Каждый ESS характеризуется позицией и мощностью. Эта информация предоставляет возможность создать пространственную плотность мощности, например, пространственную плотность мощности, которая предоставляет возможность определять оптимальную позицию или ориентацию виртуального микрофона.

Параметры ESS могут быть получены, например, используя концепции, объясненные ниже для устройства для генерации выходного аудиосигнала виртуального микрофона в конфигурируемой виртуальной позиции. Оценка позиции звуковых событий объясняется ниже для устройства для генерации выходного аудиосигнала виртуального микрофона, в частности объясняется со ссылкой на фиг. 15-17. Описанные концепции могут использоваться для определения позиции эффективного источника звука. Компенсация распространения объясняется ниже для устройства для генерации выходного аудиосигнала виртуального микрофона, в частности объясняется со ссылкой на фиг. 17-20. Описанные концепции могут использоваться для определения мощности эффективного источника звука.

Согласно варианту осуществления средство оценки пространственной информации может содержать средство оценки центра звуковой сцены для оценки позиции центра звуковой сцены в окружающей среде. Средство оценки пространственной информации может кроме того содержать средство расчета позиции микрофона для расчета позиции микрофона в качестве акустической пространственной информации, основываясь на позиции центра звуковой сцены.

В другом варианте осуществления средство расчета позиции микрофона может настраиваться для расчета позиции микрофона, причем микрофон является виртуальным микрофоном.

Кроме того, согласно другому варианту осуществления средство оценки центра звуковой сцены может настраиваться для расчета центра масс пространственной плотности мощности для оценки центра звуковой сцены.

В добавочном варианте осуществления средство оценки центра звуковой сцены может конфигурироваться для определения профиля задержки мощности, основываясь на пространственной плотности мощности, и определения среднеквадратичной задержки, основываясь на профиле задержки мощности для каждого из множества местоположений в окружающей среде. Средство оценки центра звуковой сцены может конфигурироваться для определения позиции местоположения из множества местоположений в качестве центра звуковой сцены, которая имеет минимальную среднеквадратичную задержку из среднеквадратичных задержек множества местоположений.

В другом варианте осуществления средство оценки центра звуковой сцены может настраиваться для осуществления круговой интеграции для оценки центра звуковой сцены, причем средство оценки центра звуковой сцены может настраиваться для осуществления круговой интеграции с помощью свертки пространственной плотности мощности с кругом, например, с помощью применения формулы

в которой Г(x, y) - пространственная плотность мощности, и в которой C(r,о)(x, y) указывает круг для определения значения круговой интеграции для каждого из множества местоположений окружающей среды, когда окружающая среда является двумерной окружающей средой.

Альтернативно средство оценки центра звуковой сцены может настраиваться для осуществления круговой интеграции с помощью свертки пространственной плотности мощности со сферой, например, с помощью применения формулы

в которой Г(x, y, z) является пространственной плотностью мощности, и в которой C(r,о)(x, y, z) указывает сферу для определения значения круговой интеграции для каждого из множества местоположений окружающей среды, когда окружающая среда является трехмерной окружающей средой.

Кроме того, согласно варианту осуществления средство оценки центра звуковой сцены может настраиваться для определения максимального значения круговой интеграции для каждого из множества местоположений окружающей среды для оценки центра звуковой сцены.

В добавочном варианте осуществления средство расчета позиции микрофона может настраиваться для определения линии с самым широким интервалом из множества линий через центр звуковой сцены в окружающей среде. Каждая из множества линий через центр звуковой сцены может иметь интервал энергии, причем линия с самым широким интервалом может быть линией из множества линий через центр звуковой сцены, которая имеет наибольший интервал энергии.

Согласно варианту осуществления интервал энергии рассматриваемой линии из множества линий может указывать наибольшую длину сегмента на рассматриваемой линии так, чтобы первая точка сегмента, ограничивающая сегмент, и так, чтобы другая вторая точка сегмента, ограничивающая сегмент, обе имели значения мощности, указанные с помощью пространственной плотности мощности, которые могут быть больше или равны предопределенному значению мощности. Средство расчета позиции микрофона может настраиваться для определения позиции микрофона таким образом, что вторая линия, которая проходит через центр звуковой сцены и позицию микрофона, может быть ортогональной к линии с самым широким интервалом.

В варианте осуществления средство расчета позиции микрофона может конфигурироваться для применения сингулярного разложения к матрице, имеющей множество столбцов. Столбцы матрицы могут указывать позиции местоположений в окружающей среде относительно центра звуковой сцены. Кроме того, столбцы матрицы могут указывать только позиции местоположений, имеющие значения мощности, указываемые с помощью пространственной плотности мощности, которые больше предопределенного порогового значения, или столбцы матрицы могут указывать только позиции местоположений, имеющие значения мощности, указываемые с помощью пространственной плотности мощности, которые больше или равны предопределенному пороговому значению.

Согласно другому варианту осуществления средство оценки пространственной информации может содержать средство определения ориентации для определения ориентации микрофона, основываясь на пространственной плотности мощности. Средство определения ориентации может настраиваться для определения ориентации микрофона таким образом, чтобы микрофон был ориентирован к центру звуковой сцены. Средство определения ориентации может конфигурироваться для определения значения f(φ) интеграции для каждого из множества направлений φ с помощью применения формулы

при этом rmax задает максимальное расстояние от микрофона, и при этом средство определения ориентации выполнено с возможностью определения ориентации микрофона, основываясь на определенном значении f(φ) интеграции.

В другом варианте осуществления средство определения пространственной плотности мощности может настраиваться для определения пространственной плотности мощности для множества местоположений окружающей среды для частотно-временного элемента (k, n) с помощью применения формулы

когда окружающая среда является двумерной окружающей средой,

или с помощью применения формулы

когда окружающая среда является трехмерной окружающей средой,

причем k обозначает индекс частоты, и n обозначает индекс времени, причем x, y, z обозначает координаты одного из множества местоположений, причем poweri(k, n) обозначает значение мощности в i-м источнике звука для частотно-временного элемента (k, n), причем xESSi, yESSi, zESSi обозначают координаты i-го источника звука, причем γi является скалярным значением, которое может представлять индикатор того, насколько надежны оценки позиции каждого эффективного источника звука, и причем g является функцией, зависящей от x, y, z, xESSi yESSi, zESSi, k, n и γi.

Варианты осуществления настоящего изобретения объясняются со ссылкой на сопроводительные чертежи, на которых:

фиг. 1 показывает устройство для позиционирования микрофона согласно варианту осуществления,

фиг. 2 изображает устройство для позиционирования микрофона согласно другому варианту осуществления,

фиг. 3 показывает входы и выходы устройства для позиционирования микрофона согласно варианту осуществления,

фиг. 4a-4c показывают множество сценариев применения устройства для позиционирования микрофона,

фиг. 5 изображает средство 21 определения пространственной плотности мощности согласно варианту осуществления,

фиг. 6a показывает дельта-функции для создания функции g,

фиг. 6b изображает функции плотности для создания функции g,

фиг. 7 показывает средство оценки пространственной информации согласно варианту осуществления,

фиг. 8 показывает средство оценки пространственной информации согласно добавочному варианту осуществления,

фиг. 9 показывает средство 44 расчета позиции/ориентации микрофона согласно другому варианту осуществления, изображающему больше подробностей,

фиг. 10a-10c изображают оптимизацию, основанную на интервале спроецированной энергии согласно варианту осуществления,

фиг. 11 показывает средство оценки пространственной информации согласно другому варианту осуществления, причем средство оценки пространственной информации кроме того содержит средство определения ориентации,

фиг. 12 показывает устройство для генерации выходного аудиосигнала согласно варианту осуществления,

фиг. 13 показывает входы и выходы устройства и способа для генерации выходного аудиосигнала согласно варианту осуществления,

фиг. 14 показывает основную структуру устройства для генерации выходного аудиосигнала согласно варианту осуществления, которое содержит средство оценки позиции звуковых событий и модуль вычисления информации,

фиг. 15 показывает примерный сценарий, в котором реальные пространственные микрофоны изображены как однородные линейные массивы из 3 микрофонов каждый,

фиг. 16 изображает два пространственных микрофона в 3D для оценки направления прибытия в 3D пространстве,

фиг. 17 показывает геометрию, где изотропный точечный источник звука текущего частотно-временного элемента (k, n) расположен в позиции pIPLS(r,n),

фиг. 18 изображает модуль вычисления информации согласно варианту осуществления,

фиг. 19 изображает модуль вычисления информации согласно другому варианту осуществления,

фиг. 20 показывает два реальных пространственных микрофона, звуковое событие, для которого определено местоположение, и позицию виртуального пространственного микрофона,

фиг. 21 показывает, как получить направление прибытия относительно виртуального микрофона согласно варианту осуществления,

фиг. 22 изображает возможный способ получения DOA звука с точки зрения виртуального микрофона согласно варианту осуществления,

фиг. 23 показывает средство вычисления информации, содержащее средство вычисления рассеяния согласно варианту осуществления,

фиг. 24 изображает средство вычисления рассеяния согласно варианту осуществления,

фиг. 25 показывает сценарий, в котором оценка позиции звуковых событий невозможна,

фиг. 26 показывает два реальных пространственных микрофона, звуковое событие, для которого определено местоположение, и позицию виртуального микрофона, и

фиг. 27a-27c показывают сценарии, в которых два массива микрофонов принимают прямой звук, отраженный стенкой звук и рассеянный звук.

Фиг. 1 показывает устройство для позиционирования микрофона согласно варианту осуществления. Устройство содержит средство 10 определения пространственной плотности мощности и средство 20 оценки пространственной информации. Средство 10 определения пространственной плотности мощности выполнено с возможностью определения пространственной плотности spd мощности, которая указывает значения мощности для множества местоположений в окружающей среде, основываясь на информации ssi источника звука, которая указывает одно или более значений мощности и одно или более значений позиции одного или более эффективных источников звука (EES), расположенных в окружающей среде. Средство 20 оценки пространственной информации выполнено с возможностью оценки акустической пространственной информации aspi, основываясь на пространственной плотности мощности.

Фиг. 2 показывает устройство для позиционирования микрофона согласно другому варианту осуществления. Устройство содержит средство 21 определения пространственной плотности мощности для определения пространственной плотности мощности (SPD), также называют пространственным распределением мощности, которая указывает значения мощности для множества местоположений окружающей среды, основываясь на информации эффективного источника звука, которая указывает одно или более основных значений и значений позиции одного или более эффективных источников звука, распределенных в окружающей среде. Устройство кроме того содержит средство 22 оценки пространственной информации для оценки позиции и/или ориентации виртуального микрофона (VM), основываясь на пространственной плотности мощности.

Фиг. 3 показывает входы и выходы устройства для позиционирования микрофона согласно варианту осуществления. Входы 91, 92, …, 9N на устройство содержат мощность, например, абсолютное значение возведенного в квадрат давления звукового поля, и позицию, например, 2D или 3D декартовы координаты. Эффективные источники звука (ESS) описывают звуковую сцену (звуковое поле).

Эффективные источники звука могут, например, быть равны мгновенным точечным источникам звука (IPLS), как описано ниже для устройства для генерации выходного аудиосигнала виртуального микрофона в конфигурируемой виртуальной позиции.

На выходе возвращаются позиция и местоположение одного или более виртуальных микрофонов. В последующем термин «физический источник» используется для описания реального источника звуковой сцены, например собеседника, тогда как термин «эффективный источник звука» (ESS) (также называют «источник звука») используется для описания звукового события, которое активно в один временной или частотно-временной элемент, как также используется для IPLS, описанного ниже относительно устройства для генерации выходного аудиосигнала виртуального микрофона в конфигурируемой виртуальной позиции.

Кроме того, следует отметить, что термин «источник звука» охватывает и физический источник, и эффективный источник звука.

Входы устройства согласно варианту осуществления на фиг. 2, 91, 92, …, 9N содержат информацию относительно позиции и соответствующей мощности множества N эффективных источников звука, для которого определено местоположение в пределах момента времени или частотно-временного элемента, как описано ниже для устройства для генерации выходного аудиосигнала виртуального микрофона в конфигурируемой виртуальной позиции и как также описано в

(20) Giovanni Del Galdo, Oliver Thiergart, TobiasWeller, and E. A. P. Habets. Generating virtual microphone signals using geometrical information gathered by distributed arrays. In Third Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA 11), Edinburgh, United Kingdom, May 2011.

Например, эта информация может содержаться на выходе 106 на фиг. 14 модуля вычисления информации устройства для генерации выходного аудиосигнала виртуального микрофона в конфигурируемой виртуальной позиции, который рассматривают ниже, для 1, 2, N различных элементов частоты, когда применяется сокращенное преобразование Фурье (STFT).

Относительно устройства для позиционирования микрофона различные рабочие режимы могут быть активными во время определенного интервала времени, каждый подразумевает различный сценарий для позиционирования и ориентирования одного или более виртуальных микрофонов. Устройство для позиционирования микрофона может использоваться для множества сценариев применения:

В первом сценарии применения N всенаправленных виртуальных микрофонов могут размещаться в звуковой сцене (см. фиг. 4a). Таким образом, в этом сценарии применения множество виртуальных микрофонов охватывает всю звуковую сцену.

Во втором сценарии применения один виртуальный микрофон позиционируется в акустическом центре звуковой сцены. Например, всенаправленные виртуальные микрофоны, кардиоидные виртуальные микрофоны или виртуальный пространственный микрофон (такой как микрофон B-формата) размещаются таким образом, что все участники фиксируются оптимально (фиг. 4b).

В третьем сценарии применения один пространственный микрофон размещен «вне» звуковой сцены. Например, виртуальный стереомикрофон размещают таким образом, что получается широкое пространственное изображение, как показывается на фиг. 4c.

В четвертом сценарии применения оценивается оптимальная ориентация виртуального микрофона, в то время как виртуальный микрофон расположен в фиксированной позиции (предопределенной позиции), например, позиция и направленность виртуального микрофона могут предварительно определяться, и только ориентация рассчитывается автоматически.

Нужно отметить, что все вышеупомянутые применения могут включать в себя возможность настройки во временной области. Например, позиция/ориентация виртуального высоконаправленного микрофона следует за одним из собеседников, когда данный собеседник перемещается в комнате.

На фиг. 2 и 3 дополнительная информация предоставлена с помощью показателя 13 значимости, который, например, представляет критерий надежности для оценки позиций ESS. Например, такой показатель может быть получен из средств оценки отклонений направления прибытия (используя два или более массивов микрофонов, которые объяснены), как объяснено ниже для устройства для генерации выходного аудиосигнала виртуального микрофона в конфигурируемой виртуальной позиции, или из параметра рассеяния, вычисляемого как в

(21) Ville Pulkki. Spatial sound reproduction with directional audio coding. J. Audio Eng. Soc, 55(6):503-516, June 2007.

Данный показатель может выражаться или по отношению ко всем входам 91, …, 9N (например, постоянное значение показателя для всех входов может использоваться), или может определяться по-разному для каждого входа 91, …, 9N. Выходы 15, 16 устройства на фиг. 2 могут содержать позицию и/или ориентацию одного или более виртуальных микрофонов. В зависимости от применения могут генерироваться выходы (позиции и ориентации) для множества виртуальных микрофонов, каждый соответствует определенному виртуальному микрофону.

Фиг. 5 показывает средство 21 определения пространственной плотности мощности согласно варианту осуществления. Средство определения пространственной плотности мощности содержит основной процессор 31 пространственной плотности мощности и постпроцессор 32 пространственной плотности мощности. Средство 21 определения пространственной плотности мощности выполнено с возможностью определения (или скорее вычисления) измененной пространственной плотности мощности (SPD), обозначенной в последующем Г(x, y, z, k, n), которая выражает мощность, сосредоточенную в определенной точке, например (x, y, z) в пространстве для каждого частотно-временного элемента (k, n). SPD генерируется с помощью интеграции значения мощности в позициях эффективных источников 91, …, 9N звука, которые вводят в средство 21 определения пространственной плотности мощности.

Вычисление SPD для частотно-временного элемента (k, n) может выполняться согласно формуле

в которой (x, y, z) представляют координаты системы и xESSi, yESSi, zESSi - координаты эффективного источника звука i. Показатель 103 γi значимости представляют индикатор того, насколько надежны оценки позиции каждого эффективного источника звука. По умолчанию показатель значимости может быть равен 1. Следует отметить, что мощность и координаты хESSi, yESSi и zESSi соответствуют входу 9i на фиг. 3. Кроме того, нужно отметить, что для простоты записи расширение (k, n) не будет записываться в последующем. Однако последующие формулы все еще зависят от конкретного рассматриваемого частотно-временного элемента (k, n).

SPD, сгенерированная с помощью основного процессора 31 пространственной плотности мощности (например, на фиг. 5), может добавочно обрабатываться с помощью основного процессора 32 пространственной плотности мощности (постобработка SPD и модуль временной интеграции) и интегрироваться во времени, например, используя авторегрессивный фильтр. Чтобы быть более устойчивым против резко выделяющихся значений звуковой сцены (то есть вызванных с помощью неправильной оценки позиции), любой вид постобрабатывающего фильтра может применяться к SPD. Такой постобрабатывающий фильтр может, например, быть фильтром нижних частот или морфологическим (сужения, расширения) фильтром.

Когда вычисляют позицию и/или ориентацию одного или более виртуальных микрофонов, может использоваться необязательный параметр, который зависит от SPD. Этот параметр может относиться, например, к запрещенным и/или предпочтительным областям комнаты, где разместить виртуальные микрофоны (VM), или может относиться к SPD, выбирая конкретные диапазоны SPD, которые удовлетворяют некоторым предопределенным правилам.

Как можно заметить в формуле (1), g - функция показателя значимости γ (или скорее γi) в пространстве, который по умолчанию имеет значение, равное 1. Иначе g может использоваться для учета различных вкладов. Например, если у2 является дисперсией оценки позиции, тогда, например, σ2 можно устанавливать в .

Альтернативно может использоваться среднее рассеяние ψ, вычисленное в массивах микрофонов, что приводит к γ=1-ψ.

Таким образом γ может выбираться так, что он уменьшается для более ненадежных оценок и увеличивается для более надежных.

Множество возможностей существует для создания функции g. Два примера, особенно полезных практически:

В первой функции δ(x), δ(y) и δ(z) указывают дельта-функции (см. фиг. 6a, иллюстрирующую дельта-функцию). Во второй функции s=[x y z]T, µ=[µx µy µz]T - средний вектор, и ∑γ - матрица ковариации функции g Гауссова распределения (см. фиг. 6b, иллюстрирующую функции распределения). Матрица ковариации вычисляется с помощью использования следующей формулы:

которая зависит от выбора γ для сценария, где , имея в виду, что, например, для случая 1D:

Как можно заметить в формуле (3), функция g может описываться с помощью дистрибутивной функции вокруг позиций эффективного источника звука, заданных входами 91, …, 9N, где, например, показатель значимости является инверсией дисперсии Гауссова распределения. Если оценка позиции источника звука будет иметь высокую надежность, то соответствующее распределение будет скорее узким, тогда как более ненадежная оценка будет соответствовать высоким вариантам и будет поэтому широким распределением, см., например, фиг. 6b, показывающую 1D пример.

Фиг. 7 показывает средство 22 оценки пространственной информации согласно варианту осуществления. Средство оценки пространственной информации содержит средство 41 оценки центра звуковой сцены для оценки позиции центра звуковой сцены в окружающей среде. Кроме того, средство оценки пространственной информации содержит средство 42 расчета позиции микрофона для расчета позиции микрофона в качестве акустической пространственной информации, основываясь на позиции центра звуковой сцены.

Фиг. 8 показывает средство 22 оценки пространственной информации согласно добавочному варианту осуществления. Средство оценки пространственной информации содержит средство 44 расчета позиции виртуального микрофона, настроенное для расчета позиции виртуального микрофона и добавочно настроенное для определения ориентации виртуального микрофона. Средство 44 расчета позиции виртуального микрофона поэтому также упоминается как средство 44 расчета позиции/ориентации микрофона.

Средство 22 оценки пространственной информации на фиг. 8 использует в качестве входа ранее сгенерированную SPD 23. Оно возвращает в качестве выхода позицию 15 и ориентацию 16 одного или более виртуальных микрофонов в зависимости от целевого применения. Первый блок обработки, средство 41 оценки центра звуковой сцены, обеспечивает оценку центра звуковой сцены. Выход 43 блока 41, например, позиция центра звуковой сцены, затем обеспечивается в качестве входа ко второму блоку обработки, средству 44 расчета позиции/ориентации виртуального микрофона. Средство 44 расчета позиции/ориентации виртуального микрофона выполняет фактическую оценку окончательной позиции 15 и ориентации 16 одного или более виртуальных микрофонов в зависимости от целевого применения.

Средство 41 оценки центра звуковой сцены обеспечивает оценку центра звуковой сцены. Выход средства 41 оценки центра звуковой сцены затем обеспечивается в качестве входа на средство 44 расчета позиции/ориентации микрофона. Средство 44 расчета позиции/ориентации микрофона выполняет фактическую оценку окончательной позиции 15 и/или ориентации 16 одного или более виртуальных микрофонов согласно рабочему режиму, который характеризует целевое применение.

Варианты осуществления средства оценки центра звуковой сцены теперь объясняются более подробно. Для получения центра звуковой сцены существуют несколько возможных концепций.

Согласно первой концепции первого варианта осуществления центр звуковой сцены получают с помощью вычисления центра масс SPD Г(x, y, z). Значением Г(x, y, z) может быть s, интерпретируемое как существующая масса в точке (x, y, z) в пространстве.

Согласно второй концепции второго варианта осуществления должна быть найдена позиция в пространстве с минимальной дисперсией времени канала. Это достигается с помощью учета среднеквадратичного (RMS) разброса по задержке. Сначала для каждой точки в пространстве p=(x0, y0) вычисляется профиль задержки мощности (PDP) Ap(τ), основываясь на SPD Г(x, y, z), например, с помощью использования

где

Из Ap(τ) затем рассчитывается RMS задержки с помощью использования следующего уравнения:

где представляет среднюю задержку Ap(τ). Позиция, для которой средняя задержка TRMS,p является минимальной, будет представлять центр звуковой сцены.

Согласно третьей концепции третьего варианта осуществления, который может использоваться в качестве альтернативы для оценки центра звуковой сцены, предложена «круговая интеграция». Например, в 2D случае выполняется свертка SPD Г(x, y) с кругом C(r,o) согласно следующей формуле:

в которой r - радиус круга, и в которой o задает центр круга. Радиус r или может быть постоянным, или может изменяться в зависимости от значения мощности в точке (x, y). Например, высокая мощность в точке (x, y) может соответствовать большому радиусу, тогда как низкая мощность может соответствовать маленькому радиусу. Возможны также добавочные зависимости от мощности. Одним таким примеро