Устройство, система (варианты), способ получения информации о направлении и компьютерный программный продукт

Иллюстрации

Показать все

Изобретение относится к акустическим средствам определения информации о направлении. Устройство предназначено для получения информации о направлении от множества микрофонных сигналов, в которых различающиеся эффективные направления обзора микрофонов связаны с микрофонными сигналами. При этом устройство содержит блок объединения, выполненный с возможностью получения значения амплитуды микрофонного сигнала и комбинирования единиц информации о направлении, описывающих эффективные направления обзора микрофонов, при этом единица информации о направлении, описывающая данное эффективное направление обзора микрофона, взвешивается в зависимости от значения амплитуды микрофонного сигнала, связанного с данным эффективным направлением обзора микрофона, для получения информации о направлении. Единица информации о направлении, описывающая данное эффективное направление обзора микрофона, представляет собой вектор, указывающий в данном эффективном направлении обзора микрофона, а блок объединения предназначен для соответствующей линейной комбинации единиц информации о направлении, взвешенных в зависимости от значений амплитуд, соответствующих данной частотно-временной ячейке, и в котором единицы информации о направлении являются независимыми от частотно-временных ячеек. Микрофоны выполнены ненаправленными, а между микрофонами расположен затеняющий объект. Технический результат - эффективное определение направления. 5 н. и 14 з.п ф-лы, 21 ил.

Реферат

1. Область техники, к которой относится изобретение

Варианты осуществления настоящего изобретения относятся к устройству получения информации о направлении от множества микрофонных сигналов или от множества компонентов микрофонного сигнала. Дополнительные варианты осуществления относятся к системам, содержащим такое устройство. Дополнительные варианты осуществления относятся к способам получения информации о направлении от множества микрофонных сигналов.

2. Уровень техники

Целью записи объемного звучания является определение звукового поля при помощи нескольких микрофонов, при этом на стороне воспроизведения слушатель воспринимает звуковой образ так же, как он представлен в месте записи. Стандартные подходы при записи объемного звучания используют общепринятые стереомикрофоны или более сложные комбинации направленных микрофонов, как, например, микрофоны В-формата, использованные в Ambisonics (М.А. Gerzon. Periphony, Width-height sound reproduction, J. Audio Eng. Soc, 21(1):2-10, 1973). Как правило, большинство данных способов называется способом совмещенных микрофонов.

В качестве варианта могут применяться способы, базирующиеся на параметрическом представлении звуковых полей, которые

называются параметрическими пространственными аудиокодерами. Данные способы определяют один или более сигналов понижающего микширования вместе с соответствующей дополнительной пространственной информацией, которые важны для восприятия пространственного звука. Примерами являются Направленное аудиокодирование (DirAC), описанное в V. Pulkki, Spatial sound reproduction with directional audio coding, J. Audio Eng. Soc, 55(6):503-516, June 2007, или так называемый подход пространственных аудиомикрофонов (SAM), предложенный в работе C. Faller, Microphone front-ends for spatial audio coders. In 125th AES Convention, Paper 7508, San Francisco, Oct. 2008. Пространственная ключевая информация определяется в частотных поддиапазонах и в основном включает в себя направление прихода звука (DOA) и иногда разброс звукового поля или другие статистические показатели. На стадии синтеза требуемые сигналы для воспроизведения на акустических системах определяются на основе сигналов понижающего микширования и дополнительной параметрической информации.

В дополнение к пространственной аудиозаписи в таких приложениях, как направленная фильтрация, использовался параметрический подход к представлению звукового поля (M. Kallinger, H. Ochsenfeld, G. Del Galdo, F. Kuech, D. Mahne, R. Schultz-Amling, and O. Thiergart, A spatial filtering approach for directional audio coding, in 126th AES Convention, Paper 7653, Munich, Germany, May 2009) или локализация источников (O. Thiergart, R. Schultz-Amling, G. Del Galdo, D. Mahne, and F. Kuech, Localization of sound sources in reverberant environments based on directional audio coding parameters, in 128th AES Convention, Paper 7853, New York City, NY, USA, Oct. 2009). Эти способы также базируются на параметрах звукового поля, зависящих от направления, таких как DOA звука или разброс.

Один способ оценить информацию о направлении звукового поля, а именно направление прихода звука, заключается в измерении поля в различных точках с помощью микрофонной решетки. В литературе было предложено несколько подходов J. Chen, J. Benesty, and Y. Huang, Time delay estimation in room acoustic environments: An overview, in EURASIP Journal on Applied Signal Processing, Article ID 26503, 2006 с использованием оценок относительных времен задержек между микрофонными сигналами. Однако данные подходы используют фазовую информацию микрофонных сигналов, что неизбежно приводит к пространственному наложению. Действительно, по мере увеличения анализируемых частот длина волны становится короче. При частоте, которая называется частотой наложения (сворачивания), длина волны такова, что записи с идентичными фазами соответствуют двум или более направлениям, так что однозначная оценка становится невозможной (по меньшей мере, без дополнительной априорной информации).

Существует большое разнообразие способов оценить DOA звука, используя микрофонную решетку. Обзор общепринятых подходов приведен в работе J. Chen, J. Benesty, and Y. Huang, Time delay estimation in room acoustic environments: An overview, in EURASIP Journal on Applied Signal Processing, Article ID 26503, 2006. Эти подходы объединяет то, что они используют фазовое соотношение микрофонных сигналов для оценки DOA звука. Обычно для расчета соответствующего DOA звука сначала определяется разность времен приходов на различные микрофоны, а затем используется знание геометрии решетки. В других подходах, чтобы оценить DOA звука, оценивается корреляция между различающимися сигналами микрофонов в частотных поддиапазонах (C. Faller, Microphone front-ends for spatial audio coders, in 125th AES Convention, Paper 7508, San Francisco, Oct. 2008 and J. Chen, J. Benesty, and Y. Huang, Time delay estimation in room acoustic environments: An overview, in EURASIP Journal on Applied Signal Processing, Article ID 26503, 2006).

В DirAC оценка DOA для каждого частотного диапазона определяется на базе вектора интенсивности активного звука, измеренного в наблюдаемом звуковом поле. Ниже приведено краткое описание оценки параметров направленности в DirAC. Пусть P(k, n) обозначает звуковое давление и U(k, n) - это вектор скорости частиц с частотным индексом k и временным индексом n. Тогда вектор интенсивности активного звука рассчитывается как:

Верхняя * обозначает комплексное сопряжение, Re{}- это реальная часть комплексного числа, p0 - средняя плотность воздуха. Наконец, направление, противоположное вектору Ia(k, n), указывает на DOA звука:

Дополнительно разброс звукового поля может определяться, например, в соответствии с

На практике вектор скорости частиц рассчитывается по градиенту давления с помощью близко расположенных капсул ненаправленных микрофонов, обычно называемых дифференциальной микрофонной решеткой. В соответствии с фиг.2 x-компонента вектора скорости частиц может, например, рассчитываться с использованием пары микрофонов в соответствии с

где K(k) представляет собой частотно-зависимый нормировочный множитель. Его значение зависит от конфигурации микрофонов, например, расстояния между микрофонами и/или их диаграмм направленности. Остальные компоненты Uy(k, n) (и Uz(k, n)) вектора U(k, n)) могут определяться аналогичным образом, путем комбинации подходящих пар микрофонов.

Как показано в работе M. Kallinger, F. Kuech, R. Schultz-Amling, G. Del Galdo, J. Ahonen, and V. Pulkki, Analysis and Adjustment of Planar Microphone Arrays for Application in Directional Audio Coding, in 124th AES Convention, Paper 7374, Amsterdam, the Netherlands, May 2008, пространственное наложение влияет на фазовую информацию вектора скорости частиц, не позволяя использовать градиенты давления для оценки интенсивности активного звука на высоких частотах. Данное пространственное наложение приводит к неопределенности в оценке DOA. Можно показать, что максимальная частота fmax, для которой точные оценки DOA могут быть получены на базе интенсивности активного звука, определяется расстоянием между парой микрофонов. Дополнительно от этого зависит также оценка параметров направленности звукового поля, как, например, разброс. В случае ненаправленных микрофонов с расстоянием d данная максимальная частота дается выражением

где c обозначает скорость распространения звука.

Как правило, требуемый частотный диапазон для применений, использующий информацию о направлении звуковых полей, превышает значение граничной частоты fmax пространственного наложения, ожидаемое для микрофонной конструкции, применяемой на практике. Заметим, что уменьшение расстояния d между микрофонами, повышающее значение граничной частоты fmax пространственного наложения, не является приемлемым решением для большинства приложений, поскольку слишком малое d существенно снижает надежность оценки на низких частотах, используемых на практике. Таким образом, необходимы новые способы, чтобы преодолеть ограничения современных методик оценки параметров направленности на высоких частотах.

3. Раскрытие изобретения

Задачей вариантов осуществления настоящего изобретения является создание концепции, позволяющей улучшить определение информации о направлении при превышении величины граничной частоты пространственного наложения.

Данная задача решается с помощью устройство по п.1, систем по п.п.15 и 16 формулы изобретения, способу по п.18 формулы изобретения и компьютерной программы по п.19 формулы изобретения.

Варианты осуществления обеспечивают устройство получения информации о направлении от множества микрофонных сигналов или от множества компонентов микрофонного сигнала, в котором различающиеся эффективные направления обзора микрофонов связаны с микрофонными сигналами или компонентами сигнала. Устройство содержит блок объединения, выполненный с возможностью получения амплитуды микрофонного сигнала или компонентов микрофонного сигнала. Кроме того, чтобы получать информацию о направлении, блок объединения выполнен с возможностью комбинирования (например, путем линейной комбинации) единиц информации о направлении, описывающих эффективное направление обзора микрофона, причем единица информации о направлении, описывающая данное эффективное направление обзора микрофона, взвешивается в зависимости от значения амплитуды микрофонного сигнала или компонента микрофонного сигнала, связанного с данным эффективным направлением обзора микрофона.

Было установлено, что проблема пространственного наложения при оценке параметров направленности вытекает из неопределенности фазовой информации микрофонного сигнала. Идея вариантов осуществления настоящего изобретения заключается в том, чтобы решить данную задачу путем получения информации о направлении, основываясь на значениях амплитуд микрофонных сигналов. Было установлено, что при получении информации о направлении, основываясь на значениях амплитуд микрофонных сигналов или компонентов микрофонных сигналов, не возникают те неопределенности, которые могут возникать в традиционных системах, использующих фазовую информацию для определения информации о направлении. В связи с этим варианты осуществления позволяют определять информацию о направленности даже при превышении граничной частоты пространственного наложения, выше которой определение информации о направлении невозможно (или только с ошибками) при использовании фазовой информации.

Другими словами, использование значений амплитуд микрофонных сигналов или компонентов микрофонных сигналов является особенно предпочтительным в тех частотных диапазонах, в которых ожидаются пространственное наложение или другие фазовые искажения, в связи с тем, что такие фазовые искажения не оказывают влияния на значения амплитуд и, следовательно, не приводят к неопределенности в определении информации о направлении.

В соответствии с некоторыми вариантами осуществления, эффективное направление обзора микрофона, связанное с сигналом микрофона, описывает направление, откуда был получен сигнал и в котором микрофон имеет свой максимальный отклик (или свою наивысшую чувствительность). Примером микрофона может быть направленный микрофон, имеющий неизотропную диаграмму, а эффективное направление обзора микрофона можно определить как направление, в котором диаграмма приема (захвата) микрофона имеет свой максимум. В связи с этим для направленного микрофона эффективное направление обзора микрофона может быть равным направлению обзора микрофона (описывающему направление, вдоль которого направленный микрофон имеет максимум чувствительности), например, если вблизи микрофона отсутствуют объекты, меняющие диаграмму направленности приема. Эффективное направление обзора микрофона может отличаться от направления обзора микрофона направленного микрофона в случае, если направленный микрофон расположен вблизи объекта, изменяющего его диаграмму направленности приема. В этом случае эффективное направление обзора микрофона может описывать направление, в котором направленный микрофон имеет свой максимальный отклик.

В случае ненаправленных микрофонов эффективной диаграмме направленности ненаправленного микрофона можно придать форму, например, используя затеняющий объект (который имеет эффект воздействия, меняющий диаграмму приема микрофона), при этом сформированная эффективная диаграмма направленности отклика имеет эффективное направление обзора микрофона, являющееся направлением максимального отклика ненаправленного микрофона с эффективной диаграммой направленности отклика.

В соответствии с дополнительными вариантами осуществления, информация о направлении может быть информацией о направлении звукового поля, указывающей на направление, от которого распространяется звуковое поле (например, для определенных частотных и временных индексов). Множество микрофонных сигналов позволяет описывать звуковое поле. В соответствии некоторыми вариантами осуществления, единицей информации о направлении, описывающей данное эффективное направление обзора микрофона, может быть вектор, указывающий на данное эффективное направление обзора микрофона. В соответствии с дополнительными вариантами осуществления, единицами информации о направлении могут быть единичные векторы, причем единицы информации о направлении, соответствующие различающимся эффективным направлениям обзора микрофона, имеют равные нормы (но различающиеся направления). Следовательно, норма взвешенного вектора, полученного путем линейной комбинации с помощью блока объединения, определяется величиной амплитуды микрофонного сигнала или компонента микрофонного сигнала, соответствующей единице информации о направлении взвешенного вектора.

В соответствии с дополнительными вариантами осуществления, блок объединения может выполняться с возможностью получения значения амплитуды, при этом значение амплитуды описывает амплитуду спектрального коэффициента (как компонента микрофонного сигнала), представляющего спектральный поддиапазон микрофонного сигнала компонента микрофонного сигнала. Другими словами, варианты осуществления могут получать фактическую информацию о звуковом поле (например, проанализированную в частотно-временной области) из амплитуд спектров микрофонов, использующихся для получения микрофонных сигналов.

В соответствии с дополнительными вариантами осуществления, только значения амплитуд (или информация об амплитудах) микрофонных сигналов (или информация о спектрах) используются в процессе оценки получения информации о направлении, поскольку фазовый член искажается в результате эффекта пространственного наложения.

Другими словами, варианты осуществления создают устройство и способ оценки параметров направленности, используя только информацию об амплитудах сигналов или компонентов микрофонных сигналов и спектров микрофонных сигналов соответственно.

В соответствии с дополнительными вариантами осуществления, выходная оценка параметра направленности, базирующаяся на амплитуде (информации о направлении), может комбинироваться с другими способами, учитывающими также фазовую информацию.

В соответствии с дополнительными вариантами осуществления, значение амплитуды может описывать амплитуду микрофонного сигнала или компонента.

4. Краткое описание чертежей

Варианты осуществления настоящего изобретения подробно описаны с использованием сопровождающих фигур, на которых:

на фиг.1 приведена блок-схема устройства в соответствии с вариантом осуществления настоящего изобретения;

на фиг.2 показана микрофонная конструкция с использованием четырех ненаправленных датчиков, обеспечивающих сигналы звукового давления Pi(k, n), при i=1,..., 4;

на фиг.3 показана микрофонная конструкция с использованием четырех направленных микрофонов с кардиоидными приемными диаграммами направленности;

на фиг.4 показана микрофонная конструкция, использующая жесткий цилиндр, чтобы вызвать эффекты рассеяния и затенения;

на фиг.5 показана микрофонная конструкция, схожая с фиг.4, но использующая отличающееся расположение микрофонов;

на фиг.6 показана микрофонная конструкция, использующая жесткую полусферу, чтобы вызвать эффекты рассеяния и затенения;

на фиг.7 показана трехмерная микрофонная конструкция, использующая жесткую сферу, чтобы вызвать эффекты затенения;

на фиг.8 показана блок-схема последовательности операций способа в соответствии с вариантом осуществления;

на фиг.9 показана блок-схема системы в соответствии с вариантом осуществления;

на фиг.10 показана блок-схема системы в соответствии с дополнительным вариантом осуществления настоящего изобретения;

на фиг.11 показана решетка четырех ненаправленных микрофонов с расстоянием d между противоположными микрофонами;

на фиг.12 показана решетка четырех ненаправленных микрофонов, установленных на конце цилиндра;

на фиг.13 показана диаграмма индекса DI направленности в децибелах в виде функции от коэффициента ka, представляющего собой длину окружности диафрагмы ненаправленного микрофона, деленную на длину волны;

на фиг.14 показаны логарифмические диаграммы направленности с микрофоном G.R.A.S.;

на фиг.15 показаны логарифмические диаграммы направленности с микрофоном AKG; и

на фиг.16 показаны результаты анализа направлений для диаграмм, выраженные в виде среднеквадратической ошибки (СКО).

Прежде чем варианты осуществления настоящего изобретения будут описаны более детально, с использованием сопроводительных фигур, необходимо отметить, что одинаковые или функционально эквивалентные элементы обеспечиваются одинаковыми ссылочными номерами, и что повторное описание элементов, обеспеченное одинаковыми ссылочными номерами, пропускается. В связи с этим описания, обеспеченные для элементов с одинаковыми ссылочными номерами, являются взаимозаменяемыми.

5. Осуществление изобретения

5.1 Устройство в соответствии с фиг.1

На фиг.1 показано устройство 100 в соответствии с вариантом осуществления настоящего изобретения. Устройство 100 получения информации 101 о направлении (также обозначенное как d(k, n)) от множества микрофонных сигналов 1031 до 103N (также обозначенных как P1 до PN) или от множества компонентов микрофонного сигнала содержит блок 105 объединения. Блок 105 объединения выполнен с возможностью получения значения амплитуды микрофонного сигнала или компонента сигнала микрофона и выполнения линейной комбинации единиц информации о направлении, описывающих эффективные направления обзора микрофонов, связанных с микрофонными сигналами 1031 до 103N или компонентами, причем единица информации о направлении, описывающая данное эффективное направление обзора микрофона, взвешивается в зависимости от значения амплитуды микрофонного сигнала или компонента микрофонного сигнала, связанного с данным эффективным направлением обзора микрофона, для получения информации 101 о направлении.

Компонент i-ого микрофонного сигнала Pi можно обозначить как Pi(k, n). Компонент Pi(k, n) микрофонного сигнала Pi может быть величиной микрофонного сигнала Pi, имеющей частотный индекс k и временной индекс n. Микрофонный сигнал Pi может быть получен от i-го микрофона и может быть доступен блоку 105 объединения в частотно-временном представлении, содержащем множество компонентов Pi(k, n) для различающихся частотных индексов k и временных индексов n. В качестве примера микрофонные сигналы Pi до PN могут быть сигналами звукового давления, поскольку их можно получить от микрофонов B-формата.

Следовательно, каждый компонент Pi(k, n) может соответствовать частотно-временной ячейке (k, n). Блок 105 объединения может выполняться с возможностью получения значения амплитуды, причем значение амплитуды описывает амплитуду спектрального коэффициента, представляющего спектральный поддиапазон микрофонного сигнала Pi. Данный спектральный коэффициент может быть компонентом Pi(k, n) микрофонного сигнала Pi. Спектральный поддиапазон можно определить с помощью частотного индекса k компонента Pi(k, n). Кроме того, блок 105 объединения может выполняться с возможностью получения информации 101 о направлении на основе частотно-временного представления микрофонных сигналов, при котором, например, микрофонный сигнал Pi представляется с помощью множества компонентов Pi(k, n), причем каждая компонента соответствует частотно-временной ячейке (k, n).

Как описано во вводной части данной заявки, путем получения информации о направлении d(k, n), основываясь на значениях амплитуд микрофонных сигналов Pi до PN или компонентов микрофонного сигнала, можно достичь оценки информации d(k, n) о направлении даже для более высоких частот микрофонных сигналов Pi до PN, например, для компонентов Pi(k, n) до PN (k, n), у которых частотный индекс превышает частотный индекс, соответствующий спектральной частоте fmax наложения, в связи с тем, что не происходит пространственное наложение или другие фазовые искажения.

Ниже приведен подробный пример варианта осуществления настоящего изобретения, базирующийся на комбинации амплитуд микрофонных сигналов (направленная комбинация амплитуд), и того, как он может быть выполнен с помощью устройства 100 в соответствии с фиг.1. Информация d(k, n) о направлении, также обозначенная как оценка DOA, получается путем интерпретации амплитуды каждого микрофонного сигнала (или каждого компонента микрофонного сигнала) как соответствующего вектора в двумерном (2D) или трехмерном (3D) пространстве.

Пусть dt(k, n) является истинным или искомым вектором, указывающим на направление, откуда распространяется звуковое поле, имеющее частотный и временной индексы k и n соответственно. Другими словами, DOA звука соответствует направлению di(k, n). Целью вариантов осуществления изобретения является оценка di(k, n) и возможность получения из звукового поля информации о направлении. Пусть дополнительно bl, b2,..., bN - это векторы (например, единичные нормальные векторы), указывающие на направление обзора N направленных микрофонов. Направление обзора направленного микрофона определяется как направление, в котором принятая диаграмма направленности имеет свой максимум. Аналогично в случае если рассевающие/затеняющие объекты входят в состав микрофонного устройства, векторы bl, b2,..., bN указывают на направление максимального отклика соответствующего микрофона.

Векторы bl, b2,..., bN могут рассматриваться как единицы информации о направлении, описывающие эффективные направления обзора микрофонов с первого по N-ый микрофон. В этом примере единицами информации о направлении являются векторы, указывающие на соответствующие эффективные направления обзора микрофонов. В соответствии с дополнительными вариантами осуществления, единица информации о направлении также может быть скаляром, например, углом, описывающим направление обзора соответствующего микрофона.

Кроме того, в данном примере единицами информации о направлении могут быть единичные нормальные векторы, при этом векторы, связанные с различающимися эффективными направлениями обзора микрофонов, имеют равные нормы.

Также следует отметить, что предложенный способ может работать наилучшим образом, если сумма векторов bi, соответствующих эффективным направлениям обзора микрофонов, равняется нулю (например, в пределах допуска), то есть

В некоторых вариантах осуществления пределы допуска могут составлять ±30%, ±20%, ±10%, ±5% от одной из единиц информации о направлении, используемой для получения суммы (например, единицы информации о направлении, имеющей наибольшую норму, единицы информации о направлении, имеющей наименьшую норму, или единицы информации о направлении, имеющей норму, наиболее близкую к среднему значению всех норм единиц информации, используемых для получения суммы).

В некоторых вариантах осуществления эффективные направления обзора микрофонов могут распределяться неравномерно относительно системы координат. Рассмотрим, например, систему, в которой первым эффективным направлением обзора микрофона первого микрофона является ВОСТОК (например, 0 градусов в двумерной системе координат), вторым эффективным направлением обзора микрофона второго микрофона является СЕВЕРО-ВОСТОК (например, 45 градусов в двумерной системе координат), третьим направлением обзора третьего микрофона является СЕВЕР (например, 90 градусов в двумерной системе координат), а четвертым эффективным направлением обзора микрофона четвертого микрофона - ЮГО-ЗАПАД (например -135 градусов в двумерной системе координат), при этом единичные нормальные векторы, имеющие единицы информации о направлении, будут получаться в виде

b 1 = [ 1 0 ] T для первого эффективного направления обзора микрофона;

b 2 = [ 1 / 2 1 / 2 ] T для второго эффективного направления обзора микрофона;

b 3 = [ 0 1 ] T для третьего эффективного направления обзора микрофона; и

b 4 = [ − 1 / 2 − 1 / 2 ] T для четвертого эффективного направления обзора микрофона.

Это приводит к ненулевой сумме векторов:

b sum = b 1 + b 2 + b 3 + b 4 = [ 1 1 ] T

Поскольку в некоторых вариантах осуществления требуется, чтобы сумма векторов была нулевой, a единица информации о направлении, которая является вектором, указывающим на эффективное направление обзора микрофона, могла масштабироваться. В данном примере единица b4 информации о направлении может масштабироваться следующим образом:

b 4 = [ − ( 1 + 1 / 2 ) − ( 1 + 1 / 2 ) ] T ,

давая в результате сумму bsum векторов, равную нулю:

b sum = b 1 + b 2 + b 3 + b 4 = [ 0 0 ] T

Другими словами, в соответствии с некоторыми вариантами осуществления, различающиеся единицы информации о направлении, которые являются векторами, указывающими в различающихся эффективных направлениях обзора микрофонов, могут иметь различающиеся нормы и могут выбираться таким образом, чтобы сумма единиц информации о направлении равнялась нулю.

Оценка d истинного вектора di(k, n) и, следовательно, информации о направлении, которую необходимо установить, может быть определена как

где Pi (k, n) обозначает сигнал i-го микрофона (или компонента микрофонного сигнала Ρi i-го микрофона), соответствующий частотной ячейке (k, n).

Уравнение (7) образует линейную комбинацию единиц b1 до bN информации о направлении с первого микрофона по N-ый микрофон, взвешенных с помощью значений амплитуд компонентов P1(k, n) до PN(k, n) микрофонных сигналов P1 до PN, полученных от первого до N-го микрофона. Таким образом, блок 105 объединения может получить информацию 101 (d(k, n)) о направлении, рассчитывая по уравнению (7).

Как следует из уравнения (7), с целью получения информации d(k, n) о направлении для данной частотно-временной ячейки (k, n), блок 105 объединения может быть выполнен с возможностью линейного объединения единиц b1 до bN информации о направлении, взвешенных в зависимости от значений амплитуд и соответствующих данной частотно-временной ячейке (k, n).

В соответствии с дополнительными вариантами осуществления, блок 105 объединения может быть выполнен с возможностью линейной комбинации единиц b1 до bN информации о направлении, взвешенных исключительно в зависимости от значений амплитуд, соответствующих данным частотно-временным ячейкам (k, n).

Кроме того, из уравнения (7) следует, что блок 105 объединения может быть выполнен с возможностью линейной комбинации множества различающихся частотно-временных ячеек, одинаковых единиц b1 до bN информации о направлении (поскольку они не зависят от частотно-временных ячеек), описывающих различающиеся эффективные направления обзора микрофонов, но при этом единицы информации о направлении могут взвешиваться различающимся образом, в зависимости от значений амплитуд, соответствующих различающимся частотно-временным ячейкам.

В качестве единиц b1 до bN информации о направлении могут быть единичные векторы, норма взвешенного вектора, полученная умножением единицы bi информации о направлении на значение амплитуды, может определяться значением амплитуды. Взвешенные векторы для одинакового эффективного направления обзора микрофона, но различающихся частотно-временных ячеек могут иметь одинаковое направление, но различаться по своим нормам благодаря различающимся значениям амплитуды для различающихся частотно-временных ячеек.

В соответствии с некоторыми вариантами осуществления, взвешенные значения могут быть скалярными величинами.

Показатель к в уравнении (7) может выбираться произвольно. В случае если к=2 и противоположные микрофоны (от которых получены сигналы P1 до PN) находятся на одинаковом расстоянии, информация d(k, n) о направлении пропорциональна градиенту энергии в центре решетки (например, в наборе из двух микрофонов).

Другими словами, блок 105 объединения может выполняться с возможностью получения квадратов значений амплитуд, базирующихся на значениях амплитуды, при этом квадрат значения амплитуды описывает мощность компонента Pi(k, n) микрофонного сигнала Pi. Кроме того, блок 105 объединения может быть выполнен с возможностью получения линейной комбинации единиц b1 до bN информации о направлении, при этом единица bi информации о направлении взвешивается в зависимости от квадрата значения амплитуды компонента Pi(k, n) микрофонного сигнала Pi, связанного с соответствующим направлением обзора (i-го микрофона).

Из d(k, n) легко получить информацию о направлении, выраженную через азимутальный угол φ и угол возвышения с учетом того, что:

В некоторых приложениях, когда требуется только двумерный анализ, могут использоваться четыре направленных микрофона, расставленных, например, как на фиг.3. В этом примере единицы информации о направлении могут выбираться как:

Так что (7) становится

Данный подход можно аналогичным образом применить для случая жестких объектов, размещенных в микрофонной конструкции. В качестве примера на фиг.4 и 5 проиллюстрирован пример цилиндрического объекта, помещенного в центр решетки из четырех микрофонов. Другой пример приведен на фиг.6, где рассеивающий объект имеет форму полусферы.

Пример трехмерной конструкции приведен на фиг.7, где шесть микрофонов распределены по жесткой сфере. В этом примере z-компонента вектора d(k, n) может быть получена способом, аналогичным (9)-(14):

что приводит к

Хорошо известная трехмерная конструкция направленных микрофонов, пригодная для применения в вариантах осуществления данного изобретения, - это так называемый микрофон A-формата, описанный в работе P.G. Craven and M.A. Gerzon, US4042779 (A), 1977.

Чтобы следовать предложенному подходу определения направления с помощью комбинации амплитуд, должны выполняться определенные предположения. Так, если применяются направленные микрофоны, для каждого микрофона приемные диаграммы направленности должны быть приблизительно симметричными по отношению к ориентации или направлению обзора микрофонов. Если же используется подход рассеяния/затенения, тогда эффекты рассеяния/затенения должны быть приблизительно симметричными по отношению к направлению максимального отклика. Данные предположения легко выполняются, если решетка сконструирована так же, как в примерах, показанных на фиг.3-7.

Применение для DirAC

Приведенное выше описание рассматривает только оценку информации о направлении (DOA). В контексте задачи кодирования направлений дополнительно может потребоваться информация о разбросе звукового поля. Прямой подход обеспечивается путем простого приравнивания оцененного вектора d(k, n) или определенной информации о направлении вектору интенсивности активного звука Ia(k, n), взятому с противоположным направлением:

Это возможно, поскольку d(k, n) содержит информацию, связанную с градиентом энергии. Тогда разброс можно вычислить в соответствии с (3).

5.2. Способ в соответствии с фиг.8

Дополнительные варианты осуществления настоящего изобретения создают способ получения информации о направлении от множества микрофонных сигналов или от множества компонентов микрофонного сигнала, в котором отличающиеся эффективные направления обзора микрофонов связаны с микрофонными сигналами.

Такой способ 800 приведен на блок-схеме на фиг.8. Способ 800 содержит этап 801 получения амплитуды микрофонного сигнала или компонентов микрофонного сигнала.

Кроме того, для получения информации о направлении способ 800 содержит этап 803 комбинирования (например, линейной комбинации) единиц информации о направлении, описывающих эффективные направления обзора микрофонов, при этом единица информации о направлении, описывающая данное эффективное направление обзора микрофона, взвешивается в зависимости от значения амплитуды микрофонного сигнала или компонента микрофонного сигнала, связанного с соответствующим эффективным направлением обзора микрофона.

Способ 800 может быть представлен с помощью устройства 100 (например, с помощью блока 105 объединения устройства 100).

Ниже, используя фиг.9 и 10, в соответствии с вариантами осуществления, можно описать две системы, предназначенные для сбора микрофонных сигналов и получения информации о направлении от данных микрофонных сигналов.

5.3 Системы в соответствии с фиг.9 и фиг.10

Как известно, использование амплитуды давления для получения информации о направлении не является практичным при использовании ненаправленных микрофонов. Действительно, разность амплитуд в результате различия расстояний, прошедших звуком до достижения микрофонов, обычно слишком мала, чтобы быть измеренной, поэтому наиболее известные алгоритмы, в основном, опираются на фазовую информацию. Варианты осуществления преодолевают проблему пространственного наложения при оценке параметров направленности. Системы, описанные ниже, используют ми