2642353 - Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи

Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи

Иллюстрации

Показать все

Изобретение относится к средствам для оценки вероятности присутствия многоканальной речи. Технический результат заключается в повышении точности обнаружения полезных и паразитных звуков. Устройство для обеспечения оценки вероятности речи содержит первое средство оценки вероятности речи для оценки информации вероятности речи, показывающей первую вероятность в отношении того, содержит ли звуковое поле сцены речь, или в отношении того, не содержит ли звуковое поле сцены речь. Дополнительно, устройство содержит выходной интерфейс для вывода оценки вероятности речи в зависимости от информации вероятности речи. Первое средство оценки вероятности речи сконфигурировано с возможностью оценивать информацию первой вероятности речи на основе, по меньшей мере, пространственной информации о звуковом поле или пространственной информации о сцене. 6 н. и 12 з.п. ф-лы, 21 ил.

Реферат

Настоящее изобретение относится к обработке аудиосигналов и, в частности, к устройству и способу для информированной оценки вероятности присутствия многоканальной речи.

Обработка аудиосигналов становится более и более важной. В частности, захват речи без использования рук требуется во многих интерфейсах человек-машина и системах связи. Встроенные акустические датчики обычно принимают смесь полезных звуков (например, речи) и паразитных звуков (например, окружающего шума, голосов говорящих, которые являются помехой, реверберации, и шума датчика). Так как паразитные звуки ухудшают качество и разборчивость полезных звуков, сигналы акустического датчика могут обрабатываться (например, фильтроваться и суммироваться), чтобы извлекать сигнал полезного источника или, формулируя другим образом, чтобы уменьшать сигналы паразитного звука. Чтобы вычислять такие фильтры, обычно требуется точная оценка матрицы спектральной плотности мощности шума (PSD). На практике, сигнал шума является ненаблюдаемым и его матрица PSD должна оцениваться из зашумленных сигналов акустического датчика.

Одноканальные средства оценки вероятности присутствия речи (SPP) используются, чтобы оценивать PSD шума (см., например, [1-5]) и чтобы управлять компромиссным соотношением между уменьшением шума и искажением речи (см., например, [6, 7]). В последнее время используется многоканальная апостериорная SPP, чтобы оценивать матрицу PSD шума (см., например, [8]). В дополнение, оценка SPP может использоваться, чтобы уменьшать потребляемую мощность устройства.

В последующем, рассматривается общепринятая модель сигнала в обработке многоканальной речи, где каждый акустический датчик из M-элементной решетки захватывает аддитивную смесь полезного сигнала и паразитного сигнала. Сигнал, принятый в m-м акустическом датчике может быть описан в частотно-временной области следующим образом:

(1)

где и обозначают комплексные спектральные коэффициенты сигнала полезного источника и компонента шума m-го акустического датчика соответственно, и n и k являются индексами времени и частоты соответственно.

Полезный сигнал может, например, быть пространственно когерентным по микрофонам и пространственная когерентность шума может, например, соответствовать пространственной когерентности идеального сферически изотропного звукового поля, см. [24].

Другими словами, например, может обозначать комплексные спектральные коэффициенты сигнала полезного источника в m-м акустическом датчике, может обозначать комплексные спектральные коэффициенты компонента шума в m-м акустическом датчике, n может обозначать индекс времени и k может обозначать индекс частоты.

Наблюдаемые зашумленные сигналы акустического датчика могут быть записаны в векторной системе обозначений как

(2)

и матрица спектральной плотности мощности (PSD) для определяется как

(3)

где верхний индекс обозначает сопряженное транспонирование матрицы. Векторы и и матрицы и определяются аналогичным образом. Полезные и паразитные сигналы предполагаются некоррелированными и с нулевым средним, так что формула (3) может быть записана как

(4)

Вводятся следующие стандартные гипотезы относительно присутствия полезного сигнала (например, речевого сигнала) в заданном время-частотном интервале:

показывает отсутствие речи, и

показывает присутствие речи.

Может быть, например, предпочтительным оценивать условную апостериорную SPP, т.е. .

При предположении, что i-й микрофон решетки берется в качестве эталона, может, например, быть предпочтительным оценивать полезный сигнал

При предположении, что полезные и паразитные компоненты могут моделироваться как комплексные многовариантные гауссовские случайные переменные, оценка многоканальной SPP дается посредством (см. [9]):

(5)

где обозначает априорную вероятность присутствия речи (SPP), и

(6)

(7)

где обозначает оператор следа. Также могут выводиться и использоваться альтернативные средства оценки, предполагающие другой тип распределения (например, распределение Лапласа).

Только при предположении, что матрица PSD полезного сигнала имеет ранг единицу [например, , где и обозначает столбцовый вектор длины M], многоканальная SPP может получаться посредством применения средства оценки одноканальной SPP к выводу формирователя диаграммы направленности отклика без искажений с минимальной дисперсией (MVDR).

Подходы данной области техники либо используют фиксированную априорную SPP [4, 9], либо значение, которое зависит от одноканального или многоканального априорного отношения сигнала к шуму (SNR) (см. [2, 8, 10]). Коэн и др. [10], используют три параметра и , которые основываются на время-частотном распределении оцененного одноканального априорного SNR, чтобы вычислять априорную SPP, заданную посредством

(8)

Эти параметры используют сильную корреляцию присутствия речи в соседних частотных интервалах последовательных временных кадров. В других подходах данной области техники (см. [11]), параметры вычисляются в логарифмической энергетической области. В дополнительных подходах данной области техники (см. [8]), вместо этого используется многоканальное априорное SNR, чтобы вычислять и .

Большой недостаток средств оценки SPP данной области техники состоит в том, что они не могут различать между полезными и паразитными звуками.

Цель настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для обеспечения информированной оценки вероятности присутствия многоканальной речи. Цель настоящего изобретения решается посредством устройства согласно пункту 1 формулы изобретения, посредством способа согласно пункту 17 формулы изобретения и посредством компьютерной программы согласно пункту 18 формулы изобретения.

В последующем мы будем использовать признак "сцена". Сцена является средой, где генерируется звуковое поле. Пространственная информация о сцене может, например, содержать информацию о положении одного или более источников звука, которые генерируют звуковое поле, информацию о положении акустических датчиков, информацию о расстоянии источников звука до акустических датчиков, информацию о том, обнаружен ли говорящий человек или рот, и/или информацию о том, находится ли говорящий человек или рот в близости к акустическим датчикам.

Звуковое поле может, например, характеризоваться посредством звукового давления в каждом положении в среде, например, среде, где существует звуковое поле. Например, звуковое поле может характеризоваться посредством амплитуд звукового давления в каждом положении в среде, например, среде, где существует звуковое поле. Или звуковое поле может, например, характеризоваться посредством комплексного звукового давления в каждом положении в среде, например, среде, где существует звуковое поле, когда рассматривается спектральная область или частотно-временная область. Например, звуковые давления в положениях в среде, характеризующие звуковое поле, могут, например, записываться посредством одного или более акустических датчиков, например, посредством одного или более микрофонов. Пространственная информация о звуковом поле может, например, содержать направление вектора прибытия или, например, отношение энергии прямого к диффузному, определенное посредством записей упомянутых одного или более акустических датчиков, записывающих звуковые давления в положениях в среде, при этом звуковые давления характеризуют звуковое поле.

Обеспечивается устройство для обеспечения оценки вероятности речи. Устройство содержит первое средство оценки вероятности речи (которое может быть равным средству оценки априорной вероятности присутствия речи) для оценки информации вероятности речи, показывающей первую вероятность в отношении того, содержит ли звуковое поле сцены речь, или в отношении того, не содержит ли звуковое поле сцены речь. Дополнительно, устройство содержит выходной интерфейс для вывода оценки вероятности речи в зависимости от информации вероятности речи. Первое средство оценки вероятности речи сконфигурировано с возможностью оценивать информацию первой вероятности речи на основе, по меньшей мере, пространственной информации о звуковом поле или пространственной информации о сцене.

Обеспечиваются концепции, чтобы преодолевать недостаток предшествующего уровня техники посредством использования предварительной информации, выведенной из сигналов акустического датчика и возможно сигналов неакустического датчика, в вычислении условной апостериорной SPP. В частности, используется пространственная информация о звуковом поле, такая как направленность, близость и местоположение.

Могут определяться параметры и/или , и/или .

Является важным отметить, что любая комбинация (например, произведение, сумма, взвешенная сумма) параметров и/или и других известных параметров, например, и/или , может использоваться для получения информации вероятности речи посредством использования средства комбинирования. Это также означает, что является также возможным использовать только параметры или для получения информации вероятности речи.

Смысл параметров будет объяснен дополнительно ниже.

Может использоваться любая возможная комбинация параметров, например:

a) (Например, предположим, что , когда объект находится в близости к датчику. Тогда любой активный источник звука (близкий ли или нет) будет рассматриваться как полезный с априорной SPP, равной 1-0.7=0.3.)

b) (Например, звук рассматривается как полезный, когда имеется объект, близкий к датчику, и DDR является достаточно высоким.)

c) (Например, звук рассматривается как полезный, когда имеется объект, близкий к датчику, и местоположение источника звука находится в пределах области интереса, например, диапазона направления прибытия.)

d) (Например, звук рассматривается как полезный, когда имеется объект, близкий к датчику, DDR наблюдаемого звука является достаточно высоким и местоположение источника звука находится в пределах области интереса.)

Согласно одному варианту осуществления, устройство может дополнительно содержать второе средство оценки вероятности речи для оценки вероятности речи, показывающей вторую вероятность в отношении того, содержит ли звуковое поле речь, или в отношении того, не содержит ли звуковое поле речь. Второе средство оценки вероятности речи может быть сконфигурировано с возможностью оценивать вероятность речи на основе информации вероятности речи, оцененной посредством первого средства оценки вероятности речи, и на основе одного или более сигналов акустического датчика, которые зависят от звукового поля.

В другом варианте осуществления первое средство оценки вероятности речи может быть сконфигурировано с возможностью оценивать информацию вероятности речи на основе информации направленности, при этом информация направленности показывает то, насколько направленным является звук звукового поля. Альтернативно или дополнительно, первое средство оценки вероятности речи может быть сконфигурировано с возможностью оценивать информацию вероятности речи на основе информации местоположения, при этом информация местоположения показывает, по меньшей мере, одно местоположение источника звука сцены. Альтернативно или дополнительно, первое средство оценки вероятности речи сконфигурировано с возможностью оценивать информацию вероятности речи на основе информации близости, при этом информация близости показывает, по меньшей мере, одну близость, по меньшей мере, одного (возможного) звукового объекта к, по меньшей мере, одному датчику близости.

Согласно дополнительному варианту осуществления, первое средство оценки вероятности речи может быть сконфигурировано с возможностью оценивать вероятность речи посредством определения оценки отношения прямого к диффузному для отношения прямого к диффузному в качестве пространственной информации, при этом отношение прямого к диффузному показывает отношение прямого звука, содержащегося в сигналах акустического датчика, к диффузному звуку, содержащемуся в сигналах акустического датчика.

В другом варианте осуществления первое средство оценки вероятности речи может быть сконфигурировано с возможностью определять оценку отношения прямого к диффузному посредством определения оценки когерентности комплексной когерентности между первым акустическим сигналом из сигналов акустического датчика, при этом первый акустический сигнал записывается посредством первого акустического датчика p, и вторым акустическим сигналом из сигналов акустического датчика, при этом второй акустический сигнал записывается посредством второго акустического датчика q. Первое средство оценки вероятности речи может дополнительно быть сконфигурировано с возможностью определять отношение прямого к диффузному на основе оценки фазового сдвига для фазового сдвига прямого звука между первым акустическим сигналом и вторым акустическим сигналом.

Согласно одному варианту осуществления, первое средство оценки вероятности речи может быть сконфигурировано с возможностью определять оценку отношения прямого к диффузному между первым акустическим сигналом и вторым акустическим сигналом посредством применения формулы:

может быть оценкой когерентности комплексной когерентности между первым акустическим сигналом и вторым акустическим сигналом по отношению к время-частотному интервалу (k, n), где n обозначает время и где k обозначает частоту.

может быть оценкой фазового сдвига для фазового сдвига прямого звука между первым акустическим сигналом и вторым акустическим сигналом по отношению к время-частотному интервалу (k, n), и

может соответствовать пространственной когерентности между акустическим датчиком p и акустическим датчиком q в чистом поле диффузного звука.

Функция может измеряться или может предварительно вычисляться в зависимости от предполагаемого поля диффузного звука.

В другом варианте осуществления первое средство оценки вероятности речи может быть сконфигурировано с возможностью оценивать информацию вероятности речи посредством определения , где может быть оценкой отношения прямого к диффузному, и где может быть функцией преобразования, представляющей преобразование оценки отношения прямого к диффузному в значение между 0 и 1.

В другом варианте осуществления функция преобразования может определяться посредством формулы:

где может быть минимальным значением функции преобразования, где может быть максимальным значением функции преобразования, где c может быть значением для управления смещением вдоль оси , и где может определять крутизну перехода между и .

Согласно дополнительному варианту осуществления, первое средство оценки вероятности речи может быть сконфигурировано с возможностью определять параметр местоположения посредством использования формулы

где является конкретным местоположением, где является оцененным местоположением,

где является функцией плотности условной вероятности, и

где является функцией плотности априорной вероятности для , и

где является функцией плотности вероятности для , и

где обозначает неопределенность, ассоциированную с оценками для , и

где является многомерной функцией, которая описывает область интереса, при этом .

В другом варианте осуществления первое средство оценки вероятности речи может быть сконфигурировано с возможностью определять информацию вероятности речи q(k, n) посредством применения формулы:

где является конкретным направлением прибытия, и где является оцененным направлением прибытия,

где является функцией плотности условной вероятности, и

где является функцией плотности априорной вероятности для , и

где является функцией плотности вероятности для , и

где обозначает неопределенность, ассоциированную с оценками для , и

где представляет преобразование оценки отношения прямого к диффузному в значение между 0 и 1, и

где является многомерной функцией, которая описывает область интереса, при этом .

В дополнительном варианте осуществления, первое средство оценки вероятности речи может быть сконфигурировано с возможностью определять параметр близости как пространственную информацию, при этом параметр близости имеет первое значение параметра, когда первое средство оценки вероятности речи обнаруживает один или более возможных источников звука в пределах предварительно определенного расстояния от датчика близости, и при этом параметр близости имеет второе значение параметра, которое является меньшим, чем первое значение параметра, когда первое средство оценки вероятности речи не обнаруживает возможные источники звука в прямой близости от датчика близости. Первое средство оценки вероятности речи сконфигурировано с возможностью определять первое значение вероятности речи в качестве информации вероятности речи, когда параметр близости имеет первое значение параметра, и при этом первое средство оценки вероятности речи сконфигурировано с возможностью определять второе значение вероятности речи в качестве информации вероятности речи, когда параметр близости имеет второе значение параметра, при этом первое значение вероятности речи показывает первую вероятность, что звуковое поле содержит речь, при этом первая вероятность больше, чем вторая вероятность, что звуковое поле содержит речь, при этом вторая вероятность показывается посредством второго значения вероятности речи.

В одном варианте осуществления, обеспечивается устройство для определения оценки спектральной плотности мощности шума, содержащее устройство согласно одному из вышеописанных вариантов осуществления и блок оценки спектральной плотности мощности шума. Устройство согласно одному из вышеописанных вариантов осуществления может быть сконфигурировано с возможностью обеспечивать оценку вероятности речи в блок оценки спектральной плотности мощности шума. Блок оценки спектральной плотности мощности шума сконфигурирован с возможностью определять оценку спектральной плотности мощности шума на основе оценки вероятности речи и множества входных аудиоканалов.

В дополнительном варианте осуществления, обеспечивается устройство для оценки вектора управления, содержащее устройство согласно одному из вышеописанных вариантов осуществления и блок оценки вектора управления. Устройство согласно одному из вышеописанных вариантов осуществления может быть сконфигурировано с возможностью обеспечивать оценку вероятности речи в блок оценки вектора управления. Блок оценки вектора управления может быть сконфигурирован с возможностью оценивать вектор управления на основе оценки вероятности речи и множества входных аудиоканалов.

Согласно другому варианту осуществления, обеспечивается устройство для уменьшения многоканального шума, содержащее устройство согласно одному из вышеописанных вариантов осуществления и блок фильтра. Блок фильтра может быть сконфигурирован с возможностью принимать множество входных каналов аудио. Устройство согласно одному из вышеописанных вариантов осуществления может быть сконфигурировано с возможностью обеспечивать информацию вероятности речи в блок фильтра. Блок фильтра может быть сконфигурирован с возможностью фильтровать множество входных каналов аудио, чтобы получать фильтрованные аудиоканалы на основе информации вероятности речи и множества входных аудиоканалов.

В одном варианте осуществления, первое средство оценки вероятности речи может быть сконфигурировано с возможностью генерировать параметр компромиссного соотношения, при этом параметр компромиссного соотношения зависит от пространственной информации о звуковом поле или пространственной информации о сцене.

Согласно дополнительному варианту осуществления, блок фильтра может быть сконфигурирован с возможностью фильтровать множество входных каналов аудио в зависимости от параметра компромиссного соотношения.

Предложены концепции, чтобы вслепую извлекать звуки, которые являются сильно когерентными на решетке. Обеспечивается средство оценки матрицы PSD многоканального шума, которое основывается на апостериорной SPP. В отличие от состояния данной области техники, оценка DDR используется, чтобы определять априорную SPP. Дополнительно, предлагается использовать оцененное DDR, чтобы управлять параметром компромиссного соотношения PMWF. Дополнительно, продемонстрировано, что предложенный управляемый посредством DDR PWMF превосходит формирователь диаграммы направленности MVDR и MWF в терминах улучшения сегментного SNR и улучшения PESQ.

В одном варианте осуществления, обеспечивается способ для обеспечения оценки вероятности речи. Способ содержит:

- оценку информации вероятности речи, показывающей первую вероятность в отношении того, содержит ли звуковое поле речь, или в отношении того, не содержит ли звуковое поле речь, и

- вывод оценки вероятности речи в зависимости от информации вероятности речи.

Оценка информации первой вероятности речи основывается на, по меньшей мере, пространственной информации о звуковом поле или пространственной информации о сцене.

Дополнительно, обеспечивается компьютерная программа для осуществления вышеописанного способа, когда исполняется на компьютере или сигнальном процессоре.

Варианты осуществления обеспечиваются в зависимых пунктах формулы изобретения.

В последующем, варианты осуществления настоящего изобретения описываются более подробно со ссылкой на чертежи, на которых:

Фиг. 1 иллюстрирует устройство для обеспечения оценки вероятности речи согласно одному варианту осуществления,

Фиг. 2 иллюстрирует устройство для обеспечения оценки вероятности речи согласно другому варианту осуществления,

Фиг. 3 иллюстрирует блок-схему информированного средства оценки многоканальной апостериорной SPP согласно одному варианту осуществления,

Фиг. 4 иллюстрирует блок-схему средства оценки априорной SPP согласно одному варианту осуществления,

Фиг. 5 иллюстрирует преобразование из DDR в параметр согласно одному варианту осуществления,

Фиг. 6 иллюстрирует блок-схему средства оценки для с использованием настроек пользователя/приложения, чтобы определять область интереса согласно одному варианту осуществления,

Фиг. 7 иллюстрирует блок-схему средства оценки для с использованием акустических и неакустических данных, чтобы определять область интереса согласно одному варианту осуществления,

Фиг. 8 иллюстрирует устройство для определения оценки спектральной плотности мощности шума согласно одному варианту осуществления,

Фиг. 9 иллюстрирует блок-схему предложенного средства оценки матрицы PSD шума согласно дополнительному варианту осуществления,

Фиг. 10A иллюстрирует устройство для оценки вектора управления согласно одному варианту осуществления,

Фиг. 10B иллюстрирует блок-схему средства оценки вектора управления согласно одному варианту осуществления,

Фиг. 11 иллюстрирует устройство для уменьшения многоканального шума согласно одному варианту осуществления,

Фиг. 12 иллюстрирует преобразование DDR в параметр компромиссного соотношения ,

Фиг. 13 иллюстрирует улучшение PESQ для стационарного (слева) и перекрестного шума (справа),

Фиг. 14 иллюстрирует усиление SNR для стационарного (слева) и перекрестного шума (справа),

Фиг. 15 иллюстрирует иллюстративные спектрограммы для перекрестного шума ( = 11 дБ), и

Фиг. 16 иллюстрирует оцененное DDR и соответствующую SPP ( = 11 дБ).

Фиг. 1 иллюстрирует устройство для обеспечения оценки вероятности речи согласно одному варианту осуществления. Устройство содержит первое средство 110 оценки вероятности речи для оценки информации вероятности речи, показывающей первую вероятность в отношении того, содержит ли звуковое поле сцены речь, или в отношении того, не содержит ли звуковое поле сцены речь. Дополнительно, устройство содержит выходной интерфейс 120 для вывода оценки вероятности речи в зависимости от информации вероятности речи. Первое средство 110 оценки вероятности речи сконфигурировано с возможностью оценивать информацию первой вероятности речи на основе, по меньшей мере, пространственной информации о звуковом поле или пространственной информации о сцене.

Сцена является средой, где генерируется звуковое поле. Пространственная информация о сцене может, например, содержать информацию о положении одного или более источников звука, которые генерируют звуковое поле, информацию о положении акустических датчиков, информацию о расстоянии источников звука до акустических датчиков, информацию о том, обнаружен ли говорящий человек или рот, и/или информацию о том, находится ли говорящий человек или рот в близости к акустическим датчикам.

Пространственная информация о звуковом поле может, например, быть информацией направленности, показывающей то, насколько направленным является звук звукового поля. Например, информация направленности может быть отношением прямого к диффузному (DDR), как описано ниже.

Фиг. 2 иллюстрирует устройство для обеспечения оценки вероятности речи согласно другому варианту осуществления. Устройство содержит первое средство 210 оценки вероятности речи и выходной интерфейс 220. Более того, устройство дополнительно содержит второе средство 215 оценки вероятности речи, чтобы оценивать оценку вероятности речи, показывающую вторую вероятность в отношении того, содержит ли звуковое поле речь, или в отношении того, не содержит ли звуковое поле речь. Второе средство 215 оценки вероятности речи сконфигурировано с возможностью оценивать оценку вероятности речи на основе информации вероятности речи, оцененной посредством первого средства оценки вероятности речи, и на основе одного или более сигналов акустического датчика, которые зависят от звукового поля.

Для этой цели, первое средство оценки вероятности речи принимает пространственную информацию о звуковом поле и/или пространственную информацию о сцене. Первое средство 210 оценки вероятности речи затем оценивает информацию вероятности речи, которая показывает первую вероятность в отношении того, содержит ли звуковое поле сцены речь, или в отношении того, не содержит ли звуковое поле сцены речь. Первое средство 210 оценки вероятности речи может затем обеспечивать информацию вероятности речи во второе средство 215 оценки вероятности речи. Более того, второе средство 215 оценки вероятности речи может дополнительно принимать один или более сигналов акустического датчика. Второе средство 215 оценки вероятности речи затем оценивает оценку вероятности речи на основе информации вероятности речи, оцененной посредством первого средства 210 оценки вероятности речи, и на основе одного или более сигналов акустического датчика, которые зависят от звукового поля.

В отличие от состояния данной области техники, среди прочего, оценка вероятности речи выполняется на основе пространственной информации. Это значительно улучшает оценку вероятности речи.

Теперь, вводятся следующие гипотезы относительно присутствия полезного речевого сигнала в заданном время-частотном интервале, согласно которым:

показывает отсутствие полезной речи и

показывает присутствие полезной речи.

Другими словами: показывает отсутствие полезной речи, в то время как показывает присутствие полезной речи.

Фиг. 3 иллюстрирует блок-схему информированного средства оценки многоканальной SPP. Модуль "Вычисления условной апостериорной SPP" может осуществлять формулу (5).

На фиг. 3, модуль 310 реализует осуществление "Вычисления априорной SPP". В варианте осуществления из фиг. 3, модуль 310 "Вычисления априорной SPP" может осуществлять конкретную реализацию первого средства 210 оценки вероятности речи из фиг. 2. Дополнительно, на фиг. 3, модуль 315 реализует осуществление "Вычисления условной апостериорной SPP". В варианте осуществления из фиг. 3, модуль 315 "Вычисления условной апостериорной SPP" может осуществлять конкретную реализацию второго средства 215 оценки вероятности речи из фиг. 2.

Один вариант осуществления модуля 310 "Вычисления априорной SPP" согласно конкретному варианту осуществления показан на фиг. 4. На фиг. 4, настройки пользователя/приложения являются доступными для вычисления параметров в модулях 401, ..., 40P. Настройки пользователя/приложения также могут обеспечиваться в средство 411 комбинирования. Здесь P параметров вычисляются с использованием данных акустического и неакустического датчика также как настроек пользователя/приложения. Параметры комбинируются (например, взвешенная сумма, произведение, средство комбинирования максимального отношения) посредством средства 411 комбинирования, чтобы вычислять априорную SPP q(k, n).

В следующих подразделах, представлены три параметра, которые могут использоваться, чтобы вычислять априорную SPP, требуемую для информированной многоканальной SPP.

В последующем, среди прочего, обеспечивается параметр на основе направленности.

Является разумным предполагать, что полезные звуки являются направленными, в то время как паразитные звуки являются ненаправленными. Поэтому используется параметр, чтобы показывать то, насколько направленным является наблюдаемый звук. Одной возможностью для измерения направленности звукового поля является отношение прямого к диффузному (DDR). Оценка DDR может получаться посредством комплексной когерентности (CC), как показано в [12]. CC между двумя сигналами, измеренными в акустических датчиках p и q, определяется в частотно-временной области как

(9)

где является перекрестной PSD и и являются авто-PSD упомянутых двух сигналов. Средство оценки DDR в [12] основывается на модели звукового поля, где звуковое давление в любом положении и время-частотном интервале моделируется как суперпозиция прямого звука, представленного посредством одиночной монохроматической плоской волны и идеального диффузного поля. Предполагая всенаправленные акустические датчики, функция CC может быть выражена как

(10)

где является фазовым сдвигом прямого звука между упомянутыми двумя акустическими датчиками,

Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи

Патент 2642353