Эхоподавление, содержащее моделирование компонентов поздней реверберации

Иллюстрации

Показать все

Изобретение относится к устройствам для вычисления коэффициентов (H[k,m]) фильтрации для адаптивного фильтра. Технический результат заключается в повышении качества звука системы эхоподавления или системы эхокомпенсации. Адаптивный фильтр используется для фильтрации сигнала микрофона, чтобы подавлять эхо-сигнал вследствие сигнала громкоговорителя. Устройство содержит: средство моделирования затухания эхо-сигнала для моделирования характера изменения затухания акустической среды и для предоставления соответствующего параметра (τ; αm) затухания эхо-сигнала; и средство вычисления для вычисления коэффициентов (H[k,m]) фильтрации адаптивного фильтра на основе параметра (τ; αm) затухания эхо-сигнала. Соответствующий способ содержит: предоставление параметров (τ; Ĝ[k,m]; αm) затухания эхо-сигнала, определенных посредством средства моделирования затухания эхо-сигнала; и вычисление коэффициентов (H[k,m]) фильтрации адаптивного фильтра на основе параметров (τ; αm) затухания эхо-сигнала. 9 н. и 12 з.п. ф-лы, 12 ил.

Реферат

Варианты осуществления настоящего изобретения относятся к устройствам и способам для вычисления коэффициентов фильтрации для адаптивного фильтра для фильтрации сигнала микрофона, чтобы подавлять эхо-сигнал вследствие сигнала громкоговорителя, которые могут использоваться, например, в контексте систем проведения конференций. Примеры систем проведения конференций включают в себя системы проведения телефонных конференций, системы проведения видеоконференций или другие системы проведения двунаправленных конференций.

УРОВЕНЬ ТЕХНИКИ

Акустические эхо-сигналы возникают каждый раз, когда тоны, звуки и шумы из громкоговорителя снимаются посредством микрофона, расположенного в этой комнате или в этой акустической среде. В системах связи этот сигнал акустической обратной связи передается обратно абоненту на дальнем конце, которые замечает задержанную версию собственной речи. В этом контексте, эхо-сигналы представляют сильно раздражающее возмущение и могут даже препятствовать интерактивной полнодуплексной связи. Дополнительно, акустические эхо-сигналы могут приводить к эффектам нелинейных искажений звука и другим видам нестабильности контура с акустической обратной связью.

WO 2006/111370 A1 относится к способу и устройству для удаления эхо-сигнала в многоканальном аудиосигнале. Управление акустическими эхо-сигналами и подавление шума представляет собой важную часть любой системы громкой связи, к примеру, системы проведения телефонных, аудио- или видеоконференций. Способ, описанный в документе, для обработки многоканальных аудиосигналов громкоговорителя и, по меньшей мере, одного сигнала микрофона в этом контексте включает в себя этапы преобразования входного сигнала микрофона во входные кратковременные спектры микрофона, вычисления комбинированного кратковременного спектра сигнала громкоговорителя из сигналов громкоговорителя, вычисление комбинированного кратковременного спектра сигнала микрофона из входного сигнала микрофона, оценки спектра абсолютной величины или спектра мощности эхо-сигнала в комбинированном кратковременном спектре сигнала микрофона, вычисления фильтра усиления для модификации абсолютной величины входного кратковременного спектра микрофона, применения фильтра усиления, по меньшей мере, к одному входному спектру микрофона и преобразования отфильтрованного входного спектра микрофона во временную область.

Системы эхоподавления и эхокомпенсации, которые используются сегодня и также могут упоминаться как системы удаления эхо-сигналов в разделе сущности изобретения, зачастую имеют такую проблему, что они не обрабатывают различные компоненты звука, тона, шума и компоненты эхо-сигнала оптимальным способом, несмотря на использование адаптивных фильтров. Если один компонент является преобладающим по сравнению с другим, неоптимальное подавление эхо-сигнала для сигнала громкоговорителя может возникать, например, в сигнале микрофона этой системы связи. С другой стороны, в случае отклоняющегося состава компонентов различных источников, тональные артефакты могут возникать вследствие использования системы эхоподавления или эхокомпенсации, причем эти тональные артефакты также воспринимаются как чрезвычайно раздражающее.

EP 1429315 A1 упоминает способ и систему для подавления эхо-сигналов и шума в окружениях при переменных акустических условиях, а также в условиях большой пропорции обратной связи. Система для компенсации эхо-сигналов и шумов в окружениях с переменными акустическими условиями и высокой обратной связью, к примеру, в салоне автомобильного транспортного средства, обеспечения звуковой связи между пассажирами содержит один или несколько микрофонов для речевого сигнала и аналого-цифровых, цифро-аналоговых преобразователей, средство усиления и фильтрации, формирующее электрический сигнал, воспроизводимый в качестве акустического сигнала посредством динамика, и модуль эхокомпенсации с использованием сигнала и электрического сигнала из микрофона, интегрирующий сигнал обратной связи для сигнала, другой речевой сигнал и шум, захваченный микрофоном. Система применяется к исключению обратной связи посредством предоставления дополнительной фильтрации электрического выходного сигнала устройства компенсации после обработки сигнала, содержащего изменяющийся во времени фильтр, который подавляет остаточный акустический эхо-сигнал, не компенсируемый посредством системы, и шум, захваченный микрофонами.

WO 2009/095161 A1 относится к устройству и способу для вычисления коэффициентов фильтрации для эхоподавления. Коэффициенты фильтрации предназначены для использования с адаптивным фильтром для фильтрации сигнала микрофона, чтобы подавлять эхо-сигнал вследствие сигнала громкоговорителя. Устройство включает в себя средство извлечения для извлечения стационарного компонентного сигнала или нестационарного компонентного сигнала из сигнала громкоговорителя или из сигнала, извлекаемого из сигнала громкоговорителя. Устройство также содержит средство вычисления для вычисления коэффициентов фильтрации для адаптивного фильтра на основе извлеченного стационарного компонентного сигнала и нестационарного компонентного сигнала. Устройство и способ, раскрытые в WO 2009/095161, анализируют сигнал на дальнем конце на предмет статистических свойств компонентного сигнала, который составляет сигнал громкоговорителя.

Исходя из предшествующего уровня техники цель настоящего изобретения, следовательно, состоит в том, чтобы повышать качество звука системы эхоподавления или системы эхокомпенсации при приемлемой трудоемкости вычислений.

Это цель достигается посредством устройства по п.1, способа по п.12 или программы по п.15.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Один вариант осуществления устройства для вычисления коэффициентов фильтрации для адаптивного фильтра для фильтрации сигнала микрофона, захватываемого посредством микрофона, чтобы подавлять эхо-сигнал вследствие сигнала громкоговорителя, выводимого посредством громкоговорителя, содержит средство моделирования затухания эхо-сигнала для моделирования характера изменения затухания акустической среды и для предоставления соответствующего параметра затухания эхо-сигнала или множества параметров затухания эхо-сигнала; и средство вычисления для вычисления коэффициентов фильтрации адаптивного фильтра на основе параметра(ов) затухания эхо-сигнала.

Один вариант осуществления способа для вычисления коэффициентов фильтрации для адаптивного фильтра для фильтрации сигнала микрофона, чтобы подавлять эхо-сигнал вследствие сигнала громкоговорителя, содержит: предоставление параметров затухания эхо-сигнала, определенных посредством средства моделирования затухания эхо-сигнала; и вычисление коэффициентов фильтрации адаптивного фильтра на основе параметров затухания эхо-сигнала.

Варианты осуществления устройства, способа и компьютерной программы согласно идеям, раскрытым в данном документе, основаны на полученных сведениях о том, что повышение качества звука и/или уменьшение трудоемкости вычислений может достигаться посредством моделирования, в частности, компонентов позднего эхо-сигнала посредством модели затухания эхо-сигнала. Модель затухания эхо-сигнала может основываться на рекурсивных вычислениях, которые требуют относительно небольшой трудоемкости вычислений. Затухание эхо-сигнала акустической среды, в которой используется адаптивный фильтр, может представлять изменяющиеся свойства, которые могут быть оценены из выборок сигнала микрофона и/или сигнала громкоговорителя.

Хотя компоненты раннего эхо-сигнала типично являются весьма похожими на исходный звук, компоненты более позднего эхо-сигнала становятся все более и более нечеткими и менее похожими на исходный звук. Устройство, способ и компьютерная программа согласно идеям, раскрытым в данном документе, отличают между подавлением компонентов раннего эхо-сигнала, которые требуют более высокой точности, и подавлением компонентов позднего эхо-сигнала, которые могут быть оценены менее точно за все время реверберации. В отличие от использования различных статистических свойств различных составляющих сигнала, к примеру, стационарных или нестационарных, которые внутренне присущи соответствующим составляющим исходных сигналов микрофона и громкоговорителя (т.е. на них не оказывает влияние акустическая среда), идеи, раскрытые в данном документе, используют свойства эхо-сигнала, вызываемого посредством сигнала громкоговорителя. Эти связанные с эхо-сигналом свойства ассоциированы с акустической средой 120 и в силу этого варьируются после изменения или переконфигурирования акустической среды. Тем не менее, связанные с эхо-сигналом свойства не варьируются или, по меньшей мере, не варьируются значительно, когда сигналы громкоговорителя или микрофона варьируются, например, в соответствии с отношением между стационарными компонентами и нестационарными компонентами.

Дополнительные варианты осуществления поясняются ниже в ходе настоящего описания касательно их структур и режимов работы. В зависимости от конкретного варианта осуществления, параметр(ы) затухания эхо-сигнала может быть оценен из соответствующих сигналов, например, сигнала микрофона, на который оказывает влияние системная характеристика акустической среды. Устройство в соответствии с вариантом осуществления идей этого документа дополнительно может содержать средство фильтрации при эхоподавлении, выполненное с возможностью фильтровать сигнал микрофона на основе коэффициентов фильтрации. Устройство в соответствии с идеями, раскрытыми в данном документе, может содержать средство оценки эхо-сигнала для оценки частотного спектра эхо-сигнала или спектра мощности эхо-сигнала для эхо-сигнала в сигнале микрофона. Оценка частотного спектра эхо-сигнала или спектра мощности эхо-сигнала может быть разделена на оценку компонентов раннего эхо-сигнала и оценку компонентов позднего эхо-сигнала. Оценка компонентов раннего эхо-сигнала может отличаться от оценки компонентов позднего эхо-сигнала. Оценка компонентов позднего эхо-сигнала может охватывать относительно длительный временной интервал после исходного звука при относительно низкой трудоемкости вычислений. Оценка компонентов раннего эхо-сигнала может быть относительно точной и охватывать относительно короткий временной интервал после исходного звука.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления решений, раскрытых в этом документе, поясняются ниже подробнее со ссылкой на прилагаемые чертежи. Поэтому варианты осуществления решений, раскрытых в данном документе, можно лучше понять со ссылками на следующие чертежи:

Фиг.1 показывает общее положение дел касательно проблемы удаления акустических эхо-сигналов;

Фиг.2 показывает общую структуру типичной импульсной характеристики комнаты;

Фиг.3 показывает принципиальную блок-схему модуля подавления кратковременных акустических эхо-сигналов спектральной области;

Фиг.4 показывает экспоненциальное затухание реверберации;

Фиг.5 показывает принципиальную блок-схему устройства в соответствии с различными вариантами осуществления идей этого документа;

Фиг.6 показывает принципиальную блок-схему дополнительного варианта осуществления согласно идеям этого документа;

Фиг.7 показывает принципиальную блок-схему дополнительного варианта осуществления согласно идеям этого документа;

Фиг.8 показывает принципиальную блок-схему дополнительного варианта осуществления согласно идеям этого документа;

Фиг.9 показывает принципиальную блок-схему дополнительного варианта осуществления согласно идеям этого документа;

Фиг.10 показывает временную диаграмму, иллюстрирующую исходные импульсы и соответствующие поздние реверберации;

Фиг.11 показывает временную диаграмму оценки эхо-сигнала и моделирования реверберации; и

Фиг.12 показывает блок-схему варианта осуществления идей, раскрытых в этом документе, для многоканальной реализации.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

В настоящем описании идентичные ссылочные позиции обозначают средства, модули и объекты, которые являются идентичными по принципу действия, функции, структуре или аналогичными по принципу действия, функции или структуре. Это дает возможность более короткого и сжатого представления вариантов осуществления настоящего изобретения, поскольку фрагменты описания могут переноситься между вариантами осуществления, если это не исключается в явном виде.

Помимо этого, в настоящем описании, обобщающие ссылочные позиции должны использоваться для средств, структур и объектов, которые появляются несколько раз на одном чертеже или в одном варианте осуществления. Например, двум непрямым трактам 180-1, 180-2, которые показаны на фиг.1, фактически присвоены различные ссылки с номерами на фиг.1, но если непрямые тракты указываются по существу, либо если описываются их общие признаки, только обобщающая ссылка 180 с номером должна быть использована в настоящем описании. Это также служит для того, чтобы повышать понятность и краткость настоящего описания.

Перед описанием, со ссылкой на фиг.2-12, различных вариантов осуществления идей, раскрытых в данном документе, которые обеспечивают подавление акустических эхо-сигналов при одновременном использовании разделения компонентов стационарного и нестационарного сигнала, сначала проиллюстрировано общее положение дел касательно проблемы удаления акустических эхо-сигналов со ссылкой на фиг.1.

В системе полнодуплексной громкой связи управление эхо-сигналами типично требуется для подавления соединения между громкоговорителем и микрофоном.

Фиг.1 показывает громкоговоритель 100, который может предоставляться, наряду с микрофоном 110, в акустической среде 120, которая может представлять собой, например, комнату. Аналогично, акустическая среда 120 также может представлять собой салон транспортного средства.

В этом контексте, сигнал 130 громкоговорителя, который на фиг.1 также обозначается x[n] с целочисленным временным индексом n, становится доступным для громкоговорителя 100. Микрофон 110 снимает шумы, звуки и тоны, исходящие из акустической среды 120, и формирует сигнал 140 микрофона, который также обозначается y[n] на фиг.1. Как сигнал 130 громкоговорителя, так и сигнал 140 микрофона предоставляются в качестве входных сигналов в модуль 150 обработки удаления эхо-сигналов, который предоставляет, в выводе, сигнал 160 после эхоподавления сигнала 140 микрофона, который также обозначается e[n] на фиг.1.

Таким образом, фиг.1 по существу иллюстрирует проблему акустических эхо-сигналов, которая может возникать в системах двунаправленной связи. Сигнал дальнего конца системы связи, который выводится посредством громкоговорителя, достигает микрофона по прямому тракту 170 и через отраженные тракты 180-1, 180-2, которые также упоминаются как непрямые тракты. По этой причине, микрофон 110 не только снимает речь на локальном, ближнем конце, но также и регистрирует эхо-сигнал, который затем возвращается пользователю на дальнем конце.

Другими словами, сигнал x[n] громкоговорителя возвращается в сигнал y[n] микрофона. Процесс удаления эхо-сигналов, выполняемый в модуле 150 обработки удаления эхо-сигналов, идеально удаляет этот эхо-сигнал при том, что он дает возможность прохождения речи локального, ближнего конца системы связи.

Традиционный способ обработки этого эхо-сигнала заключается в том, чтобы размещать модуль компенсации акустических эхо-сигналов (AEC) параллельно с трактом распространения эхо-сигнала, как описано в [1]. В таком модуле компенсации акустических эхо-сигналов цифровая реплика эхо-сигнала оценивается и затем вычитается из измеренного или наблюдаемого сигнала микрофона. Стандартные подходы для компенсации акустических эхо-сигналов базируются на таком допущении, что тракт эхо-сигнала может моделироваться посредством линейного FIR-фильтра (FIR - конечная импульсная характеристика), и реализуют модули компенсации акустических эхо-сигналов, соответственно, как также описано в [1]. Поскольку тракт эхо-сигнала типично неизвестен и, кроме того, может изменяться во время работы, линейный фильтр такого модуля компенсации акустических эхо-сигналов типично реализуется адаптивно. Чтобы иметь возможность моделировать типичные тракты эхо-сигнала, применяются FIR-фильтры с длинами типично в несколько сотен миллисекунд, что (относительно соответствующей частоты дискретизации) также подразумевает высокий уровень вычислительной сложности.

На практике, достижимые ослабления эхо-сигнала для этих традиционных подходов часто являются не достаточными по различным причинам. Различные причины включают в себя, например, длительные времена реверберации (эффект хвоста эхо-сигнала), которые приводят к недостаточному моделированию тракта эхо-сигнала, нелинейные компоненты эхо-сигнала, вызываемые, например, посредством эффектов вибрации или нелинейного характера изменения особенно дешевого аудиооборудования, и проблемы сходимости в случае высокой временной скорости изменения относительно трактов эхо-сигнала, как описано в [2]. Следовательно, модули компенсации акустических эхо-сигналов комбинируются с нелинейными постпроцессорами, чтобы удалять остаточные эхо-сигналы и компоненты эхо-сигнала, которые не может исключать модуль эхокомпенсации, как описано в [3]. Обычно, подавление остаточных эхо-сигналов выполняется частотно-избирательным способом, как описано в [4]. Реально, практически все модули компенсации акустических эхо-сигналов используют такие постпроцессоры, поскольку они часто не могут в достаточной степени уменьшить эхо-сигнал, чтобы он становился неслышимым.

В последнее время в [5, 6] предложен ряд модулей подавления акустических эхо-сигналов для подполосной области, которые имеют сходство с вышеуказанными нелинейными постпроцессорами, но им не требуется модуль компенсации акустических эхо-сигналов и оценка импульсной характеристики тракта эхо-сигнала. Заявляется, что эти системы имеют низкую вычислительную сложность и являются надежными при достижении высокой степени дуплексности.

Схема модуля подавления эхо-сигналов, предложенная в [6], применяет кратковременное преобразование Фурье (STFT) для того, чтобы вычислять спектры сигналов громкоговорителя и микрофона. Значение d задержки между подвергнутыми кратковременному преобразованию Фурье сигналами из этих двух сигналов применяется к соответствующему сигналу громкоговорителя, причем упомянутое значение задержки выбирается таким образом, что учитывается большая часть эффекта импульсной характеристики тракта эхо-сигнала.

Затем оценивается действительнозначная оценочная функция эхо-сигнала, которая имитирует эффект начального тракта эхо-сигнала. Чтобы получать оцененный спектр абсолютной величины эхо-сигнала, оцененное значение задержки и оценочная функция эхо-сигнала применяются к спектрам громкоговорителя. С использованием оценки спектра абсолютной величины эхо-сигнала действительнозначный фильтр эхоподавления вычисляется и применяется к спектру сигнала микрофона, чтобы подавлять эхо-сигнал.

Вышеуказанные системы подавления акустических эхо-сигналов рассматривают эффект поздней реверберации в комнате при оценке спектра мощности эхо-сигнала, т.е. эффект поздней реверберации рассматривается идентично эффекту ранних отражений в тракте эхо-сигнала, хотя поздние реверберации типично имеют различные свойства по сравнению с ранними отражениями. Чтобы обрабатывать компоненты эхо-сигнала, возникающие в результате поздней реверберации, иногда используется временное сглаживание фильтра удаления эхо-сигналов. На практике этот подход может увеличивать нежелательное искажение на ближнем конце.

Кроме того, поздние реверберации типично имеют тенденцию быть более случайными, чем ранние отражения, что может быть обусловлено наложением различных трактов распространения и отражения между громкоговорителем и микрофоном в акустической среде 120.

Сигнал x[n] на дальнем конце, испускаемый посредством громкоговорителя, движется в микрофон как непосредственно, так и через отраженные тракты. Сигнал y[n] микрофона содержит локальную речь на ближнем конце, а также шум w[n] и эхо-сигнал, который тем самым возвращается пользователю на дальнем конце:

y [ n ] = h [ n ] ∗ x [ n ] + w [ n ] (1)

где h является импульсной характеристикой комнаты, и * обозначает свертку.

Как проиллюстрировано на фиг.2, импульсная характеристика h комнаты может быть разложена на прямой звук, раннее отражение (или несколько ранних отражений) и позднюю реверберацию. Последняя также упоминается как хвост эхо-сигнала. В ранее предложенных способах, описанных в [6], только параметр d глобальной задержки и оценочная функция g эхо-сигнала используются для того, чтобы моделировать тракт эхо-сигнала, чтобы захватывать прямой звук и ранние отражения. Поздние отражения не моделируются в ранее предложенных способах, но рассматриваются посредством временного сглаживания фильтра эхоподавления. Сигнал y[n] микрофона тем самым может выражаться посредством:

y [ n ] = g [ n ] ∗ x [ n − d ] + w [ n ] (2)

Параметр d глобальной задержки может быть объяснен тем фактом, что тракт с минимальным расстоянием для сигнала громкоговорителя до микрофона задается посредством расстояния от громкоговорителя до микрофона, т.е. сигнал громкоговорителя должен проходить, по меньшей мере, расстояние от громкоговорителя до микрофона через прямой тракт. Ранние отражения являются типично относительно аналогичными исходному сигналу громкоговорителя и прямому звуку, поскольку ранние отражения соответствуют числу первичных трактов 180 отражения (фиг.1), причем это число типично является относительно небольшим в обычной акустической среде. Хвост эхо-сигнала вызывается посредством различных эффектов, таких как рассеяние звука, эффекты резонанса и многоточечные отражения, помимо прочего. В микрофоне 110 возникает наложение сигнала x[n] громкоговорителя, прошедшего через множество различных трактов в акустической среде 120. Вследствие растущего числа возможных трактов распространения между громкоговорителем 100 и микрофоном 110 с увеличивающейся задержкой на распространение (т.е. существует только один прямой тракт 170 и только ограниченное число одиночных трактов 180 отражения, но огромное число множественных трактов отражения), наложенные сигналы громкоговорителя, поступающие в микрофон 110, могут считаться практически случайными за пределами данного временного интервала после поступления прямого звука. Эффекты демпфирования акустической среды 120 вызывают затухание в поздней реверберации, которое может моделироваться в качестве экспоненциального затухания.

Как проиллюстрировано на фиг.3, спектры кратковременного дискретного преобразования Фурье (STFT) вычисляются из сигнала 420 громкоговорителя и сигнала 430 микрофона. Временные интервалы, рассматриваемые для STFT-преобразования сигнала 420 громкоговорителя и сигнала 430 микрофона, указываются посредством ссылок 440 и 450 с номерами, соответственно, на фиг.3. Задержка d (ссылка 460 с номером) вводится между сигналом 420 громкоговорителя и сигналом 430 микрофона, поскольку акустический сигнал, испускаемый посредством громкоговорителя 100, требует определенного минимального времени для того, чтобы распространяться в микрофон 110. Задержка d между STFT-окнами, применяемая к сигналу 420 громкоговорителя, выбирается таким образом, что захватывается большая часть энергии импульсной характеристики тракта эхо-сигнала. Представление в STFT-области уравнения (2) задается посредством следующего выражения:

Y [ k , m ] = G [ k , m ] X d [ k , m ] + W [ k , m ] (3)

где k является временным индексом блока, и m обозначает частотный индекс. Xd[k,m] представляет собой соответствие в STFT-области задержанного сигнала x[n-d] громкоговорителя. Из уравнения (3) также становится очевидным, что поздняя реверберация тракта акустического эхо-сигнала не захватывается в модели, поскольку промежуток времени, который охватывается посредством G[k,m], соответствует длине одного STFT-блока. Типично, эти блоки имеют длину 10-30 мс, которая намного меньше стандартных времен реверберации вплоть до нескольких сотен мс.

Фактическое подавление акустических эхо-сигналов выполняется посредством модификации абсолютной величины STFT сигнала Y[k,m] микрофона при поддержании неизменной его фазы. Это может выражаться следующим образом:

E [ k , m ] = H [ k , m ] Y [ k , m ] (4)

где фильтр 370 эхоподавления (ESF) выводит действительнозначный положительный коэффициент H[k,m] усиления. Во временной и частотной дискретной реализации (которая имеет место при кратковременном преобразовании Фурье), значение H[k,m] типично является одним элементом матрицы H, которая является допустимой для рассматриваемого в данный момент STFT-блока.

Действительнозначный положительный коэффициент(ы) H[k,m] усиления предоставляется в фактический адаптивный фильтр 210 (SM: спектральная модификация), который предоставляет сигнал E[k,m] микрофона после эхоподавления в STFT-области. Преобразование обратно из STFT-области во временную область выполняется посредством обратного кратковременного преобразования 300 Фурье (ISTFT), чтобы выводить сигнал e[n].

Согласно блок-схеме по фиг.3, фильтр 370 эхоподавления использует оценку передаточной функции G[k,m] акустической среды, причем оценка обозначается посредством Ĝ[k,m]. Оптимальные значения для фильтра 370 эхоподавления и его вывода H[k,m] могут быть извлечены посредством минимизации доли компонентов эхо-сигнала в выходном сигнале E[k,m] в смысле среднеквадратической ошибки (MSE). Оценка спектра мощности эхо-сигнала получается посредством применения оцененной задержки и оцененной оценочной функции 470 эхо-сигнала (EEF) к спектру мощности сигнала громкоговорителя, например:

| Y ^ [ k , m ] | 2 = | G ^ [ k , m ] | 2 | X d [ k , m ] | 2 (5)

Следует отметить, что на практике передаточная функция |G[k,m]|2 мощности эхо-сигнала неизвестна и должна быть заменена посредством ее оценки, а именно, |Ĝ[k,m]|2.

Оценка передаточной функции G[k,m] эхо-сигнала или ее передаточной функции мощности в оценочной функции 470 эхо-сигнала, например, может быть выполнена так, как описано в [11]. Оценка может быть оценена из корреляции спектров мощности сигналов 420, 430 микрофона и громкоговорителя, соответственно.

| G ^ [ k , m ] | 2 = E { | X d [ k , ] | 2 | Y [ k , m ] | 2 } E { | X d [ k , m ] | 2 | X d [ k , m ] | 2 } (6)

Следует отметить, что на практике математическое ожидание E{ }, используемое здесь, может быть заменено посредством соответствующих кратковременных средних. В качестве примера, рассмотрим следующее:

Φ A B [ k , m ] = E { A [ k , m ] B [ k , m ] } (7)

Кратковременное среднее AB[k,m], соответствующее ΦAB[k,m], например, может быть получено посредством рекурсивного сглаживания согласно следующему:

Φ ^ A B [ k , m ] = ( 1 − a a v g ) Φ ^ A B [ k − 1, m ] + a a v g A [ k , m ] B [ k , m ] (8)

Коэффициент αavg определяет степень сглаживания во времени, и он может регулироваться согласно любым данным требованиям.

Практический подход для вычисления фильтра 370 эхоподавления, например, предложен в [6]:

H [ k , m ] = | Y [ k , m ] | 2 − β | Y ^ [ k , m ] | 2 | Y [ k , m ] | 2 (9)

где β представляет расчетный параметр, чтобы управлять величиной эхо-сигнала, который должен подавляться, как описано в [12].

Следующий параграф обобщает структуру устройства 200 согласно относительно подробно представленному варианту осуществления идей, раскрытых в данном документе. Этот вариант осуществления, возможно, содержит больше компонентов и/или признаков, чем требуется для базовой реализации раскрытых идей.

Модель затухания эхо-сигнала предоставляет параметры затухания эхо-сигнала в средство определения оценочной функции эхо-сигнала. Средство определения оценочной функции эхо-сигнала определяет оценочную функцию эхо-сигнала, которая учитывает параметры затухания эхо-сигнала. Оценочная функция эхо-сигнала затем применяется к сигналу громкоговорителя, чтобы определять оценку эхо-сигнала, когда он возникает в фактической акустической среде. Оценка эхо-сигнала затем может быть использована посредством средства определения значений фильтра эхоподавления (также называемого средством 270 вычисления в этом описании). Средство определения значений фильтра эхоподавления реализуется, чтобы определять фильтр, который, при применении к сигналу микрофона, подавляет компонент эхо-сигнала в сигнале микрофона, который обусловлен сигналом громкоговорителя. С этой целью, коэффициенты фильтрации, которые составляют фильтр эхоподавления, предоставляются в соответствующую структуру фильтра, которая принимает сигнал микрофона в качестве ввода и предоставляет сигнал после эхоподавления в выводе.

На фиг.4 показана огибающая q[n] части поздней реверберации импульсной характеристики комнаты, если предполагается модель экспоненциального затухания:

q [ n ] = e −   n τ (10)

С учетом двух временных выборок dτ и dτ+Δdτ и соответствующих значений q[dτ] и q[dτ+Δdτ], соответственно, постоянная τ времени может быть оценена на основе следующего отношения:

Δ q = q [ d τ + Δ d τ ] q [ d τ ] (11)

которое может записываться следующим образом:

Δ q = e −   Δ d τ τ (12)

Решение для постоянной τ времени дает в результате:

τ = − Δ d τ ln Δ q (13)

В случае если значение q огибающей представляется в частотно-временной области, например, после кратковременного преобразования Фурье (STFT), каждая полоса частот может демонстрировать отдельную постоянную τm времени, называемую постоянной блока во времени. Вычисление постоянной τm блока во времени, используемое в модели STFT-области согласно уравнению (29), поясненному ниже, может быть выполнено аналогичным способом.

Q [ k , m ] = e −   k F S τ m (14)

С учетом двух временных выборок dτ и dτ+Δdτ и соответствующих значений Q[dτ,m] и Q[dτ+Δdτ,m] огибающей, соответственно, постоянная τm времени может быть оценена на основе следующего отношения:

Δ Q [ m ] = Q [ d τ + Δ d τ , m ] Q [ d τ , m ] (15)
Δ Q [ m ] = e −   Δ d τ F S τ m (16)
τ m = −   Δ d τ F S ln ( Δ Q [ m ] ) (17)

В следующем разделе представлен способ для того, чтобы определять ΔQ[m] для данного значения Δdτ. Способ основан на подходе, аналогичном подходу, используемому для определения оценочной функции эх