Способ и устройство оценки аудиопомехи
Иллюстрации
Показать всеИзобретение относится к акустике, в частности к устройствам измерения уровня шума. Устройство оценки аудиопомех содержит микрофон, причем сигнал микрофона содержит составляющую тестового сигнала, соответствующую тестовому аудиосигналу, делитель для разделения сигнала микрофона на множество интервальных составляющих тестового сигнала. Каждая интервальная составляющая тестового сигнала соответствует сигналу микрофона в некоторый интервал времени, тестовый аудиосигнал содержит множество повторов составляющей аудиосигнала, и распределение во времени интервальных составляющих тестового сигнала соответствует распределению во времени упомянутых повторов. Процессор наборов для формирования наборов интервальных составляющих тестового сигнала из упомянутого множества интервальных составляющих тестового сигнала, процессор подобия для формирования значения подобия для каждого набора интервальных составляющих тестового сигнала; средство оценки помехи для определения показателя помехи для отдельных интервальных составляющих тестового сигнала в ответ на значения подобия. Технический результат - повышение точности измерений и оценки помех. 2 н. и 11 з.п. ф-лы, 10 ил.
Реферат
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Изобретение относится к оценке аудиопомехи и, в частности, но не исключительно, к адаптации обработки аудиосигналов, которая включает в себя рассмотрение оценок помех для сигнала микрофона.
УРОВЕНЬ ТЕХНИКИ
Аудиосистемы, как правило, разрабатываются при условии конкретных общих допущений относительно акустической среды, в которой они используются, и относительно свойств применяемого оборудования. Тем не менее, реальные среды, в которых они используются, а также зачастую характеристики оборудования могут существенно изменяться. В связи с этим многие аудиосистемы и аудиоприложения обладают функциональной возможностью адаптации к текущим рабочим характеристикам. В частности, многие аудиосистемы обладают функциональной возможностью калибровки и адаптации системы, например, к конкретной акустической среде, в которой они используются. Такая адаптация может выполняться регулярно для вычисления изменений со временем.
На самом деле, во многих приложениях, в частности тех, которые относятся к системам коррекции речевых сигналов для голосовой связи, параметры, связанные с алгоритмом, адаптируются к характеристикам конкретного устройства и его аппаратного обеспечения, таким как, например, характеристики микрофона (микрофонов), громкоговорителя (громкоговорителей) и т.д. Несмотря на то что существуют адаптивные методики обработки сигналов для выполнения такой адаптации во время обычной работы устройства, зачастую конкретные параметры (в особенности те, на которых основаны такие адаптивные методики) должны оцениваться в процессе производства во время специального сеанса калибровки, который обычно выполняется в контролируемой, например, бесшумной среде только в присутствии ожидаемых сигналов.
Такая калибровка может выполняться при условиях, близких к идеальным. Однако результирующая производительность системы может ухудшаться, когда адаптация выполняется в среде применения. В таких средах может нередко присутствовать локальная помеха, такая как речевой сигнал и шум.
Например, вспомогательное средство связи, содержащее один или более микрофонов, которое может быть присоединено к телевизору и которое дополнительно выполнено с возможностью использовать громкоговорители телевизора и автономную обработку, может быть не настроено/адаптировано/откалибровано в процессе производства, поскольку соответствующее аппаратное обеспечение зависит от конкретного телевизора, в котором оно используется. Следовательно, адаптация должна выполняться пользователем у него или нее дома, где уровни шума могут привести к плохо адаптированной системе.
В качестве конкретного примера, многие системы связи зачастую используются в сочетании с другими устройствами или в диапазоне разных акустических сред. Примером одного такого устройства является вспомогательное средство связи «hands-free» (гарнитура) со встроенными микрофонами для Интернет-услуги телефонной связи с использованием телевизора. Такое устройство может быть установлено на или около телевизора и может также включать в себя видеокамеру и блок обработки цифровых сигналов, тем самым позволяя использовать программное обеспечение непосредственно через телевизор, чтобы соединиться с другими устройствами и осуществлять двустороннюю или многостороннюю связи. Трудности при разработке такого вспомогательного средства связаны с широким ассортиментом телевизоров, с которыми оно может использоваться, а также с изменениями акустических сред, в которых оно должно быть способно демонстрировать приемлемую производительность.
Тракт воспроизведения аудиосигналов в телевизионных установках и среды, в которых они используются, влияют на акустические характеристики выдаваемого звука. Например, некоторые телевизоры используют компоненты с точным воспроизведением в аудиотракте, такие как улучшенные громкоговорители, способные функционировать в линейном режиме в широком диапазоне динамических входных сигналов, в то время как другие – применяют нелинейную обработку по отношению к принятым аудиосигналам, такую как стимулированный окружающий звук и усиление басов, или сжатие динамического диапазона. Кроме того, выходной аудиосигнал телевизора может подаваться в домашнюю аудиосистему, при этом громкоговорители телевизора отключены.
Системы коррекции речевых сигналов применяют алгоритмы обработки сигналов, такие как подавление акустического эха, шумоглушение и подавление реверберации, по отношению к записанному сигналу (записанным сигналам) (микрофона) и передают четкий речевой сигнал участнику вызова на дальнем конце линии связи. Коррекция речевых сигналов ориентирована на то, чтобы улучшить качество звука, например, чтобы уменьшить утомление слушателя, связанное с долгими разговорами. Производительность такой коррекции речевых сигналов может зависеть от различных характеристик применяемого оборудования и аудиосреды.
Тот факт, что такие устройства используются в таком широком диапазоне сценариев, затрудняет обеспечение стабильного функционирования системы коррекции речевых сигналов. Следовательно, системы коррекции речевых сигналов обычно адаптируются/настраиваются в процессе установки устройства и/или во время работы устройства, когда система демонстрирует плохую производительность коррекции речевых сигналов. Большинство методов адаптации используют тестовый сигнал, который воспроизводится системой воспроизведения звука присоединенного устройства и записывается устройством записи для оценки и установки значений акустических параметров для системы коррекции речевых сигналов.
В качестве простого примера метода настройки можно рассмотреть измерение акустического импульсного отклика комнаты. Среды прослушивания, такие как, например, гостиные, характеризуются собственным временем реверберации, которое определяется как время, требуемое для того, чтобы акустический импульсный отклик комнаты ослаб на конкретную величину. Например, Т60 обозначает количество времени, за которое хвостовая часть акустического импульсного отклика комнаты ослабнет на 60 дБ.
Тестовый сигнал, такой как белый шум, может воспроизводиться громкоговорителем устройства, и результирующий звуковой сигнал может записываться с помощью микрофона. Адаптивный фильтр затем используется для оценки линейного акустического импульсного отклика. Из этого импульсного отклика различные параметры, например, Т60, могут быть оценены и использованы для улучшения производительности системы коррекции речевых сигналов, например, за счет выполнения подавления реверберации на основе времени реверберации. В качестве конкретного примера, время реверберации зачастую измеряется с использованием кривой спада энергии, задаваемой следующим образом:
где h(t) представляет собой акустический импульсный отклик. Акустический импульсный отклик и его соответствующая кривая спада энергии показана на Фиг. 1.
Тем не менее, значительная проблема, связанная с процедурами адаптации на основе тестовых аудиосигналов, состоит в том, что они подвержены изменению в присутствии звуковых помех. В частности, если имеется источник звуковых помех, то он будет вызывать искажение записанного сигнала относительно воспроизведенного аудиосигнала, тем самым ухудшая процесс адаптации.
Например, при определении акустического импульсного отклика комнаты сигнал, записанный микрофоном, может быть испорчен источниками звуковых помех, которые могут привести к ошибкам в оценке импульсного отклика или которые могут даже привести к тому, что оценивание импульсного отклика не даст в итоге никакой оценки (например, вследствие того, что адаптивный фильтр, оценивающий вычисленный импульсный отклик, не способен осуществить схождение).
Методы адаптации для обработки аудиосигналов, такие как, например, для систем коррекции речевых сигналов, обычно предполагают, что присутствуют только известные и подходящие источники звука, такие как, в частности, тестовые звуки, которые используются для этой адаптации. Например, для настройки системы подавления акустического эха сигнал, записанный микрофоном, должен только содержать сигнал, выданный громкоговорителем (эхо). Любая локальная помеха, например, источники шума или динамики на ближнем конце линии связи в локальной среде, будут только ухудшать результирующую производительность.
Так как в целом невозможно гарантировать, что нет других источников звука, отличных от тех, что используются при адаптации, соответственно зачастую крайне важно, чтобы была возможность оценить, имеется ли помеха, и, если да, то зачастую будет полезно оценить, насколько эта помеха сильна. Следовательно, оценка помехи часто важна для адаптации обработки аудиосигналов, и в особенности желательно, чтобы относительно точная оценка помехи могла быть получена без использования сверхсложной обработки. На самом деле, оценки помех могут быть приемлемы для многих алгоритмов и подходов к обработке аудиосигналов, и соответственно существует необходимость в улучшенных подходах к определению оценки аудиопомехи.
Отсюда следует, что был бы полезным улучшенный подход к формированию показателя аудиопомехи, и, в частности, был бы полезным подход, обеспечивающий улучшенную гибкость, уменьшенную сложность, снижение расходов на применение, облегченное функционирование, улучшенную точность, увеличенную надежность и/или улучшенную производительность.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Соответственно данное изобретение предпочтительно ориентировано на то, чтобы подавить, уменьшить или устранить один или более из вышеупомянутых недостатков по отдельности или в любом их сочетании.
Согласно аспекту изобретения, предложено устройство, содержащее: приемник для приема сигнала микрофона от микрофона, причем сигнал микрофона содержит составляющую тестового сигнала, соответствующую тестовому аудиосигналу, захваченному микрофоном; делитель для разделения сигнала микрофона на множество интервальных составляющих тестового сигнала, причем каждая интервальная составляющая тестового сигнала соответствует сигналу микрофона в некоторый интервал времени; процессор наборов для формирования наборов интервальных составляющих тестового сигнала из множества интервальных составляющих тестового сигнала; процессор подобия для формирования значения подобия для каждого набора интервальных составляющих тестового сигнала; средство оценки помехи для определения показателя помехи для отдельных интервальных составляющих тестового сигнала в ответ на значения подобия.
Изобретение может обеспечить улучшенное и/или облегченное определение показателя аудиопомехи, указывающего уровень аудиопомехи, присутствующей в сигнале микрофона. Этот подход может обеспечить низкую сложность и/или надежное определение присутствия помехи в акустической среде, записываемой микрофоном. Показатель помехи может быть входным значением для других алгоритмов обработки аудиосигналов, которые применяют или функционируют на основе сигнала микрофона.
Данный подход предусматривает определение помехи с низкой сложностью. Определенное преимущество состоит в том, что системе не требуется явно знать особенности тестового аудиосигнала, так как показатель помехи может быть определен из прямого сравнения разных частей сигнала микрофона и не требует сравнения с известным заранее определенным опорным сигналом.
Этот подход может облегчить взаимодействие с другим оборудованием и может быть добавлен в существующее оборудование.
В некоторых вариантах осуществления устройство может дополнительно содержать генератор тестового сигнала для формирования тестового сигнала для воспроизведения аудиопреобразователем, тем самым формируя тестовый аудиосигнал. Тестовый аудиосигнал может предпочтительно иметь повторяющиеся характеристики и может содержать или состоять из набора повторов фундаментальной сигнальной последовательности.
Устройство может допускать, что сигнал микрофона содержит тестовый аудиосигнал. Таким образом, показатель помехи может определяться при допущении присутствия составляющей тестового аудиосигнала в сигнале микрофона. Необязательно или несущественно, чтобы устройство определяло или было обеспечено информацией, указывающей, что присутствует тестовый сигнал.
В соответствии с необязательным признаком изобретения, устройство дополнительно содержит блок калибровки для адаптации обработки сигналов в ответ на интервальные составляющие тестового сигнала, причем блок калибровки выполнен с возможностью присваивать весовые коэффициенты, по меньшей мере, вкладу первой интервальной составляющей тестового сигнала в ответ на оценку помехи для первого интервала времени.
Изобретение может обеспечить улучшенную адаптацию алгоритмов обработки аудиосигналов. В частности, чувствительность и ухудшение, вызванные нестационарной аудиопомехой, могут быть существенно снижены.
Присваивание весовых коэффициентов может, например, применяться непосредственно к составляющим сигнала для интервала времени или может, например, применяться к параметрам адаптации, сформированным в соответствии с составляющими сигнала для интервала времени.
В соответствии с необязательным признаком изобретения, устройство дополнительно содержит блок калибровки для адаптации обработки сигналов в ответ на интервальные составляющие тестового сигнала, причем блок калибровки выполнен с возможностью присваивать весовые коэффициенты, по меньшей мере, вкладу первой интервальной составляющей тестового сигнала в ответ на оценку помехи для первого интервала времени.
Это может улучшить адаптацию. В частности, это может обеспечить низкую сложность и еще улучшить производительность. Данный подход может позволить отбросить составляющие сигнала для интервала времени, подверженные слишком сильной аудиопомехе, тем самым предотвращая ухудшение ими адаптации.
В соответствии с необязательным признаком изобретения, устройство дополнительно содержит средство оценки стационарного шума, выполненное с возможностью формирования оценки стационарного шума и компенсации по меньшей мере одного из порового значения и оценки помехи в ответ на оценку стационарного шума.
Это может обеспечить более точный показатель помехи и, в частности, может обеспечить более точное определение составляющих сигнала для интервала времени, подверженных слишком сильной нестационарной помехе.
Оценка стационарного шума может, в частности, быть оценкой уровня шума.
В соответствии с необязательным признаком изобретения, устройство дополнительно содержит средство оценки тестового сигнала, выполненное с возможностью формирования оценки уровня для составляющей тестового сигнала и компенсации по меньшей мере одного из порового значения и оценки помехи в ответ на оценку уровня.
Это может обеспечить более точный показатель помехи и, в частности, может обеспечить более точное обнаружение составляющих сигнала для интервала времени, подверженных слишком сильной нестационарной помехе.
Многие показатели подобия и соответственно показатели помехи могут зависеть от энергии сигнала, и компенсация энергии тестового сигнала может приводить к более точному показателю помехи.
В частности, составляющая тестового сигнала может представлять собой составляющую эха из громкоговорителя системы, и путем компенсации эха может быть достигнута улучшенная производительность.
В соответствии с необязательным признаком изобретения, делитель выполнен с возможностью разделения сигнала микрофона на множество интервальных составляющих тестового сигнала в ответ на характеристики повторяемости тестового аудиосигнала.
Это может обеспечить улучшенную производительность и упростить функционирование. Делитель может, в частности, разделять сигнал микрофона на множество интервальных составляющих тестового сигнала в соответствии с продолжительностью и/или синхронизацией повторов тестового аудиосигнала. Составляющие сигнала для интервала времени могут быть синхронизированы с повторами тестового аудиосигнала.
В соответствии с необязательным признаком изобретения, тестовый аудиосигнал содержит множество повторов составляющей аудиосигнала, и синхронизация интервальных составляющих тестового сигнала соответствует синхронизации повторов.
Это может обеспечить улучшенную производительность и/или упрощенное функционирование. Каждая составляющая сигнала для интервала времени может, в частности, соответствовать интервалу, который совпадает с целым числом повторов составляющей аудиосигнала.
В соответствии с необязательным признаком изобретения, средство оценки помехи выполнено с возможностью, для первой интервальной составляющей тестового сигнала из множества интервальных составляющих тестового сигнала, определения максимального значения подобия для значений подобия из наборов, включающих в себя первую интервальную составляющую тестового сигнала, и определения показателя помехи для первой интервальной составляющей тестового сигнала в ответ на максимальное значение подобия.
Это может улучшить производительность и/или снизить сложность. В частности, это может увеличить вероятность идентификации составляющих сигнала для интервала времени, подверженных низкой аудиопомехе.
В соответствии с необязательным признаком изобретения, делитель выполнен с возможностью формирования по меньшей мере двух наборов, содержащих по меньшей мере первую из интервальных составляющих тестового сигнала.
Это может улучшить производительность и/или снизить сложность. В частности, это может увеличить вероятность идентификации составляющих сигнала для интервала времени, подверженных низкой аудиопомехе.
В соответствии с необязательным признаком изобретения, каждый набор состоит из двух интервальных составляющих тестового сигнала.
Это может улучшить производительность и/или снизить сложность. В частности, это может увеличить вероятность идентификации составляющих сигнала для интервала времени, подверженных низкой аудиопомехе.
В соответствии с необязательным признаком изобретения, делитель выполнен с возможностью формирования наборов, соответствующих всем парным комбинациям интервальных составляющих тестового сигнала.
Это может улучшить производительность и/или снизить сложность. В частности, это может увеличить вероятность идентификации составляющих сигнала для интервала времени, подверженных низкой аудиопомехе.
Согласно аспекту изобретения, предложен способ формирования показателя аудиопомехи, причем способ содержит этапы, на которых: принимают сигнал микрофона от микрофона, причем сигнал микрофона содержит составляющую тестового сигнала, соответствующую тестовому аудиосигналу, захваченному микрофоном; разделяют сигнал микрофона на множество интервальных составляющих тестового сигнала, причем каждая интервальная составляющая тестового сигнала соответствует сигналу микрофона в некоторый интервал времени; формируют наборы интервальных составляющих тестового сигнала из множества интервальных составляющих тестового сигнала; формируют значение подобия для каждого набора интервальных составляющих тестового сигнала; и определяют показатель помехи для отдельных интервальных составляющих тестового сигнала в ответ на значения подобия.
Эти и другие аспекты, признаки и преимущества изобретения будут очевидны и пояснены со ссылкой на вариант (варианты) осуществления, описанный (описанные) в дальнейшем.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Варианты осуществления изобретения будут описаны исключительно в качестве примера со ссылкой на чертежи, на которых:
Фиг. 1 иллюстрирует пример акустического импульсного отклика и его соответствующей кривой спада энергии для комнаты;
Фиг. 2 иллюстрирует пример элементов системы обработки аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения; и
Фиг. 3-10 иллюстрируют экспериментальные результаты для системы обработки аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Нижеследующее описание сфокусировано на вариантах осуществления изобретения, пригодных для формирования оценки аудиопомехи для применения адаптации к обработке аудиосигналов, но необходимо понимать, что изобретение не ограничено этим применением и может быть использовано во многих других аудиоприложениях.
Фиг. 2 иллюстрирует пример системы обработки аудиосигналов в соответствии с некоторыми вариантами осуществления изобретения.
Аудиосистема содержит микрофон 201, который выполнен с возможностью записи звука в акустической среде. Сигнал микрофона, сформированный микрофоном 201, может, в частности, представлять собой звук в комнате, записанный в положении микрофона 201.
Микрофон 201 соединен с приемником 203, который принимает сигнал микрофона. В большинстве вариантов осуществления приемник 203 может содержать усилитель, фильтр и, по возможности, аналого-цифровой преобразователь, обеспечивающий цифровую версию сигнала микрофона, тем самым позволяя выполнять последующую обработку в цифровом формате.
В данном примере система обработки аудиосигналов дополнительно содержит процессор 205 приложений, который выполнен с возможностью поддержки или исполнения аудиоприложения. Процессор 205 приложений принимает сигнал микрофона от приемника 204 и приступает к его обработке в соответствии с конкретным аудиоприложением.
Аудиоприложение может, например, быть приложением связи, которое поддерживает двустороннюю связи с удаленным объектом. Тем не менее, должно быть понятно, что описанные принципы адаптации и оценки помехи могут быть использованы с любым подходящим приложением. В данном примере процессор 205 приложений выполнен с возможностью приема сигнала микрофона и обработки его для передачи на удаленный блок связи. Обработка может включать в себя коррекцию речевых сигналов, подавление эха, кодирование речевых сигналов и т.д. Процессор 205 приложений дополнительно выполнен с возможностью приема аудиоданных от удаленного блока связи и обработки их для формирования сигнала, который может быть воспроизведен локально. Таким образом, процессор 205 приложений принимает аудиоданные от удаленного блока и формирует соответствующий выходной аудиосигнал.
Система обработки аудиосигналов с Фиг. 2, поэтому содержит управляющий блок 207 громкоговорителя и аудиопреобразователь, который в данном конкретном примере представляет собой громкоговоритель 209. Управляющий блок 207 громкоговорителя принимает аудиосигнал от процессора 205 приложений и приступает к формированию соответствующего управляющего сигнала для громкоговорителя 209. Управляющий блок 207 громкоговорителя может, в частности, содержать схему усиления, как известно специалисту в данной области техники.
В данном примере процессор 205 приложений выполнен с возможностью выполнения коррекции речевых сигналов и, в частности, подавления и/или ослабления эха в отношении принятого сигнала микрофона. Аудиосигнал, воспроизводимый громкоговорителем 209, может быть принят микрофоном 201, и, если этот вклад не подавлен, то он приведет к тому, что удаленный блок примет копию своего собственного сигнала. Это будет похоже на эхо на удаленном блоке связи, и соответственно процессор 205 приложений обладает функциональной возможностью ослабления составляющей сигнала, соответствующей воспроизведенному аудиосигналу из громкоговорителя 209, в сигнале микрофона. Такая обработка известна как подавление эха.
Чтобы осуществить оптимальное подавление эха, алгоритм должен быть адаптирован к конкретным характеристикам как используемого оборудования, так и акустической среды, в которой оно применяется. В частности, тракт сигнала от процессора 205 приложений через управляющий блок 207 громкоговорителя, громкоговоритель 201, акустический тракт от громкоговорителя 209 к микрофону 201 и от микрофона 201 и приемника 203 назад к процессору 205 приложений должны быть предпочтительно известны, а также способны к подавлению эха, с тем чтобы выполнить адаптацию для подавления эха.
Соответственно система с Фиг. 1 включает в себя процессор 211 калибровки, который выполнен с возможностью адаптации обработки аудиосигналов процессора 205 приложений. В данном конкретном примере процессор 211 калибровки выполнен с возможностью оценки передаточной функции сигнального тракта от процессора 205 приложений через громкоговоритель 209 и микрофон 201 назад к процессору 205 приложений, т.е. сигнального тракта от входа в управляющий блок 207 громкоговорителя до выхода приемника 203.
Процессор 211 калибровки оценивает передаточную функцию, используя тестовый сигнал. Аудиосистема соответственно содержит генератор 213 тестового сигнала, который формирует тестовый сигнал, который подается в управляющий блок 207 громкоговорителя. Тестовый сигнал соответственно воспроизводиться громкоговорителем 209, и часть результирующего тестового аудиосигнала записывается микрофоном 201. Выходной сигнал приемника 203 подается на процессор 211 калибровки, который может переходить к определению характеристик передаточной функции путем сравнения его со сформированным тестовым сигналом. Результирующие параметры импульсного отклика/передаточной функции затем поступают в процессор 205 приложений и используются для подавления эха.
Должно быть понятно, что в разных вариантах осуществления могут использоваться разные тестовые сигналы и оценки импульсного отклика, и что может использоваться любой подходящий подход. Например, тестовый сигнал может быть коротким импульсом (соответствующим аппроксимации импульса Дирака) или может, например, быть разверткой по частоте, или может, например, быть искусственным речевым сигналом, который, будучи неразборчивым, содержит спектральные характеристики временной области, аналогичные характеристикам реальной речи.
Чтобы калибровка была оптимальной, единственный звук, записанный микрофоном 201, должен быть тем, что соответствует тестовому сигналу. Соответственно система обработки аудиосигналов, как правило, не воспроизводит какой-либо другой звук во время операции подавления. Тем не менее, даже в этом случае вероятно существует аудиопомеха, вызванная другими источниками звука в акустической среде. Например, в комнате может быть много разговаривающих людей, другие аудиоустройства могут быть активны и т.д. Такая аудиопомеха будет ухудшать оценку импульсного отклика и, тем самым, приведет к ухудшенной производительности подавления эха.
Система обработки аудиосигналов с Фиг. 2 обладает функциональной возможностью формирования показателя помехи, указывающего величину и/или присутствие аудиопомехи. В данном примере любой звук, возникающий не вследствие воспроизведения тестового сигнала, является аудиопомехой. Таким образом, система обработки аудиосигналов формирует величину, указывающую уровень записанного звука, который возник не вследствие воспроизведения тестового сигнала.
Показатель помехи может, например, использоваться для определения того, когда калибровка выполняется процессором 211 калибровки. Например, процессор 211 калибровки может адаптировать обработку процессора 205 приложения в соответствии с сигналом микрофона только в интервалы времени, в которые показатель помехи указывает, что аудиопомеха ниже заданного уровня. В некоторых вариантах осуществления показатель помехи может использоваться для формирования показателя надежности для сформированных значений калибровки, и, например, коррекция существующих параметров в зависимости от калибровки может зависеть от такого показателя надежности. Например, когда надежность низкая, применяется только минимальная адаптация, в то время как более значительная адаптация выполняется, когда надежность высокая.
Более конкретно, система обработки аудиосигналов содержит делитель 215, который разделяет сигнал микрофона на множество интервальных составляющих тестового сигнала. Каждая из интервальных составляющих тестового сигнала соответствует сигналу микрофона в некоторый интервал времени.
В данном примере, показанном на Фиг. 2, тестовый сигнал формируется таким образом, что он представляет собой повторяющийся сигнал. В частности, один и тот же сигнал может повторяться в течение набора последовательных интервалов времени. В системе делитель 215 выполнен с возможностью разделения сигнала микрофона на интервалы времени, которые синхронизированы с этими интервалами времени повтора. В частности, делитель 215 разделяет сигнал микрофона на интервалы времени, которые имеют продолжительность, кратную продолжительности повтора тестовых сигналов и, кроме того, имеющую начальное и конечное времена, совпадающие с начальным и конечным временами интервалов времени повтора. В частности, интервалы повтора и поделенные интервалы времени могут быть по существу идентичными. В качестве альтернативы, разделение может выполняться на интервалы времени, которые (по возможности, существенно) меньше, чем интервалы повтора. Однако, если меньшие интервалы времени разделения синхронизированы относительно интервалов повтора, соответствующие области в разных интервалах повтора могут быть все еще идентичными в отсутствие любого ухудшения или шума. Синхронизация может быть либо автоматической, например, просто посредством генератора тестового сигнала и делителя интервалов времени, использующих одинаковые сигналы синхронизации, или может, например, достигаться за счет процесса синхронизации (такого как, например, максимизация показателя корреляции).
Делитель соединен с процессором 217 наборов, который принимает промежуточные составляющие тестового сигнала из делителя. Процессор 217 наборов выполнен с возможностью формирования множества наборов интервальных составляющих тестового сигнала. В данном конкретном примере каждый набор содержит две промежуточные составляющие тестового сигнала, и, таким образом, процессор 217 наборов формирует множество пар интервальных составляющих тестового сигнала.
Для краткости и ясности каждая интервальная составляющая тестового сигнала будет в дальнейшем упоминаться как сигнальный блок.
Пары сигнальных блоков подаются в процессор 219 подобия, который выполнен с возможностью определения значения подобия для каждого из наборов, сформированных процессором 217 наборов. Значение подобия для набора сигнальных блоков указывает, насколько подобны сигнальные блоки, например, оно указывает, насколько остается подобным сигнал микрофона в интервалы времени, входящие в состав отдельного набора.
Должно быть понятно, что может использоваться любое подходящее значение подобия для определения, насколько подобны два сигнала. В частности, значение взаимной корреляции может быть сформировано и использовано в качестве значения подобия. В случае, когда каждый набор содержит более чем два сигнальных блока, значения подобия могут быть определены на попарной основе, и значение подобия для всего набора может быть определено в качестве среднего или суммарного значения подобия.
Процессор 219 подобия соединен со средством 221 оценки помехи, которое дополнительно соединено с процессором 217 наборов и процессором 211 калибровки. Средство 221 оценки помехи выполнено с возможностью формирования показателя помехи для разных сигнальных блоков на основе сформированных показателей подобия. В частности, оценка помехи для первого сигнального блока формируется на основе значений подобия, определенных для наборов, в состав которых входит первый сигнальный блок. Таким образом, в системе с Фиг. 2 показатель помехи сигнального блока определяется в ответ на значения подобия для по меньшей мере одного набора, содержащего этот сигнальный блок.
В качестве конкретного примера, показатель помехи для первого сигнального блока может быть сформирован в виде среднего значения подобия для наборов, в состав которых включен сигнальный блок, по возможности, в сравнении со средним значением подобия для наборов, в состав которых не включен первый сигнальный блок. В качестве другого примера, показатель подобия может быть определен как соответствующий максимальному значению подобия для набора, в состав которого включен первый сигнальный блок.
Показатель помехи подается в процессор 211 калибровки, который использует показатель помехи в процессе калибровки. Например, процессор калибровки может использовать показатель помехи в качестве показателя надежности для сформированных параметров адаптации. В качестве другого примера, процессор 211 калибровки может выполнять калибровку с использованием только сигнальных блоков, для которых показатель помехи достаточно высокий, тем самым указывая, что аудиопомеха достаточно низкая.
Настоящие изобретатели осознали, что аудиопомеха, как правило, является нестационарной, и что это может быть использовано для формирования оценки помехи. В присутствии нестационарной помехи записанный сигнал микрофона, вероятно, изменяется больше, чем в отсутствии нестационарной помехи. Это применяется в системе, показанной на Фиг. 2, для формирования показателя помехи. На самом деле, подобие между сигнальными блоками, вероятно, уменьшается существенно в присутствии источника значительной нестационарной помехи. Для заданного сигнального блока низкое значение подобия в сравнении с сигнальным блоком в разное время является, следовательно, показателем наличия помехи, в то время как более высокое значение подобия, как правило, указывает на отсутствие или присутствие более слабой помехи.
Данное воздействие является особенно значительным при сочетании формирования и воспроизведения конкретного тестового сигнала с повторяющимися особенностями, которые синхронизированы с интервалами времени сигнальных блоков. В таких сценариях, если нет шума или помехи, сигнал микрофона будет (по существу) идентичным тестовому сигналу, и, тем самым, разные сигнальные блоки будут также (по существу) идентичными, что приведет к показателю подобия, имеющему очень высокое значение. По мере увеличения (нестационарной) помехи это будет воздействовать на записанный аудиосигнал по-разному в разные времена и, таким образом, приведет к тому, что сигнальные блоки будут сильно различаться. Соответственно значение подобия между двумя сигнальными блоками уменьшиться при увеличении помехи.
Значения подобия для заданного набора сигнальных блоков соответствующим образом уменьшаются при увеличении помехи. Таким образом, для заданного сигнального блока значение подобия для наборов, в состав которых включен сигнальный блок, обеспечивает хорошее указание уровня присутствующей аудиопомехи.
Описанный подход может обеспечить улучшенную адаптацию алгоритмов обработки аудиосигналов, например, для коррекции речевых сигналов или подавления эха. Методы адаптации, например, для коррекции речевых сигналов обычно предполагают присутствие только ожидаемых источников звука. Например, для настройки системы подавления акустического эха сигнал, записанный микрофоном, как предполагается, содержит только сигнал, выданный громкоговорителем (т.е. эхо). Любые локальные искажения, такие как источники шума или динамики на ближнем конце линии связи в локальной среде, будут приводить к ухудшению результирующей производительности. На практике отсутствие любой помехи, как правило, маловероятно, и скорее записанный сигнал является испорченным аудиопомехой, созданной в среде на ближнем конце линии связи, например, пользователями на ближнем конце линии связи, которые перемещаются или разговаривают, или локальными источниками шума, такими как вентиляционные системы. Следовательно, системные параметры, определенные методом адаптации, будет зачастую не являться достоверным представлением акустических свойств устройств и локальных сред.