Оценка местоположения источника звука с использованием фильтрования частиц

Иллюстрации

Показать все

Использование: изобретение относится к оценке местоположения источника звука с использованием фильтрования частиц, в частности к оценке местоположения источника звука для мультимодального приложения аудиовизуальной связи. Сущность: местоположение источника звука оценивается посредством фильтрования частиц, при котором частицы представляют функцию плотности вероятности для переменной состояния, содержащей местоположение источника звука. Способ включает в себя определение весового коэффициента для частицы, в ответ на корреляцию между оцененными акустическими передаточными функциями от источника звука к, по меньшей мере, двум позициям записи звука. Функция обновления весового коэффициента, в частности, может быть определена детерминированно из корреляции, и таким образом корреляция может быть использована в качестве функции псевдоправдоподобия для измерения функции фильтрования частиц. Акустические передаточные функции могут быть определены из формирования диаграммы направленности аудио по направлению к источнику звука. Аудиовесовой коэффициент может быть комбинирован с видеовесовым коэффициентом для генерации подхода мультимодального фильтрования частиц. Технический результат: увеличение приспособляемости, снижение сложности оценки местоположения источника звука с одновременным увеличением точности и улучшением производительности. 2 н. и 13 з.п. ф-лы, 9 ил.

Реферат

Область техники изобретения

Изобретение относится к оценке местоположения источника звука с использованием фильтрования частиц и в частности, но не исключительно, к оценке местоположения источника звука для мультимодального приложения аудиовизуальной связи.

Уровень техники изобретения

Обнаружение позиции местоположения источника звука важно для многих услуг и приложений. Например, в приложении аудиовизуальной телеконференции повышенные функциональные возможности могут быть достигнуты посредством обнаружения позиции говорящего, например посредством улучшения сигнала речи благодаря методам формирования диаграммы направленности, используя оцененную позицию говорящего для направления диаграммы. В качестве другого примера, видео может быть улучшено, например, посредством увеличения на оцененную позицию говорящего.

Соответственно, разработаны системы и алгоритмы для оценивания местоположения источника звука. В частности, предложено использовать методы фильтрования частиц для оценки и отслеживания позиции источника звука. Фильтрование частиц направленно на оценку значения переменной состояния, отражающей текущее состояние системы для последующих моментов времени. Например, фильтр частиц может пытаться оценить значение переменной состояния, представляющей позицию источника звука. Однако, вместо того, чтобы просто рассмотреть отдельное значение или оценку, фильтрование частиц рассматривает плотность вероятности для переменной состояния в каждый момент времени. Фильтрование частиц основано на последовательном подходе, в котором значение переменной состояния для заданного (выборного) момента времени определяется исходя из значения переменной состояния в предшествующий (выборный) момент времени. Поскольку переменная состояния в момент времени представлена ее функцией плотности вероятности (таким образом отражая неопределенность в знании/оценке значения переменной состояния), это в принципе влечет за собой определение функции плотности вероятности в момент времени из функции плотности вероятности в предшествующий момент времени.

Однако во многих сценариях это не является аналитически практично, осуществимо или даже возможно. Например, для нелинейных систем c негауссовским шумом не осуществимо вычисление функции плотности вероятности в заданный момент времени, основанное на функции плотности вероятности в предшествующий момент времени. Фильтрование частиц решает эту проблему посредством представления функции плотности вероятности в виде набора частиц, в котором каждая частица представляет возможное значение переменной состояния. Тогда функция плотности вероятности в заданный момент времени определяется посредством вычисления обновленного значения переменной состояния каждой частицы предшествующего момента времени, на основе известной функции обновления переменной состояния. Обновление частицы, кроме того, может добавлять шум в соответствии с подходящим шумовым профилем.

Кроме того, каждая частица имеет ассоциированный весовой коэффициент, который представляет степень правдоподобия для частицы. Весовой коэффициент частицы изменяется при обновлении от одного момента времени к следующему на основе измерения системы. Таким образом предполагается, что измеренное значение может быть оценено или вычислено из значения переменной состояния (например, посредством функции измерения). Эти отношения могут, в частности, включать в себя шумовой вклад в соответствии с известным (или предполагаемым) шумовым профилем. Соответственно, весовой коэффициент частицы может быть изменен как функция обновления. В частности, если сделанное фактическое измерение имеет относительно высокую результирующую вероятность из значения обновленной переменной состояния (как, оценено с использованием функции измерения), весовой коэффициент частицы увеличивается относительно предшествующего весового коэффициента. Или наоборот, если сделанное фактическое измерение имеет относительно низкую результирующую вероятность из значения обновленной переменной состояния, весовой коэффициент частицы уменьшается по отношению к предшествующему весовому коэффициенту.

Таким образом, как часть обновления частицы из одного момента времени к следующему, весовой коэффициент частиц изменяется, для отражения того, насколько вероятно данная частица приводит в результате к новому измерению. Таким образом, весовые коэффициенты постоянно обновляются для отражения правдоподобия того, что отдельная частица соответствует фактическому значению состояния, результирующему в измеренных значениях.

Таким образом, при фильтровании частиц каждая частица может быть рассмотрена в качестве дискретной выборкой функции плотности вероятности переменной состояния.

Весовые коэффициенты будут типично сходиться по направлению к функции плотности вероятности для переменной состояния. Однако подход фильтрования частиц зачастую может привести в результате к вырождению весовых коэффициентов так, что большое количество весовых коэффициентов в конечном итоге имеют очень малые значения, тогда как другие имеют большие значения. Другими словами, фильтрование частиц может привести в результате к информации, сконцентрированной в относительно низкой доле частиц. С целью устранения этой проблемы может быть выполнена повторная выборка, в которой генерируются новые выборки, которые предоставляют более равномерное распределение выборных частиц. Этот подход соответствует важности выборного подхода и будет приводить в результате ко многим частицам, сконцентрированным в областях, для которых функция плотности вероятности имеет относительно высокое значение, и меньше частиц находятся в областях, в которых функция плотности вероятности имеет меньшие значения.

В качестве конкретного примера, повторная выборка может быть выполнена посредством вычисления среднего весового коэффициента на частицу и после генерации нового набора частиц c назначением этого весового коэффициента для каждой частицы. Однако этот новый набор частиц будет распределяться для отражения предшествующих весовых коэффициентов частиц. В качестве конкретного примера, каждая частица может быть разделена на некоторое количество частиц с (приблизительно) одинаковым значением переменной состояния, с некоторым количеством новых выборок, заданных в качестве весового коэффициента частицы, разделенной посредством среднего весового коэффициента. Кроме того, это приведет в результате к большому количеству частиц, удаленных из набора частиц (и замененных посредством дублирующих частиц, для частиц с весовым коэффициентом выше среднего).

Таким образом, в любой заданный момент функция плотности вероятности для переменной состояния представляется комбинацией распределения частиц (т.е. важна выборка их значений переменной состояния) и их весовыми коэффициентами.

Отдельная оценка для значения переменной состояния может быть определена после посредством суммирования значений частицы с каждым значением, взвешенным посредством весового коэффициента частицы. Таким образом, переменная состояния оценивается из интегрирования (взвешенного суммирования) дискретной выборной функции плотности вероятности (с каждой выборкой соответствующей частице).

Дополнительные сведения о фильтровании частиц могут, например, быть найдены в M. Sanjeev Arulampalam et.al., “A Tutorial on Particle Filters for Online Nonlinear/Non-Gaussian Bayesian Tracking”, IEEE Transactions On Signal Processing, том. 50, № 2, Февраль 2002.

Однако проблемой с фильтрованием частиц является то, что достаточно точное обновление весовых коэффициентов частиц является критичным для получения достаточно надежных результатов. На самом деле, для местоположения источника звука адаптация весовых коэффициентов частицы и распределение в значительной степени зависят от подходящих измерений и измеряющих функций, которые точно отражают отношение между переменной состояния и реальным местоположением источника звука. Однако большинство применяющихся в настоящее время измеряющих методов и функций имеют тенденцию приводить к неоптимальным результатам.

Поэтому улучшенная оценка местоположения источника звука с использованием фильтрования частиц будет полезна и, в частности, будет полезен подход, позволяющий увеличить приспособляемость, снизить сложность, увеличить точность и/или улучшить производительность.

Сущность изобретения

Таким образом, изобретение направлено предпочтительно на подавление, смягчение или устранение одного или нескольких вышеперечисленных недостатков, по отдельности или в любой комбинации.

В соответствии с аспектом изобретения предусмотрен способ оценки местоположения источника звука для источника звука посредством фильтрования частиц, причем способ содержит итерирование этапа генерации набора частиц на момент времени, причем набор частиц представляет функцию плотности вероятности для переменной состояния, содержащей местоположение источника звука в момент времени; причем этап содержит для каждой частицы из набора частиц: генерацию значения состояния для частицы в момент времени, в ответ на значение состояния частицы в предшествующий момент времени, и генерацию весового коэффициента для частицы в момент времени, в ответ на весовой коэффициент частицы в предшествующий момент времени и измерение в момент времени; и генерацию оценки переменной состояния, содержащей оценку местоположения источника звука для первого момента времени, в ответ на комбинацию значений состояния для набора частиц в первый момент времени, причем вклад от каждой частицы из набора частиц зависит от весового коэффициента частицы; при этом этап генерации весового коэффициента для частицы в момент времени содержит определение весового коэффициента, в ответ на корреляцию между оцененными акустическими передаточными функциями от источника звука к, по меньшей мере, двум позициям записи звука для первого момента времени.

Изобретение может предоставить улучшенную оценку местоположения источника звука и в частности делает возможным подход эффективного и/или точного фильтрования частиц для оценки местоположения источника звука. Кроме того, может быть использован подход практической и низкой сложности. В частности, подход низкой сложности и/или низкой ресурсоемкости может быть реализован для оценки и объединения акустических данных или измерений в основанную на фильтровании частиц оценку местоположения источника звука.

Переменная состояния в частности может содержать одну или несколько переменных (такую как, например, набор координат), представляющих местоположение источника звука. Переменная состояния в некоторых вариантах осуществления может содержать другие переменные, не представляющие местоположение источника звука. Таким образом, переменная состояния может содержать множество индивидуальных переменных или параметров. Значение состояния может содержать множество индивидуальных параметров или переменных значений. Например, значение состояния может быть вектором, например, скалярных или комплексных значений.

Передаточные акустические функции в частности могут быть представлены посредством их импульсных откликов.

В соответствии с дополнительным признаком изобретения, этап генерации весового коэффициента содержит: определение весового коэффициента для частицы, в ответ на значение корреляции для задержки, соответствующей значению состояния частицы.

Это может предоставить улучшенную и/или облегченную оценку местоположения источника звука на основе фильтрования частиц. В частности, изобретение делает возможным улучшенное обновление весового коэффициента для фильтрования частиц. Корреляция может в частности предоставлять весьма выгодное отражение влияния измерения на вероятность частиц. Более того, изобретатели установили, что значение корреляции для задержки соответствующей позиции, представленной посредством значения состояния, может предоставить достоверное указание вероятности, что фактическая позиция источника звука согласуется с позицией, представленной посредством значения состояния.

В соответствии с дополнительным признаком изобретения весовой коэффициент имеет детерминированное отношение к значению корреляции.

Это может предоставить улучшенную и/или облегченную оценку местоположения источника звука на основе фильтрования частиц. В частности, изобретение делает возможным улучшенное обновление весового коэффициента для фильтрования частиц. Корреляция может в частности предоставлять весьма выгодное отражение влияния измерения на вероятность частиц. Более того, изобретатели установили, что значение корреляции для задержки соответствующей позиции, представленной посредством значения состояния, может предоставить достоверное указание вероятности, что фактическая позиция источника звука согласуется с позицией, представленной посредством значения состояния. В частности, изобретатели установили, что неопределенность и/или шум, связанные с измерением функции для обновления весового коэффициента, могут быть представлены посредством колебаний корреляции для различных задержек. Таким образом, шум и/или неопределенность могут быть представлены посредством корреляции без какого-либо другого шума или рассматриваемого стохастического вклада.

В соответствии с дополнительным признаком изобретения детерминированное отношение является нелинейным.

Признак может предоставить улучшенную оценку местоположения источника звука и может, в частности, привести в результате к улучшенному представлению шума и неопределенности в процессе измерения посредством корреляции. В частности, подход позволяет точное представление функции плотности вероятности для измерения функции посредством корреляции.

В соответствии с дополнительным признаком изобретения этап генерации весового коэффициента содержит использование корреляции в качестве указания функции псевдоправдоподобия для функции обновления весового коэффициента, относящейся к весовому коэффициенту для частицы в момент времени, в ответ на весовой коэффициент частицы в предшествующий момент времени.

Это может предоставить улучшенную и/или облегченную оценку местоположения источника звука на основе фильтрования частиц. В частности, изобретение делает возможным улучшенное обновление весового коэффициента для фильтрования частиц. Корреляция может, в частности, предоставить весьма выгодное отражение влияния измерения на вероятность частиц. Более того, изобретатели установили, что значение корреляции для задержки, соответствующей позиции, представленной посредством значения состояния, может предоставить достоверное указание вероятности что, фактическая позиция источника звука согласуется с позицией, представленной посредством значения состояния. В частности, изобретатели установили, что неопределенность и/или шум, связанные с измерением функции для обновления веса, могут быть представлены посредством колебаний корреляции для различных задержек. Таким образом, шум и/или неопределенность могут быть представлены посредством корреляции без какого-либо другого шума или рассматриваемого стохастического вклада.

В соответствии с дополнительным признаком изобретения позиция источника звука представлена двумерной позицией в двумерной плоскости.

Изобретение может предоставить эффективное и/или точное двумерное местоположение источника звука, которые могут быть, в частности, пригодны для многих приложений, включающих в себя, например, комбинированные аудио и визуальные приложения, такие как, например, телеконференция.

В соответствии с дополнительным признаком изобретения способ дополнительно содержит: прием, по меньшей мере, одного изображения с камеры, охватывающей окружение, включающего в себя источник звука и в котором двумерная позиция является позицией в, по меньшей мере, одном изображении.

Изобретение, в частности, может предоставить точную интеграцию оценки местоположения источника звука и приложений изображения, таких как видеоприложение. В частности, изобретение может предоставить особенно выгодную комбинацию аудио и визуальной обработки и может позволить, например, улучшенное местоположение источника звука в захваченном изображении.

Камера может быть расположена для захвата области, также покрытой посредством элементов записи звука в первой и второй позициях записи звука. Например, камера может быть расположена между двумя микрофонами в позициях записи звука.

В соответствии с дополнительным признаком изобретения этап генерации весового коэффициента содержит генерацию вклада первого весового коэффициента, в ответ на измерение области изображения для частицы, и генерацию вклада второго весового коэффициента, в ответ на корреляцию, и генерацию весового коэффициента в качестве комбинации первого весового коэффициента и второго весового коэффициента.

Изобретение может предоставить особенно выгодный подход для определения местоположения источника звука на основе подхода мультимодального фильтрования частиц.

В соответствии с дополнительным признаком изобретения способ дополнительно содержит: генерацию указания достоверности для вклада первого весового коэффициента, в ответ на корреляцию; и настройку вклада, для вклада первого весового коэффициента в комбинации относительно вклада второго весового коэффициента, в ответ на указание достоверности.

Изобретение может предоставить улучшенную оценку местоположения источника звука на основе подхода мультимодального фильтрования частиц и может, в частности, предоставить улучшенную интеграцию вкладов от области аудио и от видео/визуальной области.

В соответствии с дополнительным признаком изобретения этап выполнения формирования диаграммы направленности аудио, в направлении на позицию источника звука и оценку передаточных функций, в ответ на формирование диаграммы направленности аудио.

Это может предоставить особенно подходящий путь оценки подходящей акустической передаточной функции и может обеспечить улучшенную производительность и/или пониженную сложность.

В соответствии с дополнительным признаком изобретения этап генерации весового коэффициента содержит определение весового коэффициента, в ответ на вторую корреляцию между оцененными акустическими передаточными функциями из источника звука к одной из, по меньшей мере, двух позиций записи звука и оцененными акустическими передаточными функциями от источника звука к другой позиции записи звука для первого момента времени; причем другая позиция записи звука смещена относительно линии между, по меньшей мере, двух позиций записи звука.

Упомянутый признак может обеспечить улучшенную оценку местоположения источника звука и может, во многих вариантах осуществления, позволить улучшенное двумерное местоположение источника звука.

В соответствии с дополнительным признаком изобретения этап генерации весового коэффициента содержит: прием первого сигнала от элемента записи звука в первой позиции из, по меньшей мере, двух позиций записи звука; прием второго сигнала от элемента записи звука во второй позиции из, по меньшей мере, двух позиций записи звука; и оценка акустических передаточных функций в ответ на первый сигнал и второй сигнал.

Упомянутый признак может обеспечить улучшенную оценку местоположения источника звука.

В соответствии с дополнительным признаком изобретения этап генерации весового коэффициента содержит: фильтрацию первого сигнала в первом адаптивном фильтре для генерации первого фильтрованного сигнала; фильтрацию второго сигнала во втором адаптивном фильтре для генерации второго фильтрованного сигнала; суммирование первого и второго фильтрованного сигнала для генерации комбинированного направленного сигнала; и установку коэффициентов первого адаптивного фильтра и второго адаптивного фильтра для генерации комбинированного направленного сигнала такого, что оценка мощности для компонента источника звука комбинированного направленного сигнала является максимизированной; и оценку акустических передаточных функций, в ответ на коэффициенты первого адаптивного фильтра и второго адаптивного фильтра.

Признак может обеспечить улучшенную оценку местоположения источника звука и может, в частности, предоставить особенно выгодное определение подходящей корреляционной функции. Подход может, в частности, обеспечить низкую сложность, но при этом точное определение подходящей корреляционной функции для определения обновлений весового коэффициента для частиц.

В соответствии с дополнительным признаком изобретения этап генерации весового коэффициента содержит: фильтрацию комбинированного направленного сигнала в третьем адаптивном фильтре для генерации третьего фильтрованного сигнала, причем передаточной функции третьего адаптированного фильтра соответствует скомпенсированная по задержке по существу комплексно сопряженная передаточная функция первого адаптивного фильтра; определение разностного сигнала между первым сигналом и третьим фильтрованным сигналом; и адаптацию передаточной функции первого адаптивного фильтра для уменьшения разностного сигнала.

Признак может обеспечить улучшенную оценку местоположения источника звука и может, в частности, предоставить особенно выгодное определение подходящей корреляционной функции. Подход может в частности позволить низкую сложность, но при этом точное определение подходящей корреляционной функции, для определения обновлений весового коэффициента для частиц.

В соответствии с аспектом изобретения предусмотрено устройство для оценки местоположения источника звука для источника звука посредством фильтрования частиц, причем устройство содержит: средство для итерирования этапа генерации набора частиц на момент времени, причем набор частиц представляет функцию плотности вероятности для переменной состояния, содержащей местоположение источника звука в момент времени; причем этап содержит для каждой частицы из набора частиц: генерацию значения состояния для частицы в момент времени, в ответ на значение состояния частицы в предшествующий момент времени, и генерацию весового коэффициента для частицы в момент времени, в ответ на весовой коэффициент частицы в предшествующий момент времени и измерение в момент времени; и средство для генерации оценки переменной состояния, содержащие оценку местоположения источника звука для первого момента времени, в ответ на комбинацию значений состояния для набора частиц в первый момент времени; при этом этап генерации весового коэффициента для частицы в момент времени содержит определение весового коэффициента, в ответ на корреляцию между оцененными акустическими передаточными функциями от источника звука к, по меньшей мере, двум позициям записи звука для первого момента времени.

Эти и другие аспекты, признаки и преимущества изобретения будут очевидны и объяснены со ссылкой на вариант(ы) осуществления, описанный ниже.

Краткое описание чертежей

Варианты осуществления изобретения будут описаны, только в качестве примера, со ссылкой на чертежи, в которых:

Фиг. 1 является иллюстрацией примера системы телеконференции в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 2 является иллюстрацией примера изображения, захваченного посредством системы телеконференции, иллюстрированной на Фиг. 1;

Фиг. 3 является примером устройства телеконференции в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 4 является иллюстрацией примера способа оценки источника звука в соответствии с вариантами осуществления изобретения;

Фиг. 5 является иллюстрацией примера способа определения весовых коэффициентов в оценке источника звука в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 6 является иллюстрацией примера функции обновления весового коэффициента для оценки источника звука в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 7 является иллюстрацией примера весового коэффициента функции обновления для оценки источника звука в соответствии с некоторыми вариантами осуществления изобретения;

Фиг. 8 является иллюстрацией примера способа определения весовых коэффициентов в оценке источника звука в соответствии с некоторыми вариантами осуществления изобретения; и

Фиг. 9 является иллюстрацией примера устройства телеконференции в соответствии с некоторыми вариантами осуществления изобретения.

Подробное описание некоторых вариантов осуществления изобретения

Следующее описание сосредоточено на вариантах осуществления изобретения, применяемых для оценки местоположения источника звука для системы телеконференции, дополнительно принимающей входной видеосигнал. Однако следует учесть, что изобретение не ограничивается данным приложением, а может быть применено ко многим другим приложениям и системам.

Следующее описание будет особенно сосредоточено на системе телеконференции, такой как показана на Фиг. 1. Фиг. 1 иллюстрирует сценарий, в котором отдельный пользователь 101 принимает участие в сессии телеконференции, захваченной посредством устройства 103 телеконференции, использующем пару элементов записи звука (в виде микрофонов 105, 107) для захватывания аудио и камеру 109 для захватывания видео. Устройство 103 телеконференции связано с системой связи (не показано), тем самым позволяя пользователю принять участие в сессии телеконференции с удаленными пользователями. Приложение телеконференции может, в частности, быть приложением видеотелеконференции.

В системе устройство 103 телеконференции таким образом генерирует аудиовизуальный сигнал, содержащий и аудио, и видео, от сигналов, захваченных посредством микрофонов 105, 107 и камеры 109. Аудиовизуальный сигнал может быть потом сообщен удаленным пользователям через систему связи (не показано).

В примере микрофоны 105, 107 расположены в позициях записи звука, которые относительно близки друг к другу. Во многих вариантах осуществления расстояние может преимущественно быть менее одной десятой расстояния до источника звука (говорящего 101 в настоящем примере) и/или может быть меньше чем 51 см. Во многих сценариях это может позволить рассматривать аудио, захваченное посредством микрофонов, как плоские звуковые волны, которые могут облегчить и/или улучшить обработку, описанную в нижеследующем. В частности, это может облегчить и/или улучшить оценку источника звука.

В примере камера 109 располагается между двумя микрофонами 105, 107 и, в частности, установлена главным образом в середине между микрофонами 105, 107 и главным образом на оси, определенной двумя позициями записи звука.

В системе устройство 103 телеконференции приспособлено для оценки местоположения источника звука, которое в конкретном примере является местоположением говорящего 101. Таким образом, устройство 103 телеконференции будет направлено на обнаружение и отслеживание местоположения звука, берущее свое начало от говорящего. Более того, в данном примере местоположение источника звука обнаруживается в двумерной плоскости, т.е. выполняется оценка местоположения источника звука в двумерной, а не в трехмерной. В данном примере двумерная плоскость является плоскостью, которая может быть рассмотрена на соответствующей плоскости, определенной изображением, снятым камерой 109.

Фиг. 2 иллюстрирует пример изображения, которое может быть захвачено камерой 109. Изображение может, например, быть отдельным изображением/кадром видеосигнала. Позиция на изображении источника звука, созданная говорящим 101, может в данном случае быть задана в качестве позиции (x,y) изображения, в которой x представляет горизонтальную позицию изображения и y представляет вертикальную позицию.

Устройство 103 телеконференции Фиг. 1 направлено на определение местоположения на изображении (т.е. координат (x, y)) звукового источника/говорящего 101. Оцененное местоположение источника звука потом может быть использовано для оптимизации работы устройства 103 телеконференции и может, в частности, быть использовано для направления аудиодиаграмм или для увеличения на источник звука (например, говорящий 101).

Следует учесть, что в других вариантах осуществления другие местоположения источника звука могут быть оценены в соответствии с описанными принципами и подходами. Также следует учесть, что описанный подход может быть использован для определения местоположений источника звука с использованием других опорных структур и, в частности, что могут быть использованы другие двумерные или трехмерные ссылочные системы координат. Например, настоящая пространственная двумерная или трехмерная позиция может быть определена в других примерах. Устройство 103 телеконференции, в частности, использует способ фильтрования частиц для постоянной оценки и отслеживания позиции говорящего 101 на изображении. Фиг. 3 иллюстрирует элементы устройства 103 телеконференции более подробно. В частности, устройство 103 телеконференции содержит процессор 301 фильтрования частиц, который приспособлен к выполнению алгоритма фильтрования частиц. Процессор 301 фильтрования частиц связан с процессором 303 оценки позиции, который приспособлен к генерации оценки позиции говорящего на основе данных о частицах, принятых от процессора 301 фильтрования частиц.

Устройство 103 телеконференции, кроме того, содержит аудиопроцессор 305, который принимает сигналы от двух микрофонов 105, 107 и который связан с процессором 301 фильтрования частиц. Устройство 103 телеконференции также содержит видеопроцессор 307, который принимает сигналы от камеры 109 и который связан с процессором 301 фильтрования частиц. Фильтрование частиц, выполненное процессором 301 фильтрования частиц, основывается на аудиоизмерениях, выполненных микрофонами 105, 107, и дополнительно на видеоизмерениях, выполненных камерой 109.

Фиг. 4 иллюстрирует пример способа фильтрования частиц для определения местоположения источника звука. Способ, в частности, осуществляется устройством 103 телеконференции и используется для оценки изображения позиции говорящего 101.

Способ инициируется на этапе 401, в котором инициализируется алгоритм. В частности, набор частиц генерируется для переменной состояния. Переменная состояния представляет основное (корректное) состояние системы и в конкретном примере заключается в (корректном) изображении позиции говорящего (например, (x,y) координата). Однако вместо того чтобы поддерживать и отслеживать отдельное оцененное значение для переменной состояния (позиции), подход фильтрования частиц поддерживает количество N частиц, которые представляют дискретное представление функции распределения вероятностей для переменной состояния. Каждая частица имеет значение состояния, представляющее значение значения состояния, представленного посредством частицы (в конкретном случае значение состояния соответствует конкретной позиции на изображении). Кроме того, частица имеет ассоциированный весовой коэффициент, который указывает вклад, который индивидуальная частица будет вносить для определения отдельной оценки значения состояния на основе всех частиц. В особенности, значение состояния (в конкретном примере позиция на изображении) определяется посредством взвешенного суммирования значений состояния всех частиц. Функция плотности вероятности представлена распределением частиц (которые из-за повторной выборки могут быть сконцентрированы по направлению к областям с высокой вероятностью) вместе с индивидуальными весовыми коэффициентами каждой частицы.

На этапе 401 процессор 301 фильтрования частиц инициирует фильтрование частиц, выбирая набор N частиц для представления исходных частиц. Частицы выбираются в соответствии с подходящем распределением. Например, в некоторых вариантах осуществления исходные частицы могут быть выбраны на основе равномерного распределения, соответствующего тому, что нет доступной информации о фактической функции плотности распределения для переменной состояния. В других вариантах осуществления может быть использовано оцененное или ожидаемое распределение. Например, в конкретном примере, вполне вероятно, что говорящий 101 будет располагаться по направлению к центру изображения, и поэтому частицы могут быть выбраны в соответствии с распределением, которое имеет более высокую вероятность по направлению к центру изображения. Таким образом, рассеивание позиций частиц на изображении может быть сгенерировано с увеличенной концентрацией или плотностью по направлению к центру экрана. В конкретном примере, каждой частице задается одинаковый исходный номинальный весовой коэффициент (следует учесть, что в других вариантах осуществления, неравномерное распределение может быть частично или полностью представлено варьирующимися весовыми коэффициентами).

Таким образом, на этапе 401, процессор 301 фильтрования частиц приступает к генерации исходного набора частиц, который представляет функцию плотности вероятности для переменной состояния, которая включает в себя (или в конкретном примере состоит из) местоположение источника звука.

Потом процессор 301 фильтрования частиц приступает к итерационному развитию частиц посредством вычисления значений частицы и весовых коэффициентов для последующего (выборки) момента времени на основе значений в предшествующий (выборки) момент времени. В частности, предполагается, что функция обновления переменной состояния (по меньшей мере, приблизительно) известна:

,

где X представляет переменную состояния, T представляет текущий (выборки) момент времени, T-1 представляет предшествующий (выборки) момент времени и представляет шум. В конкретном примере можно предполагать, что говорящий не двигается и таким образом функция обновления переменой состояния может быть рассмотрена просто как:

,

где n имеет подходящее распределение, представляющее шум (например, соответствующий неопределенности движений говорящих 101). Шум может, в частности, быть негауссовским (например, он может представлять увеличенную вероятность того, что пользователь будет двигаться по направлению к центру изображения).

Таким образом, за этапом 401 следует этап 403, в котором каждое значение состояния каждой частицы определяется в зависимости от значений состояния в предшествующий момент времени.

В частности, процессор 301 фильтрования частиц может применять уравнение выше ко всем частицам для генерации обновленного набора частиц в текущий момент времени T.

За этапом 403 следует этап 405, в котором весовые коэффициенты являются обновленными для каждой из частиц, сгенерированной в обновленном наборе частиц. Весовой коэффициент частицы генерируется от весового коэффициента частицы в предшествующий момент времени плюс измерение, отражающее позицию говорящего. В частности, весовой коэффициент частицы зависит от правдоподобия того, что измерение может быть результатом системы, в которой переменная состояния имеет значение состояния частицы. Таким образом, обновленный весовой коэффициент для частицы может быть определен как:

,

где представляет шум и неопределенность, связанную с измерением.

Следует учесть, что в различных вариантах осуществления и приложениях могут быть использованы различные функции g измерения. Однако во многих сценариях уместно просто масштабировать весовой коэффициент предшествующего момента времени посредством вероятности так, чтобы измерение могло следовать из переменной состояния:

,

где