Направленное маскирование звука

Иллюстрации

Показать все

Изобретение относится к акустике, в частности к системам для маскирования звука. Система содержит микрофоны, спектроанализатор для определения мощностных характеристик звука и пространственный анализатор для определения характеристик направленности воспринятого звука, представляющих направление падения на человека, генератор для генерации маскирующего звука под комбинированным управлением мощностных характеристик и пространственных характеристик для маскирования звука. Система сконфигурирована для маскирования излучаемого в направлении человека звука, в которой подсистема обработки сигнала содержит пространственный анализатор для определения характеристик направленности, причем пространственный анализатор предназначен для определения характеристик направленности на основе определения количественного представления по меньшей мере одной из интерауральной временной разности и интерауральной разности по уровню. Технический результат – повышение эффективности маскирования звука. 4 н. и 6 з.п. ф-лы, 3 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Изобретение относится к системе, сконфигурированной для маскирования падающего на человека звука. Изобретение относится также к подсистеме обработки сигнала для использования в системе по настоящему изобретению, к способу маскирования падающего на человека звука, а также к управляющему программному обеспечению для конфигурирования компьютера для выполнения способа по настоящему изобретению.

УРОВЕНЬ ТЕХНИКИ

Маскирование звука представляет собой добавление в окружение естественного или искусственного звука (такого как белый шум), чтобы спрятать нежелательный звук. Это то, что противоположно технике активного управления шумом. Маскирование звука уменьшает или исключает осведомленность о предшествующих звуках в данном окружении и может сделать окружение более удобным. Например, имеются коммерческие устройства, предназначенные для установки в комнате, чтобы маскировать звуки, которые в противном случае могли бы мешать работе или сну человека в этой комнате.

В соответствующей области техники известно, что не пиковый звуковой уровень, а скорее отношение пикового к базовому звуковому уровню связано с количеством пробуждений, обусловленных воздействием звуков на сон пациента. Поэтому добавлением маскирующего звука пороговый уровень пробуждения ото сна повышается, приводя к более комфортному для сна окружению. См. например, Stanchina, M., Abu-Hijleh, M., Chaudhry, В.К., Carlisle, С.С., Millman, R.P., (2005) "The influence of white noise on sleep in subjects exposed to ICU noise" ("Влияние белого шума на сон людей, подвергнутых воздействию шума в ОИТ"), Sleep Medicine 6(5): 423-428 - дискуссию относительно взаимозависимости между отношением пикового к базовому звуковому уровню и порогом в контексте экспериментов, проводившихся в больничном отделении интенсивной терапии (ОИТ).

Имеются коммерческие звукомаскирующие устройства, которые производят стационарный акустический шум в относительно широком частотном диапазоне, чтобы понизить вероятность того, что пользователь будет разбужен во время его (ее) сна окружающими звуками. В некоторых из этих устройств для улавливания потенциально раздражающего звука используется микрофон, чтобы затем этот потенциально раздражающий звук подвергнуть анализу для коррекции маскирующего звука до уровня интенсивности раздражающего звука и до получения спектральных характеристик раздражающего звука.

Имеющиеся коммерческие звукомаскирующие устройства используют, как правило, один динамик для воспроизведения звука в относительно широком частотном диапазоне, то есть белого шума. Некоторые из имеющихся коммерческих продуктов имеют разъем для наушников, чтобы во время рабочего использования продукта маскирующий звук не беспокоил находящихся рядом людей. Однако звук, воспроизводимый через наушники, часто представляет собой лишь удвоение одного канала.

Публикация US 2013/0170655 A1 описывает звукомаскирующую систему с линейкой микрофонов и линейкой динамиков. Положение говорящего определяется в ответ на звук голоса говорящего, который воспринимается микрофонами. Задержки для каждого динамика управляются таким образом, что звук от динамика доходит до принимающего человека в направлении говорящего, чей голос подлежит маскированию.

Публикация US 2013/0170662 A1 описывает звукомаскирующую систему, которая воспринимает звук от микрофона, удаляет акустически характерную величину и выдает маскирующий звук, соответствующий удаленной акустически характерной величине. Для удаления эха из воспринятого звука используется эхоподавляющая секция.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Авторы поняли, что имеющиеся коммерческие звукомаскирующие системы не принимают во внимание направленность нежелательных звуков.

Что касается направленности звуков, - сошлемся на книгу Jens Blauert, "Spatial Hearing: The Psychophysics of Human Sound Localization", Cambridge, MA; MIT Press, 2001 (Дженс Блоэрт «Пространственный слух: Психофизика звуковой локализации человеком», Кембридж, Масс., Изд. Масс. Технол. Инст., 2001), особенно на гл. 3.2.2. Блоэрт обсуждает сценарий, в соответствии с которым в одной комнате находится группа людей, и при этом одновременно ведется несколько разговоров. Слушатель среди гула голосов имеет возможность сфокусировать свое слуховое внимание на одного конкретного говорящего, даже не видя этого конкретного говорящего. Однако если слушатель заткнет одно из своих ушей, этот слушатель будет испытывать гораздо большие трудности с пониманием того, что говорит этот конкретный говорящий. Этот психоакустический феномен известен в своей области как "эффект вечеринки с коктейлем" или как "селективное внимание". Дополнительную информацию относительно "эффекта вечеринки с коктейлем" см. например, в статье: Cherry, Ε. Colin (1953), "Some Experiments on the Recognition of Speech, with One and Two Ears" ("Некоторые эксперименты по распознаванию речи одним и двумя ушами"), Journal of Acoustical Society of America 25(5): 975-979. Это явление происходит из того факта, что человек, который прислушивается к желательному слуховому сигналу с определенным направлением падения в окружении шума с другим направлением падения, может идентифицировать желательный слуховой сигнал лучше, когда он или она слушает бинаурально (то есть двумя ушами), чем тогда, когда он или она слушает монаурально (то есть только одним ухом). Другими словами, человек может лучше распознать аудиосигнал в присутствии слухового шума, если человек слушает бинаурально, а не монаурально, и если желательный слуховой сигнал и слуховой шум имеют различные направления падения.

Авторы изобретения "вывернули" эту ситуацию наоборот и предложили специальный сценарий звукового маскирования, в котором нежелательный звук замаскирован искусственно сгенерированным шумом, который управляется таким образом, чтобы он имел по существу то же самое направление падения на человека, которого акустически необходимо раздражать как можно меньше.

Более конкретно, авторы предлагают систему, сконфигурированную для маскирования падающего на человека звука, как она определена в приложенном пункте 1 формулы изобретения.

В системе по настоящему изобретению мощностные характеристики воспринятого падающего звука определяются для того, чтобы управлять спектром маскирующего звука, а характеристики направленности определяются для того, чтобы генерировать такой маскирующий звук, который, когда будет воспринят человеком, казался бы идущим из направления, подобного направлению, с которого падает падающий звук, с тем чтобы сделать маскирование более эффективным.

Как известно, человеческое ухо производит параллельную обработку звуков, в том смысле, что ухо одновременно обрабатывает различные спектральные компоненты. Улитка внутреннего уха, по-видимому, действует как спектральный анализатор, выполняя частотный анализ входящего звука, и в психоакустике часто моделируется как совокупность звуковых полосовых фильтров с смещенно настроенными перекрывающимися диапазонами. Однако улитка представляет собой динамическую систему, в которой характеристические параметры каждого полосового фильтра, то есть центральная частота фильтра (на пике пропускания), полоса пропускания и усиление допускают изменение на уровне бессознательного управления. Выполненные измерения фильтрующих свойств улитки указывают, что форма каждого полосового фильтра является асимметричной с более крутым наклоном на стороне высоких частот и с "хвостом" более медленного затухания на стороне низких частот. В психоакустическом моделировании фильтр асимметричной формы для отдельного звукового полосового фильтра по практическим соображениям обычно замещают симметричной амплитудно-частотной характеристикой, известной как "скругленная экспоненциальная форма" (RoEx), а эффективная полоса пропускания фильтра выражается в виде эквивалентной прямоугольной полосы пропускания1) (ЭПП).

В системе по настоящему изобретению мощностные характеристики, в том виде, как они определены, содержат соответствующий признак, представляющий частотный спектр в соответствующем одном из множества частотных диапазонов. Соответственно, вариант исполнения системы может параллельно маскировать различные падающие звуки, одновременно испущенные разными источниками разных местоположений и имеющие различные частотные спектры.

В варианте исполнения системы микрофонная подсистема выдает первый сигнал, представляющий воспринятый звук. Подсистема обработки сигнала выдает второй сигнал для управления подсистемой динамиков. Система содержит подсистему адаптивной фильтрации, предназначенную для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во втором сигнале. Система адаптивной фильтрации содержит адаптивный фильтр и субтрактор. Адаптивный фильтр имеет вход фильтра для приема второго сигнала и выход фильтра для выдачи отфильтрованного варианта второго сигнала. Субтрактор имеет первый вход субтрактора для приема первого сигнала и второй вход субтрактора для приема отфильтрованного варианта второго сигнала, а также выход субтрактора для подачи третьего сигнала в подсистему обработки сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала. Адаптивный фильтр имеет вход управления для приема третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра.

В конфигурации, когда микрофонная подсистема акустически недостаточно хорошо изолирована от подсистемы динамика, звук, воспринятый микрофонной подсистемой, содержит звук, предназначенный для маскирования, а также маскирующий звук. Адаптивная фильтрация следит за тем, чтобы маскирующий звук, в том виде, как он воспринят, был бы по существу лишен возможности влиять на возникновение самого маскирующего звука.

Подсистема обработки сигнала содержит пространственный анализатор для определения характеристик направленности, и при этом пространственный анализатор предназначен для определения характеристик направленности на основе определения количественного представления по меньшей мере одной из интерауральной временной разности (ИВР) и интерауральной разности по уровню (ИРУ).

В локализации звука человеком концепции "интерауральной временной разности" (ИВР) и "интерауральной разности по уровню" (ИРУ) относятся к физическим количествам, которые дают возможность человеку определить боковое направление (левый, правый), с которого кажется приходящим звук.

Как известно, формирование луча представляет собой технику обработки сигнала, используемую в детекторных решетках для направленной передачи или приема сигнала. Это достигается таким комбинированием элементов в решетке, что сигналы на одних определенных углах испытывают конструктивное взаимовлияние, в то время как другие испытывают деструктивное взаимовлияние. Формирование луча может быть использовано на обоих - и на передающем, и на приемном концах, для того чтобы достичь пространственной выборочности. Более подробно - см. например, "Beamforming: A versatile approach to spatial filtering" ("Формирование луча: Универсальный подход к пространственной фильтрации"), B.D.V. Veen and К.M. Buckley, IEEE ASSP Magazine, April, 1988, pp. 4-24.

В следующем варианте исполнения система по настоящему изобретению содержит звуковой классификатор, который предназначен для выборочного удаления предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

Звуковой классификатор сконфигурирован таким образом, чтобы отличать звуки, воспринятые микрофонной подсистемой, и которые подлежат массированию, от других звуков, которые восприняты микрофонной подсистемой, и которые не подлежат массированию (например, человеческий голос или сигнал тревоги), с тем чтобы выборочно подвергать воспринятые звуки процессу маскирования. Классификатор может быть реализован, например, посредством анализа спектра воспринятого звука и идентификации в нем одного или более рисунков, которые удовлетворяют предопределенным критериям.

Система, дополнительно, относится к подсистеме обработки сигнала для использования в системе, как она описана выше.

Изобретение может использоваться в коммерческих целях посредством изготовления, использования или обеспечения системы по настоящему изобретению, как она описана выше. Альтернативно, изобретение может использоваться в коммерческих целях посредством изготовления, использования или обеспечения подсистемы обработки сигнала, сконфигурированной для использования в системе по настоящему изобретению. В месте предполагаемого использования подсистему обработки сигнала в таком случае подсоединяют к микрофонной подсистеме, системе динамика и, возможно, - к адаптивному фильтру и (или) к классификатору, полученному от других поставщиков.

Кроме того, изобретение может использоваться в коммерческих целях посредством реализации способа в соответствии с изобретением. Поэтому изобретение относится также к способу маскирования звука, падающего на человека, как он определен приложенным п. 5 формулы изобретения.

В одном варианте исполнения способа по изобретению способ включает в себя прием первого сигнала, представляющего воспринятый звук; подачу второго сигнала для генерации маскирующего звука; и адаптивную фильтрацию, предназначенную для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во второй сигнал. Адаптивная фильтрация включает в себя прием второго сигнала; использование адаптивного фильтра для подачи отфильтрованного варианта второго сигнала; подачу третьего сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала; прием третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра; и использование третьего сигнала для определения мощностных характеристик и для определения характеристик направленности.

Определение характеристик направленности включает в себя определение количественного представления по меньшей мере одной из интерауральной временной разности (ИАР) и интерауральной разности по уровню (ИРУ).

Следующий вариант исполнения способа по изобретению включает в себя выборочное удаление предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

Кроме того, изобретение может использоваться в коммерческих целях в виде управляющего программного обеспечения, либо поставленного в сохраненном виде на считываемом посредством компьютера носителе, таком как, например, твердотельная память, оптический диск, магнитный диск и т.д., или сделанном доступным в виде электронного файла, загружаемого через сеть передачи данных, например, интернет.

Поэтому изобретение относится также к управляющему программному обеспечению для исполнения на компьютере с целью конфигурирования компьютера для выполнения способа маскирования падающего на человека звука, как он определен в приложенном п. 8 формулы изобретения.

В одном варианте исполнения управляющего программного обеспечения по изобретению это управляющее программное обеспечение содержит пятые инструкции для адаптивной фильтрации для уменьшения вклада маскирующего звука, присутствующего в воспринятом звуке, во второй сигнал. Пятые инструкции содержат: шестые инструкции для приема второго сигнала; седьмые инструкции для использования адаптивного фильтра для подачи отфильтрованного варианта второго сигнала; восьмые инструкции для подачи третьего сигнала, который представляет разницу между первым сигналом и отфильтрованным вариантом второго сигнала; и девятые инструкции для приема третьего сигнала для управления одним или более коэффициентами фильтра адаптивного фильтра. Вторые инструкции содержат десятую инструкцию для использования третьего сигнала для определения мощностных характеристик. Третьи инструкции содержат одиннадцатые инструкции для использования третьего сигнала для определения характеристик направленности.

Третьи инструкции содержат инструкции для определения количественного представления по меньшей мере одной из интерауральной временной разности и интерауральной разности по уровню.

Следующий вариант исполнения управляющего программного обеспечения по изобретению содержит четырнадцатые инструкции для выборочного удаления предопределенного участка из воспринятого звука до выполнения определения мощностных характеристик и до выполнения определения характеристик направленности.

Для полноты сошлемся на публикацию международной заявки WO 2011043678, озаглавленной "Система и способ обработки исключения тиннитуса". Как известно, тиннитус представляет собой чувство слышимости звука в голове человека при отсутствии слуховой стимуляции. Публикация международной заявки WO 2011043678 относится к системе маскирования тиннитуса, предназначенной для использования людьми, имеющими тиннитус. Система содержит систему подачи звука, имеющую устройства подачи аудиосигнала на левое и правое ухо с регулировкой уровня и сконфигурирована с возможностью подачи человеку через устройства подачи аудиосигнала маскирующего звука таким образом, что этот маскирующий звук, кажется, исходит из виртуального местонахождения источника звука, которое по существу соответствует пространственному нахождению в трехмерном звуковом пространстве источника тиннитуса, как он слышится человеком.

Известная система и способ основаны на маскировании тиннитуса и (или) уменьшения чувствительности пациента к тиннитусу. Было определено, что некоторые связанные с тиннитусом недомогания относятся к нарушению восприятия тиннитуса в соответствии с нормальным анализом аудиторного явления (Auditory Scene Analysis - ASA). В частности, было определено, что порождающая тиннитус нервная активность совершенно отлична от нормальной звуковой активности, что, будучи сформирована в цельное изображение, она вступает в конфликт с памятью реальных звуков. Другими словами, тиннитус не локализуется как внешний источник. Невозможность локализовать источник звука является "неестественной" и представляет собой нарушение основного процесса восприятия. Дополнительно было определено, что это представляет собой "отсутствие контекста" или отсутствие соответствующего поведенческого смысла, что и вынуждает мозг излишне часто или излишне настойчиво обращать внимание на сигнал тиннитуса. Например, фоновый звук дождя легко становится привычным. Этот звук ассоциируется с визуальным и тактильным восприятием или также - с перцептуальной памятью о дожде. Контекст это звука понятен, так что он может быть "обработан" и исключен как недостойный дальнейшего внимания. Однако в сигнале тиннитуса такого понимания нет, что не соответствует реальному аудиторному объекту. Известное лечение тиннитуса и система используют персонифицированное информационное маскирование и уменьшение чувствительности. Информационное маскирование действует на когнитивном уровне и ограничивает возможность мозга осознавать тиннитус. Маскирование тиннитуса усовершенствовано пространственным совмещением воспринятого местоположения тиннитуса и пространственным представлением (или местоположением виртуального источника звука) маскирующего звука.

В отличие от этого, настоящее изобретение относится к маскированию реального звука от одного или более реальных источников и не касается информационного маскирования на уровне распознавания, чтобы ограничить возможность мозга осознавать тиннитус.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Данное изобретение поясняется с дополнительными подробностями посредством примера и со ссылками на сопроводительные чертежи, в которых:

фиг. 1 представляет собой блок-схему первого варианта исполнения системы по настоящему изобретению;

фиг. 2 представляет собой блок-схему второго варианта исполнения системы по настоящему изобретению; и

фиг. 3 представляет собой блок-схему третьего варианта исполнения системы по настоящему изобретению.

На всех иллюстрациях похожие или соответствующие признаки обозначены одними и теми же ссылочными позициями.

ПОДРОБНЫЕ ВАРИАНТЫ ИСПОЛНЕНИЯ

Изобретение относится к системе и способу для маскирования звука, падающего на человека. Система содержит микрофонную подсистему для восприятия звука. Система дополнительно содержит спектроанализатор для определения мощностных характеристик звука, воспринятого мультимикрофонной подсистемой, и пространственный анализатор для определения характеристик направленности воспринятого звука, представляющих направление падения на человека. Система дополнительно содержит подсистему генератора для генерации маскирующего звука под комбинированным управлением мощностных характеристик и характеристик направленности для маскирования падающего звука.

Фиг. 1 представляет собой первый вариант 100 исполнения системы по настоящему изобретению. Первый вариант 100 исполнения содержит левый микрофон 102, установленный у левого уха (не показано) пользователя или рядом с ним, правый микрофон 104, установленный у правого уха (не показано) пользователя или рядом с ним. Первый вариант 100 исполнения содержит левый динамик 106, установленный у левого уха пользователя или рядом с ним, и правый динамик 108, установленный у правого уха пользователя или рядом с ним. В первом варианте 100 исполнения предполагается, что каждый из левого микрофона 102 и правого микрофона 104 хорошо акустически изолирован и от левого динамика 106, и от правого динамика 108. Например, левый микрофон 102, правый микрофон 104, левый динамик 106 и правый динамик 108 образуют часть оснащенных микрофоном пары наушников, таких как Roland CS-10ЕМ, которые имеются в продаже. Левый динамик 106 вставляется в левое ухо, а правый динамик 108 вставляется в правое ухо, в то время как каждый - и левый микрофон 102, и правый микрофон 104 направлен наружу относительно головы пользователя. Поскольку левый микрофон 102 и правый микрофон 104 сконфигурированы - для всех практических случаев - таким образом, чтобы не воспринимать звуки, испущенные левым динамиком 106 и правым динамиком 108, то говорят, что левый микрофон 102 и правый микрофон 104 акустически хорошо изолированы от левого динамика 106 и от правого динамика 108.

Первый вариант 100 исполнения содержит подсистему 103 обработки сигнала между, с одной стороны, левым микрофоном 102 и правым микрофоном 104, а, с другой стороны, - левым динамиком 106 и правым динамиком 108. Теперь будет описана работа подсистемы 103 обработки сигнала.

Левый микрофон 102 воспринимает звуки, падающие на левый микрофон 102, и создает левый аудиосигнал для левого аудиоканала. Левый аудиосигнал в левом преобразователе 110, который генерирует левый спектр, преобразуется в частотную область. Аналогично, правый микрофон 104 воспринимает звуки, падающие на правый микрофон 104, и создает правый аудиосигнал для правого аудиоканала. Правый аудиосигнал правым преобразователем 112, который генерирует правый спектр, преобразуется в частотную область. Работа левого преобразователя 110 и правого преобразователя 112 основана, например, на быстром преобразовании Фурье.

Левый спектр подается на набор из одного или более левых полосовых фильтров 114, которые определяют один или более частотных диапазонов в левом спектре. Аналогично, правый спектр подается на набор из одного или более левых полосовых фильтров 116, которые определяют один или более частотных диапазонов в правом спектре. Деление, соответственно, каждого одного из левого спектра и правого спектра на соответствующие частотные диапазоны дает возможность по отдельности обрабатывать различные диапазоны в одном и том же спектре. Например, набор левых полосовых фильтров 114 определяет один или более частотных диапазонов в левом спектре, при этом каждый конкретный один из частотных диапазонов связан с одним конкретным из слуховых полосовых фильтров. Как упоминалось выше, асимметричная форма фильтра отдельного полосового фильтра в психоакустической модели слухового восприятия на практике аппроксимируется симметричной амплитудно-частотной характеристикой, известной как "скругленная экспоненциальная" форма (RoEx). Аналогично, набор левых полосовых фильтров 116 определяет один или более частотных диапазонов в правом спектре, при этом каждый конкретный один из частотных диапазонов связан с одним конкретным из слуховых полосовых фильтров.

Первый вариант 100 исполнения, кроме того, содержит маскирующий звуковой генератор 118, который сконфигурирован для генерации сигнала, представляющего маскирующий звук. Маскирующий звуковой сигнал дополнительным преобразователем 120 частоты преобразуется в частотную область с генерацией спектра маскирующего звука. Спектр маскирующего звука подается на набор из одного или более дополнительных полосовых фильтров 122. Этот набор дополнительных полосовых фильтров 122 определяет соответствующие частотные диапазоны в спектре маскирующего звука, которые соответствуют соответствующим одним из частотных диапазонов, определенных набором левых полосовых фильтров 114 и набором правых полосовых фильтров 116.

Отдельная часть левого спектра, связанная с отдельным частотным диапазоном, другая отдельная часть правого спектра, связанная с этим отдельным частотным диапазоном, и следующая отдельная часть спектра маскирующего звука, связанная с отдельным частотным диапазоном, подаются на отдельную одну из первой подсистемы 124, второй подсистемы 126, третьей подсистемы 128 и т.д. Далее обработка отдельной части левого спектра, другой отдельной части правого спектра и следующей отдельной части спектра маскирующего звука поясняется со ссылкой на обработку посредством первой подсистемы 124.

Первая подсистема 124 содержит спектроанализатор 130, пространственный анализатор 134 и подсистему 135 генератора. Подсистема 135 генератора содержит спектральный эквалайзер 132 и виртуализатор 136. Вторая подсистема 126, третья подсистема 128 и т.д. имеют конфигурацию, подобную конфигурации первой подсистемы 124. Подсистема 135 генератора сконфигурирована для генерации маскирующего звука с комбинированным управлением мощностных характеристик, как они определены спектроанализатором 130, и характеристик направленности, как они определены пространственным анализатором 134, для маскирования звука, в том виде, как он воспринят левым микрофоном 102 и правым микрофоном 104.

Спектроанализатор 130 сконфигурирована для оценки или определения мощности в соответствующем одном из частотных диапазонов, который обрабатывается первой подсистемой 124 для звука, комбинированно воспринятого левым микрофоном 102 и правым микрофоном.

Мощность в соответствующем частотном диапазоне, как она определена спектроанализатором, соответствующим образом усредненная по времени, используется для управления спектральным эквалайзером 132. Этот спектральный эквалайзер 132 сконфигурирован для настройки мощности в соответствующем частотном диапазоне маскирующего звука при управлении мощностью, оцененной спектроанализатором 130, как она представлена в соответствующем частотном диапазоне падающего звука, воспринятого левым микрофоном 102 и правым микрофоном. "Факультативно" спектральный эквалайзер 132 является настраиваемым, так чтобы устанавливать параметры управления заранее для регулировки мощности в соответствующем частотном диапазоне маскирующего звука в зависимости от спектральной мощности соответствующего частотного диапазона воспринятого звука. Например, настраиваемость спектрального эквалайзера позволяет ограничить отношение между мощностью в частотном диапазоне воспринятого звука и мощностью в частотном диапазоне маскирующего звука диапазоном отношения между минимальной величиной и максимальной величиной. Это ограничение отношения способствует генерации маскирующего звука, который будет воспринят пользователем как более естественный, чем искусственный.

Пространственный анализатор 134 сконфигурирован для определения характеристик направленности, например, направления падения на левый микрофон 102 и на правый микрофон 104 той конкретной составляющей звука, которая воспринимается левым микрофоном 102 и правым микрофоном 104, и которая связанна с соответствующим частотным диапазоном.

Пространственный анализатор 134, таким образом, осуществляет звуковую локализацию составляющей воспринятого звука в соответствующем частотном диапазоне. Выражение "звуковая локализация", как оно используется в соответствующей области техники, относится к способности человека определять положение обнаруженного звука по направлению и по расстоянию. Звуковая локализация может также относиться к способам акустической инженерии по имитации нахождения слухового сигнала в виртуальном трехмерном пространстве. В локализации звука человеком концепции "интерауральной временной разности" (ИВР) и "интерауральной разности по уровню" (ИРУ) относятся к физическим количествам, которые дают возможность человеку определить боковое направление (левый, правый), с которого кажется приходящим звук. ИВР представляет собой разность во времени прихода звука в левое ухо человека и в правое ухо человека. Если звуковой сигнал достигает головы человека с одной стороны, то этот звуковой сигнал, чтобы дойти до дальнего уха человека, должен пройти большее расстояние. Эта разница в пути приводит к временной разности в поступлении звука в уши, которая и определяется и способствует определению направления, с которого кажется приходящим звук. Что касается ИРУ, то звук, поступающий в ближнее ухо человека, имеет большую энергию, чем звук, поступающий в дальнее ухо человека, поскольку дальнее ухо расположено в акустической тени головы человека, которая вызывает значительное ослабление звукового сигнала. ИРУ является заметно частотно-зависимой, поскольку характеристический размер головы человека находится внутри диапазона длины волны слышимого звукового спектра. Пространственный анализатор 134 сконфигурирован, например, для определения величины, представляющей по меньшей мере одну из ИВР или ИРУ звука, воспринятого левым микрофоном 102 и правым микрофоном 104.

Виртуализатор 136 сконфигурирован для генерации под комбинированным управлением спектроанализатора 130 и пространственного анализатора 134 представления левого канала и представления правого канала маскирующего звука в частотной области, связанных с соответствующим частотным диапазоном. Представление левого канала подается в левый инверсный преобразователь 138, чтобы оно было преобразовано во временную область, например, посредством обратного быстрого преобразования Фурье. Затем представление левого канала во временной области подается в левый динамик 106. Аналогично, представление правого канала подается в правый инверсный преобразователь 140, чтобы оно было преобразовано во временную область, например, посредством обратного быстрого преобразования Фурье. Затем представление правого канала во временной области подается в правый динамик 108.

Соответствующая каждая одна из второй подсистемы 126, третьей подсистемы 128 и т.д. выполняет аналогичные операции для обработки соответствующей составляющей воспринятого звука из соответствующего другого частотного диапазона. После этого возможный маскирующий звук, в том виде, как он воспроизведен в левом динамике 106 и в правом динамике 108, содержит соответствующее представление левого канала во временной области и соответствующее представление правого канала во временной области, как они поданы соответствующей одной из первой подсистемы 124, второй подсистемы 126, третьей подсистемы 128 и т.д.

Для полноты при этом следует заметить, что может быть использовано более чем два микрофона и более чем два динамика так, чтобы можно было определять направленность падающего звука с большим разрешением, и так, чтобы с большим разрешением можно было воспроизводить маскирующий звук. Наконец, заметим, что звук, воспринятый микрофонами, в данном случае левым микрофоном 102 и правым микрофоном 104, может происходить от двух или более источников, или же может падать на микрофоны со множества направлений (например, через множественные отражения от акустически отражающих объектов в диапазоне микрофонов). Первый вариант 100 исполнения определяет спектр мощности и направление падения для одного отдельного из частотных диапазонов и генерирует возможный маскирующий звук, принимая во внимание множественные источники и (или) множественные направления падения звука.

Кроме того, в случае бинаурального маскирующего звука может быть добавлена некоторая реверберация, так чтобы усилить ощущение пользователя, что воспринятый звук исходит из одного или более источников, внешних по отношению к голове пользователя.

Для полноты следует также заметить, что первый вариант 100 исполнения проиллюстрирован как включающий в себя левый микрофон 102 и правый микрофон 104. Если в первом варианте 100 исполнения присутствуют один или более дополнительных микрофонов, то выходной сигнал каждого дополнительного микрофона подается на дополнительный преобразователь частоты (не показан), а от него - на дополнительный набор полосовых фильтров (не показаны). Каждый отдельный один из полосовых фильтров из дополнительного набора подает конкретный выходной сигнал, индикативный относительно конкретного частотного диапазона, на конкретный один из первой подсистемы 124, второй подсистемы 126, третьей подсистемы 128 и т.д. Рассмотрим конкретный выходной сигнал дополнительного набора полосовых фильтров, который подан на первую подсистему 124. В этом случае конкретный выходной сигнал подается на спектроанализатор 130 и пространственный анализатор 134 параллельно левому выходному сигналу набора левых полосовых фильтров 114, поданному в первую подсистему 124, и параллельно правому выходному сигналу набора правых полосовых фильтров 116, поданному в первую подсистему 124.

Рассмотрим теперь сценарий, в котором один или оба из левого микрофона 102 и правого микрофона104 не являются акустически хорошо изолированными от левого динамика 106 и (или) от правого динамика 108. Например, типичный наушник с активным шумоподавлением имеет как блок динамика, так и блок микрофона, расположенные внутри каждой из ушных чашек. То есть типичный наушник с активным шумоподавлением имеет левый микрофон 102 и левый динамик 106, расположенные внутри левой ушной чашки, и имеет правый микрофон 104 и правый динамик 108, расположенные внутри правой ушной чашки. В результате, маскирующий звук, воспроизводимый левым динамиком 106, будет восприниматься левым микрофоном 102, а маскирующий звук, воспроизводимый правым динамиком 108, будет восприниматься правым микрофоном 104. В этом случае необходимо удалить маскирующий звук, воспроизведенный левым динамиком 106, из звука, который воспринят левым микрофоном 102, и удалить маскирующий звук, воспроизведенный правым динамиком 108, из звука, воспринятого правым микрофоном 104, так чтобы подвергнуть модифицированный таким образом воспринятый звук обработке сигнала, выполняемой подсистемой 103 обработки сигнала.

Аналогичным же образом, рассмотрим другой сценарий, в котором левый микрофон 102 и правый микрофон 104 расположены на удалении от ушей пользователя. В результате каждый отдельный микрофон из левого микрофона 102 и правого микрофона 104 является акустически связанным и с левым динамиком 106, и с правым динамиком 108. В этом случае также необходимо удалить маскирующий звук, воспроизведенный левым динамиком 106, и маскирующий звук, воспроизведенный правым динамиком 108, из звука, воспринятого каждым отдельным микрофоном из левого микрофона 102 и правого микрофона 104, с тем чтобы подвергнуть модифицированный таким образом воспринятый звук обработке сигнала, выполняемой подсистемой 103 обработки сигнала, как описано выше со ссылкой на схему по фиг. 1.

Удаление маскирующего звука, в том виде, как он воспринят каждым отдельным микрофоном из левого микрофона 102 и правого микрофона 104, может быть выполнено посредством использования адаптивной фильтрации, как это пояснено со ссылкой на схему по фиг. 2.

Фиг. 2 представл