Устройство и способ для многоканального прямого-окружающего разложения для обработки звукового сигнала

Изобретение относится к средствам для обработки звукового сигнала. Технический результат заключается в повышении эффективности многоканального прямого-окружающего разложения звукового сигнала. Каждый из двух или более входных звуковых канальных сигналов содержит части прямого сигнала и части окружающего сигнала. Устройство для генерирования одного или нескольких выходных звуковых канальных сигналов содержит модуль определения фильтра для определения фильтра путем оценки первой информации спектральной плотности мощности и оценки второй информации спектральной плотности мощности. Помимо этого устройство содержит процессор обработки сигналов для генерирования одного или нескольких выходных звуковых канальных сигналов путем применения фильтра на двух или более входных звуковых канальных сигналах. Первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам. 3 н. и 12 з.п. ф-лы, 7 ил.

Реферат

Настоящее изобретение имеет отношение к устройству и способу для многоканального прямого-окружающего разложения для обработки звукового сигнала.

Обработка звуковых сигналов становится все более важной. В этой области важную роль играет разделение звуковых сигналов на прямые и окружающие звуковые сигналы.

В большинстве случаев акустические звуки состоят из смеси прямых звуков и окружающих (или рассеянных) звуков. Прямые звуки испускаются источниками звука, например музыкальным инструментом, вокалистом или громкоговорителем, и поступают по кратчайшему пути на приемник, например ушной канал слушателя или микрофон.

При прослушивании прямого звука, он воспринимается как поступающий со стороны источника звука. Характерными слуховыми ориентирами для локализации и для других пространственных характеристик звука являются интерауральная разница интенсивности, интерауральная временная разница и интерауральная когерентность. Прямые звуковые волны, вызывающие идентичные интерауральную разницу интенсивности и интерауральную временную разницу, воспринимаются как поступающие с одной и той же стороны. В отсутствие рассеянного звука сигналы, достигающие левого и правого уха или какого-либо другого множества датчиков, являются когерентными.

Окружающие звуки, в отличие от этого, испускаются многими разнесенными источниками звука или звукоотражающими барьерами, вносящими вклад в один и тот же окружающий звук. Когда звуковая волна достигает стены в комнате, часть ее отражается, и наложение всех отражений в комнате, реверберация, является показательным примером окружающего звука. Другими примерами являются звуки аудитории (например, аплодисменты), природные звуки (например, дождь), а также другие фоновые звуки (например, неразборчивый шум). Окружающие звуки воспринимаются как рассеянные, без определенного местоположения, и вызывают ощущение окутывания ("погружения в звук") у слушателя. При захвате окружающего звукового поля с использованием множества разнесенных датчиков, записанные сигналы являются, по меньшей мере, частично некогерентными.

Различные приложения редактирования и воспроизведения звука пользуются разложением звуковых сигналов на компоненты прямого сигнала и компоненты окружающего сигнала. Главная трудность такой обработки сигналов состоит в том, чтобы добиться высокой степени разделения при сохранении высокого качества звука для произвольного числа входных канальных сигналов и для всех возможных характеристик входных сигналов. Прямое-окружающее разложение (DAD - direct-ambient decomposition), т.е. разложение звуковых сигналов на компоненты прямых сигналов и компоненты окружающих сигналов, дает возможность раздельного воспроизведения или модификации компонентов сигнала, что, например, желательно для повышающего микширования звуковых сигналов.

Термин повышающее микширование относится к технологическому процессу создания сигнала с P каналами, если имеется входной сигнал с N каналами, где P>N. Его главным применением является воспроизведение звуковых сигналов с использованием установок объемного звучания, имеющих больше каналов, чем доступно во входном сигнале. Воспроизведение содержимого при помощи усовершенствованных алгоритмов обработки сигналов позволяет слушателю использовать все доступные каналы многоканальной установки воспроизведения звука. Такая обработка может раскладывать входной сигнал на значащие компоненты сигнала (например, на основании их воспринимаемой позиции в стереофоническом изображении, прямые звуки в противоположность окружающим звукам, отдельные инструменты) или на сигналы, в которых эти компоненты сигнала ослаблены или усилены.

Широко известны две концепции повышающего микширования.

1. Управляемое повышающее микширование: повышающее микширование с дополнительной информацией, направляющей технологический процесс повышающего микширования. Дополнительная информация может быть или «закодирована» определенным образом во входном сигнале или может храниться дополнительно.

2. Неуправляемое повышающее микширование: выходной сигнал получается исключительно из звукового входного сигнала, без какой-либо дополнительной информации.

Усовершенствованные способы повышающего микширования могут быть дополнительно классифицированы с учетом позиционирования прямых и окружающих сигналов. Это различие между подходом «прямой/окружающий» и «групповым» подходом. Основным компонентом методов на основе «прямой/окружающий» является выделение окружающего сигнала, который подается, например, в задние каналы или верхние каналы многоканальной установки объемного звучания. Воспроизведение окружения с использованием задних или верхних каналов создает впечатление окутывания («погружения в звук») у слушателя. Дополнительно, источники прямого звука могут быть распределены между фронтальными каналами согласно их воспринимаемой позиции в стереопанораме. В отличие от этого, «групповой» подход нацелен на позиционирование всех звуков (как прямого звука, так и окружающих звуков) вокруг слушателя с использованием всех доступных громкоговорителей.

Разложение звукового сигнала на прямые и окружающие сигналы также дает возможность раздельной модификации окружающих звуков или прямых звуков, например, масштабируя или фильтруя их. Одним вариантом использования является обработка записи музыкального исполнения, которое было захвачено со слишком большим количеством окружающего звука. Другим вариантом использования является звукопроизводство (например, для звукового сопровождения фильма или музыки), когда объединяются звуковые сигналы, захваченные в разных местах и вследствие этого имеющие разные характеристики окружающего звука.

В любом случае требования, предъявляемые к такой обработке сигнала, состоят в том, чтобы добиться высокой степени разделения при сохранении высокого качества звука для произвольного числа входных канальных сигналов и для всех возможных характеристик входных сигналов.

Различные подходы были предоставлены на предшествующем уровне техники для DAD или для ослабления или усиления либо компонентов прямого сигнала, либо компонентов окружающего сигнала, и кратко рассматриваются ниже.

Известные концепции имеют отношение к обработке речевых сигналов с целью удаления нежелательного фонового шума из записей с микрофона.

Способ для ослабления реверберации речевых записей, имеющих два входных канала описан в документе [1]. Компоненты реверберирующего сигнала уменьшаются путем ослабления компонентов некоррелированного (или рассеянного) сигнала во входном сигнале. Обработка реализуется в частотно-временной области таким образом, что сигналы участков полосы частот обрабатываются посредством способа спектрального взвешивания. Вещественные весовые коэффициенты вычисляются с использованием спектральных плотностей мощности (СПМ)

где X(m,k) и Y(m,k) обозначают представления в частотно-временной области для входных сигналов xt[n] и yt[n] во временной области, E{∙} является операцией математического ожидания, а является комплексно сопряженным с X.

Авторы первоисточника указывают на то, что допустимы разные функции спектрального взвешивания, которые пропорциональны , например, если используются веса, равные нормированной взаимно-корреляционной функции (или функции когерентности)

С учетом подобного обоснования, способ, описанный в документе [2], выделяет окружающий сигнал, используя спектральное взвешивание с весами, полученными исходя из нормированной взаимно-корреляционной функции, вычисленной в полосах частот, см. Формула (4) (или, в формулировке авторов первоисточника, «функции межканальной кратковременной когерентности»). Отличие от документа [1] состоит в том, что вместо ослабления компонентов рассеянного сигнала, ослабляются компоненты прямого сигнала с использованием спектральных весов, которые являются монотонной непрерывной функцией (1-ρ(m,k)).

Разложение для применения повышающего микширования входных сигналов, имеющих два канала, с использованием многоканальной винеровской фильтрации, было описано в документе [3]. Обработка производится в частотно-временной области. Входной сигнал моделируется как смесь окружающего сигнала и одного активного прямого источника (для каждой полосы частот), причем прямой сигнал в одном канале ограничивается до масштабированной копии компонента прямого сигнала во втором канале, т.е. амплитудного панорамирования. Коэффициент панорамирования и мощности прямого сигнала и окружающего сигнала оцениваются с использованием нормированной взаимной корреляции и мощностей входных сигналов в обоих каналах. Прямой выходной сигнал и окружающие выходные сигналы получаются из линейных комбинаций входных сигналов, с вещественными весовыми коэффициентами. Дополнительное последующее масштабирование применяется таким образом, что мощность выходных сигналов равна оцененным величинам.

Способ, описанный в документе [4], выделяет окружающий сигнал с помощью спектрального взвешивания, на основании оценки окружающей мощности. Окружающая мощность является оценкой на основании предположений, что компоненты прямого сигнала в обоих каналах полностью коррелированы, что окружающие канальные сигналы некоррелированы друг с другом и с прямыми сигналами, и что окружающие мощности в обоих каналах равны.

Способ для повышающего микширования стереофонических сигналов на основе Направленного Звукового Кодирования (DirAC - Directional Audio Coding) описан в документе [5]. DirAC нацелено на анализ и воспроизведение направления поступления, рассеянности и спектра звукового поля. Для повышающего микширования входных стереофонических сигналов моделируются безэховые записи в B-формате входных сигналов.

Способ для выделения некоррелированной реверберации из звукового стереофонического сигнала с использованием алгоритма адаптивной фильтрации, который нацелен на предсказание компонента прямого сигнала в одном канальном сигнале, используя другой канальный сигнал, посредством алгоритма минимальной среднеквадратичной ошибки (LMS - Least Mean Square), описан в документе [6]. Затем окружающие сигналы получаются путем вычитания оцененных прямых сигналов из входных сигналов. Обоснование этого подхода состоит в том, что предсказание работает только для коррелированных сигналов, и ошибка предсказания имеет сходство с некоррелированным сигналом. Существуют различные алгоритмы адаптивной фильтрации, основанные на принципе LMS, и допустимы, например, алгоритм LMS или нормированной LMS (NLMS - Normalized LMS).

Для разложения входных сигналов с более чем двумя каналами в документе [7] описан способ, в котором многоканальные сигналы сперва подвергаются понижающему микшированию, чтобы получить 2-канальный стереофонический сигнал, а затем применяется способ для обработки входных стереофонических сигналов, представленный в документе [3].

Для обработки монофонических сигналов, способ, описанный в документе [8], выделяет окружающий сигнал с помощью спектрального взвешивания, причем спектральные веса вычисляются с использованием выделения признаков и контролируемого обучения.

Другой способ для выделения окружающего сигнала из монофонических записей для применения повышающего микширования получает представление в частотно-временной области, исходя из разницы представления в частотно-временной области входного сигнала и его сжатой версии, предпочтительно вычисленной с помощью факторизации неотрицательной матрицы [9].

Способ для выделения и изменения компонентов реверберирующего сигнала в звуковом сигнале на основании оценки абсолютной величины передаточной функции реверберационной системы, в которой генерируется реверберирующий сигнал, описан в документе [10]. Оценка абсолютных величин представления в частотной области компонентов сигнала производится при помощи рекурсивной фильтрации и может быть модифицирована.

Задачей настоящего изобретения является предоставить улучшенные концепции для многоканального прямого-окружающего разложения для обработки звукового сигнала. Задача настоящего изобретения решается благодаря устройству по п. 1 формулы изобретения, способу по п. 14 формулы изобретения и компьютерной программе по п. 15 формулы изобретения.

Предоставляется устройство для генерирования одного или нескольких выходных звуковых канальных сигналов в зависимости от двух или более входных звуковых канальных сигналов. Каждый из двух или более входных звуковых канальных сигналов содержит части прямого сигнала и части окружающего сигнала. Устройство содержит модуль определения фильтра для определения фильтра путем оценки первой информации спектральной плотности мощности и оценки второй информации спектральной плотности мощности. Помимо этого, устройство содержит процессор обработки сигналов для генерирования одного или нескольких выходных звуковых канальных сигналов путем применения фильтра на двух или более входных звуковых канальных сигналах. Первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям окружающих сигналов двух или более входных звуковых канальных сигналов. Или, первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям прямых сигналов двух или более входных звуковых канальных сигналов. Или, первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям прямых сигналов двух или более входных звуковых канальных сигналов, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям окружающих сигналов двух или более входных звуковых канальных сигналов.

Варианты осуществления предоставляют концепции для разложения входных звуковых сигналов на компоненты прямого сигнала и компоненты окружающего сигнала, которые могут быть применены для монтажа и воспроизведения звука. Главная трудность такой обработки сигналов состоит в том, чтобы добиться высокой степени разделения при сохранении высокого качества звука для произвольного числа входных канальных сигналов и для всех возможных характеристик входных сигналов. Предоставляемые концепции основываются на многоканальной обработке сигнала в частотно-временной области, которая приводит к условному оптимальному решению по среднеквадратической ошибке, и, например, с учетом ограничений по искажению оцененных полезных сигналов или по снижению остаточных помех.

Предоставляются варианты осуществления для разложения входных звуковых сигналов на компоненты прямых сигналов и компоненты окружающего сигнала. Кроме того, будет предоставлено получение фильтров для вычисления компонентов окружающих сигналов, и помимо этого описываются варианты осуществления для применений этих фильтров.

Некоторые варианты осуществления имеют отношение к неуправляемому повышающему микшированию согласно подходу прямой/ окружающий в отношении входных сигналов, имеющих более одного канала.

Что касается намеченных применений описываемого разложения, интерес представляет вычисление выходных сигналов, имеющих такое же число каналов, как и входной сигнал. Для такого применения варианты осуществления обеспечивают очень хорошие результаты с точки зрения разделения и качества звука, потому что можно справиться с входными сигналами, в которых прямые сигналы задерживаются по времени между входными каналами. В отличие от других концепций, например, концепций, предоставленных в документе [3], варианты осуществления не предполагают, что прямые звуки во входных сигналах панорамируются только за счет масштабирования (амплитудное панорамирование), но также и благодаря введению разностей по времени между прямыми сигналами в каждом канале.

Кроме того, варианты осуществления могут оперировать с входным сигналом, имеющим произвольное число каналов, в отличие от всех других концепций на предшествующем уровне техники (см. выше), которые могут обрабатывать только входные сигналы, имеющие один или два канала.

Другими преимуществами вариантов осуществления являются использование управляющих параметров, оценка окружающей матрицы СПМ и дополнительные модификации фильтра, что описано ниже.

Некоторые варианты осуществления обеспечивают единообразные окружающие звуки для всех входных звуковых объектов. Когда входные сигналы раскладываются на прямые и окружающие звуки, некоторые варианты осуществления адаптируют характеристики окружающего звука посредством надлежащей обработки звукового сигнала, а другие варианты осуществления заменяют компоненты окружающего сигнала при помощи искусственной реверберации и других искусственных окружающих звуков.

Согласно одному из вариантов осуществления, устройство может дополнительно содержать анализирующий банк фильтров, выполненный с возможностью преобразования двух или более входных звуковых канальных сигналов из временной области в частотно-временную область. Модуль определения фильтра может быть выполнен с возможностью определения фильтра путем оценки первой информации спектральной плотности мощности и второй информации спектральной плотности мощности в зависимости от входных звуковых канальных сигналов, представленных в частотно-временной области. Процессор обработки сигналов может быть выполнен с возможностью генерирования одного или нескольких выходных звуковых канальных сигналов, представленных в частотно-временной области, путем применения фильтра на двух или более входных звуковых канальных сигналах, представленных в частотно-временной области. Помимо этого, устройство может дополнительно содержать синтезирующий банк фильтров, выполненный с возможностью преобразования одного или нескольких выходных звуковых канальных сигналов, представленных в частотно-временной области, из частотно-временной области во временную область.

Помимо этого, предоставляется способ для генерирования одного или нескольких выходных звуковых канальных сигналов в зависимости от двух или более входных звуковых канальных сигналов. Каждый из двух или более входных звуковых канальных сигналов содержит части прямого сигнала и части окружающего сигнала. Способ содержит этапы, на которых:

- Определяют фильтр путем оценки первой информации спектральной плотности мощности и оценки второй информации спектральной плотности мощности. И:

- Генерируют один или несколько выходных звуковых канальных сигналов путем применения фильтра на двух или более входных звуковых канальных сигналах.

Первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям окружающих сигналов двух или более входных звуковых канальных сигналов. Или, первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям прямых сигналов двух или более входных звуковых канальных сигналов. Или, первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям прямых сигналов двух или более входных звуковых канальных сигналов, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям окружающих сигналов двух или более входных звуковых канальных сигналов.

Помимо этого, предоставляется компьютерная программа для реализации вышеописанного способа при исполнении на компьютере или процессоре обработки сигналов.

В дальнейшем варианты осуществления настоящего изобретения описываются более подробно со ссылкой на чертежи, на которых:

Фиг. 1 иллюстрирует устройство для генерирования одного или нескольких выходных звуковых канальных сигналов в зависимости от двух или более входных звуковых канальных сигналов, согласно одному из вариантов осуществления,

Фиг. 2 иллюстрирует входные и выходные сигналы разложения 5-канальной записи классической музыки, с входными сигналами (левый столбец), окружающими выходными сигналами (средний столбец) и прямыми выходными сигналами (правый столбец), согласно одному из вариантов осуществления,

Фиг. 3 изображает общее представление разложения с использованием оценки окружающего сигнала и оценки прямого сигнала, согласно одному из вариантов осуществления,

Фиг. 4 демонстрирует общее представление разложения с использованием оценки прямого сигнала, согласно одному из вариантов осуществления,

Фиг. 5 иллюстрирует общее представление разложения с использованием оценки окружающего сигнала, согласно одному из вариантов осуществления,

Фиг. 6А иллюстрирует устройство согласно другому варианту осуществления, в котором устройство дополнительно содержит анализирующий банк фильтров и синтезирующий банк фильтров, и

Фиг. 6В изображает устройство согласно еще одному варианту осуществления, иллюстрируя выделение компонентов прямого сигнала, при этом блок АБФ представляет собой набор из N анализирующих банков фильтров (один для каждого канала), и при этом СБФ представляет собой набор синтезирующих банков фильтров.

Фиг. 1 иллюстрирует устройство для генерирования одного или нескольких выходных звуковых канальных сигналов в зависимости от двух или более входных звуковых канальных сигналов, согласно одному из вариантов осуществления. Каждый из двух или более входных звуковых канальных сигналов содержит части прямого сигнала и части окружающего сигнала.

Устройство содержит модуль 110 определения фильтра для определения фильтра путем оценки первой информации спектральной плотности мощности и оценки второй информации спектральной плотности мощности.

Помимо этого устройство содержит процессор 120 обработки сигнала для генерирования одного или нескольких выходных звуковых канальных сигналов путем применения фильтра на двух или более входных звуковых канальных сигналах.

Первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям окружающих сигналов двух или более входных звуковых канальных сигналов.

Или, первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям прямых сигналов двух или более входных звуковых канальных сигналов.

Или, первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям прямых сигналов двух или более входных звуковых канальных сигналов, а вторая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по частям окружающих сигналов двух или более входных звуковых канальных сигналов.

Описываются варианты осуществления, предоставляющие концепции для разложения входных звуковых сигналов на компоненты прямых сигналов и компоненты окружающих сигналов, которые могут быть применены для монтажа и воспроизведения звука. Главная трудность такой обработки сигналов состоит в том, чтобы добиться высокой степени разделения при сохранении высокого качества звука для произвольного числа входных канальных сигналов и для всех возможных характеристик входных сигналов. Предоставляемые варианты осуществления основываются на многоканальной обработке сигнала в частотно-временной области и обеспечивают оптимальное решение по среднеквадратической ошибке, с учетом ограничений по искажению оцененных полезных сигналов или по снижению остаточных помех.

Сначала описываются идеи изобретения, на которых основываются варианты осуществления настоящего изобретения.

Предполагается, что принимаются N входных канальных сигналов yt[n]:

Например, N ≥ 2. Целью предоставляемых концепций является разложение входных канальных сигналов y1[n]... yN[n] ( = [yt[n]]T) на N компонентов прямых сигналов, обозначаемых dt[n] = [d1[n]... dN[n]]T и/или N компонентов окружающих сигналов, обозначаемых at[n] = [a1[n]... aN[n]]T. Обработка может быть применена для всех входных каналов, или каналы входных сигналов разбиваются на подмножества каналов, которые обрабатываются по отдельности.

Согласно вариантам осуществления, один или несколько компонентов d1[n],..., dN[n] прямых сигналов и/или один или несколько компонентов a1[n],..., aN[n] окружающих сигналов должны оцениваться, исходя из двух или более входных канальных сигналов y1[n],..., yN[n], чтобы получить одну или несколько оценок компонентов d1[n],..., dN[n] прямых сигналов и/или компонентов a1[n],..., aN[n] окружающих сигналов в качестве одного или нескольких выходных канальных сигналов.

Пример обеспечиваемых выходов некоторых вариантов осуществления изображен на Фиг. 2, для N = 5. Один или несколько выходных звуковых канальных сигналов () получаются путем оценки компонентов прямых сигналов и компонентов окружающих сигналов независимо, как показано на Фиг. 3. В качестве альтернативы, вычисляется оценка ( или ) для одного из двух сигналов (либо dt[n] либо at[n]), и другой сигнал получается путем вычитания первого результата из входного сигнала. Фиг. 4 иллюстрирует обработку для оценки сначала компонентов прямого сигнала dt[n], и получения окружающих компонентов at[n] сигналов путем вычитания оценки прямых сигналов из входного сигнала. С аналогичным обоснованием, сначала может быть получена оценка компонентов окружающих сигналов, как проиллюстрировано в схеме на Фиг. 5.

Согласно вариантам осуществления, обработка может быть, например, выполнена в частотно-временной области. Представление в частотно-временной области входного звукового сигнала может быть, например, получено при помощи банка фильтров (анализирующего банка фильтров), например, оконного преобразования Фурье (STFT - Short-time Fourier transform).

Согласно варианту осуществления, проиллюстрированному на Фиг. 6А, анализирующий банк 605 фильтров преобразует входные звуковые канальные сигналы yt[n] из временной области в частотно-временную область. Помимо этого, на Фиг. 6А, синтезирующий банк 625 фильтров преобразует оценку компонентов прямых сигналов из частотно-временной области во временную область, чтобы получить выходные звуковые канальные сигналы

В варианте осуществления на Фиг. 6А анализирующий банк 605 фильтров выполнен с возможностью преобразования двух или более входных звуковых канальных сигналов из временной области в частотно-временную область. Модуль 110 определения фильтра выполнен с возможностью определения фильтра путем оценки первой информации спектральной плотности мощности и второй информации спектральной плотности мощности в зависимости от входных звуковых канальных сигналов, представленных в частотно-временной области. Процессор 120 обработки сигналов выполнен с возможностью генерирования одного или нескольких выходных звуковых канальных сигналов, представленных в частотно-временной области, путем применения фильтра на двух или более входных звуковых канальных сигналах, представленных в частотно-временной области. Синтезирующий банк 625 фильтров выполнен с возможностью преобразования одного или нескольких выходных звуковых канальных сигналов, представленных в частотно-временной области, из частотно-временной области во временную область.

Представление в частотно-временной области содержит некоторое число сигналов участков полосы частот, которые меняются с течением времени. Смежные участки полосы частот в некоторых случаях могут быть линейно объединены в сигналы более широких участков полосы частот для того, чтобы снизить сложность вычислений. Каждый участок полосы частот входных сигналов обрабатывается отдельно, как подробно описано ниже. Выходные сигналы во временной области получаются путем применения обратной обработки банка фильтров, т.е. синтезирующего банка фильтров, соответственно. Предполагается, что все сигналы имеют нулевое среднее, сигналы в частотно-временной области могут быть смоделированы как комплексные случайные величины.

В дальнейшем приводятся определения и допущения.

Приведенные ниже определения используются во всем описании изобретенного способа: Представление в частотно-временной области многоканального входного сигнала с N каналами задается следующим образом

с временным индексом m и индексом k участка полосы частот, k = 1... K, и предполагается аддитивная смесь компонента d(m,k) прямого сигнала и компонента a(m,k) окружающего сигнала, т.е.

при

где Di(m,k) обозначает прямой компонент, а Ai(m,k) окружающий компонент, в i-м канале.

Цель прямого-окружающего разложения состоит в том, чтобы оценить d(m,k) и a(m,k). Выходные сигналы вычисляются с использованием матриц HD(m,k) или HA(m,k) фильтров, или обеих. Матрицы фильтров имеют размер N×N и являются комплекснозначными, или могут быть, в некоторых вариантах осуществления, например, вещественнозначными. Оценка N-канальных сигналов компонентов прямых сигналов и компонентов окружающих сигналов получается из следующего

В качестве альтернативы, может использоваться только одна матрица фильтра, и вычитание, проиллюстрированное на Фиг. 4, может быть выражено в виде

где I является единичной матрицей размера N × N, или, как показано в Фиг. 5, в виде

соответственно. Здесь верхний индекс H обозначает сопряженное транспонирование матрицы или вектора. Матрица HD(m,k) фильтров используется для вычисления оценок для прямых сигналов Матрица HA(m,k) фильтров используется для вычисления оценок для окружающих сигналов .

В вышеизложенных Формулах (10)-(15), y(m,k) отражает два или более входных звуковых канальных сигнала. отражает оценку частей окружающих сигналов, и отражает оценку частей прямых сигналов входных звуковых канальных сигналов, соответственно. и/или , или один или несколько векторных компонентов и/или , могут быть одним или несколькими выходными звуковыми канальными сигналами.

Одна, некоторые или все Формулы (10), (11), (12), (13), (14) и (15) могут задействоваться процессором 120 обработки сигналов, изображенным на Фиг. 1 и Фиг. 6А, для применения фильтра, изображенного на Фиг. 1 и Фиг. 6А, на входных звуковых канальных сигналах. Фильтром, изображенным на Фиг. 1 и Фиг. 6А, может быть, например, HD(m,k), HA(m,k), , или В других вариантах осуществления, однако, фильтр, определенный модулем 110 определения фильтра, и задействованный процессором 120 обработки сигналов, может не быть матрицей, а может быть фильтром другого типа. Например, в других вариантах осуществления, фильтр может содержать один или несколько векторов, которые задают фильтр. В дополнительных вариантах осуществления фильтр может содержать множество коэффициентов, которые задают фильтр.

Фильтрующие матрицы вычисляются, исходя из оценок статистических характеристик сигналов, как описано ниже.

В частности, модуль 110 определения фильтра выполнен с возможностью определения фильтра путем оценки первой информации спектральной плотности мощности (СПМ) и второй информации СПМ.

Зададим:

где E{∙} является оператором математического ожидания, а обозначает комплексное сопряжение с X. Для i = j получается СПМ, а для i ≠ j получаются взаимные СПМ.

Ковариационными матрицами для y(m,k), d(m,k) и a(m,k) являются

Ковариационные матрицы Φy(m,k), Φd(m,k) и Φa(m,k) содержат оценки СПМ для всех каналов на главной диагонали, тогда как недиагональные элементы являются оценками взаимной СПМ соответственных канальных сигналов. Таким образом, каждая из матриц Φy(m,k), Φd(m,k) и Φa(m,k) представляет собой оценку информации спектральной плотности мощности.

В Формулах (17)-(19), Φy(m,k) отражает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам. Φd(m,k) отражает информацию спектральной плотности мощности по компонентам прямых сигналов двух или более входных звуковых канальных сигналов. Φa(m,k) отражает информацию спектральной плотности мощности по компонентам окружающих сигналов двух или более входных звуковых канальных сигналов.

Каждую из матриц Φy(m,k), Φd(m,k) и Φa(m,k) в Формулах (17), (18) и (19) можно рассматривать как информацию спектральной плотности мощности. Тем не менее, следует отметить, что, в других вариантах осуществления, первая и вторая информация спектральной плотности мощности не является матрицей, а может быть представлена в подходящем формате любого другого типа. Например, согласно вариантам осуществления, первая и/или вторая информация спектральной плотности мощности может быть представлена в виде одного или нескольких векторов. В дополнительных вариантах осуществления первая и/или вторая информация спектральной плотности мощности может быть представлена в виде множества коэффициентов.

Предполагается, что

• Di(m,k) и Ai(m,k) являются взаимно некоррелированными:

• Ai(m,k) и Aj(m,k) являются взаимно некоррелированными:

• Окружающая мощность равна во всех каналах:

Как следствие, считается, что

Как следствие Формулы (20), из этого следует, что если определяются две матрицы из матриц Φy(m,k), Φd(m,k) и Φa(m,k), то третья из этих матриц сразу же дос