Применение многоканальной декорреляции для усовершенствованного многоканального повышающего микширования

Иллюстрации

Показать все

Изобретение относится к средствам многоканального повышающего микширования с применением многоканальной декорреляции. Технический результат заключается в повышении качества кодирования сигнала при уменьшении ресурсоемкости. Система линейных уравнений применяется для повышающего микширования количества N звуковых сигналов с целью генерирования большего количества М звуковых сигналов, которые являются психоакустически декоррелированными относительно друг друга, и может применяться для улучшения представления рассеянного звукового поля. Линейные уравнения определяются матрицей, которая устанавливает множество векторов в М-мерном пространстве, существенно ортогональных друг к другу. Раскрыты способы получения системы линейных уравнений. 4 н. и 6 з.п. ф-лы, 6 ил.

Реферат

Перекрестная ссылка на родственные заявки

Данная заявка заявляет приоритет предварительной заявки на патент США №61/297699, поданной 22 января 2010 г., которая ссылкой полностью включается в настоящее описание.

Область техники изобретения

Настоящее изобретение, в общем, имеет отношение к обработке сигналов для звуковых сигналов и, в частности, имеет отношение к способам обработки сигналов, которые могут применяться для генерирования звуковых сигналов, представляющих рассеянное звуковое поле. Указанные способы обработки сигналов могут применяться в аудиоприложениях, таких как повышающее микширование, в котором получается некоторое количество сигналов выходных каналов из меньшего количества сигналов входных каналов.

Предпосылки изобретения

Настоящее изобретение может применяться для улучшения качества звуковых сигналов, получаемых при повышающем микшировании; однако настоящее изобретение может полезно применяться для, в значительной мере, любого приложения, которое требует одного или большего количества звуковых сигналов, представляющих рассеянное звуковое поле. Более конкретно, в нижеследующем описании упоминаются приложения, связанные с повышающим микшированием.

Процесс, известный как повышающее микширование, получает количество М каналов звукового сигнала из меньшего количества N каналов звукового сигнала. Например, звуковые сигналы для пяти каналов, обозначаемых как левый (L), правый (R), центральный (С), левый окружающий (LS) и правый окружающий (RS), могут быть получены путем повышающего микширования звуковых сигналов для двух входных каналов, обозначаемых здесь как левый входной (Li) и правый входной (Ri). Одним из примеров устройства повышающего микширования является декодер Dolby® Pro Logic® II, который описан в Gundry, "A New Active Matrix Decoder for Surround Sound," 19th AES Conference, May 2001. Повышающий микшер, который использует данную конкретную технологию, анализирует фазу и амплитуду двух каналов входного сигнала, определяя то, каким образом звуковое поле, которое они представляют, предназначено для передачи слушателю впечатлений о направленности. В зависимости от желаемого художественного эффекта входных звуковых сигналов повышающий микшер должен быть способен генерировать выходные сигналы пяти каналов для того, чтобы создать у слушателя ощущение одного или нескольких слуховых составляющих, имеющих выраженные направления в пределах, охватываемых рассеянным звуковым полем, не имеющим выраженного направления. Настоящее изобретение направлено на генерирование выходных звуковых сигналов для одного или нескольких каналов, которые могут, через один или несколько акустических преобразователей, создавать высококачественное рассеянное звуковое поле.

Звуковые сигналы, которые предназначены для представления рассеянного звукового поля, должны создавать у слушателя впечатление, что звук испускается из многих, если не всех, направлений вокруг слушателя. Данный эффект противоположен хорошо известному явлению создания кажущегося источника звука, или выраженного направления звука, между двумя громкоговорителями путем воспроизведения одного и того же звукового сигнала через каждый из этих громкоговорителей. Высококачественное рассеянное звуковое поле, как правило, не может создаваться путем воспроизведения одного и того же звукового сигнала через ряд громкоговорителей, расположенных вокруг слушателя. Результирующее звуковое поле имеет в различных положениях прослушивания широко варьирующуюся амплитуду, которая часто изменяется на большую величину при очень небольших изменениях в положении. Нередко определенные положения в пределах области прослушивания кажутся лишенными звука для одного уха, но не для второго. Результирующее звуковое поле кажется искусственным.

Раскрытие изобретения

Целью настоящего изобретения является создание способа обработки звуковых сигналов для получения двух или большего количества каналов звуковых сигналов, которые могут применяться для создания высококачественного рассеянного звукового поля через акустические преобразователи, такие как громкоговорители.

Согласно одной из особенностей настоящего изобретения, для представления рассеянного звукового поля, М выходных сигналов получается из N входных звуковых сигналов, где М больше N и больше двух. Это осуществляется путем получения К промежуточных звуковых сигналов из N входных звуковых сигналов так, чтобы каждый промежуточный сигнал был психоакустически декоррелирован с N входных звуковых сигналов и, если К больше единицы, был психоакустически декоррелирован со всеми остальными промежуточными сигналами. N входных звуковых сигналов и К промежуточных сигналов микшируются для получения М выходных звуковых сигналов в соответствии с системой линейных уравнений с коэффициентами матрицы, которая определяет множество из N+К векторов в М-мерном пространстве. По меньшей мере, К из N+K векторов существенно ортогональны всем остальным векторам в множестве. Величина К больше или равна единице и меньше или равна M-N.

Согласно другой особенности настоящего изобретения, матрица коэффициентов системы линейных уравнений получается для использования при микшировании N входных звуковых сигналов с целью получения М выходных звуковых сигналов для представления рассеянного звукового поля. Это осуществляется путем получения первой матрицы, содержащей коэффициенты, которые определяют множество из N первых векторов в М-мерном пространстве;

получения множества из К вторых векторов в М-мерном пространстве, где каждый второй вектор существенно ортогонален каждому первому вектору и, если К больше единицы, всем остальным вторым векторам; получения второй матрицы, содержащей коэффициенты, которые определяют множество из К вторых векторов;

конкатенация первой матрицы и второй матрицы для получения промежуточной матрицы, содержащей коэффициенты, которые определяют объединение множества из N первых векторов и множества из К вторых векторов; и, предпочтительно, масштабирование коэффициентов промежуточной матрицы для получения матрицы обработки сигнала, имеющей норму Фробениуса, находящуюся в пределах 10% нормы Фробениуса для первой матрицы, где коэффициенты матрицы обработки сигнала представляют собой коэффициенты системы линейных уравнений.

Различные характерные признаки настоящего изобретения и предпочтительные варианты его осуществления могут быть лучше поняты путем отсылки к нижеследующему обсуждению и сопроводительным графическим материалам, в которых сходные ссылочные позиции на некоторых фигурах относятся к сходным элементам. Содержимое нижеследующего обсуждения и графических материалов излагается лишь в качестве примеров, и его не следует понимать как представляющее ограничения объема настоящего изобретения.

Краткое описание графических материалов

Фиг.1 - принципиальная блок-схема устройства обработки звуковых сигналов, которое может включать особенности настоящего изобретения.

Фиг.2 - схематическая иллюстрация базисной матрицы повышающего микширования.

Фиг.3 - схематическая иллюстрация базисной матрицы повышающего микширования, конкатенированной с пополняющей матрицей повышающего микширования.

Фиг.4 - схематическая иллюстрация декоррелятора сигналов, использующего элементы задержки.

Фиг.5 - схематическая иллюстрация декоррелятора сигналов, использующего фильтр поддиапазона с зависящим от частоты бимодальным изменением по фазе и фильтр поддиапазона с зависящей от частоты задержкой.

Фиг.6 - принципиальная блок-схема устройства, которое может применяться для реализации различных особенностей настоящего изобретения.

Варианты осуществления изобретения

А. Введение

Фиг.1 представляет принципиальную блок-схему устройства 10, которое может включать особенности настоящего изобретения. Устройство 10 принимает звуковые сигналы для одного или нескольких входных каналов из тракта 19 сигнала и генерирует по тракту 59 сигнала звуковые сигналы для ряда выходных каналов. Малая линия, которая пересекает тракт 19 сигнала, а также малые линии, которые пересекают другие тракты сигнала, указывают на то, что эти тракты сигнала переносят сигналы для одного или нескольких каналов. Символы N и М непосредственно под малыми пересекающими линиями указывают на то, что различные тракты сигнала переносят сигналы для каналов N и М соответственно. Символы x и y непосредственно под некоторыми из пересекающих линий указывают, на то, что соответствующие тракты сигнала переносят неопределенное количество сигналов, что неважно для цели понимания настоящего изобретения.

В устройстве 10 анализатор 20 входного сигнала принимает звуковые сигналы для одного или нескольких входных каналов из тракта 19 сигнала и анализирует их с целью определения того, какие части входных сигналов представляют рассеянное звуковое поле и какие части представляют звуковое поле, которое не является рассеянным. Рассеянное звуковое поле создает у слушателя впечатление, что звук испускается из множества, если не из всех, направлений вокруг слушателя. Нерассеянное звуковое поле создает впечатление, что звук испускается из конкретного направления или из относительно узкого диапазона направлений. Отличие между рассеянным и нерассеянным звуковыми полями является субъективным и не всегда может быть точно определенным. Несмотря на то, что это может оказывать влияние на практические реализации, которые используют особенности настоящего изобретения, это не влияет на принципы, лежащие в основе настоящего изобретения.

Части входных звуковых сигналов, которые считаются представляющими нерассеянное звуковое поле, проходят по тракту 28 сигнала в процессор 30 нерассеянных сигналов, который генерирует по тракту 29 сигнала множество из М сигналов, которые предназначены для воспроизведения нерассеянного звукового поля через ряд акустических преобразователей, таких как громкоговорители. Одним из примеров устройства повышающего микширования, которое выполняет этот тип обработки, является упомянутый выше декодер Dolby Pro Logic II.

Части входных звуковых сигналов, которые считаются представляющими рассеянное звуковое поле, проходят по тракту 29 сигнала в процессор 40 рассеянных сигналов, который генерирует по тракту 49 сигнала множество из М сигналов, которые предназначены для воспроизведения рассеянного звукового поля через ряд акустических преобразователей, таких как громкоговорители. Настоящее изобретение направлено на обработку, которая выполняется в процессоре 40 рассеянных сигналов.

Суммирующий компонент 50 объединяет каждый из М сигналов из процессора 30 нерассеянных сигналов с соответствующим одним из М сигналов из процессора 40 рассеянных сигналов, генерируя звуковой сигнал для соответствующего одного из М выходных каналов. Звуковой сигнал каждого из выходных каналов предназначен для приведения в действие акустического преобразователя, такого как громкоговоритель.

Настоящее изобретение направлено на разработку и применение системы линейных уравнений микширования с целью генерирования множества звуковых сигналов, которые могут представлять рассеянное звуковое поле. Эти уравнения микширования могут применяться, например, в процессоре 40 рассеянных сигналов. В оставшейся части данного раскрытия принимается, что число N больше или равно единице, число М больше или равно трем и число М больше числа N.

Устройство 10 представляет только один из примеров того, как может применяться настоящее изобретение. Настоящее изобретение может включаться и в другие устройства, которые отличаются по функциям или по конструкции от устройства, проиллюстрированного на фиг.1. Например, сигналы, представляющие и рассеянные, и нерассеянные части звукового поля, могут обрабатываться единственным компонентом. Ниже описано несколько реализаций отдельного процессора 40 рассеянных сигналов, который микширует сигналы в соответствии с системой линейных уравнений, определяемой матрицей. Различные части процессов и для процессора 40 рассеянных сигналов, и для процессора 30 нерассеянных сигналов могут реализовываться системой линейных уравнений, которая определяется единственной матрицей. Кроме того, особенности настоящего изобретения могут включаться в устройство без включения также и анализатора 20 входного сигнала, процессора 30 нерассеянных сигналов или суммирующего компонента 50.

В. Первый способ получения

Процессор 40 рассеянных сигналов генерирует по тракту 49 сигнала множество из М сигналов путем микширования N каналов звуковых сигналов, принимаемых из тракта 29, в соответствии с системой линейных уравнений. Для облегчения описания в нижеследующем обсуждении части N каналов звукового сигнала, принимаемые из тракта 29, именуются промежуточными входными сигналами, и М каналов промежуточных сигналов, генерируемых по тракту 49, именуются промежуточными выходными сигналами. Данная операция микширования включает применение системы линейных уравнений, которая может быть представлена матричным умножением, как показано в выражении 1:

Y → = [ Y 1 ⋮ Y M ] = [ C 1.1   ⋯   C 1. N + K ⋮       ⋱         ⋮ C M .1       ⋯   C M , N + K ] ⋅ [ X 1   ⋮ X N + K ] = C ⋅ X →   д л я   1 ≤ K ≤ ( M − N )   ( 1 )

где X → =вектор-столбец, представляющий N+K сигналов, полученных из N промежуточных входных сигналов;

С=матрица, или массив, размера М×(N+K) коэффициентов микширования;

и Y → =вектор-столбец, представляющий М промежуточных выходных сигналов.

Операция микширования может выполняться на сигналах, представленных во временной области или в частотной области. В частности, в нижеследующем описании упоминаются реализации во временной области.

При желании эта же система линейных уравнений микширования может быть выражена путем транспонирования векторов и матрицы следующим образом:

Y → T = X → T ⋅ C T       ( 2 )

где X → T =вектор-строка, представляющий N+K сигналов, полученных из N промежуточных входных сигналов;

СT=транспонированная матрица С размера (N+K)×M; и

Y → T =вектор-строка, представляющий М промежуточных выходных сигналов.

В нижеследующем описании используются обозначения и терминология, такие как строки и столбцы, которые согласуются с выражением 1; однако принципы настоящего изобретения могут быть получены и применены с использованием других форм или выражений, таких как выражение 2 или система линейных уравнений в явном виде.

Как показано в выражении 1, К больше или равно единице и меньше или равно разности (M-N). Как следствие, количество сигналов Xi и количество столбцов в матрице С находится между N+1 и М.

Коэффициенты матрицы С могут быть получены из множества N+K единичных векторов в М-мерном пространстве, которые «существенно ортогональны» друг другу. Два вектора считаются существенно ортогональными друг другу, если их скалярное произведение меньше 35% произведения их модулей. Это соответствует углу между векторами от приблизительно семидесяти градусов до приблизительно 110 градусов. Каждый столбец матрицы С может содержать М коэффициентов, которые соответствуют элементам одного из векторов в множестве. Например, коэффициенты, которые находятся в первом столбце матрицы С, соответствуют одному из векторов V в множестве, элементы которого обозначаются как (V1,…, VM), и, таким образом, C1,1=p·V1,…, CM,1=p·VM, где р - коэффициент масштабирования, используемый, когда это может потребоваться, для масштабирования коэффициентов матрицы. В альтернативном варианте коэффициенты в каждом столбце j матрицы С могут масштабироваться с различными коэффициентами масштабирования pj. Во многих приложениях коэффициенты масштабируются так, чтобы норма Фробениуса матрицы была равна или находилась в пределах 10% N . Дополнительные особенности масштабирования обсуждаются ниже.

Множество из N+K векторов может быть получено любым возможным желаемым способом. Один из способов создает матрицу G размера М×М из коэффициентов с псевдослучайными значениями, имеющими гауссово распределение, и вычисляет разложение по сингулярным числам этой матрицы для получения трех матриц размера М×М, обозначаемых здесь как U, S и V. Обе матрицы U и V являются единичными матрицами. Матрица С может быть получена путем выбора N+K столбцов или из матрицы U, или из матрицы V и масштабирования коэффициентов в этих столбцах для получения нормы Фробениуса, равной или находящейся в пределах 10% N . Ниже описан предпочтительный способ, который ослабляет некоторые требования к ортогональности.

N+K входных сигналов получаются путем декорреляции N промежуточных входных сигналов относительно друг друга. Требуемый тип декорреляции именуется здесь «психоакустической декорреляцией». Психоакустическая декорреляция является менее строгой, чем численная декорреляция, в том смысле, что два сигнала могут считаться психоакустически декоррелированными даже тогда, когда они в некоторой степени обладают численной корреляцией друг с другом.

Численная корреляция двух сигналов может быть вычислена с использованием множества известных численных алгоритмов. Эти алгоритмы вырабатывают критерий численной корреляции, называемый коэффициентом корреляции, который варьируется от минус единицы до плюс единицы. Коэффициент корреляции, модуль которого равен или близок к единице, указывает на то, что два сигнала тесно связаны. Коэффициент корреляции с модулем, равным или близким к нулю, указывает на то, что два сигнала в целом независимы друг от друга.

Психоакустическая корреляция относится к корреляционным свойствам звуковых сигналов, которые существуют в пределах частотных полос, имеющих так называемую критическую ширину полосы частот. Разрешающая способность по частоте слуховой системы человека изменяется с частотой по всему звуковому спектру. Человеческое ухо может различать спектральные составляющие, более близкие друг к другу по частоте, при менее высоких частотах ниже приблизительно 500 Гц, но не настолько близкие друг к другу по мере увеличения частоты до пределов слышимости. Ширина указанного разрешения по частоте именуется критической шириной полосы частот, и, как только что разъяснялось, она изменяется с частотой.

Два сигнала называются психоакустически декоррелированными один относительно другого, если средний коэффициент численной корреляции в пределах психоакустической критической ширины полосы частот равен или близок к нулю. Психоакустическая декорреляция достигается тогда, когда коэффициент численной корреляции между двумя сигналами равен или близок к нулю при всех частотах. Также психоакустическая декорреляция может достигаться даже тогда, когда коэффициент численной корреляции между двумя сигналами не равен или не близок к нулю при всех частотах, если численная корреляция варьируется так, чтобы ее среднее в пределах каждой психоакустической критической полосы частот было меньше половины максимального коэффициента корреляции для любой частоты в пределах этой критической полосы.

Психоакустическая декорреляция может достигаться с использованием задержек или специальных типов фильтров, которые описываются ниже. Во многих реализациях для достижения психоакустической декорреляции N из N+K сигналов Xi могут браться напрямую из N промежуточных входных сигналов без использования каких-либо задержек или фильтров, поскольку эти N сигналов представляют рассеянное звуковое поле и с большой вероятностью уже являются психоакустически декоррелированными.

С. Усовершенствованный способ получения

Если сигналы, которые генерируются процессором 40 рассеянных сигналов, комбинируются с другими сигналами, представляющими нерассеянное звуковое поле, как, например, показано на фиг.1, результирующая комбинация сигналов может генерировать нежелательные артефакты тогда, когда матрица С конструируется с использованием описанного выше способа. Указанные артефакты могут возникать в результате того, что конструкция матрицы С не учитывает возможные взаимодействия между рассеянными и нерассеянными частями звукового поля. Как упоминалось выше, отличие между рассеянным и нерассеянным не всегда является точно определенным, и анализатор 20 входного сигнала может генерировать по тракту 28 сигналы, которые в некоторой степени представляют рассеянное звуковое поле, и может генерировать по тракту 29 сигналы, которые в некоторой степени представляют нерассеянное звуковое поле. Если генератор 40 рассеянных сигналов нарушает или модифицирует нерассеянный характер звукового поля, представляемого сигналами в тракте 29, в звуковом поле, полученном из входных сигналов, которые генерируются по тракту 59, могут возникать нежелательные артефакты или слышимые искажения. Например, если сумма М рассеянных обработанных сигналов в тракте 49 и М нерассеянных обработанных сигналов в тракте 39 приводит к сокращению некоторых нерассеянных составляющих сигнала, то может ухудшаться субъективное впечатление, которое иначе достигалось бы путем применения настоящего изобретения.

Улучшения можно добиться, конструируя матрицу С так, чтобы она учитывала нерассеянную сущность звукового поля, которое обрабатывается процессором 30 нерассеянных сигналов. Это можно осуществить, вначале идентифицируя матрицу Е, которая или представляет, или предполагаемо представляет кодирование, которое обрабатывает М каналов звуковых сигналов, создавая N каналов входных звуковых сигналов, принимаемых из тракта 19, а затем получает матрицу, обратную этой матрице так, как это описывается ниже.

Одним из примеров матрицы Е является матрица размера 5×2, которая применяется для понижающего микширования пяти каналов, L, С, R, LS, RS, в два канала, обозначаемые как левый общий (LT) и правый общий (RT). Сигналы для каналов LT и RT представляют один из примеров входных звуковых сигналов для двух (N=2) каналов, которые принимаются из тракта 19. В этом примере устройство 10 может применяться для синтеза пяти (М=5) каналов выходных звуковых сигналов, которые могут создавать звуковое поле, сходное по восприятию, но не идентичное звуковому полю, которое могло бы создаваться из оригинальных пяти звуковых сигналов.

Один из примеров матрицы Е размера 5×2, которая может применяться для кодирования сигналов каналов LT и RT из сигналов каналов L, С, R, LS и RS, показан в следующем выражении:

E = [ 1   2 2   0   3 2   − 1 2 0   2 2   1   − 1 2   3 2 ]       ( 3 )

Обычно из матрицы E размера N×М с использованием известных численных методов, включая такие реализованные в числовом программном обеспечении методы, как функция «pinv» в Matlab®, поставляемом MathWorks™, Натик, Массачусетс, или функция «Pseudolnverse» в Mathematica®, поставляемом Wolfram Research, Шампэйн, Иллинойс, можно получить псевдообратную матрицу В. Матрица В может не являться оптимальной, если ее коэффициенты создают нежелательные перекрестные помехи между какими-либо из каналов или если какие-либо коэффициенты представляют собой мнимые или комплексные числа. Матрица В может модифицироваться для удаления указанных нежелательных характеристик. Также она может модифицироваться для достижения любого желаемого художественного эффекта путем изменения коэффициентов с целью подчеркивания сигналов для выбранных громкоговорителей. Например, коэффициенты могут изменяться с целью увеличения энергии в сигналах, предназначенных для воспроизведения через громкоговорители для левого и правого каналов, и для снижения энергии в сигналах, предназначенных для воспроизведения через громкоговорители для центрального канала. Коэффициенты матрицы Е масштабируются так, чтобы каждый столбец матрицы представлял единичный вектор в М-мерном пространстве. В том, чтобы векторы, представленные столбцами матрицы В, были ортогональными друг другу, нет необходимости.

Один из примеров матрицы В размера 5×2 показан в следующем выражении:

B = [ 0.65       0 0.40       0.40 0       0.65 0.60       − 0.24 − 0.24   0.60 ]       ( 4 )

Эта матрица может применяться для генерирования множества из М промежуточных выходных сигналов из N промежуточных входных сигналов при помощи следующей операции:

Y → = B ⋅ X →       ( 5 )

Данная операция схематически проиллюстрирована на фиг.2. Микшер 41 принимает N промежуточных входных сигналов из трактов 29-1 и 29-2 сигнала и микширует эти сигналы в соответствии с системой линейных уравнений, генерируя множество из М промежуточных выходных сигналов по трактам 49-1-49-5 сигнала. Блоки в микшере 41 представляют умножение, или усиление, сигнала посредством коэффициентов матрицы В в соответствии с системой линейных уравнений.

Несмотря на то, что матрица В может применяться сама по себе, эффективность улучшается путем применения дополнительной пополняющей матрицы А размера М×K, где 1≤K≤(M-N). Каждый столбец в матрице А представляет собой единичный вектор в М-мерном пространстве, который существенно ортогонален векторам, представленным N столбцами матрицы В. Если К больше единицы, каждый столбец представляет вектор, который также существенно ортогонален векторам, представленным всеми остальными столбцами матрицы A.

Векторы для столбцов матрицы А могут получаться практически любым желаемым способом. Могут применяться упомянутые выше способы. Ниже описывается предпочтительный способ.

Коэффициенты в пополняющей матрице A и в матрице B могут масштабироваться, как разъясняется ниже, и конкатенироваться, давая матрицу С. Масштабирование и конкатенация может алгебраически выражаться как:

C = [ β ⋅ B | α ⋅ A ]       ( 6 )

где |=горизонтальная конкатенация столбцов матрицы В и матрицы А;

α=коэффициент масштабирования для коэффициентов матрицы А; и

β=коэффициент масштабирования для коэффициентов матрицы В.

Для многих приложений коэффициенты масштабирования α и β выбираются так, чтобы норма Фробениуса составной матрицы С была равна или находилась в пределах 10% нормы Фробениуса матрицы В. Норма Фробениуса матрицы С может быть выражена как:

‖ C ‖ F = ∑ i ∑ j | c i j | 2

где ci,j=коэффициент матрицы в строке i и столбце j.

Если каждый из N столбцов матрицы В и каждый из К столбцов матрицы А представляет единичный вектор, то норма Фробениуса матрицы В равна N и норма Фробениуса матрицы А равна N . В этом случае можно показать, что если задать норму Фробениуса матрицы С равной N , то значения коэффициентов масштабирования α и β соотносятся друг с другом так, как показано в следующем выражении:

α = N ⋅ ( 1 − β 2 ) K       ( 7 )

После задания значения коэффициента масштабирования β значение коэффициента масштабирования α можно вычислить по выражению 7. Предпочтительно, коэффициент масштабирования β выбирается так, чтобы сигналы, микшируемые посредством коэффициентов в столбцах матрицы В, давались с весом на, по меньшей мере, 5 дБ больше, чем сигналы, микшируемые посредством коэффициентов в столбцах пополняющей матрицы А. Разность весов в, по меньшей мере, 6 дБ может достигаться путем ограничения коэффициентов масштабирования так, чтобы α<1/2 β. Для достижения желаемого акустического баланса между звуковыми каналами могут применяться большие или меньшие разности весов масштабирования для столбцов матрицы В и матрицы А.

В альтернативном варианте коэффициенты в каждом столбце пополняющей матрицы А могут масштабироваться по отдельности, как показано в следующем выражении:

C = [ β ⋅ B | α 1 ⋅ A 1   α 2 ⋅ A 2   …   α K ⋅ A K ]       ( 8 )

где Aj=столбец у пополняющей матрицы А; и

αj=соответствующий коэффициент масштабирования для столбца j.

В данном альтернативном варианте для каждого коэффициента масштабирования αj можно выбрать произвольные значения при условии, что каждый коэффициент масштабирования удовлетворяет ограничению αj<1/2 β. Предпочтительно, значения коэффициентов αj и β выбираются так, чтобы обеспечить норму Фробениуса С, приблизительно равную норме Фробениуса матрицы В.

Каждый из сигналов, которые микшируются в соответствии с пополняющей матрицей A, обрабатывается так, чтобы они были психоакустически декоррелированы относительно N промежуточных входных сигналов и всех остальных сигналов, которые микшируются в соответствии с пополняющей матрицей А. Это иллюстрируется на фиг.3, которая показывает пример двух (N=2) промежуточных входных сигналов, пяти (М=5) промежуточных выходных сигналов и трех (K=3) декоррелированных сигналов, микшируемых в соответствии с пополняющей матрицей А. В данном примере два промежуточных входных сигнала микшируются в соответствии с базисной обратной матрицей В, представленной блоком 41, и декоррелируются декоррелятором 43, образуя три декоррелированных сигнала, которые микшируются в соответствии с пополняющей матрицей A, представленной блоком 42.

Декоррелятор 43 может реализовываться различными способами. Одна из реализаций, показанная на фиг.4, достигает психоакустической декорреляции путем задержки ее входных сигналов на различные величины. Для различных применений пригодны задержки в диапазоне от одной до двадцати миллисекунд.

Часть другой реализации декоррелятора 43 показана на фиг.5. Эта часть обрабатывает один из промежуточных входных сигналов. Промежуточный входной сигнал проходит по различным трактам обработки сигнала, которые применяют фильтры к соответствующим им сигналам в двух перекрывающихся частотных поддиапазонах. Низкочастотный тракт включает фильтр 61 переворота фазы, который фильтрует его входной сигнал в первом частотном поддиапазоне в соответствии с первой импульсной характеристикой, и фильтр 62 нижних частот, который определяет первый частотный поддиапазон. Более высокочастотный тракт включает зависящую от частоты задержку 63, реализуемую фильтром, который фильтрует его входной сигнал во втором частотном поддиапазоне в соответствии со второй импульсной характеристикой, которая не равна первой импульсной характеристике, фильтр 64 верхних частот, который определяет второй частотный поддиапазон, и элемент 65 задержки. Выходные сигналы задержки 65 и фильтра 62 нижних частот объединяются в суммирующем узле 66. Выходной сигнал суммирующего узла 66 представляет собой сигнал, который является психоакустически декоррелированным относительно промежуточного входного сигнала.

Фазовая характеристика фильтра 61 переворота фазы является зависящей от частоты и имеет бимодальное распределение по частоте с пиками, в значительной степени равными плюс и минус девяносто градусов. Идеальная реализация фильтра 61 переворота фазы имеет единичную амплитудную характеристику и фазовую характеристику, которая чередуется, или переворачивается, между плюс девяносто градусов и минус девяносто градусов на краях двух или нескольких частотных полос в пределах полосы пропускания фильтра. Переворот фазы может реализовываться посредством разреженного преобразования Гильберта, которое имеет импульсную характеристику, показанную в следующем выражении:

H S ( k ) = { 2 / k ' π   { o d d   k ' = k / S } 0       { o t h e r w i s e }       ( 9 )

Импульсная характеристика разреженного преобразования Гильберта может усекаться до длин