Кодирование звука с использованием декоррелированных сигналов

Иллюстрации

Показать все

Изобретение относится к кодированию и декодированию многоканальных звуковых сигналов с использованием пространственных параметров и, в частности, к усовершенствованным принципам для формирования и использования декоррелированных сигналов. Многоканальный сигнал, содержащий, по меньшей мере, три канала, может быть реконструирован так, что реконструированные каналы, по меньшей мере, частично декоррелированы друг от друга, с использованием подвергнутого понижающему микшированию сигнала, полученного из исходного многоканального сигнала, и набора декоррелированных сигналов, предоставленных декоррелятором, который извлекает набор декоррелированных сигналов из сигнала понижающего микширования, при этом некоррелированные сигналы в пределах набора декоррелированных сигналов являются по большей части ортогональными друг другу, то есть отношение ортогональности между парами каналов удовлетворено в пределах диапазона допустимых значений ортогональности. Технический результат - обеспечение эффективного формирования одного или более ортогональных сигналов наряду с охранением импульсных свойств и воспринимаемого качества звучания. 8 н. и 13 з.п. ф-лы, 10 ил.

Реферат

Изобретение относится к кодированию многоканальных звуковых сигналов с использованием пространственных параметров и, в частности, к новым усовершенствованным принципам для формирования и использования декоррелированных сигналов.

В последнее время технологии многоканального воспроизведения звука становятся все более и более важными. Ввиду эффективной передачи многоканальных звуковых сигналов, задействующих 5 или более раздельных звуковых каналов, было разработано несколько способов сжатия стереофонических или многоканальных сигналов. Современные подходы к параметрическому кодированию многоканальных звуковых сигналов (параметрическая стереофония (PS), «бинауральное кодирование сигналов» (BCC) и т. п.) представляют многоканальный звуковой сигнал посредством сигнала понижающего микширования (мог бы быть монофоническим или содержать несколько каналов) и дополнительную параметрическую информацию, также указываемую ссылкой как «пространственные сигналы», характеризующие воспринимаемую пространственную фазу звука.

Устройство многоканального кодирования обычно принимает в качестве входного сигнала, по меньшей мере, два канала и выводит один или более каналов несущей и параметрические данные. Параметрические данные извлекаются из условия, чтобы в декодере могла быть рассчитана аппроксимация исходного многоканального сигнала. Обычно канал (каналы) несущей будут включать в себя полосные отсчеты, спектральные коэффициенты, отсчеты временной области и т. д., которые обеспечивают сравнительно точное представление лежащего в основе сигнала, тогда как параметрические данные не включают в себя такие отсчеты спектральных коэффициентов, но взамен включают в себя параметры управления для управления определенным алгоритмом реконструкции. Такая реконструкция могла бы содержать взвешивание посредством умножения, временной сдвиг, частотный сдвиг, фазовый сдвиг и т. п. Таким образом, параметрические данные включают в себя лишь сравнительно грубое представление сигнала или ассоциативно связанного канала.

Технология бинаурального кодирования сигнала (BCC) описана в множестве публикаций, например, в «Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression» («Бинауральное кодирование сигналов применительно к сжатию стереофонического и многоканального звука») К. Фаллер, Ф. Баумгарте, доклад 5574 на съезде AES, май 2002 года, Мюнхен, в 2 публикациях ICASSP «Estimation of auditory spatial cues for binaural cue coding» («Оценка слуховых пространственных сигналов для бинаурального кодирования сигналов»), и «Binaural cue coding: a normal and efficient representation of spatial audio» («Бинауральное кодирование сигналов: нормальное и рациональное представление пространственного звука»), оба созданные К.Фаллером и Ф.Баумгарте, Орландо, Флорида, май 2002 г.

При BCC-кодировании множество входных звуковых каналов преобразуется в спектральное представление с использованием основанного на ДПФ (дискретном преобразовании Фурье) преобразования с окном перекрытия. Результирующий однородный спектр затем делится на не перекрывающиеся сегменты. Каждый сегмент обладает шириной полосы пропускания, пропорциональной эквивалентной прямоугольной полосе пропускания (ERB). Затем пространственные параметры, называемые ICLD (межканальной разницей уровней) и ICTD (межканальной временной разницей), оцениваются для каждого сегмента. Параметр ICLD описывает разницу уровней между двумя каналами, а параметр ICTD описывает временную разницу (фазовый сдвиг) между двумя сигналами разных каналов. Разницы уровней и временные разницы обычно задаются для каждого канала относительно опорного канала. После извлечения этих параметров, параметры квантуются и в заключение кодируются для передачи.

Хотя параметры ICLD и ICTD представляют наиболее важные параметры местоположения источника звука, пространственное представление, использующее эти параметры, может быть усовершенствовано посредством ввода дополнительных параметров.

Родственная технология, называемая «параметрической стереофонией», описывает параметрическое кодирование двухканального стереофонического сигнала на основании передаваемого монофонического сигнала, а также дополнительной информации параметров. В этом контексте, введены 3 типа пространственных параметров, упомянутых как межканальная разница интенсивности (IID), межканальные разницы фаз (IPD) и межканальная когерентность (ICC). Расширение набора пространственных параметров параметром когерентности (параметром корреляции) дает возможность параметризации воспринимаемой пространственной «диффузности» или пространственной «компактности» звукового каскада. Параметрическая стереофония описана более подробно в: «Parametric Coding of stereo audio» («Параметрическое кодирование стереофонического звука»), Дж. Бребарт, С. Вандепар, А. Кохлрауш, Е. Схейерс ((2005) Eurasip, J. Прикладная обработка сигналов 9, стр. 1305-1322), в «High-Quality Parametric Spatial Audio Coding at Low Bitrates» («Высококачественное параметрическое кодирование звука на низких битовых скоростях»), Дж. Бребарт, С. Вандерпар, А. Кохлрауш, Е. Схейерс, 116-ый съезд AES, препринт 6072, Берлин, май 2004 г., и в «Low Complexity Parametric Stereo Coding» («Параметрическое стереофоническое кодирование низкой сложности»), Е. Схейерс, Дж. Бребарт, Х. Пурнхаген, Дж. Енгдегард, 116-ый съезд AES, прерпринт 6073, Берлин, май 2004 г.

Настоящее изобретение относится к параметрическому кодированию пространственных свойств звукового сигнала. Параметрические многоканальные звуковые декодеры реконструируют N каналов на основании M передаваемых каналов, где N>M, и дополнительных управляющих данных. Дополнительные управляющие данные демонстрируют значительно более низкую скорость передачи данных, чем передача всех N каналов, делая кодирование очень эффективным, наряду с одновременным обеспечением совместимости с по меньшей мере обоими М-канальными устройствами и N-канальными устройствами. Типичными параметрами, используемыми для описания пространственных свойств, являются межканальные разности интенсивности (IID), межканальные временные разности (ITD) и межканальные когерентности (ICC). Для того чтобы реконструировать пространственные параметры на основании этих параметров, требуется способ, который может реконструировать нормальный уровень корреляции между двумя или более каналами согласно параметрам IC. Это достигается посредством способа декорреляции, то есть способа для извлечения декоррелированных сигналов из передаваемых сигналов, чтобы объединять декоррелированные сигналы с передаваемыми сигналами в пределах некоторой последовательности операций повышающего микширования. Способы для повышающего микширования на основании передаваемого сигнала, декоррелированного сигнала и параметров IID/ICC описаны в библиографическом списке, предоставленном выше.

Существует пара способов, имеющихся в распоряжении для создания декоррелированных сигналов. Предпочтительно декоррелированные сигналы имеют подобные или идентичные временные и спектральные огибающие в качестве исходных входных сигналов. В идеале, требуется инвариантная во времени линейная (LTI) функция со сверхширокополосной частотной характеристикой. Один из очевидных способов для достижения таковой состоит в использовании постоянной задержки. Однако использование задержки или любой другой сверхширокополосной LTI-функции будет иметь следствием неширокополосную характеристику после добавления необработанного сигнала. В случае задержки, результатом будет типичный гребенчатый фильтр. Гребенчатый фильтр часто дает нежелательный «металлический» звук, который, даже если может быть эффективным действие стереофонического расширения, сильно уменьшает естественность оригинала. Способ постоянной задержки и другие способы предшествующего уровня техники страдают от неспособности создавать более чем один декоррелированный сигнал наряду с сохранением взаимной декорреляции.

Качество восприятия реконструированного многоканального звукового сигнала, поэтому, строго зависит от действующей концепции, которая предусматривает формирование декоррелированного сигнала из передаваемого сигнала, при котором в идеале декоррелированный сигнал ортогонален сигналу, из которого извлечен, то есть является полностью декоррелированным. Даже если в распоряжении есть полностью декоррелированный сигнал, результат многоканального повышающего микширования, в котором отдельные каналы являются взаимно декоррелированными, не может быть получен с использованием одного декоррелированного сигнала. Во время повышающего микширования реконструированный звуковой канал формируется посредством комбинирования переданного сигнала со сформированным декоррелированным сигналом, тогда как степень, до которой декоррелированный сигнал примешивается к переданному сигналу, типично регулируется передаваемым пространственным звуковым параметром (ICC). Взаимно идеально декоррелированные сигналы, поэтому, не могут быть достигнуты, так как каждый декоррелированный звуковой канал содержит долю одного и того же декоррелированного сигнала.

Задача настоящего изобретения состоит в том, чтобы предоставить более эффективный принцип для создания высоко декоррелированных сигналов.

Эта задача решается устройством согласно п. 1 формулы изобретения или способом согласно п. 15 формулы изобретения.

Настоящее изобретение основано на открытии, что многоканальный сигнал, содержащий по меньшей мере три канала, может быть реконструирован из условия, чтобы реконструированные каналы по меньшей мере частично были декоррелированы друг от друга с использованием подвергнутого понижающему микшированию сигнала, полученного из исходного многоканального сигнала, и набора декоррелированных сигналов, предоставленных декоррелятором, который извлекает набор декоррелированных сигналов из подвергнутого понижающему микшированию сигнала, при этом декоррелированные сигналы в пределах набора декоррелированных сигналов являются приближенно ортогональными друг другу, то есть отношение ортогональности между парами каналов удовлетворено в пределах диапазона допустимых значений ортогональности.

Диапазон допустимых значений ортогональности, например, может быть получен из коэффициента взаимной корреляции, который количественно определяет степень корреляции между двумя сигналами. Коэффициент взаимной корреляции 1 означает полную корреляцию, то есть два идентичных сигнала. С другой стороны, коэффициент взаимной корреляции 0 означает полную антикорреляцию или ортогональность сигналов. Диапазон допустимых значений ортогональности, поэтому, может быть определен в качестве интервала значений коэффициента корреляции, находящегося в диапазоне от 0 до определенного верхнего предела.

Следовательно, настоящее изобретение предоставляет решение задачи эффективного формирования одного или более ортогональных сигналов наряду с сохранением импульсных свойств и воспринимаемого качества звучания.

В одном из вариантов осуществления настоящего изобретения решетчатый БИХ-фильтр (IIR, с бесконечной импульсной характеристикой) реализован в качестве декоррелятора, обладающего коэффициентами фильтра, полученными из псевдошумовой последовательности, а фильтрация выполняется в пределах набора комплекснозначных или вещественнозначных фильтров.

В одном из вариантов осуществления настоящего изобретения способ для реконструирования многоканального сигнала включает в себя способ для создания нескольких ортогональных или близких к ортогональным сигналов посредством использования группы решетчатых БИХ-фильтров.

В дополнительном варианте осуществления настоящего изобретения способ для создания нескольких ортогональных сигналов является содержащим способ для выбора коэффициентов фильтра для достижения ортогональности или приближения ортогональности мотивированным ощущениями образом.

В дополнительном варианте осуществления настоящего изобретения группа решетчатых БИХ-фильтров используется в пределах набора комплекснозначных фильтров во время реконструирования многоканального сигнала.

В дополнительном варианте осуществления настоящего изобретения реализован способ для создания одного или более ортогональных или близких к ортогональным сигналов с использованием одного или более сверхширокополосных БИХ-фильтров на основании решетчатой структуры в пределах пространственного декодера.

В дополнительном варианте осуществления настоящего изобретения вариант осуществления, описанный выше, реализован из условия, чтобы коэффициенты фильтра, используемые для БИХ-фильтрации, были основаны на случайных псевдошумовых последовательностях.

В дополнительном варианте осуществления настоящего изобретения к используемым фильтрам добавлены дополнительные временные задержки.

В дополнительном варианте осуществления настоящего изобретения фильтрация обрабатывается в области набора фильтров.

В дополнительном варианте осуществления настоящего изобретения фильтрация обрабатывается в наборе комплекснозначных фильтров.

В дополнительном варианте осуществления настоящего изобретения ортогональные сигналы, создаваемые посредством фильтрации, смешиваются, чтобы сформировать набор выходных сигналов.

В дополнительном варианте осуществления смешивание ортогональных сигналов является зависящим от передаваемых управляющих данных, дополнительно применяемых к обладающему признаками изобретения декодеру.

В дополнительном варианте осуществления настоящего изобретения обладающий признаками изобретения декодер или обладающий признаками изобретения способ декодирования использует управляющие данные, которые содержат по меньшей мере параметр, указывающий требуемую взаимную корреляцию по меньшей мере двух формируемых выходных сигналов.

В дополнительном варианте осуществления настоящего изобретения 5.1-канальный сигнал объемного звучания подвергается повышающему микшированию из переданного монофонического сигнала посредством извлечения декоррелированных сигналов с использованием идеи изобретения. Монофонический подвергнутый понижающему микшированию сигнал и четыре декоррелированных сигнала затем смешиваются вместе согласно некоторым правилам смешивания, чтобы сформировать выходной 5.1-канальный сигнал. Следовательно, предоставлена возможность формировать выходные сигналы, которые взаимно декоррелированы, так как сигналы, используемые для повышающего микширования, то есть переданный монофонический сигнал и четыре сформированных декоррелированных сигнала, декоррелируются, главным образом, согласно обладающему признаками изобретения формированию.

В дополнительном варианте осуществления настоящего изобретения два индивидуальных канала передаются в виде результата понижающего микширования 5.1-канального сигнала. В одной из реализаций два дополнительных взаимно декоррелированных сигнала извлекаются с использованием идеи изобретения, чтобы предоставить четыре канала в качестве базиса для результата повышающего микширования, который всегда является полностью декоррелированным. В модификации варианта осуществления, описанного выше, три декоррелированных сигнала извлекаются и смешиваются с двумя другими декоррелированными сигналами, чтобы предоставить дополнительный декоррелированный сигнал, имеющийся в распоряжении для последующего повышающего микширования. С использованием этого признака качество восприятия может быть дополнительно улучшено для отдельных каналов, например, центрального канала сигнала объемного звучания 5.1.

В дополнительном варианте осуществления настоящего изобретения пять звуковых каналов подвергаются повышающему микшированию из монофонического передаваемого канала перед извлечением с использованием идеи изобретения четырех декоррелированных сигналов, которые впоследствии комбинируются с четырьмя из пяти вышеупомянутых подвергнутых повышающему микшированию каналов, принимая во внимание критерий пяти выходных звуковых каналов, которые, в основном, взаимно декоррелированы.

В дополнительном варианте осуществления настоящего изобретения звуковые сигналы задерживаются перед или после применения обладающей признаками изобретения основанной на БИХ-фильтре фильтрации. Задержка дополнительно улучшает декорреляцию сформированных сигналов и уменьшает расцвечивание при смешивании сформированных декоррелированных сигналов с подвергнутым понижающему микшированию сигналом.

В дополнительном варианте осуществления настоящего изобретения формирование декоррелированных сигналов выполняется в области поддиапазона (комплексно модулированного) набора фильтров, при этом коэффициенты фильтра, используемые декоррелятором, получены с использованием отдельного индекса набора фильтров из набора фильтров, для которого выводятся декоррелированные сигналы.

В дополнительном варианте осуществления настоящего изобретения декоррелированные сигналы получены с использованием решетчатых БИХ-фильтров, которые выполняют гребенчатую сверхширокополосную БИХ-фильтрацию звукового сигнала. Использование решетчатого БИХ-фильтра обладает большими преимуществами. Экспоненциальное затухание характеристики такого фильтра, который предпочтителен для создания надлежащих декоррелированных сигналов, является неотъемлемым свойством такого фильтра. Более того, требуемое длительное затухание импульсной характеристики фильтра, используемого для формирования декоррелированных сигналов, может быть достигнуто чрезвычайно рациональным по объему памяти и вычислений образом (низкой сложности) посредством использования структуры решетчатого фильтра.

В модификации ранее описанного варианта осуществления настоящего изобретения используемые коэффициенты фильтра (коэффициенты отражения) задаются посредством предоставления коэффициентов фильтра, полученных из псевдошумовых последовательностей. В модификации коэффициенты отражения рассчитываются отдельно на основании индекса подполосы у подполосы, в которой используется решетчатый фильтр для получения декоррелированных сигналов.

В одном из вариантов осуществления настоящего изобретения отфильтрованные сигналы и не модифицированный входной сигнал комбинируются посредством матрицы D смешивания, чтобы сформировать набор выходных сигналов. Матрица D смешивания определяет взаимные корреляции выходных сигналов, а также энергию каждого выходного сигнала. Элементы (веса) матрицы D смешивания предпочтительно являются переменными во времени и зависящими от передаваемых управляющих данных. Параметры управления предпочтительно содержат (требуемые) разности уровней между определенными выходными сигналами и/или параметры удельной взаимной корреляции.

В дополнительном варианте осуществления настоящего изобретения обладающий признаками изобретения звуковой декодер содержится в пределах звукового приемника или устройства воспроизведения для улучшения качества восприятия реконструированного сигнала.

Предпочтительные варианты осуществления настоящего изобретения впоследствии описаны по следующим чертежам, на которых:

фиг. 1 показывает структурную схему идеи изобретения звукового декодирования;

фиг. 2 показывает декодер предшествующего уровня техники, не реализующий идею изобретения;

фиг. 3 показывает 5.1-многоканальный звуковой декодер согласно настоящему изобретению;

фиг. 4 показывает дополнительный 5.1-многоканальный звуковой декодер согласно настоящему изобретению;

фиг. 5 показывает дополнительный обладающий признаками изобретения звуковой декодер;

фиг. 6 показывает дополнительный вариант осуществления обладающего признаками изобретения многоканального звукового декодера;

фиг. 7 схематично показывает формирование декоррелированного сигнала;

фиг. 8 показывает решетчатый БИХ-фильтр, используемый для формирования декоррелированного сигнала;

фиг. 9 показывает приемник или звуковой проигрыватель, содержащий обладающий признаками изобретения звуковой декодер; и

фиг. 10 показывает передачу, имеющую в распоряжении приемник или устройство воспроизведения, содержащие обладающий признаками изобретения звуковой декодер.

Варианты осуществления, описанные ниже, являются только иллюстративными в отношении принципов настоящего изобретения касательно передовых способов для создания ортогональных сигналов. Понятно, что модификации и варианты компоновок и детализаций, описанных в материалах настоящей заявки, будут очевидны специалистам в данной области техники. Поэтому, намерение состоит в том, чтобы ограничиваться только рамками предстоящей формулы изобретения, а не отдельными деталями, представленными в качестве описания и разъяснения вариантов осуществления в материалах настоящей заявки.

Фиг. 1 иллюстрирует обладающее признаками изобретения устройство для декорреляции сигналов, которое используется в параметрической стереофонической или многоканальной системе. Обладающее признаками изобретения устройство включает в себя средство 101 для предоставления множества ортогональных декоррелированных сигналов, полученных из входного сигнала 102. Средство предоставления может быть массивом фильтров декорреляции, основанных на решетчатых БИХ-структурах. Входной сигнал 102 (x) может быть сигналом временной области или одиночным сигналом полосной области, как, например, полученный из набора комплексных QMF (квадратурных зеркальных фильтров). Сигналы, выведенные средством 101, y1-yN, являются результирующими декоррелированными сигналами, все из которых являются взаимно ортогональными или близкими к ортогональным.

Так как для восстановления пространственных свойств параметрической стереофонической или параметрической многоканальной системы жизненно необходимо снижать когерентность между двумя или более каналами, для того чтобы восстановить воспринимаемую широту пространственного образа, результирующий декоррелированный сигнал может использоваться для создания конечного результата повышающего микширования многоканального сигнала. Это может производиться добавлением отфильтрованных вариантов (h1(x)) исходного сигнала (x) в выходные каналы. Следовательно, снижение когерентности между N сигналами с использованием N разных фильтров может быть произведено согласно:

y1 = a·x + b·h1(x)

y2 = a·x + b·h2(x)

yn = a·x + b·hn(x)

где х - исходный сигнал, с y1 по yn - результирующие выходные сигналы, a и b - коэффициенты усиления, управляющие величиной когерентности, и с h1 по hn - разные фильтры декорреляции. В более общем смысле можно записать выходные сигналы yi (i=1...I) в виде линейной комбинации входного сигнала х и входного сигнала х, отфильтрованного фильтрами hj (j=l...N):

Здесь матрица D смешивания определяет взаимные корреляции и выходные уровни выходных сигналов yi.

Для того чтобы предотвратить изменения в тембре, рассматриваемый фильтр предпочтительно должен обладать сверхширокополосной характеристикой. Один из успешных подходов состоит в том, чтобы использовать сверхширокополосные фильтры, подобные используемым для последовательностей операций искусственной реверберации. Алгоритмы искусственной реверберации обычно требуют высокого временного разрешения для обеспечения импульсной характеристики, которая является достаточно распространенной во времени. Один из способов проектирования таких всечастотных фильтров состоит в том, чтобы использовать случайную псевдошумовую последовательность в качестве импульсной характеристики. Фильтр затем легко может быть реализован в виде КИХ-фильтра (с конечной импульсной характеристикой, FIR). Для того чтобы достичь достаточной степени независимости между отфильтрованными выходными сигналами, импульсная характеристика КИХ-фильтра должна быть относительно длинной, следовательно, требующей значительного количества вычислительных усилий для выполнения свертки. Сверхширокополосный БИХ-фильтр предпочтителен для такой цели. БИХ-структура имеет несколько преимуществ, когда она касается разработки фильтров декорреляции:

а) Естественное экспоненциальное затухание, которое является обычным для всей естественной реверберации, является желательным для фильтра декорреляции. Это является неотъемлемым свойством БИХ-фильтров.

b) Касательно длительно затухающих импульсных характеристик БИХ-фильтра, соответствующий КИХ-фильтр обычно является более дорогостоящим в показателях сложности и требует большей памяти.

Однако проектирование сверхширокополосных БИХ-фильтров является менее тривиальным, чем случай КИХ, где любая случайная псевдошумовая последовательность становится вектором коэффициентов. Проектным ограничением при разработке многочисленных фильтров декорреляции также является требуемая возможность сохранять одинаковые свойства затухания для всех фильтров наряду с предоставлением ортогональных выходных сигналов (то есть импульсных характеристик фильтров, которые, по существу, обладают удовлетворительной низкой взаимной корреляцией) по каждому выходному сигналу фильтра. К тому же, в качестве основного требования должна быть достигнута устойчивость.

Настоящее изобретение показывает новый способ для создания многочисленных ортогональных сверхширокополосных фильтров посредством структуры решетчатых БИХ-фильтров. Этот подход имеет несколько преимуществ:

а) Более низкая сложность, чем у КИХ-фильтров (при условии требуемой длины импульсных характеристик).

b) Ограничения по стабильности могут быть легко удовлетворены, так как это достигается автоматически, когда абсолютные значения амплитуд всех коэффициентов отражения являются меньшими, чем единица.

c) Многочисленные ортогональные сверхширокополосные фильтры могут легче проектироваться при одних и тех же свойствах затухания на основании случайных псевдошумовых последовательностей.

d) Высокая устойчивость к ошибкам квантования вследствие эффектов конечной длины слов.

Хотя коэффициенты отражения решетчатого БИХ-фильтра могут быть основаны на случайных псевдошумовых последовательностях, для оптимальных рабочих характеристик эти коэффициенты также должны быть отсортированы более изощренным образом или обработаны неслучайными способами, для того чтобы добиться достаточной ортогональности и других важных свойств. Простой способ состоит в том, чтобы формировать множество векторов случайных коэффициентов отражения, сопровождаемых выбором отдельного набора на основании определенных критериев, таких как общая огибающая затухания, минимизация всех взаимных корреляций импульсных характеристик выбранного набора и тому подобное.

Более конкретно, можно было бы начать с большого набора случайных псевдошумовых последовательностей. Каждая из этих последовательностей используется в качестве коэффициентов отражения в сверхширокополосной секции. Впоследствии, импульсная характеристика результирующей сверширокополосной секции вычисляется для каждой случайной псевдошумовой последовательности. В заключение, выбираются те псевдошумовые последовательности, которые дают взаимно декоррелированные импульсные характеристики.

Огромные преимущества заключены в базировании алгоритма декорреляции на наборе (комплексных) фильтров, таком как набор комплекснозначных QMF. Этот набор фильтров обеспечивает гибкость для предоставления свойствам декоррелятора возможности быть избирательными по частоте в показателях, например, компенсации, времени затухания, импульсной плотности и тембра. Отметим, что многие из этих свойств могут быть изменены, наряду с сохранением сверхширокополосной характеристики. Есть много сведений, имеющих отношение к слуховому восприятию, которое направляет проектирование такого решетчатого БИХ-фильтра. Важным аспектом является длина и форма огибающей затухания импульсной характеристики. Также важна потребность в дополнительной предварительной задержке, по выбору, частотно-зависимой, так как это в значительной степени влияет на то, какой вид характеристики гребенчатого фильтра будет получен при смешивании декоррелированного сигнала с исходным. Для достаточной импульсной плотности основанные на шуме коэффициенты отражения в решетчатом фильтре предпочтительно должны быть разными для разных каналов набора фильтров. Для еще лучшей импульсной плотности могут использоваться приближения дробной задержки в пределах набора фильтров.

Фиг. 2 показывает иерархическую структуру декодирования для получения многоканального сигнала для монофонического сигнала понижающего микширования, переданного посредством являющихся результатом параметрических стереофонических блоков, с использованием одиночного декоррелированного сигнала. Посредством краткого рассмотрения подхода предшествующего уровня техники, снова будет затронута задача, решаемая настоящим изобретением. Декодер 110 канала 1-в-3, показанный на фиг. 2, содержит декоррелятор 112, первый параметрический стереофонический повышающий микшер 114 и второй параметрический стереофонический повышающий микшер 116.

Монофонический входной сигнал 118 вводится в декоррелятор 112, чтобы получить декоррелированный сигнал 120. Получается только один декоррелированный сигнал. Первый параметрический стереофонический повышающий микшер принимает в качестве входного сигнала монофонический сигнал 118 понижающего микширования и декоррелированный сигнал 120. Первый повышающий микшер 114 получает центральный канал 122 и комбинированный канал 124 посредством смешивания монофонического сигнала 118 понижающего микширования и декоррелированного сигнала 120 с использованием параметра 126 декорреляции, который управляет смешиванием каналов.

Комбинированный канал 124, затем, вводится во второй параметрический стереофонический повышающий микшер 116, компонующий второй иерархический уровень звукового декодера. Второй параметрический стереофонический повышающий микшер 116 дополнительно принимает декоррелированный сигнал 129 в качестве входного сигнала и получает левый канал 128 и правый канал 130 посредством смешивания комбинированного канала 124 и декоррелированного сигнала 120.

Принципиально возможно формировать центральный канал 122, который является идеально декоррелированным от комбинированного канала 124, когда декоррелятор 112 способен получать декоррелированный сигнал, который полностью ортогонален монофоническому сигналу 118 понижающего микширования. Почти полная декорреляция может быть достигнута, если управляющая информация 126 указывает повышающее микширование, в котором каждый подвергшийся повышающему микшированию канал является преимущественно содержащим составляющую сигнала, происходящую либо из декоррелированного сигнала 120, либо из монофонического сигнала 118 понижающего микширования. Однако так как один и тот же декоррелированный сигнал 120 затем используется, чтобы получать левый канал 128 и правый канал 130, очевидно, что это будет иметь результатом остаточную корреляцию между центральным каналом 122 и одним из каналов 128 или 130.

Это становится даже более очевидным при рассмотрении крайнего случая, в котором полностью декоррелированные левый канал 128 и правый канал 130 должны быть получены из декоррелированного сигнала 120, который предполагается идеально ортогональным монофоническому сигналу понижающего микширования. Идеальная декорреляция между левым каналом 128 и правым каналом 130 может быть достигнута, когда комбинированный канал 124 удерживает информацию только по монофоническому сигналу 118 понижающего микширования, каковое одновременно означает, что центральный канал 122 содержит в основном декоррелированный сигнал 112. Поэтому декоррелированные левый канал 128 и правый канал 130 могли бы означать, что один из каналов действительно содержит в основном информацию по декоррелированному сигналу 120, а другой канал мог бы содержать в основном комбинированный сигнал 124, который в таком случае является идентичным монофоническому сигналу 118 понижающего микширования. Поэтому единственный путь, которым полностью декоррелируются левый и правый каналы, оказывает воздействие на почти идеальную декорреляцию между центральным каналом 122 и одним из каналов 128 или 130.

Это наиболее нежелательное свойство может быть успешно устранено посредством применения идеи изобретения по формированию разных и взаимно ортогональных декоррелированных сигналов.

Фиг. 3 показывает вариант осуществления обладающего признаками изобретения многоканального звукового декодера 400, содержащего матрицу 401 предварительного декоррелятора, декоррелятор 401 и матрицу 403 смешивания. Обладающий признаками изобретения декодер 400 показывает конфигурацию 1-в-5, где пять звуковых каналов и канал низкочастотного расширения получаются из монофонического сигнала 405 понижающего микширования и дополнительных данных пространственного управления, таких как параметры ICC или ICLD. Они не показаны на принципиальной упрощенной схеме на фиг. 3. Монофонический сигнал 405 понижающего микширования вводится в матрицу 401 предварительного декоррелятора, которая получает четыре промежуточных сигнала 406, каковые служат в качестве входного сигнала для декоррелятора 402, который содержит четыре обладающих признаками изобретения декоррелятора h1-h4. Таковые подают четыре взаимно ортогонально декоррелированных сигнала 408 на выход декоррелятора 402.

Матрица 403 смешивания принимает в качестве входного сигнала четыре взаимно ортогональных декоррелированных сигнала 408 и, в дополнение, сигнал 410 понижающего микширования, полученный из монофонического сигнала 405 понижающего микширования посредством матрицы 401 предварительного декоррелятора.

Матрица 403 смешивания комбинирует монофонический сигнал 410 и четыре декоррелированных сигнала 408, чтобы получить выходной 5.1-сигнал 412, содержащий левый передний канал 414а, левый канал 414b объемного звучания, правый передний канал 414с, правый канал 414d объемного звучания, центральный канал 414e и канал 414f низкочастотного расширения.

Важно отметить, что формирование четырех взаимно ортогональных декоррелированных каналов 408 дает возможность получать пять каналов 5.1-канального сигнала, которые являются по меньшей мере частично декоррелированными. В предпочтительном варианте осуществления настоящего изобретения таковыми являются каналы с 414а по 414е. Канал 414f низкочастотного расширения содержит низкочастотные части многоканального сигнала, которые комбинируются в одном единственном низкочастотном канале для всех каналов с 414а по 414е объемного звучания.

Фиг. 4 показывает обладающий признаками изобретения декодер 2-в-5 для получения 5.1-канального сигнала объемного звучания из двух переданных сигналов.

Многоканальный звуковой декодер 500 содержит матрицу 501 предварительного декоррелятора, декоррелятор 502 и матрицу 503 смешивания. В схеме 2-в-5, два переданных канала, 505а и 505b, вводятся в матрицу предварительного декоррелятора, которая получает промежуточный левый канал 506а, промежуточный правый канал 506b и промежуточный центральный канал 506с, а также два промежуточных канала 506d из представленных каналов 505а и 505b, к тому же, необязательно, с использованием дополнительных управляющих данных, таких как параметры ICC и ICLD.

Промежуточные каналы 506d используются в качестве входного сигнала для декоррелятора 502, который получает два взаимно ортогональных или почти ортогональных декоррелированных сигнала, которые вводятся в матрицу 503 смешивания вместе с промежуточным левым каналом 506а, промежуточным правым каналом 506b и промежуточным центральным каналом 506с.

Матрица 503 смешивания получает окончательный 5.1-канальный звуковой сигнал 508 из ранее упомянутых сигналов, где полученные в заключение звуковые каналы имеют те же полезные свойства, как уже описанные для каналов, полученных посредством многоканального звукового декодера 400 1-в-5.

Фиг. 5 показывает дополнительный вариант осуществления настоящего изобретения, к