Способы улучшения характеристик многоканальной реконструкции на основе прогнозирования

Иллюстрации

Показать все

Для многоканальной реконструкции аудиосигналов на основе, по меньшей мере, одного основного канала используют меру энергии для компенсации потерь энергии в результате предиктивного повышающего микширования. Мера энергии может быть применена в кодере или в декодере. Кроме того, декоррелированный сигнал добавляют к выходным каналам, сгенерированным с использованием процедуры повышающего микширования, вносящего потерю энергии. Энергия декоррелированного сигнала меньше, чем или равна ошибке энергии, введенной предиктивным повышающим микшированием. Таким образом, решают проблемы, возникающие в способах повышающего микширования, основанных на прогнозировании, таких как повышающее микширование сигналов, которые кодированы с использованием методики реконструкции высокой частоты, в результате чего получают правильную корреляцию между каналами повышающего микширования или адаптируют повышающее микширование для произвольного понижающего микширования. Технический результат - обеспечение повышения качества конструированного многоканального выходного сигнала. 17 н. и 37 з.п. ф-лы, 18 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к многоканальной реконструкции аудиосигналов на основе доступного стереосигнала и дополнительных данных управления.

Уровень техники

Развитие кодирования звука в последнее время сделало возможным восстановление многоканального представления аудиосигнала на основе стерео- (или моно-) сигнала и соответствующих данных управления. Эти способы существенно отличаются от использовавшегося ранее решения на основе матрицы, такого как Dolby Prologic, поскольку дополнительные данные управления передают для управления восстановлением, также называемым повышающим микшированием, окружающих каналов на основе передаваемых моно- или стереоканалов.

Таким образом, параметрические многоканальные аудиодекодеры реконструируют N каналов на основе М передаваемых каналов, когда N>М, и дополнительных данных управления. Дополнительные данные управления требуют существенно меньшей скорости передачи данных, чем для передачи дополнительных N-M каналов, что делает кодирование очень эффективным, одновременно обеспечивая совместимость как с М-канальными устройствами, так и с N-канальными устройствами.

Такие параметрические способы кодирования окружающего звука обычно содержат параметризацию окружающего сигнала на основе РИК (IID, разность интенсивности между каналами) и КМК (ICC, когерентность между каналами). Эти параметры описывают отношения мощности и корреляцию между парами каналов в процессе повышающего микширования. Другие параметры, также используемые в предшествующем уровне техники, содержат параметры прогнозирования, используемые для прогнозирования промежуточных или выходных каналов в процедуре повышающего микширования.

Один из наиболее привлекательных вариантов использования способа на основе прогнозирования, как описано в предшествующем уровне техники, представляет система, которая восстанавливает конфигурацию 5.1 каналов из двух переданных каналов. В такой конфигурации доступна стереопередача на стороне декодера, которая представляет собой понижающее микширование исходных 5.1 многоканальных сигналов. В этом контексте особенно интересно было бы обеспечить возможность, как можно более точно выделить центральный канал из стереосигнала, поскольку центральный канал обычно микшируют с понижением, как с использованием левого, так и правого каналов, микшированных с понижением. Это выполняется посредством оценки двух коэффициентов прогнозирования, описывающих величину каждого из двух передаваемых каналов, используемых для построения центрального канала. Эти параметры оценивают для разных областей частот, аналогично указанным выше параметрам РИК и КМК.

Однако поскольку параметры прогнозирования не описывают отношение мощности двух сигналов, а основаны на сопоставлении формы колебаний в смысле среднеквадратической ошибки, способ по своей сущности становится чувствительным к любой модификации формы колебаний стереосигнала после расчета параметров прогнозирования.

Дальнейшее развитие аудиокодирования в последние годы позволило ввести способы высокочастотной реконструкции как очень полезный инструмент, используемый в аудиокодеках при низких значениях скорости передачи данных. Один из примеров представляет собой ДСД (SBR, дублирование спектрального диапазона) [WO 98/57436], в котором используются стандартизированные кодеки MPEG (Стандарт Экспертной группы по вопросам движущегося изображения), такие как MPEG-4 High Efficiency AAC (высокоэффективное усовершенствованное аудиокодирование). Для всех этих способов характерно то, что они восстанавливают высокие частоты на стороне декодера из сигнала с узкой полосой частот, кодированного с помощью основного центрального кодека, и с использованием небольшого количества дополнительной направляющей информации. Аналогично случаю параметрической реконструкции многоканальных сигналов на основе одного или двух каналов количество данных управления, требуемых для восстановления отсутствующих компонентов сигнала (в случае ДСД, на высоких частотах), значительно меньше, чем количество данных, которые потребовалось бы для кодирования всего сигнала с использованием кодека формы колебаний.

Однако следует понимать, что восстановленный сигнал в области высоких частот по восприятию равен исходному сигналу в области высоких частот, в то время как действительная форма колебаний существенно отличается. Кроме того, для кодеров формы сигнала обычно используют кодирование стереосигналов с применением предварительной обработки стереосигнала с низкой скоростью передачи данных, что означает, что выполняют ограничения бокового сигнала среднего/бокового представления стереосигнала.

Когда требуется обеспечить многоканальное представление на основе сигнала стереокодека, с использованием формата MPEG-4 High Efficiency AAC или любого другого кодека, в котором применяются методики высокоэффективного восстановления, требуется учитывать эти и другие аспекты кодека, используемого для кодирования стереосигнала с понижающим микшированием.

Более того, как правило, для записи, доступной как многоканальный аудиосигнал, доступно специализированное стереосмешение, которое не является автоматизированной версией понижающего микширования многоканального сигнала. Такой подход обычно называется "артистическим понижающим микшированием". Такое понижающее микширование нельзя выразить в виде линейной комбинации многоканальных сигналов.

Задача настоящего изобретения состоит в предоставлении улучшенной концепции многоканального понижающего микширования/кодера или повышающего микширования/декодера, которая позволит обеспечить более высокое качество реконструированного многоканального выходного сигнала.

Эта задача решается с помощью многоканального синтезатора в соответствии с пунктом 1 формулы изобретения, кодера для обработки многоканального входного сигнала в соответствии с пунктом 30 формулы изобретения, способа генерирования, по меньшей мере, трех выходных каналов, в соответствии с пунктом 42 формулы изобретения, способа кодирования в соответствии с пунктом 43 формулы изобретения, кодированного многоканального сигнала в соответствии с пунктом 44 формулы изобретения, носителя данных в соответствии с пунктом 45 формулы изобретения.

Сущность изобретения

Настоящее изобретение относится к проблеме модификации формы колебаний микшированного с понижением многоканального сигнала, когда используют способы повышающего микширования на основе прогнозирования. Это включает в себя, когда сигнал понижающего микширования кодируют с помощью кодека, выполняющего предварительную стереообработку, высокочастотное восстановление и другие схемы кодирования, которые существенно модифицируют форму колебаний сигнала. Кроме того, изобретение направлено на решение проблемы, которая возникает при использовании предиктивных технологий повышающего микширования для артистического понижающего микширования, то есть для сигнала не автоматизированного понижающего микширования из многоканального сигнала.

Настоящее изобретение характеризуется следующими признаками:

- Оценка параметров прогнозирования на основе модифицированной формы колебаний вместо формы колебаний после понижающего микширования;

- Использование способов на основе прогнозирования только в тех частотных диапазонах, где это является предпочтительным;

- Коррекция потери энергии и неточностей корреляции между каналами, вводимых в процедуре повышающего микширования на основе прогнозирования.

Краткое описание чертежей

Настоящее изобретение будет описано ниже с использованием иллюстративных примеров, не ограничивающих объем или сущность изобретения, со ссылкой на прилагаемые чертежи, на которых:

на фиг.1 представлена реконструкция на основе прогнозирования трех каналов из двух каналов;

на фиг.2 иллюстрируется предиктивное повышающее микширование с компенсацией энергии;

на фиг.3 представлена компенсация энергии предиктивного повышающего микширования;

на фиг.4 показан блок оценки параметра прогнозирования для стороны кодера с компенсацией энергии сигнала, обработанного с понижающим микшированием;

на фиг.5 представлено предиктивное повышающее микширование с реконструкцией корреляции;

на фиг.6 представлен модуль микширования для смешивания декоррелированного сигнала с сигналом повышающего микширования при повышающем микшировании с реконструкцией корреляции;

на фиг.7 показана иллюстрация альтернативного модуля микширования для смешивания декоррелированного сигнала с сигналом после повышающего микширования при повышающем микшировании с реконструкцией корреляции;

на фиг.8 представлена оценка параметра прогнозирования на стороне кодера;

на фиг.9 показана оценка параметра прогнозирования на стороне кодера;

на фиг.10 показана иллюстрация оценки параметра прогнозирования на стороне кодера;

на фиг.11 показано устройство повышающего микшировании в соответствии с настоящим изобретением;

на фиг.12 показан график энергии, представляющий результат повышающего микширования, вносящего потери энергии, и предпочтительной компенсации;

на фиг.13 показана таблица предпочтительных способов компенсации энергии;

на фиг.14a показана схема предпочтительного многоканального кодера;

на фиг.14b показана блок-схема последовательности операций предпочтительного способа, выполняемого устройством по фиг.14a;

на фиг.15a показан многоканальный кодер, имеющий функцию дублирования спектрального диапазона для генерирования другой параметризации по сравнению с устройством, показанным на фиг.14a;

на фиг.15b представлена в виде таблицы иллюстрация избирательного по частоте генерирования и передачи параметрических данных;

на фиг.16a показан декодер в соответствии с настоящим изобретением, иллюстрирующий расчет коэффициентов матрицы повышающего микширования;

на фиг.16b представлено подробное описание расчета параметра для предиктивного повышающего микширования;

на фиг.17 показаны передатчик и приемник системы передачи данных;

на фиг.18 показано устройство аудиозаписи, имеющее кодер, и проигрыватель звука, имеющий декодер, в соответствии с настоящим изобретением.

Подробное описание предпочтительного варианта осуществления

Описанные ниже варианты выполнения представляют собой просто иллюстрацию принципов настоящего изобретения. Следует понимать, что модификации и варианты описанных здесь компоновок и деталей будут очевидны для других людей - специалистов в данной области техники. Поэтому предполагается, что ограничения определены только объемом приведенной ниже формулы изобретения патента, а не конкретными деталями, представленными в виде описания и пояснения вариантов его выполнения.

Следует подчеркнуть, что следующий расчет параметров, варианты применения, повышающее микширование, понижающее микширование, или любые другие действия могут быть выполнены на основе избирательного подхода к частотному диапазону, то есть для поддиапазонов в наборе фильтров.

Для того чтобы кратко представить преимущества настоящего изобретения, вначале будет приведено подробное описание предиктивного повышающего микширования, известного из предшествующего уровня техники. Предположим, что на фиг.1 схематично представлено повышающее микширование трех каналов на основе двух каналов, полученных после понижающего микширования, где ссылочной позицией 101 представлен левый исходный канал, ссылочной позицией 102 представлен центральный исходный канал, ссылочной позицией 103 представлен правый исходный канал, ссылочной позицией 104 представлен модуль понижающего микширования и выделения параметра на стороне кодера, ссылочными позициями 105 и 106 обозначены параметры прогнозирования, ссылочной позицией 107 обозначен левый канал после понижающего микширования, ссылочной позицией 108 представлен правый канал после понижающего микширования, ссылочной позицией 109 представлен модуль предиктивного повышающего микширования и ссылочными позициями 110, 111 и 112 представлены реконструированные левый, центральный и правый каналы, соответственно.

Примем следующие определения, где X представляет собой матрицу размером 3×L, содержащую три сегмента l(k), r(k), c(k) сигнала, k=0, ..., L-1 в качестве строк.

Аналогично, пусть два сигнала l0(k), r0(k) после понижающего микширования формируют строки матрицы X0. Процесс понижающего микширования описан как

X0=DX (1)

где матрица понижающего микширования определена как

(2)

Предпочтительный выбор матрицы понижающего микширования может быть представлен как

(3)

что означает, что левый сигнал l0(k) понижающего микширования будет содержать только l(k) и αc(k), и сигнал r0(k) будет содержать только r(k) и αc(k). Такая матрица понижающего микширования является предпочтительной, поскольку она назначает равные части центрального канала левому и правому каналам понижающего микширования, и поскольку она не назначает какую-либо часть исходного правого канала левому каналу понижающего микширования или наоборот.

Повышающее микширование определяется как

(4)

где C представляет собой матрицу повышающего микширования размером 3×2.

Предиктивное повышающее микширование, как известно из предшествующего уровня техники, основано на идее решения сверхопределенной системы

(5)

для C в смысле наименьших квадратов. Это приводит к нормальным уравнениям

(6)

При умножении левой части уравнения (6) на D получим DCX0X0"=X0X0", которая, в общем случае, когда X0X0*=DXX*D* не является вырожденной, при этом подразумевается, что

(7)

где In обозначает n единичных матриц. Это уравнение уменьшает пространство C параметра до размерности два.

Учитывая приведенное выше, матрица повышающего микширования может быть полностью определена на стороне декодера, если известна матрица D понижающего микширования, и будут переданы два элемента матрицы C, например,

с11 и с22.

Остаточные сигналы (ошибка прогнозирования) определяются уравнением

(8)

При умножении левой части на D получим

(9)

в соответствии с (7). Из этого следует, что существует векторный сигнал xr строки 1×L, такой, что

(10)

где ν представляет собой единичный вектор размером 3x1, проходящий через ядро (нулевое пространство) матрицы D. Например, в случае понижающего микширования (3) можно использовать уравнение

(11)

В общем, когда ν=[νl, νr, νe]T и , это означает только, что с учетом весового коэффициента, остаточный сигнал является общим для всех трех каналов,

(12)

В соответствии с принципом ортогональности остаточный xr(k) является ортогональным ко всем трем прогнозируемым сигналам .

Решаемые проблемы и улучшения, полученные с помощью предпочтительных вариантов выполнения настоящего изобретения

Очевидно, что при использовании повышающего микширования на основе прогнозирования в соответствии с предшествующим уровнем техники, кратко описанным выше, возникают следующие проблемы:

Способ основан на сопоставлении формы колебаний в смысле минимальных среднеквадратичных ошибок, что неприменимо для систем, в которых не поддерживается форма колебаний сигналов после понижающего микширования.

Способ не обеспечивает правильную структуру корреляции между реконструированными каналами (как будет описано ниже).

Способ не восстанавливает правильное количество энергии в реконструируемых каналах.

Компенсация энергии

Как указано выше, одна из проблем, связанных с многоканальной реконструкцией на основе прогнозирования, состоит в том, что ошибка прогнозирования соответствует потере энергии трех реконструируемых каналов. Ниже представлено теоретическое обоснование такой потери энергии и решение в соответствии с предпочтительными вариантами выполнения. Вначале выполнен теоретический анализ и затем приведен предпочтительный вариант выполнения настоящего изобретения в соответствии с кратко описанной ниже теорией.

Пусть E, и Er представляют сумму энергии исходных сигналов в X, прогнозируемых сигналов в и сигналов ошибки прогнозирования в Xr, соответственно. Из принципа ортогональности следует, что

(13)

Суммарное усиление прогнозирования может быть определено как , но ниже будет более удобно учитывать параметр

(14)

Следовательно, измеряет общую относительную энергию предиктивного повышающего микширования.

Учитывая такое значение ρ, становится возможным выполнить повторную регулировку в каждом канале, применяя коэффициент усиления компенсации , так что для z=1, r, c. В частности целевая энергия определяется уравнением (12),

(15)

таким образом, требуется решить уравнение

(16)

Здесь, поскольку ν представляет единичный вектор,

(17)

и из определения (14) ρ и (13) следует, что

(18)

После объединения всего этого вместе получим коэффициент усиления

(19)

Очевидно, что при использовании такого способа, в дополнение к передаче ρ, в декодере необходимо рассчитывать распределение энергии декодированных каналов. Кроме того, обеспечивается правильная реконструкция только энергии, в то время как структура корреляции за пределами диагонали игнорируется.

Возможно получить значение коэффициента усиления, которое обеспечивает сохранение суммарной энергии, но не обеспечивает то, что энергия в отдельных каналах будет правильной. Суммарное значение коэффициента усиления для всех каналов gz=g, которое обеспечивает сохранение общей энергии, получают путем определения уравнения . Таким образом,

(20)

В соответствии с принципом линейности, такой коэффициент усиления можно применять в кодере для сигналов после понижающего микширования, и поэтому требуется передавать дополнительный параметр.

На фиг.2 схематично представлен предпочтительный вариант выполнения настоящего изобретения, который повторно создает три канала, при поддержании правильной энергии выходных каналов. Сигналы l0 и r0 после понижающего микширования подают в модуль 201 повышающего микширования вместе с параметрами с1 и c2 прогнозирования. Модуль повышающего микширования восстанавливает матрицу C повышающего микширования, основываясь на знании матрицы D понижающего микширования и полученных параметров прогнозирования. Три выходных канала блока 201 подают в блок 202 вместе с параметром ρ регулирования. В трех каналах регулируют коэффициент усиления как функцию переданного параметра ρ и на выход подают сигналы каналов со скорректированной энергией.

На фиг.3 показан более подробный вариант выполнения модуля 202 регулирования. Три канала повышающего микширования подают в модуль 304 регулирования, а также в модули 301, 302 и 303, соответственно. Модули 301-303 оценки энергии выполняют оценку энергии трех сигналов после повышающего микширования и передают измеренное значение энергии в модуль 304 регулирования. Сигнал ρ управления (представляющий прогнозируемый коэффициент усиления), полученный из кодера, также подают в модуль 304 регулирования. Модуль регулирования выполняет уравнение (19), которое приведено выше.

В альтернативном варианте выполнения настоящего изобретения коррекция энергии может быть выполнена на стороне кодера. На фиг.4 представлен вариант выполнения кодера, где после понижающего микширования регулируют коэффициент усиления для сигналов l0 107 и r0 108 с помощью модулей 401 и 402, в соответствии со значением коэффициента усиления, рассчитанным в модуле 403. Значение коэффициента усиления получают в соответствии с приведенным выше уравнением (20). Как указано выше, этот вариант выполнения настоящего изобретения имеет преимущество, поскольку не требуется рассчитывать энергию трех восстановленных каналов после предиктивного повышающего микширования. Однако это обеспечивает только то, что суммарная энергия трех восстановленных каналов будет правильной. Такой подход не обеспечивает, что энергия в индивидуальных каналах будет правильной.

На фиг.4 под понижающим микшером показан предпочтительный пример матрицы понижающего микширования, соответствующей уравнению (3). Однако в понижающем микшере может применяться любая общая матрица понижающего микширования, в соответствии с уравнением (2).

Как будет описано ниже, для настоящего случая понижающего микширования, на входе которого используется три канала и на выходе получают два канала, требуются, по меньшей мере, два дополнительных параметра c1, с2 повышающего микширования. Когда матрица D является переменной или не полностью известна декодеру, в дополнение к параметрам 105 и 106 также требуется передавать дополнительную информацию по использованному понижающему микшированию со стороны кодера на сторону декодера.

Структура корреляции

Одна из проблем процедуры повышающего микширования, описанной для предшествующего уровня техники, состоит в том, что она не позволяет восстановить правильную корреляцию между восстановленными каналами. Поскольку, как было указано выше, центральный канал прогнозирует как линейную комбинацию левого канала после понижающего микширования и правого канала после понижающего микширования, и левый, и правый каналы восстанавливают путем вычитания прогнозируемого центрального канала из левого и правого каналов после понижающего микширования. Очевидно, что в результате ошибки прогнозирования возникают остатки исходного центрального канала в прогнозируемом левом и правом каналах. Это подразумевает, что корреляции между тремя каналами не будет той же для реконструированных каналов, какой она была для исходных трех каналов.

В предпочтительном варианте выполнения описано, что прогнозируемые три канала следует комбинировать с декоррелированными сигналами, в соответствии с измеренной ошибкой прогнозирования.

Основные теоретические положения для достижения правильной структуры корреляции будут описаны ниже. Специальная структура остаточного сигнала может использоваться для реконструкции полной, размером 3×3, структуры XX* корреляции, путем замены остаточного сигнала в декодере декоррелированным сигналом хd.

Вначале отметим, что нормальные уравнения (6) приводят к XrX0*=0, в результате чего

(21)

Следовательно, поскольку

(22)

где для последнего равенства были применены уравнения (10) и (17).

Допустим, что хd представляет собой сигнал, декоррелированный из всех декодированных сигналов так, что Улучшенный сигнал

(23)

затем имеет матрицу корреляции

(24)

Для полного воспроизведения исходной матрицы (22) корреляции достаточно, чтобы

(25)

Если xd был получен путем декорреляции сигнала после понижающего микширования, скажем, , после чего следует коэффициент усиления γ, тогда будет справедливым следующее выражение

(26)

Такой коэффициент усиления может быть рассчитан в кодере. Однако если требуется использовать более хорошо определенный параметр из (14), в декодере должна быть выполнена оценка и . С учетом этого, более привлекательно сгенерировать xd c использованием трех декорреляторов

(26а)

поскольку в этом случае , так что (25) удовлетворяется путем выбора

(27)

На фиг.5 представлен один вариант выполнения настоящего изобретения для предиктивного повышающего микширования трех каналов из двух каналов понижающего микширования, при поддержании правильной структуры корреляции между каналами. На фиг.5 используются те же модули 109, 110, 111 и 112, что и по фиг.1, и не будут здесь дополнительно описаны. Три сигнала после повышающего микширования, поступающие с выхода модуля 109, подают в модули 501, 502 и 503 декорреляции. Они генерируют взаимно декоррелированные сигналы. Декоррелированные сигналы суммируют и подают в модули 504, 505 и 506 микширования, где их микшируют с выходным сигналом модуля 109. Микширование сигналов предиктивного повышающего микширования с их же декоррелированными версиями является существенным свойством настоящего изобретения. На фиг.6 представлен один вариант выполнения модулей 504, 505 и 506 микширования. В этом варианте выполнения настоящего изобретения уровень декоррелированного сигнала регулируют с помощью модуля 601 на основе сигнала γ управления. Декоррелированный сигнал затем добавляют к сигналу, полученному после предиктивного повышающего микширования в модуле 602.

В третьем предпочтительном варианте выполнения используются декорреляторы 501, 502, 503 для каналов повышающего микширования. Декоррелированный сигнал также может быть сгенерирован декоррелятором 501', который принимает в качестве входного сигнала сигнал канала после понижающего микширования или даже сигналы всех каналов понижающего микширования. Кроме того, в случае более одного канала понижающего микширования, как показано на фиг.5, сигнал декорреляции также может быть сгенерирован с помощью отдельных декорреляторов для левого основного канала l0 и правого основного канала r0 и путем комбинирования выхода этих отдельных декорреляторов. Эта возможность, по существу, является такой же, как возможность, представленная на фиг.5, но отличается от возможности, показанной на фиг.5, тем, что используются основные каналы до повышающего микширования.

Кроме того, в связи с фиг.5 можно отметить, что микширующие модули 504, 505 и 506 не только принимают коэффициент γ, который равен для всех трех каналов, поскольку этот коэффициент зависит только от меры ρ энергии, но также и принимают специфичный для канала коэффициент νl, νc и νr, который определяют, как описано со ссылкой на уравнения (10) и (11). Этот параметр, однако, не требуется передавать из кодера в декодер, когда для декодера известно понижающее микширование, используемое в кодере. Вместо этого, эти параметры в матрице ν, как показано в уравнении (10) и (11), предпочтительно заранее программируют в микширующих модулях 504, 505 и 506 так, чтобы эти специфичные для канала взвешивающие коэффициенты не требовалось передавать (но, конечно, они могут быть переданы, в случае необходимости).

На фиг.6 показано, что взвешивающее устройство 601 регулирует энергию декоррелированного сигнала, используя произведение γ, и параметра vz, зависящего от понижающего микширования, специфичного для канала, где z обозначает l, r или c. В этом контексте следует отметить, что уравнение (26a) обеспечивает то, что энергия хd будет равна суммарной энергии левого, правого и центрального каналов после повышающего микширования с прогнозированием. Поэтому устройство 601 может быть выполнено просто как преобразователь масштаба с использованием коэффициента GI масштабирования. Когда, однако, декоррелированный сигнал генерируют альтернативно, модуль 504, 505, 506 микширования должен выполнять абсолютную регулировку энергии декоррелированного сигнала, добавленного с помощью устройства 602 суммирования так, чтобы энергия сигнала, добавленная в сумматоре 602, была равна энергии остаточного сигнала, например, энергии, которая была потеряна в результате предиктивного повышающего микширования без сохранения энергии.

Что касается специфичного для канала параметра νz, зависящего от понижающего микширования, те же замечания, которые были выражены со ссылкой на фиг.6, также применимы для фиг.7.

Кроме того, здесь следует отметить, что варианты выполнения, показанные на фиг.6 и фиг.7, основаны на понимании того, что, по меньшей мере, часть энергии, потерянной при предиктивном повышающем микшировании, добавляют с использованием сигнала декорреляции. Для получения правильных значений энергии сигнала и частей коррекции в "сухом" компоненте сигнала (нескоррелированном) и во "влажном" компоненте сигнала (декоррелированном) следует убедиться, что "сухой" сигнал, подаваемый в модуль 504 микширования, не был заранее масштабирован. Когда, например, основные каналы были заранее скорректированы на стороне декодера (как показано на фиг.4), такая предварительная корреляция, показанная на фиг.4, должна быть скомпенсирована путем умножения канала на (относительную) меру ρ энергии перед вводом сигнала из этого канала в модуль 504, 505 или 506 микширования. Кроме того, та же процедура должна быть выполнена, когда такая коррекция энергии была выполнена на стороне декодера перед вводом сигналов каналов понижающего микширования в повышающий микшер 109, как показано на фиг.5.

Когда только часть остаточной энергии должна быть охвачена декоррелированным сигналом, предварительная корреляция должна быть устранена только частично, путем предварительного масштабирования сигнала, вводимого в модуль 504, 505, 506 микширования, с помощью коэффициента, зависящего от ρ, который, однако, ближе к единице, чем сам коэффициент ρ. Естественно, такой частично компенсирующий коэффициент предварительного масштабирования будет зависеть от сигнала κ, генерируемого кодером, подаваемого на вход 605 по фиг.7. Когда требуется выполнить такое частичное предварительное масштабирование, весовой коэффициент, применяемый в G2, становится ненужным. Вместо этого, ответвление от входа 604 в сумматор 602 будет таким же, как на фиг.6.

Управление степенью декорреляции

В предпочтительном варианте выполнения изобретения описано, что степенью декорреляции, добавляемой к прогнозируемым сигналам повышающего микширования, можно управлять из кодера, при этом поддерживая правильную выходную энергию. Это происходит в результате того, что в типичном примере "интервью" сухой речи в центральном канале и окружающих звуков в левом и правом каналах замена ошибки прогнозирования в центральном канале декоррелированным сигналом может быть нежелательной.

В соответствии с предпочтительным вариантом выполнения настоящего изобретения может использоваться альтернативная процедура микширования, представленная на фиг.5. Ниже будет показано, как в соответствии с настоящим изобретением проблемы сохранения общей энергии и правильного воспроизведения корреляции могут быть разделены, и степенью декорреляции можно управлять с помощью параметра κ.

Предположим, что компенсация (20) коэффициента усиления, для сохранения общей энергии, была выполнена в сигнале после понижающего микширования, в результате чего вначале получают декодированный сигнал. Исходя из этого, декоррелированный сигнал d с той же суммарной энергиейбудет получен, например, используя три декоррелятора, как и в предыдущем разделе. Суммарный сигнал после повышающего микширования затем будет определен в соответствии с

(29)

где представляет собой переданный параметр. Выбор κ=1 соответствует сохранению суммарной энергии без добавления сигнала декорреляции, и κ=ρ соответствует полному воспроизведению структуры корреляции 3x3. Получим

(30)

таким образом, суммарная энергия будет сохранена для всех , как можно видеть, путем расчета следов (суммы диагональных значений) матриц в (30). Однако правильная отдельная энергия будет получена только для κ=ρ.

На фиг.7 показан вариант выполнения модулей 504, 505 и 506 микширования по фиг.5 в соответствии с теорией, представленной выше. В этом альтернативном варианте модулей микширования параметр γ управления поступает в модули 702 и 701. Коэффициент усиления, используемый для модуля 702, соответствует κ, в соответствии с уравнением (29), приведенным выше, и коэффициент усиления, используемый для модуля 701, соответствует в соответствии с уравнением (29), приведенным выше.

Описанный выше вариант выполнения настоящего изобретения позволяет использовать в системе механизм детектирования на стороне кодера, который выполняет оценку величины декорреляции, которая должна быть добавлена при повышающем микшировании на основе прогнозирования. В варианте выполнения, описанном со ссылкой на фиг.7, добавляют указанную величину декоррелированного сигнала и применяют коррекцию энергии так, чтобы суммарная энергия трех каналов была правильной, и при этом все еще об