Декодирование уменьшенного количества каналов

Иллюстрации

Показать все

Изобретение относится к области техники декодирования звуковых сигналов, в частности к декодированию сигналов, полученных путем параметрического многоканального микширования первоначального многоканального сигнала с сокращением количества каналов. Промежуточное представление каналов многоканального сигнала восстанавливают, когда вычислены параметры микширования с увеличением количества каналов для микширования с увеличением количества каналов переданного сигнала, смикшированного с сокращением количества каналов, в промежуточное представление каналов, что позволяет выполнять микширование с увеличением количества каналов с использованием тех же самых алгоритмов микширования с увеличением количества каналов, как и при многоканальном восстановлении. Это достигают с использованием средства перерасчета параметров для вычисления параметров микширования с увеличением количества каналов, при котором также учитывают параметры, содержащие информацию о каналах, не содержащихся в промежуточном представлении каналов. Технический результат - декодирование сигнала с высокой эффективностью и с высокой верностью воспроизведения. 9 н. и 14 з.п. ф-лы, 8 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к области техники декодирования звуковых сигналов, в частности к декодированию сигналов, полученных путем параметрического многоканального микширования первоначального многоканального сигнала с сокращением количества каналов (downmix) до нескольких каналов, количество которых является меньшим, чем количество каналов первоначального многоканального сигнала.

УРОВЕНЬ ТЕХНИКИ

Последние достижения в области кодирования звука обеспечили возможность восстановления многоканального представления звукового сигнала на основании стерео (или моно) сигнала и соответствующих управляющих данных. Эти способы существенно отличаются от прежних решений, основанных на матрицах, например, от системы "Долби Пролоджик" (Dolby Prologic), поскольку производят передачу дополнительных управляющих данных для управления восстановлением каналов объемного звучания на основании переданных моно- или стереоканалов, которое также именуют микшированием с увеличением количества каналов (upmix).

Следовательно, такое устройство параметрического декодирования многоканального звука, например звука в формате MPEG c объемным звучанием (MPEG Surround), восстанавливает N каналов на основании М переданных каналов, где N>М, и дополнительных управляющих данных. Скорость передачи дополнительных управляющих данных является существенно более низкой, чем скорость передачи всех N каналов, что делает кодирование очень эффективным, одновременно обеспечивая совместимость как с M-канальными устройствами, так и с N-канальными устройствами.

Эти способы параметрического кодирования объемного звука обычно включают в себя параметризацию сигнала объемного звучания на основании разности интенсивности между каналами (IID) и когерентности между каналами (ICC). Эти параметры описывают отношения мощностей и корреляцию между парами каналов в процессе микширования с увеличением количества каналов. На известном уровне техники также используют еще и другие параметры, в том числе параметры прогнозирования, используемые для прогнозирования промежуточных или выходных каналов во время процедуры микширования с увеличением количества каналов.

Двумя известными примера такого многоканального кодирования являются бинауральное кодирование (BCC) и кодирование в формате MPEG c объемным звучанием (MPEG surround). При бинауральном кодировании (BCC) несколько входных звуковых каналов преобразовывают в спектральное представление с использованием преобразования, основанного на дискретном преобразовании Фурье (ДПФ) с перекрывающимися окнами. Затем полученный в результате этого равномерный спектр разделяют на неперекрывающиеся сегменты. Каждый сегмент имеет ширину полосы частот, пропорциональную эквивалентной ширине прямоугольной полосы частот (ERB). Затем производят оценку пространственных параметров, именуемых ICLD (разностью уровней между каналами) и ICTD (разностью по времени между каналами), для каждого сегмента. Параметр ICLD описывает разность уровней между двумя каналами, а параметр ICTD описывает разность по времени (сдвиг фазы) между двумя сигналами различных каналов. Разности уровней и разности по времени являются заданными для каждого канала относительно общего опорного канала. После получения этих параметров выполняют дискретизацию и кодирование параметров для передачи.

При бинауральном кодировании (BCC) оценку отдельных параметров производят относительно одного единственного опорного канала. В других системах параметрического кодирования объемного звука, например в формате MPEG c объемным звучанием (MPEG surround), используют параметризацию с древовидной структурой. Это означает, что оценку параметров больше не производят относительно одного единственного общего опорного канала, а ее производят относительно различных опорных каналов, которыми даже может являться комбинация каналов исходного многоканального сигнала. Например, при наличии в канале сигнала системы 5.1 может быть произведена оценка параметров между комбинацией передних каналов и между комбинацией тыловых каналов.

Само собой разумеется, что для схем параметрического кодирования также очень желательно наличие обратной совместимости с уже существующими стандартами звуковоспроизведения. Например, при наличии монофонического сигнала, смикшированного с сокращением количества каналов, желательно также обеспечивать возможность создания стереофонического сигнала с высокой верностью воспроизведения. Это означает, что монофонический сигнал, смикшированный с сокращением количества каналов, должен быть смикширован с увеличением количества каналов в стереофонический сигнал с использованием дополнительно переданных параметров наилучшим возможным способом.

Одной общей проблемой при многоканальном кодировании является сохранение энергии при микшировании с увеличением количества каналов, поскольку доминирующим фактором при восприятии человеком положения источника звука в пространстве является громкость сигнала, то есть энергия, содержащаяся в сигнале. Следовательно, при воспроизведении сигнала необходимо проявлять крайнюю тщательность для обеспечения правильной громкости каждого восстановленного канала, например, во избежание введения искажений, сильно ухудшающих качество восприятия восстановленного сигнала. Поскольку во время микширования с сокращением количества каналов обычно выполняют суммирование амплитуд сигналов, то возникает возможность помех, которая описывается параметром корреляции или когерентности.

Когда дело доходит до восстановления уменьшенного количества каналов (нескольких каналов, количество которых является меньшим, чем исходное количество каналов многоканального сигнала), то обработка в схемах, подобных схеме бинаурального кодирования (BCC), является простой, поскольку каждый параметр передают относительно одного и того же одного опорного канала. Следовательно, имея сведения об опорном канале, наиболее существенная информация (мера абсолютной энергии) может легко быть получена для каждого канала, необходимого для микширования с увеличением количества каналов. Таким образом, уменьшенное количество каналов может быть восстановлено без необходимости сначала выполнять восстановление полного многоканального сигнала. Таким образом, вычисления энергии для значений энергии многоканального сигнала являются более простыми в схеме бинаурального кодирования (BCC) с использованием отдельных переменных, а не произведений переменных, но это является только лишь первым этапом. Когда дело доходит до получения значений энергии и корреляций уменьшенного количества каналов, которые должны являться настолько близкими к результатам частичного микширования исходных многоканальных сигналов с сокращением количества каналов, насколько это возможно, уровень сложности при кодировании в формате MPEG c объемным звучанием (MPEG surround) и при бинауральном кодировании (BCC) является сопоставимым.

В отличие от этого, в древовидной структуре, как, например, в формате MPEG c объемным звучанием (MPEG surround), используют параметризацию, в которой соответствующая информация для каждого отдельного канала не содержится в одном параметре. Следовательно, на известном уровне техники для восстановления уменьшенного количества каналов требуется восстановление многоканального сигнала, после чего выполняют микширование с сокращением количества каналов до уменьшенного количества каналов, не нарушая требований относительно сохранения энергии. Это имеет очевидный недостаток, заключающийся в чрезвычайно высокой сложности вычислений.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Задачей настоящего изобретения является создание концепции более эффективного получения уменьшенного количества каналов из параметрического многоканального сигнала.

Согласно первому объекту настоящего изобретения эта задача достигнута при помощи средства вычисления параметров, предназначенного для получения параметров микширования с увеличением количества каналов для выполнения микширования с увеличением количества каналов сигнала, смикшированного с сокращением количества каналов, в промежуточное представление каналов многоканального сигнала, имеющее большее количество каналов, чем сигнал, смикшированный с сокращением количества каналов, и меньшее количество каналов, чем многоканальный сигнал, причем сигнал, смикшированный с сокращением количества каналов, имеет связанные с ним многоканальные параметры, описывающие пространственные характеристики многоканального сигнала, при этом многоканальный сигнал содержит каналы, не содержащиеся в промежуточном представлении каналов, и многоканальные параметры содержат информацию о каналах, не содержащихся в промежуточном представлении каналов, а средство вычисления параметров, содержит средство перерасчета параметров, предназначенное для получения параметров микширования с увеличением количества каналов из многоканальных параметров c использованием параметров, содержащих информацию о каналах, не содержащихся в промежуточном представлении каналов.

Согласно второму объекту настоящего изобретения эта задача достигнута при помощи средства восстановления каналов, которое снабжено средством восстановления параметров, содержащим средство вычисления параметров, предназначенное для получения параметров микширования с увеличением количества каналов для микширования с увеличением количества каналов сигнала, смикшированного с сокращением количества каналов, в промежуточное представление каналов многоканального сигнала, имеющее большее количество каналов, чем сигнал, смикшированный с сокращением количества каналов, и меньшее количество каналов, чем многоканальный сигнал, причем сигнал, смикшированный с сокращением количества каналов, имеет связанные с ним многоканальные параметры, описывающие пространственные характеристики многоканального сигнала, при этом многоканальный сигнал содержит каналы, не содержащиеся в промежуточном представлении каналов, и многоканальные параметры содержат информацию о каналах, не содержащихся в промежуточном представлении каналов, а средство вычисления параметров содержит средство перерасчета параметров, предназначенное для получения параметров микширования с увеличением количества каналов из многоканальных параметров с использованием параметров, содержащих информацию о каналах, не содержащихся в промежуточном представлении каналов, и средство микширования с увеличением количества каналов, предназначенное для получения промежуточного представления каналов с использованием параметров микширования с увеличением количества каналов и сигнала, смикшированного с сокращением количества каналов.

Согласно третьему объекту настоящего изобретения эта задача достигнута при помощи способа генерации параметров микширования с увеличением количества каналов для микширования с увеличением количества каналов сигнала, смикшированного с сокращением количества каналов, в промежуточное представление каналов многоканального сигнала, имеющее большее количество каналов, чем сигнал, смикшированный с сокращением количества каналов, и меньшее количество каналов, чем многоканальный сигнал, причем сигнал, смикшированный с сокращением количества каналов, имеет связанные с ним многоканальные параметры, описывающие пространственные характеристики многоканального сигнала, при этом многоканальный сигнал содержит каналы, не содержащиеся в промежуточном представлении каналов, и многоканальные параметры содержат информацию о каналах, не содержащихся в промежуточном представлении каналов, а способ содержит следующую операцию: получают параметры микширования с увеличением количества каналов из многоканальных параметров с использованием параметров, содержащих информацию о каналах, не содержащихся в промежуточном представлении каналов.

Согласно четвертому объекту настоящего изобретения эта задача достигнута при помощи звукового приемника или устройства воспроизведения звука, при этом приемник или устройство воспроизведения звука содержит средство вычисления параметров, предназначенное для получения параметров микширования с увеличением количества каналов для микширования с увеличением количества каналов сигнала, смикшированного с сокращением количества каналов, в промежуточное представление каналов многоканального сигнала, имеющее большее количество каналов, чем сигнал, смикшированный с сокращением количества каналов, и меньшее количество каналов, чем многоканальный сигнал, причем сигнал, смикшированный с сокращением количества каналов, имеет связанные с ним многоканальные параметры, описывающие пространственные характеристики многоканального сигнала, при этом многоканальный сигнал содержит каналы, не содержащиеся в промежуточном представлении каналов, и многоканальные параметры содержат информацию о каналах, не содержащихся в промежуточном представлении каналов, а средство вычисления параметров содержит средство перерасчета параметров, предназначенное для получения параметров микширования с увеличением количества каналов из многоканальных параметров с использованием параметров, содержащих информацию о каналах, не содержащихся в промежуточном представлении каналов.

Согласно пятому объекту настоящего изобретения эта задача достигнута при помощи способа приема или воспроизведения звука, включающего в себя способ генерации параметров микширования с увеличением количества каналов для микширования с увеличением количества каналов сигнала, смикшированного с сокращением количества каналов, в промежуточное представление каналов многоканального сигнала, имеющее большее количество каналов, чем сигнал, смикшированный с сокращением количества каналов, и меньшее количество каналов, чем многоканальный сигнал, причем сигнал, смикшированный с сокращением количества каналов, имеет связанные с ним многоканальные параметры, описывающие пространственные характеристики многоканального сигнала, при этом многоканальный сигнал содержит каналы, не содержащиеся в промежуточном представлении каналов, и многоканальные параметры содержат информацию о каналах, не содержащихся в промежуточном представлении каналов, а способ содержит следующую операцию: вычисляют параметры микширования с увеличением количества каналов из многоканальных параметров с использованием параметров, содержащих информацию о каналах, не содержащихся в промежуточном представлении каналов.

Настоящее изобретение основано на обнаружении того факта, что промежуточное представление каналов многоканального сигнала может быть восстановлено с высокой эффективностью и с высокой точностью воспроизведения в том случае, когда получены параметры микширования с увеличением количества каналов для микширования переданного сигнала, смикшированного с сокращением количества каналов, с увеличением количества каналов в промежуточное представление каналов, позволяющие выполнять микширование с увеличением количества каналов с использованием тех же самых алгоритмов микширования с увеличением количества каналов, что и в случае восстановления многоканального сигнала. Это может быть достигнуто в том случае, когда для получения параметров микширования с увеличением количества каналов используют средство перерасчета параметров, обеспечивая также учет параметров, содержащих информацию о каналах, не содержащихся в промежуточном представлении каналов.

В одном из вариантов осуществления настоящего изобретения устройство декодирования способно восстанавливать стереофонический выходной сигнал из параметрического микширования с сокращением количества каналов многоканального сигнала с 5 каналами, при этом результат параметрического микширования с сокращением количества каналов содержит монофонический сигнал, смикшированный с сокращением количества каналов, и соответствующие многоканальные параметры. Согласно настоящему изобретению для микширования стереофонического сигнала с увеличением количества каналов пространственные параметры объединяют для получения параметров микширования с увеличением количества каналов, причем при этом объединении также учитывают многоканальные параметры, не связанные с левым передним или с правым передним каналом. Следовательно, могут быть получены абсолютные значения мощности для стереофонических каналов, смикшированных с увеличением количества каналов, и может быть получена мера когерентности между левым и правым каналами, что обеспечивает возможность стереофонического восстановления многоканального сигнала с высокой верностью воспроизведения. Кроме того, получают параметр когерентности между каналами (ICC) и параметр, характеризующий разность уровней между каналами (CLD), что позволяет выполнять микширование с увеличением количества каналов с использованием уже существующих алгоритмов и реализаций. Использование параметров каналов, не связанных с восстановленными стереофоническими каналами, позволяет сохранять энергию в сигнале с более высокой точностью. Это имеет наибольшую важность, поскольку неуправляемые изменения громкости в наибольшей степени нарушают качество воспроизводимого сигнала.

В общем случае применение идеи настоящего изобретения обеспечивает возможность восстановления стереофонического сигнала, смикшированного с увеличением количества каналов, из монофонического сигнала, смикшированного с сокращением количества каналов из многоканального сигнала, без необходимости промежуточного полного восстановления многоканального сигнала, что имеет место в способах из известного уровня техники. Очевидно, что таким образом может быть значительно уменьшена сложность вычислений в устройстве декодирования. К тому же использование многоканальных параметров, связанных с каналами, не содержащимися в сигнале, смикшированном с увеличением количества каналов (то есть в сигнале, имеющем левый передний канал и правый передний канал), обеспечивает возможность такого восстановления, которое не вносит каких-либо дополнительных искажений или изменений громкости, но, наоборот, полностью сохраняет энергию сигнала. В более конкретном изложении отношение энергии между левым и правым восстановленными каналами вычисляют от множества имеющихся многоканальных параметров, при этом также учитывают многоканальные параметры, не связанные с левым передним каналом и с правым передним каналом. Очевидно, что соотношение громкости между левым и правым восстановленными (смикшированными с увеличением количества каналов) каналами является доминирующим фактором для качества прослушивания восстановленного стереофонического сигнала. Без использования идеи настоящего изобретения восстановление каналов, имеющих в точности правильное соотношение энергии, в древовидных структурах, рассмотренных в этом документе, невозможно.

Следовательно, реализация идеи настоящего изобретения позволяет осуществлять высококачественное стереофоническое воспроизведение многоканального сигнала, смикшированного с сокращением количества каналов, на основании многоканальных параметров, которые не получены для точного воспроизведения стереофонического сигнала.

Следует отметить, что идея настоящего изобретения также может быть использована в том случае, когда количество воспроизведенных каналов является иным, чем два, например, когда также необходимо выполнять восстановление центрального канала с высокой точностью, что имеет место в некоторых режимах воспроизведения.

Ниже будет приведен более подробный обзор схем многоканального кодирования (в особенности, основанных на древовидных структурах) из известного уровня техники для краткого изложения большой пользы идеи настоящего изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Ниже приведено описание предпочтительных вариантов осуществления настоящего изобретения со ссылкой на сопроводительные чертежи, на которых изображено следующее:

на Фиг. 1 показаны примеры способов параметризации, основанных на древовидной структуре;

на Фиг. 2 показаны примеры схем декодирования с древовидной структурой;

на Фиг. 3 показан пример устройства многоканального кодирования из известного уровня техники;

на Фиг. 4 показаны примеры устройств декодирования из известного уровня техники;

на Фиг. 5 показан пример стереофонического восстановления многоканального сигнала, смикшированного с сокращением количества каналов, из известного уровня техники;

на Фиг. 6 показана блок-схема примера средства вычисления параметров, предложенного в настоящем изобретении;

на Фиг. 7 показан пример средства восстановления каналов, предложенного в настоящем изобретении; и

на Фиг. 8 показан пример приемника или устройства воспроизведения звука, предложенного в настоящем изобретении.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

Ниже приведено описание идеи настоящего изобретения, в основном, применительно к кодированию в формате MPEG, но она также хорошо применима для других схем, основанных на параметрическом кодировании многоканальных сигналов. То есть описанные ниже варианты осуществления изобретения просто являются иллюстративными примерами принципов настоящего изобретения для декодирования уменьшенного количества каналов для многоканальных систем с древовидной структурой. Понятно, что для специалистов в данной области техники очевидна возможность модификаций и изменений описанных здесь устройств и подробностей. Следовательно, подразумевают, что настоящее изобретение ограничено только лишь объемом приведенной ниже формулы изобретения, а не конкретными подробностями, представленными здесь посредством описания и объяснения вариантов осуществления изобретения.

Как упомянуто выше, в некоторых системах параметрического кодирования объемного звука, например в формате MPEG c объемным звучанием (MPEG surround), используют параметризацию с древовидной структурой. Такая параметризация схематично изображена на чертежах Фиг. 1 и Фиг. 2.

На Фиг. 1 показаны два способа параметризации сценария стандартных звуковых каналов системы 5.1, имеющей левый передний канал 2, центральный канал 3, правый передний канал 4, левый канал 5 объемного звучания и правый канал 6 объемного звучания. Возможно, но не обязательно, также может присутствовать канал 7 усиления низких частот (LFE) (далее - канал УНЧ).

Как правило, отдельные каналы или пары каналов характеризуют относительно друг друга посредством многоканальных параметров, таких как, например параметр когерентности между каналами (ICC) и параметр уровня (параметр, характеризующий разность уровней между каналами, CLD). В следующем абзаце будет приведено краткое объяснение возможных способов параметризации, а затем будут проиллюстрированы результирующие схемы декодирования с древовидной структурой со ссылкой на Фиг. 2.

В примере, показанном в верхней части Фиг. 1 (параметризация типа 5-1-51), многоканальный сигнал описывают параметром, характеризующим разность уровней между каналами (CLD), и параметром когерентности между каналами (ICC), которые описывают соотношение между левым каналом 5 объемного звучания и правым каналом 6 объемного звучания, левым передним каналом 2 и правым передним каналом 4, и между центральным каналом 3 и каналом 7 усиления низких частот. Однако поскольку вся конфигурация должна быть смикширована с сокращением количества каналов в один единственный монофонический канал, то для полного описания набора каналов требуются дополнительные параметры. Следовательно, используют дополнительные параметры (CLD1, ICC1), описывающие связь комбинации громкоговорителя 7 УНЧ и центрального громкоговорителя 3 с комбинацией левого переднего канала 2 и правого переднего канала 4. Кроме того, требуется еще один дополнительный набор параметров (CLD0, ICC0), эти параметры описывают связь между объединенными каналами 5 и 6 объемного звучания и остальными каналами многоканального сигнала.

При параметризации, показанной в нижней части чертежа (параметризация типа 5-1-52), используют параметры, описывающие связь левого переднего канала 2 с левым каналом 5 объемного звучания, правого переднего канала 4 с правым каналом 6 объемного звучания и центрального канала 3 с каналом 7 усиления низких частот. Дополнительные параметры (CLD1 и ICC1) описывают соотношение между комбинацией левых каналов 2 и 5 и комбинацией правых каналов 4 и 6. Еще один набор параметров (CLD0 и ICC0) описывает соотношение между комбинацией центрального канала 3 и канала 7 УНЧ, и комбинацией остальных каналов.

На Фиг. 2 проиллюстрированы концепции кодирования, лежащие в основе различных способов параметризации из Фиг. 1. На стороне устройства декодирования в древовидной структуре используют так называемые модули OTT ("один к двум", далее - ОКД). Каждый модуль ОКД выполняет микширование монофонического сигнала с увеличением количества каналов, преобразуя его в два выходных сигнала. При декодировании параметры для модулей ОКД следует применять в порядке, обратном их порядку при кодировании. Следовательно, в древовидной структуре типа 5-1-51 модуль 20 ОКД, получающий сигнал 22 (m), смикшированный с сокращением количества каналов, функционирует таким образом, что использует параметры CLD0 и ICC0 для получения двух каналов, один из которых является комбинацией левого канала 5 объемного звучания и правого канала 6 объемного звучания, а другой канал по-прежнему является комбинацией остальных каналов многоканального сигнала.

Соответственно модуль 24 ОКД, используя CLD1 и ICC1, получает первый канал, представляющий собой объединенный канал из центрального канала 3 и низкочастотного канала 7, и второй канал, представляющий собой комбинацию левого переднего канала 2 и правого переднего канала 4. Таким же самым образом модуль 26 ОКД получает левый канал объемного звучания 5 и правый канал объемного звучания 6, используя CLD2 и ICC2. Модуль 27 ОКД получает центральный канал 3 и низкочастотный канал 7, используя CLD4, а модуль 28 ОКД получает левый передний канал 2 и правый передний канал 4, используя CLD3 и ICC3. Наконец, получают восстановление полного набора каналов 30 из одиночного монофонического канала 22, смикшированного с сокращением количества каналов. Для древовидной структуры типа 5-1-52 общая схема размещения модулей ОКД эквивалентна древовидной структуре 5-1-51. Однако одиночные модули ОКД получают иные комбинации каналов, причем эти комбинации каналов соответствуют параметризации, изображенной на Фиг. 1 для случая 5-1-52.

Из Фиг. 1 и 2 становится очевидным, что древовидная структура различных способов параметризации является только лишь визуализацией для используемой параметризации. Кроме того, важно отметить, что отдельными параметрами являются параметры, описывающие соотношение между различными каналами, в отличие, например, от схемы бинаурального кодирования (BCC), в которой подобные параметры получают относительно одного единственного опорного канала.

Следовательно, в показанных способах параметризации отдельные каналы не могут быть получены просто с использованием параметров, связанных с модулями ОКД в визуализации, но, кроме того, необходимо учитывать некоторые или все остальные параметры.

Древовидная структура параметризации представляет собой только лишь визуализацию реального потока сигнала или реальной обработки, показанной на Фиг. 3, на которой проиллюстрировано микширование переданного малого количества каналов с увеличением количества каналов, выполняемое путем матричного умножения. На Фиг. 3 показано декодирование на основе принятого канала 40, смикшированного с сокращением количества каналов. Канал 40, смикшированный с сокращением количества каналов, вводят в блок 42 микширования с увеличением количества каналов, получая восстановленный многоканальный сигнал 44, при этом состав каналов является различным в зависимости от используемых способов параметризации. Однако матричные элементы матрицы, используемой блоком 42 восстановления, получены непосредственно из древовидной структуры. Блок 42 восстановления, только лишь для иллюстративных целей, может быть дополнительно разбит на составные части, одной из которых является матрица 46 предварительного декоррелятора, посредством которой получают дополнительные декоррелированные сигналы из переданного канала 40. Их затем вводят в матрицу 48 смешивания, посредством которой получают многоканальные сигналы 44 путем смешивания отдельных входных каналов.

Как показано на Фиг. 4, прямолинейный подход к уменьшению количества восстановленных каналов состоит в том, что просто выполняют "обрезку" древовидной структуры модулей "один к двум". На Фиг. 4 пунктирными линиями проиллюстрирована возможная "обрезка" древовидных структур, при этой "обрезке" во время восстановления не используют модули ОКД, расположенные с правой стороны древовидной структуры, уменьшая, таким образом, количество каналов на выходе. Однако при использовании способов параметризации из известного уровня техники, показанных на Фиг. 1 и 2, которые представлены потому, что они обеспечивают кодирование с низкой скоростью в битах с максимально возможным качеством, получение стереофонического выходного сигнала, правильно отображающего каналы левой стороны исходного многоканального сигнала, смикшированные с сокращением количества каналов, и каналы правой стороны исходного многоканального сигнала, смикшированные с сокращением количества каналов, невозможно просто путем "обрезки". На Фиг. 5 показан подход к созданию стереофонического выходного сигнала из описанных выше сигналов согласно известному уровню техники, в котором используют очевидный подход, когда сначала полностью восстанавливают многоканальный сигнал перед выполняемым после этого микшированием сигнала с сокращением количества каналов, преобразуя его в стереофоническое представление с использованием дополнительного микшера 60 с сокращением количества каналов. Очевидно, что этот подход имеет несколько недостатков, например высокую сложность и низкое качество звука.

Ниже приведено описание решения вышеупомянутой проблемы получения стереофонического выходного сигнала из монофонического сигнала, смикшированного с сокращением количества каналов, и параметров параметрического объемного звука при параметризации, естественно, не обеспечивающего поддержку "обрезки" до стереофонического выходного сигнала, которое получено для общего случая. После этого приведено описание двух конкретных вариантов осуществления изобретения, демонстрирующих использование идеи настоящего изобретения в описанных выше способах параметризации. Таким образом, обеспечены решения проблемы получения стереофонического выходного сигнала из монофонического сигнала, смикшированного с сокращением количества каналов, и параметров параметрического объемного звука при параметризации, которая не обеспечивает поддержку "обрезки" до стереофонического выходного сигнала.

Ниже будет приведено краткое описание общего подхода к перерасчету параметров. В частности, он применим для случая вычисления параметров стереофонического выходного сигнала из произвольного количества каналов многоканального звука, которое равно N. Кроме того, предполагают, что звуковой сигнал описывается его представлением по поддиапазонам, полученным с использованием блока фильтров, которое может быть вещественным или комплексно-модулированным.

Пусть все рассматриваемые сигналы являются конечными векторами выборок из поддиапазона, соответствующими частотно-временному фрагменту, определяемому пространственными параметрами, и пусть выборки восстановленного многоканального звукового сигнала в поддиапазоне сформированы из выборок звуковых каналов из поддиапазона и декоррелированных выборок звуковых каналов из поддиапазона в соответствии с операцией матричного микширования с увеличением количества каналов

,

Все сигналы считают векторами-строками. Матрица имеет размер и отображает суммарное действие матриц M1 и M2 из Фиг. 3 и, по существу, блока 42 микширования с увеличением количества каналов. Общий способ достижения надлежащих параметров мощности и корреляции версии, смикшированной с сокращением количества каналов до каналов исходных выборок из поддиапазона многоканального звукового сигнала состоит в формировании ковариационной матрицы виртуального микширования с сокращением количества каналов, определяемой матрицей микширования с сокращением количества каналов, которая состоит из элементов

Эта ковариационная матрица может быть вычислена путем умножения на транспонированное комплексно-сопряженное значение следующим образом:

,

где внутренняя ковариационная матрица часто является известной из характеристик декорреляторов и переданных параметров.

Важным особым случаем, где это выполняется, является случай, когда , и в этом случае эта внутренняя ковариационная матрица часто фактически равна единичной матрице размера . Поэтому для стереофонического выходного сигнала, где =2, параметр, характеризующий разность уровней между каналами (CLD), и параметр когерентности между каналами (ICC) могут быть считаны из следующего выражения:

в том смысле, что

Следует отметить, что здесь и далее применяют приведенную ниже систему обозначений. Для комплексных векторов комплексное скалярное произведение и норма вектора в квадрате определяются следующим выражением:

где знак "звездочка" обозначает комплексное сопряжение.

Ниже должны быть получены два варианта осуществления настоящего изобретения для различных способов параметризации (5-1-51 и 5-1-52), показанных на Фиг. 1 и 2. В вариантах осуществления настоящего изобретения идея состоит в следующем: для того, чтобы осуществить вывод стереофонических сигналов на основании монофонических сигналов, смикшированных с сокращением количества каналов, и соответствующих параметров формата MPEG c объемным звучанием (MPEG surround) (многоканальных параметров), необходимо выполнить перерасчет параметров микширования с увеличением количества каналов в одиночный набор параметров, состоящий из параметра, характеризующего разность уровней между каналами (CLD), и параметра когерентности между каналами (ICC), которые могут использоваться для непосредственного получения стереофонического сигнала из монофонического сигнала путем микширования с увеличением количества каналов.

Кроме того, предполагают, что обработку отдельных звуковых каналов выполняют покадровым способом, то есть в дискретных отрезках времени. Таким образом, говоря о значениях мощности или энергии, содержащихся в одном канале, термин "мощность" или "энергия" следует понимать как энергию или мощность, содержащуюся в одном кадре одного к