Устройство и способ генерирования кодированного многоканального сигнала и устройство и способ декодирования кодированного многоканального сигнала

Иллюстрации

Показать все

Изобретение относится к методам параметрической многоканальной обработки аудио, в частности к эффективному размещению параметрической информации управления декодером, когда имеется несколько различных наборов параметров, доступных для восстановления. В многоканальном кодере, генерирующем несколько различных наборов параметров для восстановления многоканального выходного сигнала с использованием, по меньшей мере, одного канала передачи, поток данных записывают так, что два набора параметров являются декодируемыми независимо друг от друга, и многоканальному декодеру предоставляется возможность пропуска набора параметров, который обозначается как необязательный и/или имеет более высокий номер версии при считывании потока данных, и все же выполнения достоверного многоканального восстановления с использованием набора данных, обозначенного как обязательный, или набор данных, имеющий достаточно низкий номер версии. Технический результат - обеспечение гибкого принципа кодера/декодера, пригодного для будущих обновлений, характеризуемых обратной совместимостью и надежностью. 6 н. и 13 з.п. ф-лы, 8 ил.

Реферат

Настоящее изобретение относится к методам параметрической многоканальной обработки аудио и, в частности, к эффективному размещению параметрической информации управления декодером, когда имеется несколько различных наборов параметров, доступных для восстановления.

В дополнение к двум стереоканалам рекомендуемое многоканальное окружающее воспроизведение включает в себя центральный канал С и два окружающих канала, т.е. левый окружающий канал Ls и правый окружающий канал Rs, и, дополнительно, если применимо, низкочастотный канал, также упоминаемый как канал улучшения низких частот (улучшение низких частот - УНЧ, LFE). Этот упоминаемый формат звука также упоминается как 3/2 (плюс УНЧ) стерео и недавно также как 5.1 многоканальный, что означает, что имеется три передних канала, два канала окружающего звука и один канал УНЧ. Вообще говоря, для этого рекомендуемого многоканального окружающего воспроизведения требуется пять или шесть каналов передачи. В среде воспроизведения требуется по меньшей мере пять громкоговорителей в соответствующих пяти различных расположениях для получения оптимальной так называемой зоны наилучшего восприятия на определенном расстоянии от пяти правильно расположенных громкоговорителей. Однако в отношении их расположения низкочастотный громкоговоритель может использоваться относительно свободным образом.

Существует несколько методов снижения количества данных, необходимых для передачи многоканального аудиосигнала. Такие методы также называются методами квазистерео. С этой целью ссылка делается на фиг.5. Фиг.5 изображает устройство 60 квазистерео. Это устройство может представлять собой устройство, реализующее, например, метод интенсивного стерео (метод ИС, IS) или бинауральное кодирование управляющих сигналов (БКУС, BCC). Такое устройство, как правило, принимает по меньшей мере два канала (CH1, CH2, … CHn) в качестве входного сигнала и выводит по меньшей мере один-единственный канал несущей (преобразование с уменьшением числа каналов) и параметрические данные, т.е. один или несколько наборов параметров. Параметрические данные определяются так, что аппроксимация каждого исходного канала (CH1, CH2, … CHn) может вычисляться в декодере.

Обычно канал несущей включает в себя выборки поддиапазона, спектральные коэффициенты или выборки временной области и т. д., которые обеспечивают относительно высококачественное представление лежащего в основе сигнала, в то же время параметрические данные и/или наборы параметров не включают в себя никакие такие выборки или спектральные коэффициенты. Вместо этого параметрические данные включают в себя параметры управления для управления установленным алгоритмом восстановления, таким как взвешивание посредством умножения, сдвиг во времени, сдвиг по частоте, …. Параметрические данные, таким образом, включают в себя только сравнительно грубое представление сигнала или связанного с ним канала. Выражаясь в числах, количество данных, требуемое каналом несущей, находится в диапазоне 60-70 Кбит/с, тогда как количество данных, требуемое параметрической информацией управления декодером, составляет порядка от 1,5 Кбит/с на канал. Одним примером параметрических данных являются известные масштабные коэффициенты, информация об интенсивном стерео или параметры бинауральных управляющих сигналов, как описано ниже.

Метод кодирования интенсивного стерео описан в препринте 3799 Общества инженеров-звукотехников (ОИЗ, AES), озаглавленном “Intensity stereo coding” J. Herre, K. H. Brandenburg, D. Lederer, февраль 1994 г., г. Амстердам. В общих чертах, принцип интенсивного стерео основан на преобразовании главной оси, которое должно применяться к данным двух стереофонических аудиоканалов. Если большинство точек данных размещается вокруг первой главной оси, улучшение кодирования может достигаться посредством поворота обоих сигналов на определенный угол до кодирования. Однако это не всегда применяется к реальным методам стереофонического воспроизведения. Восстановленные сигналы для левого и правого каналов состоят из различно взвешенных или масштабированных вариантов одного и того же переданного сигнала. Тем не менее, восстановленные сигналы отличаются по амплитуде, но они идентичны в отношении информации об их фазе. Огибающие энергии во времени обоих исходных аудиоканалов, однако, сохраняются при помощи операции селективного масштабирования, обычно действующей частотно-селективным образом. Это соответствует звуковосприятию человеком на высоких частотах, где преобладающие пространственные управляющие сигналы определяются огибающими энергии.

Кроме того, в практических реализациях переданный сигнал, т.е. канал несущей, формируется из суммарного сигнала левого канала и правого канала вместо поворота обоих компонентов. Кроме того, эта обработка, т.е. генерирование параметров интенсивного стерео для выполнения операции масштабирования, выполняется частотно-селективном образом, т.е. независимо друг от друга для каждого диапазона масштабных коэффициентов, т.е. для каждого частотного разбиения кодера. Предпочтительно, чтобы оба канала объединялись для формирования объединенного канала или канала «несущей». В дополнение к объединенному каналу определяется информация об интенсивном стерео, которая зависит от энергии первого канала, энергии второго канала и энергии объединенного или суммарного канала.

Метод БКУС описан в докладе 5574 на съезде ОИЗ, озаглавленном “Binaural cue coding applied to stereo and multi-channel audio compression”, C. Faller, F. Baumgarte, Май 2002 г., г. Мюнхен. При кодировании БКУС некоторое количество входных аудиоканалов преобразуется в спектральное представление, используя дискретное преобразование Фурье (ДПФ, DFT) с перекрывающимися окнами. Результирующий спектр разделяется на неперекрывающиеся разделы. Каждый раздел имеет ширину полосы частот, пропорциональную эквивалентной прямоугольной ширине полосы частот (ЭПШП, ERB). Так называемые межканальные разности уровней (МКРУ, ICLD), а также так называемые межканальные временные разности (МКВР, ICTD) вычисляются для каждого раздела, т.е. для каждого диапазона и для каждого кадра k, т.е. блока временных выборок. Параметры МКРУ и МКВР квантуются и кодируются для получения потока битов БКУС. Межканальные разности уровней и межканальные временные разности определяются для каждого канала относительно опорного канала. В частности, параметры вычисляются по предварительно определенным формулам в зависимости от конкретных разделений сигнала, подлежащего обработке.

На стороне декодера декодер принимает монофонический сигнал и поток битов БКУС, т.е. первый набор параметров для межканальных временных разностей и второй набор параметров для межканальных разностей уровней. Монофонический сигнал преобразуется в частотную область и вводится в блок синтеза, также принимающий декодированные значения МКРУ и МКВР. В блоке синтеза или блоке восстановления параметры БКУС (МКРУ и МКВР) используются для выполнения операции взвешивания монофонического сигнала для восстановления многоканального сигнала, который затем, после частотно/временного преобразования, представляет восстановление исходного многоканального аудиосигнала.

В случае БКУС модуль 60 квазистерео служит для вывода канальной информации управления декодером, так что параметрические канальные данные представляют собой квантованные и кодированные параметры МКРУ и МКВР, причем один из исходных каналов может использоваться в качестве опорного канала для кодирования канальной информации управления декодером. Обычно канал несущей формируется из суммы участвующих исходных каналов.

Конечно, вышеупомянутый метод обеспечивает только монофоническое представление для декодера, который может декодировать только канал несущей, но который не может генерировать параметрические данные для генерирования одной или нескольких аппроксимаций более чем одного входного канала.

Метод звукового кодирования, упоминаемый как метод БКУС, дополнительно описан в заявках на патент США 2003/0219130 А1, 2003/0026441 А1 и 2003/0035553 А1. Кроме того, дополнительно смотрите “Binaural Cue Coding. Part II: Schemes and Applications”, C. Faller and F. Baumgarte, IEEE: Transactions on Audio and Speech Proc., Vol. 11, No. 6, November 1993. Далее, также смотрите C. Faller and F. Baumgarte “Binaural Cue Coding applied to Stereo and Multi-Channel Audio compression”, препринт 112-ого съезда Общества инженеров-звукотехников (ОИЗ), Май 2002 г., и J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio”, 116-ый съезд ОИЗ, г. Берлин, 2004 г., препринт 6049. Ниже более подробно представлена типовая общая схема БКУС для многоканального звукового кодирования в отношении фиг.6-8. Фиг.6 изображает общую схему кодирования БКУС для кодирования/передачи многоканальных аудиосигналов. Многоканальный входной аудиосигнал подается на вход 110 кодера 112 БКУС и «преобразуется с уменьшением числа каналов» в так называемом блоке 114 преобразования с уменьшением числа каналов, т.е. преобразуется в единственный суммарный канал. В настоящем примере сигнал на входе 110 представляет собой 5-канальный окружающий сигнал, имеющий передний левый канал и передний правый канал, левый окружающий канал и правый окружающий канал и центральный канал. Обычно блок преобразования с уменьшением числа каналов генерирует суммарный сигнал простым сложением этих пяти каналов в монофонический сигнал. Известны другие схемы преобразования с уменьшением числа каналов в технике, в которых все приводится к генерированию, используя многоканальный входной сигнал, сигнала с помощью преобразования с уменьшением числа каналов, имеющего единственный канал или имеющего несколько каналов, количество которых, в любом случае, меньше, чем количество исходных входных каналов. В настоящем примере операция преобразования с уменьшением числа каналов уже достигается тогда, когда четыре канала несущей генерировались из пяти входных каналов. Единственный выходной канал и/или несколько выходных каналов выводятся по линии 115 суммарного сигнала.

Информация управления декодером, получаемая блоком 116 анализа БКУС, выводится по линии 117 информации управления декодером. В блоке анализа БКУС могут вычисляться наборы параметров для МКРУ, МКВР или значений межканальной корреляции (МКК, ICC). Таким образом, имеется до трех различных наборов параметров (МКРУ, МКВР и МКК) для восстановления в блоке 122 синтеза БКУС.

Суммарный сигнал и информация управления декодером с наборами параметров обычно передаются на декодер 120 БКУС в квантованном и кодированном формате. Декодер БКУС разделяет переданный суммарный сигнал на несколько поддиапазонов и выполняет масштабирование, задержки и дополнительную обработку для генерирования поддиапазонов нескольких каналов, подлежащих восстановлению. Эта обработка выполняется так, что параметры МКРУ, МКВР и МКК (управляющие сигналы) восстановленного многоканального сигнала на выходе 121 аналогичны соответствующим управляющим сигналам для исходного многоканального сигнала на входе 110 кодера 112 БКУС. С этой целью декодер 120 БКУС включает в себя блок 122 синтеза БКУС и блок 123 обработки информации управления декодером.

Нижеследующее иллюстрирует внутреннюю структуру блока 122 синтеза БКУС в отношении фиг.7. Суммарный сигнал на линии 115 вводится в блок преобразования времени/частоты, обычно выполняемый в виде банка 125 фильтров БФ(FB). На выходе блока 125 присутствует несколько N сигналов поддиапазонов или, в максимальном случае, блок спектральных коэффициентов, если банк 125 звуковых фильтров выполняет преобразование, генерирующее N спектральных коэффициентов из N выборок временной области.

Блок 122 синтеза БКУС дополнительно включает в себя каскад 126 задержки, каскад 127 модифицирования уровня, каскад 128 обработки корреляции и каскад 129 БОФ(IFB) (банк обратных фильтров), представляющий банк обратных фильтров. На выходе каскада 129 восстановленный многоканальный аудиосигнал, имеющий, например, пять каналов в случае 5-канальной окружающей системы, может выводиться на группу громкоговорителей 124, как показано на фиг.6.

Фиг.7 дополнительно изображает, что входной сигнал s(n) преобразуется в частотную область или область банка фильтров посредством элемента 125. Сигнал, выводимый элементом 125, умножается, так что получается несколько версий одного и того же сигнала, как указано узлом 130. Количество версий исходного сигнала равно количеству выходных каналов в выходном сигнале, подлежащем восстановлению. Если каждая версия исходного сигнала подвергается определенной задержке d1, d2, … di, dN в узле 130, то результатом является такой случай на выходе блоков 126, который включает в себя версии одного и того же сигнала, но с различными задержками. Параметры задержки вычисляются блоком 123 обработки информации управления декодером на фиг.6 и выводятся из межканальных временных разностей, которые были определены блоком 116 анализа БКУС.

Это же применимо к параметрам умножения а1, а2 … ai, aN, которые также вычисляются блоком 123 обработки информации управления декодером на основании межканальных разностей уровней, определенных блоком 116 анализа БКУС.

Параметры МКК вычисляются блоком 116 анализа БКУС и используются для управления функциональными возможностями блока 128, так что определенные значения корреляции между задержанными и манипулированными по уровню сигналами получаются на выходе блока 128. Необходимо заметить, что порядок каскадов 126, 127, 128 может отличаться от того, который представлен на фиг.7.

Далее необходимо заметить, что при поблочной обработке аудиосигнала анализ БКУС также выполняется поблочно. Кроме того, анализ БКУС также выполняется по частоте, т.е. частотно-селективным образом. Это означает то, что для каждого спектрального диапазона имеется параметр МКРУ, параметр МКВР и параметр МКК. Параметры МКВР для по меньшей мере одного канала по всем диапазонам, таким образом, представляют набор параметров МКВР. Это же применяется к набору параметров МКРУ, представляющему все параметры МКРУ для всех частотных диапазонов, для восстановления по меньшей мере одного выходного канала. Это же применяется, в свою очередь, к набору параметров МКК, который и в этом случае включает в себя несколько индивидуальных параметров МКК для различных диапазонов для восстановления по меньшей мере одного выходного канала на основе входного канала или суммарного канала.

Ниже ссылка делается на фиг.8, изображающую случай, из которого можно понять определение параметров БКУС. Обычно параметры МКРУ, МКВР и МКК могут определяться между парами каналов. Является типичным, однако, что определение параметров МКРУ и МКВР выполняется между опорным каналом и каждым другим входным каналом, так что существует отдельный набор параметров для каждого входного канала. Это также иллюстрируется на фиг.8В.

Однако параметры МКК могут определяться иным образом. Вообще говоря, параметры МКК могут генерироваться в кодере между любыми парами каналов, что также схематически изображено на фиг.8В. В этом случае декодер будет выполнять синтез МКК так, что получается примерно такой же результат, что и тот, который присутствовал в исходном сигнале между любыми парами каналов. Однако было предположение для вычисления только параметров МКК между двумя самыми сильными каналами в любой момент времени, т.е. для каждого временного кадра. Эта схема представлена на фиг.8С, которая изображает пример, в котором в один момент времени вычисляется и передается параметр МКК между каналами 1 и 2 и в котором в другой момент времени вычисляется параметр МКК между каналами 1 и 5. Декодер тогда синтезирует межканальную корреляцию между двумя самыми сильными каналами в декодере и исполняет дополнительные обычно эвристические правила для синтезирования межканальной когерентности для остальных пар каналов.

В отношении вычисления, например, параметров умножения а1, … aN, основанных на переданных параметрах МКРУ, ссылка делается на противопоставленный доклад 5574 на съезде ОИЗ. Параметры МКРУ представляют распределение энергии в исходном многоканальном сигнале. Без потери всеобщности фиг.8А изображает то, что имеется четыре параметра МКРУ, представляющих разность энергий между всеми другими каналами и передним левым каналом. В блоке 123 обработки информации управления декодером параметры умножения а1, … aN выводятся из параметров МКРУ, так что полная энергия всех восстановленных выходных каналов представляет собой такую же энергию, что и та, которая присутствует для переданного суммарного сигнала, или, по меньшей мере, пропорциональна этой энергии. Одним путем определения этих параметров является двухэтапный процесс, в котором на первом этапе коэффициент умножения для левого переднего канала устанавливается равным 1, в то время как коэффициенты умножения для других каналов на фиг.8С устанавливаются равными переданным значениям МКРУ. Тогда, на втором этапе, энергия всех пяти каналов вычисляется и сравнивается с энергией переданного суммарного сигнала. Затем все каналы масштабируются вниз, а именно используя масштабный коэффициент, который равен для всех каналов, в котором масштабный коэффициент выбирается так, что полная энергия всех восстановленных выходных каналов после масштабирования равна полной энергии переданного суммарного сигнала и/или переданных суммарных сигналов.

В отношении показателя межканальной когерентности МКК, переданного с кодера БКУС на декодер БКУС в качестве дополнительного набора параметров, необходимо отметить, что манипулирование когерентностью может выполняться посредством модифицирования коэффициентов умножения, например, посредством умножения весовых коэффициентов всех поддиапазонов на случайные числа, имеющие значения между 20 log10-6 и 20 log106. Псевдослучайная последовательность обычно выбирается так, что дисперсия для всех критических диапазонов примерно равна и что среднее значение в каждом критическом диапазоне равно нулю. Одинаковая последовательность используется для спектральных коэффициентов каждого различного кадра или блока. Таким образом, ширина звуковой сцены управляется посредством модифицирования дисперсий псевдослучайной последовательности. Большая дисперсия генерирует большую ширину слышимости. Модифицирование дисперсии может выполняться в индивидуальных диапазонах, имеющих ширину критического диапазона. Это делает возможным одновременное существование нескольких объектов в сцене слышимости, в которой каждый объект имеет различную ширину слышимости. Подходящим распределением амплитуды для псевдослучайной последовательности является равномерное распределение по логарифмической шкале, например, представленное в публикации патента США 2002/0219130 А1.

Чтобы передавать пять каналов совместимым образом, например, в формате потока битов, который также подходит для нормального стереофонического декодера, может использоваться так называемый метод матрицирования, описанный в “MUSICAM Surround: A universal multi-channel coding system compatible with ISO/IEC 11172-3”, G. Theile и G. Stoll, препринт ОИЗ, октябрь 1992г., г. Сан-Франциско.

Кроме того, смотрите дополнительные методы многоканального кодирования, описанные в публикации “Improved MPEG 2 Audio multi-channel encoding”, B. Grill, J. Herre, K. H. Brandenburg, I. Eberlein, J. Koller, J. Miller, препринт 3865 ОИЗ, февраль 1994 г., г. Амстердам, в которой используется матрица совместимости для получения каналов, посредством преобразования с уменьшением числа каналов, из исходных входных каналов.

Итак, можно сказать, что метод БКУС делает возможным эффективное и также обратно-совместимое кодирование многоканального звукового материала, как также описано, например, в публикации специалиста E. Schuijer, J. Breebaart, H. Purnhagen, J. Engdegard, озаглавленной “Low-Complexity Parametric Stereo Coding”, 119-ый съезд ОИЗ, г. Берлин, 2004 г., препринт 6073. В этом контексте необходимо также упомянуть стандарт MPEG-4 (Экспертная группа по вопросам движущегося изображения) и, в частности, расширение на методы параметрического аудио, в которых эта часть стандарта также известна по обозначению ISO/IEC 14496-3: 2001/FDAM 2 (Parametric Audio). В этом отношении необходимо упомянуть, в частности, синтаксис в таблице 8.9 стандарта MPEG-4, озаглавленной “syntax of the ps_data()”. В этом примере заявители упоминают элементы синтаксиса “enable_icc” и “enable_ipdopd”, при этом эти элементы синтаксиса используются для включения и выключения передачи параметра МКК и фазы, соответствующей межканальным временным разностям. Также необходимо упомянуть элементы синтаксиса “icc_data()”, “ipd_data()” и “opd_data()”.

Вкратце необходимо отметить, что, как правило, такие параметрические многоканальные методы используются с применением одного или нескольких переданных каналов несущей, причем М переданных каналов формируются из N исходных каналов для восстановления снова N выходных каналов или количества K выходных каналов, причем K равно или меньше, чем количество исходных каналов N.

Во всех описанных до настоящего времени методах является проблематичным вопрос того, как может быть создана совместимость форматов между различными типами декодеров для многоканального декодирования, например, для декодеров БКУС и для других версий параметрической информации управления декодером. В частности, возникают две проблемы, когда на рынке существуют различные многоканальные декодеры наряду с тем, что в то же время на рынке присутствует информация управления декодером, имеющая различные наборы параметров, генерируемые различными многоканальными декодерами, и, таким образом, доступная для пользователя, который имеет только единственный декодер.

Во-первых, желательно иметь декодеры с высокой вычислительной возможностью, обеспечивающие оптимальное качество многоканального звука при декодировании. В то же время, однако, также будут декодеры, которые работают в условиях ограниченных ресурсов, такие как декодеры в мобильных устройствах, таких как мобильные телефоны. Конечно, такие декодеры должны обеспечивать многоканальный выход, имеющий качество, которое все же является максимально хорошим, но также должны иметь только ограниченный объем вычислительной работы. Это приводит к вопросу, могут ли быть форматы потока битов с наборами параметров для пространственного восстановления, которые поддерживают этот вид масштабируемости, т.е. которые предоставляют возможность как декодирования с высокой сложностью и, таким образом, оптимальным качеством, так и декодирования с уменьшенной сложностью, но также с соответствующим пониженным качеством.

Следующим аспектом, который следует рассмотреть при введении новых поколений/версий декодеров БКУС и, таким образом, потоков битов БКУС, является вопрос, как может быть сохранена совместимость между различными версиями потоков битов БКУС и декодерами БКУС. Другими словами, желательно, чтобы новые наборы параметров БКУС и также обновленные старые наборы параметров были обратно-совместимыми. Таким образом, конечно, желательно обеспечить направление обновления для пользователей БКУС, давая возможность представления новых улучшенных многоканальных схем, когда они станут доступны вследствие технического прогресса. С другой стороны, новые форматы потоков битов БКУС обычно приводят к несовместимости между этими потоками битов и различными (более старыми) версиями декодеров БКУС.

В частности, необходимо отметить, что многоканальные кодеры/декодеры должны использоваться во все возрастающем количестве областей применения, в которых необязательно является доступным максимальные вычислительные возможности, но которые также не всегда обязательно требуют полного качества звука.

Задачей настоящего изобретения является предоставление идеи, которая является эффективной и гибкой, т.е. которая дает возможность, например, выполнить интеграцию новых наборов параметров или обновление старых наборов параметров и которая в то же самое время может гибко использоваться в многочисленных различных применениях.

Эта задача достигается устройством для генерирования кодированного многоканального сигнала по п.1 формулы изобретения, устройством для декодирования кодированного многоканального сигнала по п.15 формулы изобретения, способом генерирования кодированного многоканального сигнала по п.21 формулы изобретения, способом декодирования многоканального сигнала по п.22 формулы изобретения или компьютерной программой по п.23 формулы изобретения.

Настоящее изобретение основано на том факте, что эффективное и обратно-совместимое декодирование кодированных многоканальных сигналов достигается тогда, когда кодированный многоканальный сигнал записывается в виде потока данных, который, в дополнение к по меньшей мере одному каналу передачи или каналу несущей, включает в себя по меньшей мере два различных набора параметров, причем два набора параметров записываются в поток данных, так что восстановление выходных каналов может выполняться при помощи менее чем по меньшей мере двух наборов параметров. Согласно изобретению поток данных записывается так, что декодер может идентифицировать, какой из наборов параметров требуется для восстановления и какой набор параметров необязательно является необходимым для восстановления. В этом случае декодер может использовать только набор параметров, который является необходимым (т.е. обязательным) для восстановления, и просто игнорировать необязательные наборы параметров, если этого требуют внешние обстоятельства. В результате этого декодер является быстродействующим и обходится ограниченной вычислительной возможностью при использовании только обязательного набора параметров для восстановления наряду с тем, что в то же самое время другой декодер может выполнять высококачественное многоканальное восстановление на основе этого же потока данных, представляющего кодированный многоканальный сигнал, которое, однако, также требует больше времени и/или большей вычислительной возможности и/или, вообще говоря, больших ресурсов декодера.

В предпочтительном варианте осуществления настоящего изобретения обязательным набором параметров является тот, который включает в себя межканальные разности уровней. Как было обнаружено в соответствии с изобретением, эти межканальные разности уровней являются очень важными для определения базового распределения многоканального звука между выходными каналами для всех типов случаев воспроизведения. Межканальные временные разности могут классифицироваться как необязательные наборы параметров, так как они, главным образом, уместны тогда, когда должно быть представление или при помощи наушников, т.е. два выходных канала из одного переданного канала, или когда происходит многоканальное звуковое представление в так называемой относительно «сухой» акустической ситуации, т.е. акустической ситуации, включающей в себя немногочисленное эхо. Межканальные временные разности, таким образом, уже могут классифицироваться как необязательный набор параметров.

Значения межканальной корреляции важны для предоставления ширины источников звука и для дополнительного создания впечатления у слушателя, что он или она находятся на сцене со смешанными источниками звука, например, классический оркестр, который включает в себя много некоррелированных звуковых компонентов. Набор параметров МКК, таким образом, также может классифицироваться как необязательный набор параметров, так как он очевидно имеет важное влияние на качество, но при восстановлении часто приводит к относительно большому объему работ по вычислению, который, например, не является настолько важным в обязательном наборе параметров межканальных разностей уровней, так как, по существу, требуется только операция взвешивания, т.е. умножения, которая может выполняться эффективно по отношению к вычислению.

Что касается проблемы обратной совместимости кодированных многоканальных сигналов с наборами параметров в потоках данных, то набор параметров, имеющий, например, более высокий номер версии, записывается в поток данных, так что восстановление декодером может выполняться без этого набора параметров, в результате декодер будет использовать только первый набор параметров для восстановления и просто пропустит второй набор параметров, когда он установит, что он не может обрабатывать этот второй набор параметров.

На стороне декодера это означает, что декодер должен полностью считывать набор параметров и обрабатывать его, когда он идентифицирует этот набор параметров как обязательный набор параметров, что, однако, декодер просто пропустит биты в потоке битов, принадлежащие набору параметров, когда он встретит набор параметров, который не является обязательным для восстановления, т.е. который обозначен как необязательный. Декодеру, таким образом, не нужно иметь никаких сведений о синтаксисе второго набора параметров, чтобы он мог иметь дело с кодированным многоканальным сигналом, но он может просто пропустить его и просто перейти к последующим областям кодированного многоканального сигнала, которые могут быть еще необходимы для восстановления.

Предпочтительно, чтобы информация о длине, таким образом, вставлялась в поток данных для наборов параметров, обозначенных как необязательные, которые дают возможность декодеру просто пропустить биты, связанные с этим набором параметров, быстрым и эффективным образом и взять только наборы параметров, обозначенные как обязательные для декодирования. Что касается обратной совместимости, то также предпочтительно, чтобы номер версии ассоциировался с по меньшей мере каждым необязательным набором параметров, который задает, какой версией кодера генерировался этот набор параметров. Таким образом, например, набор параметров для межканальных разностей уровней самой низшей версии будет обозначаться как обязательный в потоке данных, тогда как набор параметров для межканальных разностей уровней более поздней версии кодера получает другой номер версии, так что декодер будет просто использовать соответствующий набор параметров с более низшим номером версии для восстановления, когда он установит, что он не может обрабатывать набор параметров, имеющий более высокий номер версии.

Наконец, необходимо отметить, что поток данных, представляющий многоканальный сигнал, необязательно должен также содержать каналы передачи. Вместо этого они могли генерироваться и передаваться отдельно, как, например, в том случае, когда параметры БКУС записываются впоследствии на компакт-диск в соответствующий канал, причем компакт-диск уже содержит М (= равный или больше 1) каналов передачи.

Предпочтительные варианты осуществления настоящего изобретения подробно объясняются ниже в отношении прилагаемых чертежей, на которых:

фиг.1А представляет собой общий вид кодированного многоканального сигнала, имеющего определенный синтаксис потока данных согласно варианту осуществления настоящего изобретения;

фиг.1B представляет собой подробное представление блока управления по фиг.1A согласно варианту осуществления настоящего изобретения;

фиг.2A представляет собой блок-схему кодера согласно варианту осуществления настоящего изобретения;

фиг.2B представляет собой блок-схему декодера согласно варианту осуществления настоящего изобретения;

фиг.3A-3D изображают предпочтительную реализацию для конфигурации набора параметров согласно настоящему изобретению;

фиг.4A-4C изображают предпочтительную реализацию данных набора параметров согласно настоящему изобретению;

фиг.5 изображает общее представление многоканального кодера;

фиг.6 представляет собой схематическую блок-схему тракта кодера БКУС/декодера БКУС;

фиг.7 представляет собой блок-схему блока синтеза БКУС по фиг.6; и

фиг.8А-8С изображают представление типовых планов действий для вычисления наборов параметров МКРУ, МКВР и МКК.

Фиг.2A изображает предпочтительную реализацию устройства для генерирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, которые подаются на вход 20 средства 22 для предоставления как М каналов передачи, так и параметрической информации с по меньшей мере двумя наборами параметров. В частности, количество М каналов передачи, выводимых на выходе 23 средства 22, меньше количества N исходных аудиоканалов. Индивидуальные наборы параметров, которые вместе представляют параметрическую информацию для восстановления К выходных каналов, подаются на выходы 24а, 24b, 24с средства 22 для предоставления М каналов передачи, причем М равно или больше 1 и меньше N, подаются на средство 25 для записи потока данных на выходной стороне, которые подаются на выход 26, точно как и наборы параметров на выходах 24а, 24b, 24с.

Как описано выше, информация о преобразовании с уменьшением числа каналов (М каналов передачи) также может передаваться/храниться отдельно от параметрической информации.

Средство 25 для записи потока данных, представляющего кодированный многоканальный сигнал, выполнено с возможностью записи М каналов передачи в поток данных и дополнительно записи первого, второго и третьего набора параметров в поток данных, так что восстановление К выходных каналов может выполняться без использования одного из трех наборов параметров и, предпочтительно, даже без использования по меньшей мере двух из трех наборов параметров. В этом отношении наборы параметров на выходах 24а-24с средства 22 для предоставления обозначаются так, что один набор параметров, такой как первый набор параметров, абсолютно необходим для восстановления, тогда как два других набора параметров, т.е. второй набор параметров и третий набор параметров, определяются так, что они только необязательно требуются для восстановления.

Средство 25 для записи затем записывает первый набор параметров в качестве обязательного набора параметров в поток данных и записывает второй набор параметров и третий набор параметров только в качестве необязательных наборов параметров в поток данных, как описано ниже.

Поток данных на выходе 26 на фиг.2A подается на вход 27 потока данных многоканального декодера, изображенного на фиг.2B. Данные потока данных подаются на средство 28 для считывания потока данных, в котором средство 28 для считывания потока данных, точно как и кодер, показанный на фиг.2A, снова содержит логический выход 29 для М каналов передачи, извлеченных из потока данных, и дополнительные логические выходы 30а, 30b для наборов параметров, содержащихся в потоке данных. В предпочтительном варианте осуществления настоящего изобретения, в котором первый набор параметров обозначается как обязательный или абсолютно необходимый для восстановления, средство 28 для считывания подает этот первый набор параметров на средство 31 для восстановления при помощи логического выхода 30а. Если средство 28 для считывания, например, фиксировано установлено на считывание только обязательных наборов параметров и подачи их на средство 31 для восстановления, то средство 28 просто пропустит второй набор параметров в потоке данных на входе 27, что символически представлено логическим выходом 30b с обрывом на фиг.2B.

Сигнал управления, извлекаются ли только обязательные наборы параметров или дополнительно также необязательные наборы параметров из потока данных и подаются ли на средство 31, также может подаваться на средство 28 при помощи управляющего входа 32, причем информация о доступности ресурсов и/или управляющая информация, извлеченная из нее, поступает по управляющему входу 32.

Информация о доступности ресурсов, например, может заключаться в том, что питаемый от батарей декодер устанавливает, что имеется еще достаточное количество доступной энергии батарей, так что средство 28 для считывания потока данных инструктируется на извлечение не только обязательных наборов параметров, но также необязательных наборов параметров и подачу их на средство 31 для восстановления при помощи соответствующих логических выходов, так что, в свою очередь, это средство обеспечивает К выходных каналов на выходе 33, причем К равно или меньше, чем исходное количество N исходных входных каналов на входе 20 на фиг.2A. Необходимо заметить, что предпочтительно, чтобы количество К было р