2417458 - Генерирование многоканальных звуковых сигналов

Генерирование многоканальных звуковых сигналов

Иллюстрации

Показать все

Изобретение относится к генерированию многоканальных звуковых сигналов из матрично-кодированного стереосигнала объемного звука. Технический результат - повышение качества звукового сигнала. Декодер генерирует многоканальный звуковой сигнал, такой как сигнал объемного звука, из принятого первого сигнала. Многоканальный сигнал содержит второй набор звуковых каналов, и первый сигнал содержит первый набор звуковых каналов. Декодер содержит приемник, который принимает первый сигнал. Приемник подсоединен к процессору оценки, который генерирует оцененные параметрические данные для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов. Оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов. Декодер дополнительно содержит декодер пространственного звука, который декодирует первый сигнал в ответ на оцененные параметрические данные для генерирования многоканального сигнала, содержащего второй набор каналов. Изобретение позволяет использовать декодирование пространственного звука с сигналами, которые не кодируются кодером пространственного звука. 6 н. и 13 з.п. ф-лы, 6 ил.

Реферат

Изобретение относится к генерированию многоканальных звуковых сигналов посредством декодирования пространственного звука и, в частности, но не исключительно, к генерированию многоканальных звуковых сигналов из матрично-кодированного стереосигнала объемного звука.

Цифровое кодирование сигналов различных источников стало все более важным в последние десятилетия, так как цифровое представление сигналов и цифровая связь все больше и больше заменяют аналоговое представление и связь. Например, мобильные телефонные системы, такие как глобальная система мобильной связи, основаны на цифровом кодировании речи. Также, распределение медиаконтента, такого как видео и музыка, в большей степени основывается на кодировании цифрового контента.

Кроме того, в последнем десятилетии наблюдалась тенденция к многоканальному звуку и, особенно, к пространственному звуку, простирающемуся за пределы обычных стереосигналов. Например, традиционные стереозаписи содержат только два канала, тогда как современные усовершенствованные звуковые системы обычно используют пять или шесть каналов, как в популярных 5.1-канальных системах объемного звука. Это обеспечивает более глубокий опыт прослушивания, где пользователь может быть окружен источниками звука.

Были разработаны различные методы и стандарты для передачи таких многоканальных сигналов. Например, шесть дискретных каналов, представляющих 5.1-канальную объемную систему, могут передаваться в соответствии со стандартами, такими как стандарты перспективного звукового кодирования (ААС, ПЗК) или Dolby Digital.

Однако, чтобы обеспечить обратную совместимость, известно понижающее микширование с большего числа каналов до меньшего числа каналов, и, конкретно, часто используется понижающее микширование 5.1-канального сигнала объемного звука в стереосигнал, позволяя воспроизводить стереосигнал традиционными (стерео) декодерами и 5.1-канальный сигнал - декодерами объемного звука.

Такие существующие способы для обратно совместимой многоканальной передачи без дополнительной многоканальной информации могут обычно характеризоваться как способы матрицированного объема. Примеры матричного кодирования объемного звука включают в себя способы, такие как Dolby Prologic II и Logic-7. Общим принципом этих способов является то, что они выполняют матричное умножение многочисленных каналов входного сигнала на подходящую неквадратную матрицу, таким образом генерируя выходной сигнал с меньшим количеством каналов. Конкретно, матричный кодер обычно применяет фазовые сдвиги к объемным каналам перед их смешиванием с передними и центральными каналами. Генерирование сигнала (Lt, Rt) с понижающим микшированием может, например, определяться как:

Таким образом, левый сигнал (Lt) понижающего микширования состоит из левого-переднего сигнала (Lf), центрального сигнала (с), умноженного на коэффициент q, левого-объемного сигнала (Ls), фаза которого сдвинута на 90 градусов ('j') и который масштабирован с коэффициентом а, и, наконец, правого-объемного (Rs) сигнала, фаза которого также сдвинута на 90 градусов и который масштабирован с коэффициентом b. Правый сигнал (Rt) понижающего микширования генерируется аналогичным образом. Типовыми коэффициентами понижающего микширования являются 0,707 для q и а, и 0,408 - для b.

Логическим обоснованием для противоположных знаков для правого сигнала (Rt) понижающего микширования является то, что объемные каналы смешиваются в противофазе в пару (Lt, Rt) понижающего микширования. Это свойство помогает декодеру выполнять различение между передним и задним каналами из пары сигналов понижающего микширования. Декодер может (частично) восстановить многоканальный сигнал из стереосигнала понижающего микширования применением операции дематрицирования. Насколько точно вновь созданный многоканальный сигнал имеет сходство с исходным многоканальным сигналом будет зависеть от конкретных свойств многоканального звукового контента.

Хотя системы матрицированного объемного звука предусматривают обратную совместимость, они могут обеспечивать только низкое качество звука по сравнению с дискретными объемными системами/кодерами, такими как системы ААС (ПЗК) или Dolby Digital.

Методы кодирования/декодирования, известные как кодирование пространственного звука (SAC, КПЗ), были разработаны для обеспечения улучшенного качества звуковых сигналов с понижающим микшированием. При КПЗ декодер выполняет понижающее микширование каналов до меньшего количества и, кроме того, генерирует параметрические данные, которые описывают характеристики многоканальных сигналов относительно сигналов с понижающим микшированием. Дополнительные параметрические данные затем включаются в битовый поток вместе с сигналом понижающего микширования, которым обычно является звуковой моно- или стереосигнал. Таким образом, традиционные декодеры могут игнорировать дополнительные параметрические данные и повторно генерировать моно- или стереосигнал (или, возможно, матрично-декодированный сигнал объемного звука низкого качества). Кроме того, КПЗ-декодеры могут извлекать параметрические данные и использовать их для генерирования многоканального сигнала более высокого качества.

Однако проблемой с этим подходом является то, что многие системы не оборудованы для КПЗ-кодированных сигналов. Например, многие системы используют только матричное кодирование объемного звука, которое не генерирует параметрические данные КПЗ. Кроме того, многие стандарты на сигнал и декодер не обеспечивают гибкости для включения дополнительных параметрических данных, таким образом требуя полное переключение на новый стандарт до того, как может быть развернуто КПЗ. Это может потребовать, чтобы все существующие кодеры и декодеры в системе были заменены кодерами и декодерами с поддержкой КПЗ. Конкретно, существует много двухканальных стереофонических традиционных систем (таких как радио, цифровое радио и т.д.), где неосуществимо большой объем работ по добавлению дополнительной информации, необходимой для КПЗ, т.е. слишком высоки затраты для расширения таких систем до использования КПЗ. Кроме того, уже существует большое количество доступного матрично-кодированного звукового материала, и он потребовал бы перекодирования КПЗ-кодером перед тем, как могут быть достигнуты преимущества КПЗ-декодирования.

Следовательно, была бы полезной улучшенная система для обработки и/или передачи многоканальных звуковых сигналов, и, в частности, были бы полезными функциональные возможности, позволяющие получить повышенную гибкость, улучшенное качество звука, повышенную применимость принципов КПЗ и/или улучшенные рабочие характеристики.

Следовательно, изобретение пытается, предпочтительно, ослабить, уменьшить или устранить одно или несколько из вышеупомянутых недостатков отдельно или в любой комбинации.

Согласно первому аспекту изобретения, обеспечивается декодер для генерирования многоканального звукового сигнала, причем декодер содержит: средство для приема первого сигнала, содержащего первый набор звуковых каналов; средство оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодер пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

Изобретение может предоставить улучшенные рабочие характеристики. Конкретно, изобретение может сделать возможным использование принципов декодирования пространственного звука для сигналов, не содержащих параметры кодирования пространственного звука (КПЗ). Применимость декодера может быть существенно повышена, и он, например, может использоваться с матричными кодерами и кодированными сигналами. Улучшенное качество звука может быть достигнуто посредством декодирования пространственного звука.

Второй набор каналов, в общем, содержит больше каналов, чем первый набор каналов. Второй набор звуковых каналов может содержать один или несколько из первого набора звуковых каналов. Один или несколько из второго набора звуковых каналов могут генерироваться без использования оцененных параметрических данных. Оцененными параметрическими данными могут быть, по существу, данные, соответствующие параметрам пространственного звука и, в частности, параметрам пространственного звука, которые обычно генерируются обычными КПЗ-кодерами.

Оцененные параметрические данные могут непосредственно связывать заданную характеристику первого набора каналов с заданной характеристикой второго набора каналов и/или могут, например, содержать значения данных, связывающие характеристики различных каналов второго набора каналов, таким образом, указывая, как первый сигнал может декодироваться для обеспечения второго набора звуковых каналов. Характеристиками может быть последовательность измерений одного единственного параметра по различным интервалам времени. Альтернативно, характеристики могут принадлежать более чем одному единственному параметру.

Согласно дополнительному признаку изобретения, первый сигнал не содержит параметрических звуковых данных, связанных со вторым набором каналов.

Изобретение позволяет применять принципы декодирования пространственного звука к сигналу, не содержащему параметрических звуковых данных для по меньшей мере некоторых из выходных каналов. Таким образом, изобретение может предоставить улучшенное качество для не-КПЗ-кодированных сигналов. Изобретение может предоставить улучшенную обратную совместимость и может, в частности, предоставить улучшенное качество звука для декодированных сигналов объемного звука из матрично-кодированных сигналов объемного звука.

Согласно дополнительному признаку изобретения, средство оценки содержит средство для определения первых параметрических данных для первого набора звуковых каналов и средство для отображения первых параметрических данных на оцененные параметрические данные для второго набора звуковых каналов.

Это может предоставить эффективную реализацию и оценку параметрических данных, которые могут обеспечить особенно высокое качество декодированного звука. Отображение может, например, быть посредством использования таблицы соответствия или посредством вычисления математической функции. Таким образом, существует прямая зависимость между оцененными параметрическими значениями и заданными параметрическими значениями первых параметрических данных.

Согласно дополнительному признаку изобретения, первые параметрические данные содержат по меньшей мере одно значение межканальной разности уровней для по меньшей мере двух звуковых каналов первого набора звуковых каналов.

Это может предоставить эффективную реализацию и оценку параметрических данных, которые могут обеспечивать особенно высокое качество декодированного звука. В частности, исследования показали, что значение межканальной разности уровней особенно подходит для оценки связанных с ним параметрических данных КПЗ из матрично-кодированного сигнала объемного звука. Изобретатели настоящего изобретения поняли, что существует сильная корреляция между межканальной разностью уровней для, например, стереофонического матрично-кодированного сигнала объемного звука и данными КПЗ для сигнала объемного звука.

Согласно дополнительному признаку изобретения, первые параметрические данные содержат по меньшей мере одно значение коэффициента межканальной корреляции для по меньшей мере двух звуковых каналов первого набора звуковых каналов.

Это может предоставить эффективную реализацию и оценку параметрических данных, которые могут обеспечивать особенно высокое качество декодированного звука. В частности, исследования показали, что значение коэффициента межканальной корреляции особенно подходит для оценки связанных с ним параметрических данных КПЗ из матрично-кодированного сигнала объемного звука. Изобретатели настоящего изобретения поняли, что существует сильная корреляция между коэффициентом межканальной корреляции для, например, стереофонического матрично-кодированного сигнала объемного звука и данными КПЗ для сигнала объемного звука.

Согласно необязательному признаку изобретения, многоканальный звуковой сигнал представляет собой сигнал объемного звука, и оцененные параметрические данные содержат по меньшей мере один параметр, выбранный из группы, состоящей из: межканальной разности уровней между левым-передним и левым-объемным каналом второго набора каналов; межканальной разности уровней между правым-передним и правым-объемным каналом второго набора каналов; коэффициента межканальной корреляции между левым-передним и левым-объемным каналом второго набора каналов; коэффициента межканальной корреляции между правым-передним и правым-объемным каналом второго набора каналов; коэффициента предсказания для центрального канала второго набора звуковых каналов; и межканальной разности уровней между центральным каналом и другим каналом (или комбинацией каналов) второго набора каналов.

Это может предоставить особенно высокие рабочие характеристики. Конкретно, эти параметры особенно подходят для генерирования высококачественного декодированного сигнала декодером пространственного звука и обычно имеют сильную корреляцию между параметрами входного сигнала, такого как в системе матрично-кодированного объемного звука.

По меньшей мере один параметр, выбранный из группы, может генерироваться прямым отображением из значения межканальной разности уровней и/или значения коэффициента межканальной корреляции для по меньшей мере двух звуковых каналов первого набора звуковых сигналов на по меньшей мере один параметр.

Согласно необязательному признаку изобретения, устройство дополнительно содержит средство для генерирования частотно-временных фрагментов; и в котором средство оценки выполнено с возможностью генерирования оцененных параметрических данных для частотно-временных фрагментов.

Это облегчает работу и/или повышает качество. В частности, это может предоставлять облегченное и/или улучшенное отображение между параметрами, извлеченными из первого сигнала, и оцененными параметрическими данными.

Согласно необязательному признаку изобретения, средство оценки содержит средство для прямого отображения набора по меньшей мере одной характеристики сигнала первого набора звуковых каналов для частотно-временного фрагмента на значение параметрических данных для второго набора звуковых каналов.

Это может предоставлять эффективную реализацию и оценку параметрических данных, которые могут обеспечивать особенно высокое качество декодированного звука. Отображение может, например, выполняться посредством использования таблицы соответствия или посредством вычисления математической функции. Таким образом, применяется прямая зависимость между набором характеристик сигнала и соответствующими значениями оцененных параметрических данных. Характеристиками сигнала могут быть межканальная разность уровней и/или коэффициент межканальной корреляции для двух каналов первого набора звуковых каналов, и они могут непосредственно отображаться, например, на коэффициенты предсказания и/или коэффициенты межканальной корреляции и/или межканальной разности уровней для второго набора звуковых каналов.

Согласно необязательному признаку изобретения, декодер пространственного звука выполнен с возможностью выполнения по меньшей мере одной матричной операции, используя параметры, определенные в ответ на оцененные параметрические данные.

Это может предоставлять высокие рабочие характеристики. В частности, это может предоставлять подходящую реализацию с высоким качеством декодирования.

Согласно необязательному признаку изобретения, декодер дополнительно содержит средство для извлечения параметрических данных для второго сигнала, и декодер пространственного звука выполнен с возможностью декодирования второго сигнала в ответ на извлеченные параметрические данные.

Декодер может быть выполнен с возможностью обработки как КПЗ-кодированных сигналов, так и не-КПЗ-кодированных сигналов, используя один и тот же кодер пространственного звука. Для КПЗ-кодированных сигналов могут использоваться извлеченные данные, тогда как для не-КПЗ-кодированных сигналов могут использоваться оцененные параметрические данные. Изобретение может обеспечивать улучшенную применимость и/или обратную совместимость. Устройство может быть выполнено с возможностью декодирования первого сигнала в ответ на извлеченные параметрические данные, таким образом позволяя применять корреляцию между первым и вторым сигналом.

Согласно необязательному признаку изобретения, декодер дополнительно содержит средство для выбора режима декодирования в ответ на характеристику первого сигнала.

Декодер, например, может быть выполнен с возможностью работы в первом режиме, при котором оцениваются параметрические данные КПЗ, и во втором режиме, при котором параметрические данные КПЗ извлекаются из принятого сигнала, и может быть выполнен с возможностью выбора между первым и вторым режимом в ответ на то, содержит ли первый сигнал данные КПЗ или нет. Таким образом, может достигаться в высокой степени гибкий декодер, способный обрабатывать многочисленные различные типы сигналов.

Согласно необязательному признаку изобретения, первый набор звуковых каналов состоит из двух звуковых каналов.

Изобретение может предоставить улучшенное декодирование многоканальных сигналов, преобразованных понижающим микшированием до стереосигнала.

Согласно необязательному признаку изобретения, первый сигнал представляет собой матрично-кодированный сигнал объемного звука.

Изобретение может предоставить особенно улучшенное декодирование многоканальных сигналов, преобразованных с понижающим микшированием до матрично-кодированного сигнала объемного звука. В частности, эксперименты показали, что очень точные данные КПЗ могут быть оценены для матрично-кодированных сигналов объемного звука, основываясь на стереоканалах сигнала.

Согласно необязательному признаку изобретения, декодер дополнительно содержит обратную матрицу матричного объема и средство для определения по меньшей мере одного коэффициента обратной матрицы матричного объема в ответ на оцененные параметрические данные.

Это может предоставить улучшенное качество декодированного звука для матрично-кодированного объемного сигнала.

Согласно другому аспекту изобретения, обеспечивается способ генерирования многоканального звукового сигнала, причем способ содержит: прием первого сигнала, содержащего первый набор звуковых каналов; генерирование оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодирование декодером пространственного звука первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается продукт компьютерной программы для исполнения способа.

Согласно другому аспекту изобретения, обеспечивается приемник для генерирования многоканального звукового сигнала, причем приемник содержит: средство для приема первого сигнала, содержащего первый набор звуковых каналов; средство оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодер пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается система передачи, включающая в себя: кодер для генерирования первого сигнала, содержащего первый набор звуковых каналов, посредством кодирования многоканального сигнала; передатчик для передачи первого сигнала; средство для приема первого сигнала; средство оценки для генерирования оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодер пространственного звука для декодирования первого сигнала в ответ на оцененные параметрические данные для генерирования декодированного многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается способ передачи и приема звукового сигнала, причем способ содержит: генерирование первого сигнала, содержащего первый набор звуковых каналов, посредством кодирования многоканального сигнала; передачу первого сигнала; прием первого сигнала; генерирование оцененных параметрических данных для второго набора звуковых каналов в ответ на характеристики первого набора звуковых каналов; причем оцененные параметрические данные связывают характеристики второго набора звуковых каналов с характеристиками первого набора звуковых каналов; и декодирование декодером пространственного звука первого сигнала в ответ на оцененные параметрические данные для генерирования декодированного многоканального звукового сигнала, содержащего второй набор каналов.

Согласно другому аспекту изобретения, обеспечивается устройство проигрывания звука, содержащее декодер, как описано выше.

Эти и другие аспекты, признаки и преимущества изобретения очевидны из варианта(ов) осуществления, описанного ниже в данном документе, и объясняются со ссылкой на него (них).

Описываются варианты осуществления изобретения, только в качестве примера, со ссылкой на чертежи, на которых

фиг.1 иллюстрирует систему передачи для передачи звукового сигнала согласно некоторым вариантам осуществления изобретения;

фиг.2 иллюстрирует блок-схему типового КПЗ-кодера;

фиг.3 иллюстрирует пример типового КПЗ-декодера;

фиг.4 иллюстрирует декодер согласно некоторым вариантам осуществления изобретения;

фиг.5 иллюстрирует элементы декодера согласно некоторым вариантам осуществления изобретения; и

фиг.6 иллюстрирует способ генерирования многоканального звукового сигнала согласно некоторым вариантам осуществления изобретения.

Нижеследующее описание сосредотачивает внимание на вариантах осуществления изобретения, применимых для декодирования матрицированных сигналов объемного звука, преобразованных понижающим микшированием до стереосигналов. Однако понятно, что изобретение не ограничивается этим применением, но может применяться ко многим другим сигналам.

Фиг.1 иллюстрирует систему 100 передачи для передачи звукового сигнала согласно некоторым вариантам осуществления изобретения. Система 100 передачи содержит передатчик 101, который соединен с приемником 103 посредством сети 105, которой, конкретно, может быть Интернет.

В конкретном примере передатчик 101 представляет собой записывающее сигнал устройство, и приемник представляет собой устройство 103 проигрывателя сигнала, но понятно, что в других вариантах осуществления передатчик и приемник могут использоваться в других применениях и для других целей. Например, передатчик 101 и/или приемник 103 могут быть частью функциональной возможности транскодирования и могут, например, обеспечивать сопряжение с другими источниками или получателями сигналов.

В конкретном примере, где поддерживается функция записи сигнала, передатчик 101 содержит цифровой преобразователь 107, который принимает аналоговый сигнал, который преобразуется в цифровой сигнал импульсно-кодовой модуляции (ИКМ) посредством дискретизации и аналого-цифрового преобразования. Аналоговым сигналом, конкретно, является многоканальный сигнал объемного звука по стандарту 5.1.

Передатчик 101 соединен с кодером 109 на фиг.1, который кодирует сигнал ИКМ в соответствии с алгоритмом кодирования. Конкретно, кодером является матричный кодер, который генерирует стереосигнал с понижающим микшированием, используя матричную операцию по уравнению 1. Таким образом, кодированный сигнал представляет собой матрично-кодированный сигнал объемного звука.

Кодер 100 соединен с сетевым передатчиком 111, который принимает кодированный сигнал и выполняет сопряжение с Интернетом 105. Сетевой передатчик может передавать кодированный сигнал на приемник 103 по Интернету 105.

Приемник 103 содержит сетевой приемник 113, который выполняет сопряжение с Интернетом 105 и который предназначен для приема кодированного сигнала от передатчика 101.

Сетевой приемник 111 соединен с декодером 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования.

В конкретном примере, где поддерживается функция проигрывания сигнала, приемник 103 дополнительно содержит проигрыватель 117 сигнала, который принимает декодированный звуковой сигнал от декодера 115 и представляет его пользователю. Конкретно, проигрыватель 113 сигнала может содержать цифроаналоговый преобразователь, усилители и громкоговорители, необходимые для вывода декодированного звукового сигнала.

В описанном варианте осуществления изобретения алгоритм декодирования, используемый декодером 115, содержит элемент КПЗ-декодирования. Для ясности сначала будет описан принцип действия типового КПЗ-кодера.

Фиг.2 иллюстрирует блок-схему типового КПЗ-кодера 200. Кодер 200 разделяет поступающие сигналы в отдельные частотно-временные фрагменты посредством банка 201 квадратурных зеркальных фильтров (КЗФ). Эти частотно-временные фрагменты, в основном, упоминаются как «диапазоны параметров».

Для каждого диапазона параметров элемент 203 КПЗ-кодирования определяет ряд пространственных параметров, которые описывают свойства пространственного изображения, например, межканальные разности уровней и коэффициенты взаимной корреляции. Кроме извлечения параметров, элемент 203 КПЗ-кодирования также генерирует монофонический или стереофонический сигнал понижающего микширования из многоканального входного сигнала. Посредством банков 205 синтеза КЗФ эти сигналы переносятся во временную область. Результирующий сигнал понижающего микширования подается на процессор 207 битового потока, который генерирует битовый поток, содержащий каналы понижающего микширования и параметрические данные, сгенерированные элементом 203 КПЗ-кодирования. Предпочтительно, что сигнал понижающего микширования также кодируется перед передачей (используя обычный монофонический или стереофонический «базовый» кодер), тогда как битовые потоки базового кодера и пространственные параметры, предпочтительно, объединяются (мультиплексируются) в единственный выходной битовый поток.

В зависимости от режима работы эта скорость передачи данных параметрических данных может охватывать широкий диапазон скоростей передачи битов от нескольких кбит/с для многоканального звука хорошего качества до десятков кбит/с для почти прозрачного качества.

Кроме того, в случае стереофонического сигнала понижающего микширования пользователь имеет выбор из обычного стереосигнала понижающего микширования или сигнала понижающего микширования, который совместим с системами матрицированного объема. В последнем случае кодер 200 может генерировать совместимый с матрицированным объемом сигнал понижающего микширования, используя подход матрицирования по уравнению 1. Альтернативно, он может генерировать совместимый с матрицированным объемом сигнал понижающего микширования, используя блок постобработки понижающего микширования, работающий с обычным стереосигналом понижающего микширования. В такой конфигурации кодер может содержать постпроцессор матрицированного объема, который модифицирует обычный стереосигнал понижающего микширования, делая его совместимым с матрично-объемным звуком, используя пространственные параметры, извлеченные этапом оценки параметров. Преимущество такого подхода заключается в том, что обработка матрицированного объема может быть полностью изменена на обратную декодером, имеющим доступные пространственные параметры.

КПЗ-декодер, в принципе, выполняет процесс, обратный кодеру. Фиг.3 иллюстрирует пример типового КПЗ-декодера. КПЗ-декодер 300 содержит разделитель 301, который принимает битовый поток и разделяет его на сигнал понижающего микширования и параметрические данные. Впоследствии, декодированный сигнал понижающего микширования обрабатывается банком 303 анализа КЗФ, приводя к диапазонам параметров, которые являются такими же, что и диапазоны, примененные в КПЗ-кодере 200. Каскад 305 пространственного синтеза восстанавливает многоканальный сигнал, используя параметрические данные, извлеченные разделителем 301. Наконец, сигналы КЗФ-области пересылаются во временную область посредством банка 307 синтеза КЗФ, приводя к окончательным многоканальным выходным сигналам.

Таким образом, в системах, где как кодеры, так и декодеры содержат функциональную возможность КПЗ, может достигаться высокое качество декодированных многоканальных сигналов для относительно низкой скорости передачи данных. Однако, так как многие уже развернутые системы и большинство звукового материала не используют функциональную возможность КПЗ, преимущества обычно ограничиваются новыми системами и повторно кодированным звуковым материалом.

В примере по фиг.1 декодер 115 содержит функциональную возможность КПЗ-декодирования, которая может использоваться с не-КПЗ-кодерами и не-КПЗ-кодированным материалом. Декодер 115, таким образом, может вносить некоторые преимущества КПЗ, не требуя перекодирования или совместимых с КПЗ кодеров, и может, в частности, обеспечивать существенно улучшенное отношение качества к скорости передачи данных для многоканальных сигналов.

Фиг.4 более подробно иллюстрирует декодер 115 по фиг.1. Декодер 115 содержит приемник 401, который принимает сигнал, содержащий набор звуковых каналов. В частности, приемник принимает битовый поток, содержащий два канала, которые были сгенерированы матричным кодированием сигнала объемного звука кодером 109. Приемник 401 принимает битовый поток и генерирует два канала y₁, y₂ стереосигнала понижающего микширования. Отмечается, что в конкретном примере кодер 109 представляет собой обычный матричный кодер для объемного сигнала, генерирующий битовый поток, содержащий только два канала понижающего микширования. Таким образом, в примере битовый поток не содержит параметрических данных пространственного звука. В других вариантах осуществления кодер 109 может, например, представлять собой КПЗ-кодер, генерирующий стереосигнал, совместимый с матричным объемом, без параметрических данных КПЗ.

Декодер 115 дополнительно содержит элемент 403 КПЗ-декодирования, подсоединенный к приемнику 401. Элемент 403 КПЗ-декодирования декодирует стереоканалы y₁, y₂ понижающего микширования, используя методы КПЗ, описанные ранее. Конкретно, принцип действия элемента 403 КПЗ-декодирования соответствует принципу действия, описанному для КПЗ-декодера 300 по фиг.3. Элемент 403 КПЗ-декодирования, таким образом, генерирует выходной сигнал объемного звука, соответствующий окружающему сигналу, который был матрично-кодирован кодером 109.

Как ранее описано, стереоканалы понижающего микширования могли кодироваться матричным кодером, как описано в уравнении 1. Альтернативно, каналы понижающего микширования могли генерироваться КПЗ-кодером 203, включающим в себя блок постобработки для генерирования совместимого с матричным объемом сигнала понижающего микширования. В обоих случаях элемент 403 КПЗ-декодирования может включать в себя блок предварительной обработки, который меняет на обратные операции, примененные кодером для совместимости с матричным объемом.

Декодер 115 дополнительно содержит процессор 405 оценки, который подсоединен к приемнику 401 и элементу 403 КПЗ-декодирования. Процессор 405 оценки выполнен с возможностью генерирования оцененных параметрических данных, которые могут использоваться для генерирования выходных окружающих сигналов. Конкретно, процессор 405 оценки оценивает параметрические данные, которые КПЗ-кодер сгенерировал бы для каналов понижающего микширования, если бы было выполнено КПЗ-кодирование. Таким образом, оцененные параметрические данные связывают характеристики выходных окружающих каналов с характеристиками принятых каналов понижающего микширования, так как они предоставляют информацию о том, как они могут декодироваться для генерирования выходных окружающих каналов.

В примере на фиг.4 процессор 405 оценки генерирует оцененные параметрические данные, так что они соответствуют данным КПЗ, которые элемент 403 КПЗ-декодирования может непосредственно использовать для определения выходных объемных каналов.

Таким образом, декодер 115 использует принципы КПЗ для декодирования матрично-кодированного материала объемного звука. Процессор 405 оценки использует сигнальные контрольные метки принятого входного стереосигнала для определения данных, которые используются элементом 403 КПЗ-декодирования. Конкретно, процессор 405 оценки оценивает межканальные контрольные метки принятого стереосигнала и отображает их на контрольные метки КПЗ, которые могут использоваться непосредственно элементом 403 КПЗ-декодирования. Это может, конкретно, сделать возможным, чтобы элемент 403 КПЗ-декодирования был обычным КПЗ-декодером, таким образом, способствуя обратной совместимости, снижая конструктивные требования и требования к разработке и позволяя, чтобы одна и та же функциональная возможность использовалась для декодирования КПЗ-кодированных сигналов и не-КПЗ-кодированных сигналов. Таким образом, в примере, необходимые параметры КПЗ генерируются на стороне декодера, используя параметры, полученные посредством анализа принятого двухканального сигнала понижающего микширования.

Процессор 405 оценки содержит процессор 407 анализа, который определяет один или несколько параметров для стереосигнала понижающего микширования. Конкретно, процессор 407 анализа генерирует значения межканальной разности уровней (МРУ) и значения коэффициента межканальной корреляции (КМК) для стереоканалов y₁, y₂ понижающего микширования.

Процессор 407 анализа соединен с процессором 409 отображения, который отображает значения МРУ и КМК в значения КПЗ, относящиеся к выходным каналам.

Процессор 409 отображения, в частности, использует ранее неизвестный и неожиданный факт, что обычно существует сильная корреляция между значениями МРУ и КМК для матрично-кодированного объемного сигнала и параметров пространственного звука для исходных каналов объемного звука.

Процессор 409 отображения может просто использовать таблицу соответствия для определения значений параметров КПЗ для выходных окружающих каналов относительно стереоканалов y₁, y₂ понижающего микширования. Определенные значения МРУ и КМК или их представители, например, после квантования, могут использоваться в качестве адреса для просмотра таблицы. Эквивалентно, процессор 409 отображения может оценивать предварительно определенную функцию, имеющую значения МРУ и КМК в качестве входных параметров и предоставляющую нео

Генерирование многоканальных звуковых сигналов

Патент 2417458