Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука
Иллюстрации
Показать всеИзобретение относится к квантованию пространственных параметров звука. Квантование параметров, являющихся мерой, характеризующей канал или пару каналов, причем параметр представляет собой меру, характеризующую канал или пару каналов относительно другого канала многоканального сигнала, может быть выполнено более эффективно с использованием правила квантования, генерация которого осуществляется на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала. При генерации правила квантования, учитывающего психоакустический подход, объем закодированного представления многоканального сигнала может быть уменьшен за счет более грубого квантования без существенного нарушения качества восприятия многоканального сигнала, восстановленного из закодированного представления. Технический результат - обеспечение более эффективного сжатия без существенного ухудшения качества восприятия звукового сигнала. 18. н. и 29 з.п. ф-лы, 18 ил.
Реферат
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к квантованию пространственных параметров звука и, в частности, к концепции, обеспечивающей возможность более эффективного сжатия без существенного ухудшения качества восприятия звукового сигнала, восстановленного с использованием квантованных пространственных параметров звука.
УРОВЕНЬ ТЕХНИКИ
В последнее время способы многоканального воспроизведения звука становятся все более и более важными. Учитывая необходимость обеспечения эффективной передачи многоканальных звуковых сигналов, имеющих пять или большее количество раздельных звуковых каналов, было разработано несколько способов сжатия стереофонического или многоканального сигнала. В современных подходах к решению проблемы параметрического кодирования многоканальных звуковых сигналов (параметрическое стерео (PS), "бинауральное кодирование сигнала" ("Binaural Cue Coding" (BCC)) и т.д.) многоканальный звуковой сигнал представляют посредством смикшированного (down-mix) сигнала (который может представлять собой монофонический сигнал или содержать несколько каналов) и дополнительной параметрической информации, также именуемой "пространственными сигналами" ("spatial cues"), которая характеризует стадию ее пространственного звукового восприятия.
Устройство многоканального кодирования обычно принимает в качестве входного сигнала, по меньшей мере, два канала и осуществляет вывод одного или большего количества каналов несущей частоты и параметрических данных. Параметрические данные получены таким образом, что в устройстве декодирования может быть вычислено приближенное значение исходного многоканального сигнала. Канал (каналы) несущей частоты обычно содержит (содержат) выборки из поддиапазона частот, спектральные коэффициенты, выборки, произведенные во временной области, и т.д., которые обеспечивают сравнительно точное представление исходного сигнала, а параметрические данные не содержат такие выборки спектральных коэффициентов, но вместо этого содержат параметры управления для управления определенным алгоритмом восстановления. Такое восстановление может содержать умножение на весовой коэффициент, сдвиг по времени, сдвиг по частоте, сдвиг по фазе и т.д. Таким образом, параметрические данные содержат только сравнительно грубое представление сигнала или связанного с ним канала.
Способ "бинаурального кодирования сигнала" ("binaural cue coding" (BCC)) описан в нескольких публикациях, таких как публикация "Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, AES convention paper 5574, May 2002, Munich, в двух публикациях Международной конференции по акустике и обработке речи и сигналов (ICASSP): "Estimation of auditory spatial cues for binaural cue coding" и "Binaural cue coding: a normal and efficient representation of spatial audio", Orlando, FL, May 2002, авторами обеих из которых являются C. Faller и F. Baumgarte.
При кодировании способом BCC несколько входных звуковых каналов преобразовывают в их спектральное представление с использованием преобразования на основе дискретного преобразования Фурье (ДПФ) с перекрывающимися окнами. Результирующий равномерный спектр затем разделяют на неперекрывающиеся части. Каждая часть имеет ширину полосы частот, пропорциональную эквивалентной прямоугольной ширине полосы частот (ERB). Затем производят оценку пространственных параметров, именуемых ICLD (разность между каналами по уровню) и ICTD (разность между каналами по времени) для каждой части. Параметр ICLD описывает разность уровней между двумя каналами, а параметр ICTD описывает разность по времени (сдвиг фазы) между двумя сигналами различных каналов. Разности уровней и разности по времени обычно являются заданными для каждого канала относительно опорного канала. После вычисления этих параметров эти параметры квантуют и, наконец, кодируют для передачи.
Несмотря на то что параметры ICTD и ICLD представляют собой наиболее важные параметры локализации источника звука, пространственное представление с использованием этих параметров может быть усовершенствовано путем введения дополнительных параметров.
Родственный способ, именуемый "параметрическое стерео", описывает параметрическое кодирование двухканального стереофонического сигнала на основании переданного монофонического сигнала плюс дополнительной информации о параметре. В этом способе введены пространственные параметры трех типов, именуемые "разностью интенсивности между каналами" (IIDs), "разностями между каналами по фазе" (IPDs) и "когерентность между каналами" (IC). Расширение пространственного параметра, заданного параметром когерентности (параметром корреляции), обеспечивает возможность параметризации пространственной "расплывчатости" или пространственной "компактности" звукозаписи при восприятии. Более подробное описание параметрического стерео приведено в следующих публикациях: в публикации "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, страницы 1305-1322", в публикации "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116 th Convention, Preprint 6072, Berlin, May 2004 и в публикации "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116 th Convention, Preprint 6073, Berlin, May 2004.
В международной публикации заявки на изобретение WO 2004/008805 A1 изложено то, каким образом может быть осуществлено целесообразное сжатие многоканального звукового сигнала путем объединения нескольких модулей параметрического стерео, обеспечивая таким образом реализацию иерархической структуры для получения представления исходного многоканального звукового сигнала, содержащего смикшированный сигнал и дополнительную параметрическую информацию.
В подходе, основанном на BCC и параметрическом стерео (PS), представление разностей уровней (также именуемых разностями интенсивности (ICLD) или разностями энергии (IID)) между звуковыми каналами является существенной частью параметрического представления стереофонического/многоканального звукового сигнала. Такую информацию и иные пространственные параметры передают из устройства кодирования в устройство декодирования для каждого временного/частотного интервала. Следовательно, с точки зрения эффективности кодирования большой интерес вызывает представление этих параметров в настолько более сжатом виде, насколько это возможно при сохранении качества звука.
При кодировании способом BCC разности уровней представлены относительно так называемого "опорного канала" и их квантование осуществляют на равномерной шкале, выраженной в единицах децибел (дБ), относительно опорного канала. Это не обеспечивает оптимальное использование того факта, что каналы с низким уровнем сигнала относительно опорного канала подвергаются существенному эффекту маскирования при их прослушивании людьми-слушателями. В предельном случае наличия канала, вообще не имеющего никакого сигнала, ширина полосы частот, используемая параметрами, описывающими этот конкретный канал, расходуется совершенно бесполезно. В более общем случае, когда один канал является намного более слабым, чем другой канал, то есть, когда во время воспроизведения слушатель может почти не слышать слабый канал, менее точное воспроизведение слабого канала также привело бы к тому же самому качеству восприятия слушателем, поскольку слабый сигнал является, в основном, замаскированным более сильным сигналом.
Для объяснения ситуации и проблем, возникающих при кодировании многоканального сигнала, приведена ссылка на Фиг. 10А, на которой проиллюстрирован обычно используемый 5-канальный сигнал. 5-Канальная конфигурация содержит левый тыловой канал 101 (A, имеющий сигнал a(t)), левый передний канал 102 (B, имеющий сигнал b(t)), центральный канал 103 (C, имеющий сигнал c(t)), правый передний канал 104 (D, имеющий сигнал d(t)) и правый тыловой канал 105 (E, имеющий сигнал e(t)). Соотношения интенсивности между одиночными каналами или парами каналов отмечены стрелками. Следовательно, распределение интенсивности левым передним каналом 102 и правым передним каналом 104 обозначено как r1 (110), распределение интенсивности между левым тыловым каналом и правым тыловым каналом обозначено как r4 (112). Распределение интенсивности между комбинацией каналов, состоящей из левого переднего канала 102, правого переднего канала 104 и центрального канала 103, обозначено как r2 (114), а распределение интенсивности между комбинацией тыловых каналов и комбинацией передних каналов обозначено как r3 (116). Когда, например, записан простой монолог, то большая часть энергии содержится в центральном канале 103. В этом примере в особенности тыловые каналы содержат всего лишь незначительную (или нулевую (0)) энергию. Следовательно, в этом примере имеет место просто непроизводительное расходование параметров, описывающих свойства тыловых каналов, поскольку во время воспроизведения активными будут в основном центральный канал 102 или передние каналы.
В следующем абзаце приведено описание способов вычисления распределения энергии между каналами или комбинациями каналов на основании Фиг. 10А.
На Фиг. 10А проиллюстрирована многоканальная параметризация для пятиканальной акустической системы, в которой различные звуковые каналы обозначены номерами позиций со 101 по 105; a(t) 101 представляет собой сигнал левого канала объемного звучания, b(t) 102 представляет собой сигнал левого переднего канала, c(t) 103 представляет собой сигнал центрального канала, d(t) 104 представляет собой сигнал правого переднего канала, e(t) 105 представляет собой сигнал правого канала объемного звучания. Акустическая система разделена на переднюю часть и тыловую часть. Распределение энергии между всеми передними каналами (102, 103 и 104) акустической системы и тыловыми каналами (101 и 105) проиллюстрировано на Фиг. 10А стрелками и обозначено параметром r3. Распределение энергии между центральным каналом 103, левым передним каналом 102 и правым передним каналом 103 обозначено как r2. Распределение энергии между левым каналом 101 объемного звучания и правым каналом 105 объемного звучания проиллюстрировано как r4. Наконец, распределение энергии между левым передним каналом 102 и правым передним каналом 104 задано параметром r1. Поскольку параметры r1-r4 представляют собой параметризации различных областей, то также понятно, что помимо распределения энергии также могут быть параметризованы и другие существенные свойства зоны, например корреляция между зонами. Кроме того, для каждого параметра r1-r4 может быть вычислена локальная энергия. Например, локальная энергия r4 равна суммарной энергии канала A 101 и канала E 105.
где E[.] - ожидаемое значение, определяемое следующим выражением:
.
На Фиг. 10Б показано устройство декодирования многоканального звука, построенное путем иерархического упорядочения модулей параметрического стерео, например, так, как описано в публикации международной заявки WO 2004/008805 A1. Звуковые каналы 101-105, представленные на Фиг. 10А, здесь воспроизводят поэтапно из одиночного монофонического смикшированного сигнала 120 (M) и соответствующей дополнительной информации посредством первого устройства 122 двухканального декодирования, второго устройства 124 двухканального декодирования, третьего устройства 126 двухканального декодирования и четвертого устройства 128 двухканального декодирования. Как видно из чертежа, в древовидной структуре, показанной на Фиг. 10Б, первое устройство двухканального декодирования разлагает монофонический смикшированный сигнал 120 на два сигнала, которые подают во второе и в третье устройства 124 и 126 двухканального декодирования. При этом канал, подаваемый в третье устройство 126 двухканального декодирования, представляет собой объединенный канал, который получен путем объединения левого тылового канала 101 и правого тылового канала 105. Канал, подаваемый во второе устройство 124 двухканального декодирования, представляет собой объединение центрального канала 103 и объединенного канала, который снова представляет собой объединение левого переднего канала 102 и правого переднего канала 104.
Таким образом, после второго этапа иерархического декодирования оказываются восстановленными следующие каналы: левый тыловой канал 101, правый тыловой канал 105, центральный канал 103 и объединенный канал, являющийся объединением левого переднего канала 102 и переднего правого канала 104, с использованием переданных пространственных параметров, содержащих параметр уровня для его использования каждым из устройств 122, 124 и 126 двухканального декодирования.
На третьем этапе иерархического декодирования четвертое устройство 128 двухканального декодирования получает левый передний канал 102 и правый передний канал 104 с использованием информации об уровне, переданной в качестве дополнительной информации для четвертого устройства 128 двухканального декодирования. При использовании устройства иерархического декодирования из известного уровня техники, которое показано на Фиг. 10Б, желательная энергия для каждого одиночного выходного канала является следствием наличия многих различных модулей параметрического стерео между входным сигналом и каждым из выходных сигналов. Другими словами, энергия конкретного выходного канала может зависеть от параметров IID/ICLD множества модулей параметрического стерео. В такой древовидной структуре из соединенных друг с другом модулей параметрического стерео также может быть применено неравномерное квантование параметров IID в каждом модуле параметрического стерео для создания значений IID, которые затем используются устройством декодирования в качестве части дополнительной информации. Это обеспечило бы использование преимуществ неоднородного квантования IID в локальном масштабе (то есть отдельно в каждом модуле параметрического стерео), но, тем не менее, субоптимально, поскольку квантование в каждом модуле (в "листах" древовидной структуры) выполняют независимо от энергий/уровня других звуковых каналов, которые могут иметь высокий относительный уровень и, следовательно, создавать маскирование.
Это возможно потому, что модули, являющиеся "листьями" древовидной структуры, не имеют сведений о глобальном распределении уровней на более высоком уровне древовидной структуры (например, в "корневом" модуле). Каждый лист древовидной структуры имеет свой собственный соответствующий параметр IID/ICLD, который указывает распределение энергии от его входа до выходных каналов. Например, параметр IID/ICLD листа "r3" древовидной структуры (обработку которого производит первое устройство 122 двухканального декодирования) может указывать, что 90% поступающей энергии должно быть передано в лист r2 древовидной структуры, а остальная энергия (10%) должна быть передана в лист r4 древовидной структуры. Этот процесс повторяют для каждого листа в древовидной структуре. Так как каждый параметр распределения энергии представлен с ограниченной точностью, то отклонение между желательной и фактической энергией для каждого выходного канала от А до E зависит от погрешностей квантования в параметрах IID/ICLD, а также от распределения энергии (и, следовательно, от распространения погрешностей квантования). Другими словами, поскольку для параметра определенного типа, например для ICC (корреляция/когерентность между каналами) или IID, ту же самую таблицу квантования используют на всех стадиях параметризации с r1 по r4, то квантование IID/ICLD выполнено оптимальным образом только лишь на локальном уровне. Это означает, что в реализациях из предшествующего уровня техники для каждой стадии параметризации с r1 по r4 погрешность выходной энергии для (локальных) выходных каналов является максимальной для самого слабого выходного канала.
Как подробно изложено в предыдущих абзацах, квантование параметров уровня (IID или ICLD) или иных параметров, например ICC, разностей по фазе или разностей по времени, описывающих пространственное восприятие многоканального звукового сигнала, по-прежнему является субоптимальным, так как ширина полосы частот может непроизводительно расходоваться для пространственных параметров, описывающих те каналы, которые в основном являются замаскированными вследствие низкой энергии в канале.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Задачей настоящего изобретения является создание усовершенствованной концепции для квантования пространственных параметров многоканального звукового сигнала.
Согласно первому объекту настоящего изобретения эта задача достигнута посредством устройства квантования параметра, предназначенного для квантования входного параметра, причем входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, которое содержит: генератор правила квантования, предназначенный для генерации правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство квантования значения, предназначенное для получения квантованного параметра из входного параметра с использованием сгенерированного правила квантования.
Согласно второму объекту настоящего изобретения эта задача достигнута посредством устройства обращения квантования параметра, предназначенного для обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, которое содержит: генератор правила обращения квантования, предназначенный для генерации правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство обращения квантования значения, предназначенное для получения параметра из квантованного параметра с использованием сгенерированного правила обращения квантования.
Согласно третьему объекту настоящего изобретения эта задача достигнута посредством способа квантования входного параметра, при этом входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а способ содержит следующие операции: осуществляют генерацию правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают квантованный параметр из входного параметра с использованием сгенерированного правила квантования.
Согласно четвертому объекту настоящего изобретения эта задача достигнута посредством способа обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а способ содержит следующие операции: осуществляют генерацию правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают параметр из квантованного параметра с использованием сгенерированного правила обращения квантования.
Согласно пятому объекту настоящего изобретения эта задача достигнута посредством представления многоканального сигнала, имеющего квантованный параметр, представляющий собой квантованное представление параметра, являющегося мерой, характеризующей одиночный канал или пару каналов, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а квантованный параметр получен с использованием правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала.
Согласно шестому объекту настоящего изобретения эта задача достигнута посредством считываемого компьютером носителя информации, содержащего запомненное на нем вышеописанное представление многоканального сигнала.
Согласно седьмому объекту настоящего изобретения эта задача достигнута посредством передатчика или устройства записи звука, снабженного устройством квантования параметра, предназначенным для квантования входного параметра, при этом входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, которое содержит: генератор правила квантования, предназначенный для генерации правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство квантования значения, предназначенное для получения квантованного параметра из входного параметра с использованием сгенерированного правила квантования.
Согласно восьмому объекту настоящего изобретения эта задача достигнута посредством приемника или проигрывателя звукозаписей, снабженного устройством обращения квантования параметра, предназначенным для обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, который содержит: генератор правила обращения квантования, предназначенный для генерации правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство обращения квантования значения, предназначенное для получения параметра из квантованного параметра с использованием сгенерированного правила обращения квантования.
Согласно девятому объекту настоящего изобретения эта задача достигнута посредством способа передачи или записи звука, причем этот способ содержит способ квантования входного параметра, при этом входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, и этот способ содержит следующие операции: осуществляют генерацию правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают квантованный параметр из входного параметра с использованием сгенерированного правила квантования.
Согласно десятому объекту настоящего изобретения эта задача достигнута посредством способа приема или воспроизведения звука, причем этот способ содержит способ обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а способ содержит следующие операции: осуществляют генерацию правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают параметр из квантованного параметра с использованием сгенерированного правила обращения квантования.
Согласно одиннадцатому объекту настоящего изобретения эта задача достигнута посредством системы передачи, содержащей передатчик и приемник, причем передатчик снабжен устройством квантования параметра, предназначенным для квантования входного параметра; а приемник снабжен устройством обращения квантования параметра, предназначенным для обращения квантования квантованного параметра.
Согласно двенадцатому объекту настоящего изобретения эта задача достигнута посредством способа передачи и приема, причем этот способ содержит способ передачи, включающий в себя способ квантования входного параметра; и содержит способ приема, включающий в себя способ обращения квантования квантованного параметра.
Согласно тринадцатому объекту настоящего изобретения эта задача достигнута посредством компьютерной программы, предназначенной для выполнения одного из вышеупомянутых способов при ее исполнении в компьютере.
Настоящее изобретение основано на том установленном факте, что квантование параметров, являющихся мерой, характеризующей одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, может быть произведено более эффективно с использованием правила квантования, генерация которого осуществлена на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала.
Основное преимущество идеи изобретения состоит в том, что генерацию правила квантования или выбор надлежащего правила квантования из группы имеющихся правил квантования осуществляют в зависимости от энергии сигнала, подлежащего описанию. Следовательно, для устройства квантования при кодировании или для устройства обращения квантования при декодировании может быть применена психоакустическая модель для того, чтобы использовать правило квантования, приспособленное к потребностям реального сигнала. В особенности в тех случаях, когда канал содержит очень малую величину энергии по сравнению с другими каналами в многоканальном сигнале, квантование может быть намного более грубым, чем для сигналов, имеющих высокие значения энергии. Это обусловлено тем, что при воспроизведении сигналы с высокой энергией маскируют сигналы с низкой энергией, то есть слушатель почти не распознает какие-либо детали сигнала с низкой энергией, и, таким образом, сигнал с низкой энергией может быть еще более ухудшен за счет грубого квантования, при этом слушатель не способен распознать искажение вследствие высокой степени маскирования сигнала с низкой энергией.
В одном из вариантов осуществления настоящего изобретения устройство квантования параметра, предназначенное для квантования параметров, содержит генератор правила квантования, предназначенный для генерации правила квантования, и устройство квантования значения, предназначенное для получения квантованных параметров из входных параметров с использованием сгенерированного правила квантования. Для генерации надлежащего правила квантования устройство выбора, имеющееся в устройстве квантования, принимает в качестве входных данных полную энергию многоканального звукового сигнала, подлежащего кодированию, и локальную энергию канала или пары каналов, пространственные параметры которых подлежат квантованию. Зная полную энергию и локальную энергию, устройство выбора, имеющееся в устройстве квантования, может принять решение о том, какое правило квантования следует использовать, то есть выбрать правила более грубого квантования для каналов или пар каналов, имеющих сравнительно низкую локальную энергию. В качестве альтернативы, устройство выбора, имеющееся в устройстве квантования, также может получать алгоритмическое правило для видоизменения существующего правила квантования или вычислять совершенно новое правило квантования в зависимости от локальной и полной энергии. Например, одним из возможных вариантов является вычисление общего масштабного коэффициента, применяемого к сигналу до устройства линейного квантования или устройства нелинейного квантования для достижения целевой задачи, заключающейся в уменьшении объема дополнительной информации, подлежащей передаче.
В еще одном варианте осуществления настоящего изобретения многоканальный сигнал закодирован попарным способом, то есть с использованием иерархической структуры, имеющей несколько устройств микширования, сводящих 2 канала в один, которые упорядочены в виде древовидной структуры, при этом каждое устройство микширования осуществляет генерацию монофонического канала из двух каналов, подаваемых на вход устройства микширования. Согласно идее изобретения зависящее от энергии квантование может быть теперь реализовано не только в локальном масштабе, то есть в каждом устройстве микширования, сводящем 2 канала в один, который имеет только ту информацию, которая является доступной на входе устройства микширования, сводящего 2 канала в один, но и на основании сведений о сумме энергий сигнала в глобальном масштабе. Это значительно улучшает качество восприятия воспринимаемого сигнала.
Очевидно, что согласно идее изобретения объем дополнительной информации может быть уменьшен почти без воздействия на качество закодированного многоканального звукового сигнала.
В еще одном варианте осуществления настоящего изобретения устройство квантования параметра, предложенное в изобретении, включено в состав устройства кодирования параметра перед устройством дифференциального кодирования и устройством кодирования по алгоритму Хаффмана, оба из которых используют для дополнительного кодирования квантованных параметров для получения потока битов, описывающих параметр. Такое устройство кодирования, предложенное в настоящем изобретении, имеет большое преимущество, заключающееся в том, что в дополнение к уменьшению размера кодовых слов, необходимых для описания квантованных параметров, более грубое квантование автоматически увеличивает относительное количество идентичных кодовых слов, подаваемых в устройство дифференциального кодирования и в устройство кодирования Хаффмана, что обеспечивает возможность лучшего сжатия квантованных параметров, еще более уменьшая объем дополнительной информации.
В еще одном варианте осуществления настоящего изобретения устройство квантования параметра, предложенное в изобретении, содержит генератор коэффициентной функции для устройства квантования и умножитель параметра. Генератор коэффициентной функции для устройства квантования получает в качестве входных данных сведения о полной энергии и о локальной энергии и вычисляет, исходя из поданных на вход величин, одно значение для устройства масштабирования. На вход умножителя параметра поступают параметры и вычисленный коэффициент f для устройства квантования, предназначенный для деления параметров на этот коэффициент для устройства квантования перед передачей измененных параметров в устройство квантования, которое применяет к измененным параметрам установленное правило квантования.
В видоизмененном варианте этого варианта осуществления изобретения умножитель параметра расположен после устройства квантования и, следовательно, вычисленный коэффициент f для устройства квантования используют для деления результирующего индекса, полученного на выходе устройства квантования. Результат этой операции затем вновь должен быть округлен до целочисленного индекса.
Применение масштабного коэффициента для параметров имеет тот же самый эффект, как и выбор различных правил квантования, так как, например, деление на большой коэффициент сжимает пространство входного параметра таким образом, что действующей фактически является только лишь меньшая часть уже существующего правила квантования. Это решение имеет преимущество, заключающееся в том, что на стороне устройства декодирования и устройства кодирования может быть сэкономлен дополнительный объем памяти, поскольку необходимо производить запоминание или обработку только одного правила квантования, так как вычисление выполняют просто путем умножения, требующего всего лишь ограниченного дополнительного аппаратного или программного обеспечения. Дополнительное преимущество состоит в том, что при применении коэффициента для устройства квантования этот коэффициент для устройства квантования может быть получен с использованием любой возможной функциональной зависимости. Следовательно, вместо выбора заранее заданных правил квантования из заданного шаблона может производиться непрерывная регулировка чувствительности устройства квантования или устройства обращения квантования в пределах всего возможного пространства входного параметра.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Ниже приведено описание предпочтительных вариантов осуществления настоящего изобретения со ссылкой на сопроводительные чертежи, на которых изображено следующее:
на Фиг. 1 показана блок-схема устройства квантования параметра, которое предложено в настоящем изобретении;
на Фиг. 2A - Фиг. 2В показано несколько возможных правил квантования, подлежащих применению;
на Фиг. 3 показано устройство кодирования параметра, содержащее устройство квантования параметра, которое предложено в настоящем изобретении;
на Фиг. 4А и Фиг.4Б показан альтернативный вариант осуществления устройства кодирования параметра, содержащего устройство квантования параметра, которое предложено в настоящем изобретении;
на Фиг. 5 показаны примеры функций масштабного коэффициента;
на Фиг. 6 показано правило нелинейного квантования;
на Фиг. 7 показано устройство обращения квантования параметра, которое предложено в настоящем изобретении;
на Фиг. 8 показано устройство распаковки параметра, содержащее устройство обращения квантования параметра, которое предложено в настоящем изобретении;
на Фиг. 9А показан вариант осуществления устройства обращения квантования параметра, которое предложено в настоящем изобретении;
на Фиг. 9Б показан еще один вариант осуществления устройства обращения квантования параметра, которое предложено в настоящем изобретении;
на Фиг. 9В показан пример реализации обращения квантования в зависимости от энергии;
на Фиг. 9Г показан еще один пример реализации обращения квантования в зависимости от энергии;
на Фиг. 9Д показаны примеры квантования параметров и обращения квантования параметров;
на Фиг. 10А показано представление многоканального звукового сигнала с пятью каналами; и
на Фиг. 10Б показано устройство иерархического многоканального параметрического декодирования из известного уровня техники.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
На Фиг. 1 показано предложенное в изобретении устройство 199 квантования параметра, содержащее устройство 200 квантования и устройство 202 выбора для устройства квантования. Устройство 202 выбора для устройства квантования получает сведения о локальной энергии канала или пары каналов, лежащие в основе параметров, подлежащих кодированию, и сведения о полной энергии многоканального звукового сигнала. На основании информации об обеих энергиях устройство 202 выбора для устройства квантования осуществляет генерацию правила квантования, используемого устройством 200 квантования для получения квантованного параметра 204 из параметра 206, введенного в устройство 200 квантования. Следовательно, в этом случае устройство 202 выбора для устройства квантования служит в качестве генератора правила квантования.
Входными параметрами, подаваемыми в устройство 202 выбора для устройства квантования, являются полная энергия исходного многоканального сигнала и локальная энергия для канала, описанного параметром, подлежащим квантованию. В предпочтительном варианте осуществления настоящего изобретения соотношение между локальной энергией и полной энергией дает тот критерий, который может быть использован для принятия решения о том, какое именно устройство квантования следует использовать. В качестве примера, это соотношение, обозначенное как q (относительная локальная энергия), может быть вычислено в децибелах (дБ) с использованием приведенного ниже уравнения:
Выбранное устройство квантования затем используют для квантования параметра 206 посредством устройства квантования.
Идея настоящего изобретения состоит в том, что может быть использовано более грубое квантование параметров IID/ICLD (и т.п.) в том случае, если энергия на стадии параметризации является более низкой по сра