Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования

Иллюстрации

Показать все

Изобретение относится к средствам кодирования и декодирования звуковых сигналов. Технический результат заключается в повышении качества кодирования сигнала. Генерируют низведенный сигнал и остаточный сигнал на основе стереофонического сигнала. Определяют разность интенсивностей между каналами и взаимную корреляцию между каналами. Предпочтительно параметры параметрического стереофонического кодирования являются зависящими от времени и от частоты. Этап преобразования генерирует псевдолевый/правый стереофонический сигнал путем выполнения преобразования на основе низведенного сигнала и остаточного сигнала. Псевдостереофонический сигнал обрабатывается перцептуальным стереофоническим кодером. Для стереофонического кодирования может быть выбрано левое/правое кодирование или среднее/побочное кодирование. Предпочтительно выбор между левым/правым кодированием и средним/побочным кодированием является зависящим от времени и от частоты. 4 н. и 16 з.п. ф-лы, 26 ил.

Реферат

Область технического применения

Заявка относится к кодированию звуковых сигналов, в частности, к кодированию стереофонических звуковых сигналов, объединяющему технологии параметрического кодирования и кодирования формы сигнала.

Предпосылки изобретения

Совместное кодирование левого (L) и правого (R) каналов стереофонического сигнала позволяет осуществлять более эффективное кодирование по сравнению с независимым кодированием L и R. Традиционным подходом к совместному стереофоническому кодированию является кодирование средних/побочных (M/S) сигналов. В этом случае средний (М) сигнал формируется путем сложения сигналов L и R, например, сигнал М может иметь форму

.

Аналогично, побочный (S) сигнал формируется путем вычитания каналов L и R, например, сигнал S имеет форму

.

В случае M/S-кодирования вместо сигналов L и R кодируются сигналы М и S.

В стандарте MPEG (Moving Picture Experts Group) AAC (Advanced Audio Coding) (см. документ стандарта ISO/IEC 13818-7) стереофоническое L/R-кодирование и стереофоническое M/S-кодирование могут быть выбраны зависящими от времени и зависящими от частоты образом. Так, стереофонический кодер может применять L/R-кодирование для некоторых частотных полос стереофонического сигнала, в то время как M/S-кодирование используется для кодирования других частотных полос стереофонического сигнала (зависящий от частоты способ). Кроме того, кодер может переключаться между L/R-кодированием и M/S-кодированием с течением времени (зависящий от времени способ). В MPEG ААС стереофоническое кодирование выполняется в частотной области, точнее, в области MDCT (модифицированного дискретного косинусного преобразования). Это позволяет адаптивно делать выбор между L/R-кодированием и M/S-кодированием зависящим от частоты, а также о г времени образом. Решение о выборе между стереофоническим L/R-кодированием и стереофоническим M/S-кодированием может базироваться па оценке побочного сигнала: когда энергия побочного сигнала мала, должно использоваться стереофоническое M/S-кодирование, которое являйся более эффективным. В альтернативном варианте принятия решения о выборе между двумя схемами кодирования могут испытываться обе эти схемы, и выбор может базироваться на результирующих попытках квантования, т.е. на наблюдаемой перцептуальной энтропии.

Альтернативным подходом к совместному стереофоническому кодированию является параметрическое стереофоническое (PS) кодирование. В этом случае стереофонический сигнал передается как монофонический низведенный сигнал после кодирования низведенного сигнала традиционным кодером звуковых сигналов, таким как кодер ААС. Низведенный сигнал представляет собой суперпозицию каналов L и R. Монофонический низведенный сигнал передайся в комбинации с дополнительными параметрами PS-кодирования, зависящими от времени и от частоты, такими как разность интенсивностей между каналами (IID) и взаимная корреляция между каналами (ICC). В декодере, на основе декодированного низведенного сигнала и параметров параметрического стереофонического кодирования, реконструируйся стереофонический сигнал, который является приближением воспринимаемого пространственного изображения оригинального стереофонического сигнала. Для реконструкции декоррелятор генерирует декоррелированную версию низведенного сигнала. Указанный декоррелятор может реализовываться посредством соответствующего фазового фильтра. PS-кодирование и декодирование описано в статье "Low Complexity Parametric Stereo Coding in MPEG-4", H. Purnhagen, Proc. Of the 7th Int. Conference on Digital Audio Effects (DAFx'04). Naples. Italy. October 5-8, 2004, pages 163-168. Раскрытие из этого документа ссылкой включается в настоящее описание.

Стандарт MPEG Surround (см. документ ISO/IEC 23003-1) использует концепцию PS-кодирования. В декодере MPEG Surround множество выходных каналов создается на основе меньшего количества входных каналов и управляющих параметров. Декодеры и кодеры MPEG Surround строятся путем каскадного размещения параметрических стереофонических модулей, которые в стандарте MPEG Surround называются модулями ОТТ (модулями «от одного к двум») для кодера, и модулями R-OTT (обратными модулями «от одного к двум») - для кодера. Модуль ОТТ определяет два выходных канала посредством единого входного канала (низведенный сигнал), сопровождаемого параметрами PS-кодирования. Модуль ОТТ соответствует PS-декодеру, а модуль R-OTT соответствует PS-кодеру. Параметрическое стереофоническое кодирование может реализовываться с использованием MPEG Surround с одним модулем ОТТ на стороне декодера и одним модулем R-OTT - на стороне кодера; это также называется режимом "MPEG Surround 2-1-2". Синтаксис битового потока может отличаться, 110 лежащая в его основе теория и обработка сигнала являются одинаковыми. Поэтому в нижеследующем описании все отсылки к PS-кодированию также включают параметрическое стереофоническое кодирование на основе "MPEG Surround 2-1-2" или MPEG Surround.

В PS-кодере (например, в PS-кодере MPEG Surround) может определяться остаточный сигнал (RES), который передается в дополнение к низведенному сигналу. Этот остаточный сигнал указывает на погрешность, связанную с отображением оригинальных каналов посредством их понижающего микширования и параметров PS-кодирования. В декодере остаточный сигнал может использоваться вместо декоррелированной версии низведенного сигнала. Это позволяет лучше реконструировать форму сигналов оригинальных каналов L и R. Использование дополнительного остаточного сигнала описано, например, в стандарте MPEG Surround (см. документ ISO/EEC 23003-1) и в статье "MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding", J. Herre et al., Audio Engineering Convention Paper 7084. 122nd Convention, May 5-8, 2007. Раскрытия из обоих документов, в частности, ремарки, относящиеся в них к остаточному сигналу, ссылкой включаются в настоящее описание.

PS-кодирование с остаточным сигналом является более общим подходом к совместному кодированию стереофонического сигнала, чем M/S-кодирование: M/S-кодирование выполняет вращение сигнала при преобразовании L/R-сигналов в M/S-сигналы. PS-кодирование с остаточным сигналом также выполняет вращение сигнала при преобразовании L/R-сигналов в низведенный и остаточный сигналы. Однако в последнем случае вращение сигнала является варьируемым и зависит от параметров PS-кодирования.

По причине большей общности подхода PS-кодирования с остатком, PS-кодирование с остатком позволяет более эффективно, чем M/S-кодирование, кодировать определенные типы сигналов, такие как панорамированный монофонический сигнал. Так, предложенный кодер позволяет эффективно комбинировать технологии параметрического стереофонического кодирования с технологиями стереофонического кодирования на основе кодирования формы сигнала.

Часто перцептуальные стереофонические кодеры, такие как перцептуальный стереофонический кодер MPEG ААС, могут принимать решение о выборе между стереофоническим L/R-кодированием и стереофоническим M/S-кодированием, где в последнем случае средний/побочный сигнал генерируется на основе стереофонического сигнала. Этот выбор может зависеть от частоты, т.е. для некоторых частотных полос может использовался стереофоническое L/R-кодирование, в то время как для других частотных полос может использоваться стереофоническое M/S-кодирование.

В ситуации, когда каналы L и R по существу представляют собой независимые сигналы, указанный перцептуальный стереофонический кодер, как правило, не будет использовать стереофоническое M/S-кодирование, поскольку в данной ситуации эта схема кодирования не обеспечивает никакого улучшения кодирования по сравнению со стереофоническим L/R-кодированием. Кодер перейдет обратно на уровень простого стереофонического L/R-кодирования, 110 существу обрабатывающего L и R независимо.

В такой же ситуации система PS-кодера будет создавать низведенный сигнал, который содержит оба канала, L и R, что препятствует независимой обработке каналов L и R. Для PS-кодирования с остаточным сигналом это может означать менее эффективное кодирование по сравнению со стереофоническим кодированием, где адаптивно выбирается стереофоническое L/R-кодирование или стереофоническое M/S-кодирование.

Таким образом, существуют ситуации, в которых PS-кодер превосходит перцептуальный стереофонический кодер с адаптивным выбором между стереофоническим L/R-кодированием и стереофоническим M/S-кодированием, в то время как в других ситуациях последний кодер превосходит PS-кодер.

Краткое описание изобретения

Настоящая заявка описывает систему кодера звуковых сигналов и способ кодирования, которые основываются на идее комбинирования PS-кодирования с использованием остаточного сигнала и адаптивного перцептуального стереофонического L/R- или M/S-кодирования (например, перцептуального совместного стереофонического кодирования ААС в области MDCT). Это позволяет комбинировать преимущества адаптивного стереофонического L/R- или M/S-кодирования (например, используемого в MPEG ААС) с преимуществами PS-кодирования с остаточным сигналом (например, используемого в MPEG Surround). Кроме того, заявка описывает соответствующую систему декодера звуковых сигналов и способ декодирования.

Первый аспект заявки относится к системе кодера, предназначенной для кодирования стереофонического сигнала в сигнал битового потока. Согласно одному из вариантов осуществления системы кодера, система кодера включает этап понижающего микширования, предназначенный для генерирования на основе стереофонического сигнала низведенного сигнала и остаточного сигнала. Остаточный сигнал может покрывать весь или только часть используемого частотного диапазона звукового сигнала. Кроме того, система кодера включает этап определения параметров, предназначенный для определения таких параметров PS-кодирования, как разность интенсивностей между каналами и взаимная корреляция между каналами. Предпочтительно параметры PS-кодирования являются зависящими от частоты. Указанные этапы понижающего микширования и определения параметров, как правило, составляют часть PS-кодера.

Кроме того, система кодера включает средства перцептуального кодирования в нисходящем направлении относительно этапа понижающего микширования, где производится выбор между двумя схемами кодирования:

- кодированием на основе суммы низведенного сигнала и остаточного сигнала и на основе разности между низведенным сигналом и остаточным сигналом; или

- кодированием на основе низведенного сигнала и на основе остаточного сигнала.

Следует отметить, что в случае кодирования на основе низведенного сигнала и остаточного сигнала низведенный сигнал и остаточный сигнал могут являться кодированными, или могут являться кодированными сигналы, пропорциональные этим сигналам. В случае кодирования, на основе суммы и разности, сумма и разность могут являться кодированными, или могут являться кодированными сигналы, пропорциональные этим сигналам.

Выбор может быть зависящим от частоты (или зависящим от времени), т.е. для первой полосы частот может делаться выбор в пользу кодирования, основанного на суммарном сигнале и разностном сигнале, в то время как для второй полосы частот может делаться выбор в пользу кодирования, основанного па низведенном сигнале и на остаточном сигнале.

Такая система кодера имеет преимущество, которое позволяет переключаться между стереофоническим L/R-кодированием и PS-кодированием с остаточным сигналом (предпочтительно зависящим от частоты образом): если средства перцептуального кодирования делают выбор (для конкретной полосы или для всего частотного диапазона) в пользу кодирования, на основе низведенного и остаточного сигналов, система кодирования ведет себя как система, использующая стандартное PS-кодирование с остаточным сигналом. Однако если средства перцептуального кодирования делают выбор (для конкретной полосы или для всего частотного диапазона) в пользу кодирования, па основе суммарного сигнала низведенного сигнала и остаточного сигнала и разностном сигнале низведенного сигнала и остаточного сигнала, при определенных условиях, операции суммирования и вычитания в значительной мере компенсируют предшествующую операцию понижающего микширования (за исключением случая, возможно, отличающегося коэффициента усиления), и, таким образом, система в целом фактически может выполнять L/R-кодирование для всего стереофонического сигнала или для одной из его частотных полос. Например, такие условия возникают тогда, когда каналы L и R стереофонического сигнала независимы и имеют одинаковый уровень, что более подробно будет разъяснено позднее.

Предпочтительно адаптация схемы кодирования зависит от времени и от частоты. Так, предпочтительно некоторые полосы частот стереофонического сигнала кодируются посредством схемы L/R-кодирования, в то время как другие полосы частот стереофонического сигнала кодируются посредством схемы PS-кодирования с остаточным сигналом.

Следует отметить, что в случае кодирования, на основе низведенного сигнала и остаточного сигнала, как обсуждалось выше, фактический сигнал, который является входным в базовый кодер, может быть сформирован двумя последовательными операциями на низведенном сигнале и остаточном сигнале, которые являются обратными (за исключением случая, возможно, отличающегося коэффициента усиления). Например, низведенный сигнал и остаточный сигнал подаются на этап преобразования M/S в L/R, а затем выходной сигнал этапа преобразования подается на этап преобразования L/R в M/S. Результирующий сигнал (который затем используется для кодирования) соответствует низведенному сигналу и остаточному сигналу (за исключением случая, возможно, отличающегося коэффициента усиления).

Нижеследующий вариант осуществления изобретения использует эту идею. Согласно одному из вариантов осуществления системы кодера, система кодера, как обсуждалось выше, включает этап понижающего микширования и этап определения параметров. Кроме того, система кодера включает этап преобразования (например, составляющий часть средств кодирования, описанных выше). Этап преобразования генерирует псевдо-L/R-стереофонический сигнал путем выполнения преобразования низведенного сигнала и остаточного сигнала. Этап преобразования предпочтительно выполняет преобразования в сумму и разность, где низведенный сигнал и остаточный сигнал суммируются, генерируя один канал псевдостереофонического сигнала (сумма, возможно, умножается на некоторый коэффициент), и вычитаются один из другого, генерируя второй канал псевдостереофонического сигнала (разность, возможно, умножается на некоторый коэффициент). Предпочтительно первый канал (например, псевдолевый канал) псевдостереофонического сигнала пропорционален сумме низведенного и остаточного сигналов, где второй канал (например, псевдоправый канал) псевдостереофонического сигнала пропорционален разности низведенного и остаточного сигналов. Таким образом, низведенный сигнал DMX и остаточный сигнал RES из PS-кодера могут быть конвертированы в псевдостереофонический сигнал Lp, Rp в соответствии со следующими уравнениями:

Lp=g(DMX+RES)

Rp=g(DMX-RES).

В приведенных выше уравнениях нормировочный коэффициент усиления g, например, имеет значение .

Псевдостереофонический сигнал предпочтительно обрабатывается перцептуальным стереофоническим кодером (например, составляющим часть средств кодирования). Для кодирования выбирается стереофоническое L/R-кодирование или стереофоническое M/S-кодирование. Адаптивный перцептуальный стереофонический L/R- или M/S-кодер может представлять собой кодер на базе ААС. Предпочтительно выбор между стереофоническим L/R-кодированием и стереофоническим M/S-кодированием зависит от частоты; так, выбор может варьироваться для различных частотных полос, как обсуждалось выше. Кроме того, выбор между L/R-кодированием и M/S-кодированием предпочтительно зависит от времени. Решение о выборе между L/R-кодированием и M/S-кодированием предпочтительно принимается перцептуальным стереофоническим кодером.

Указанный перцептуальный стереофонический кодер для M/S-кодирования обладает возможностью внутреннего вычисления (псевдо-) сигналов М и S (во временной области или в выбранных полосах частот) на основе псевдостереофонического сигнала L/R. Указанные сигналы М и S соответствуют низведенному и остаточному сигналам (за исключением случая, возможно, отличающегося коэффициента усиления). Таким образом, если перцептуальный стереофонический кодер делает выбор в пользу M/S-кодирования, то он фактически кодирует низведенный и остаточный сигналы (которые соответствуют псевдосигналам М и S), как это могло бы выполняться в системе, использующей стандартное PS-кодирование с остаточным сигналом.

Кроме того, в специфических условиях этап преобразования в значительной мере компенсирует предшествующую операцию понижающего микширования (за исключением случая, возможно, отличающегося коэффициента усиления), и, таким образом, система кодера в целом может фактически выполнять L/R-кодирование всего стереофонического сигнала или одной из его частотных полос (если перцептуальным кодером выбрано L/R-кодирование). Этот случай соответствует, например, случаю, когда каналы L и R стереофонического сигнала независимы и имеют одинаковый уровень, что более подробно будет разъяснено позднее. Таким образом, для данной полосы частот псевдостереофонический сигнал в значительной мере соответствует или является пропорциональным стереофоническому сигналу, если - для этой полосы частот - левый и правый каналы стереофонического сигнала, в значительной мере, независимы и имеют, в значительной мере, одинаковый уровень.

Таким образом, система кодера фактически позволяет осуществлять переключение между стереофоническим L/R-кодированием и PS-кодированием с остаточным сигналом с целью получения возможности адаптации к свойствам данного входного стереофонического сигнала. Предпочтительно адаптация схемы кодирования зависит от времени и от частоты. Так, предпочтительно некоторые полосы частот стереофонического сигнала кодируются посредством схемы L/R-кодирования, в то время как другие полосы частот стереофонического сигнала кодируются посредством схемы PS-кодирования с остаточным сигналом. Следует отметить, что M/S-кодирование по существу представляет собой частный случай PS-кодирования с остаточным сигналом (поскольку преобразование L/R в M/S представляет собой частный случай операции понижающего микширования при PS-кодировании), и, таким образом, система кодера также может выполнять полное M/S-кодирование.

Указанный вариант осуществления изобретения, содержащий этап преобразования в нисходящем направлении относительно PS-кодера и в восходящем направлении относительно перцептуального стереофонического L/R- или M/S-кодера, имеет преимущество, которое заключается в том, что могут быть использованы традиционный PS-кодер и традиционный перцептуальный кодер. Тем не менее, PS-кодер, или перцептуальный кодер, в данном случае может адаптироваться для специфического использования.

Новая концепция повышает эффективность стереофонического кодирования, позволяя эффективно комбинировать PS-кодирование и совместное стереофоническое кодирование.

В соответствии с альтернативным вариантом осуществления изобретения, средства кодирования, которые обсуждались выше, включают этап преобразования, предназначенный для выполнения преобразования в сумму и разность на основе низведенного сигнала и остаточного сигнала для одной или нескольких частотных полос (например, для всего используемого частотного диапазона или только для одной полосы частот). Это преобразование может выполняться в частотной области или во временной области. Этап преобразования генерирует псевдолевый/правый стереофонический сигнал для одной или нескольких частотных полос. Один канал псевдостереофонического сигнала соответствует сумме, а второй канал псевдостереофонического сигнала соответствует разности.

Таким образом, в случае, когда кодирование основывается на суммарном и разностном сигналах, выходной сигнал этапа преобразования может использоваться для кодирования, в то время как в случае, когда кодирование основывается на низведенном сигнале и остаточном сигнале, для кодирования могут использоваться сигналы в восходящем направлении относительно этапа кодирования. Таким образом, этот вариант осуществления изобретения не использует два последовательных преобразования в сумму и разность на низведенном сигнале и остаточном сигнале, приводящих к низведенному сигналу и остаточному сигналу (за исключением случая, возможно, отличающегося коэффициента усиления).

При выборе кодирования на основе низведенного сигнала и остаточного сигнала, выбирается параметрическое стереофоническое кодирование стереофонического сигнала. При выборе кодирования на основе суммы и разности (т.е. кодирования на основе псевдостереофонического сигнала), выбирается L/R-кодирование стереофонического сигнала.

Этап преобразования может представлять собой этап преобразования L/R в M/S, составляющий часть перцептуального кодера с адаптивным выбором между стереофоническим L/R- и M/S-кодированием (возможно, в отличии от традиционного этапа преобразования L/R в M/S, коэффициенты усиления отличаются). Следует отметить, что решение о выборе между стереофоническим L/R- и M/S-кодированием должно быть обратимым. Таким образом, кодирование, на основе низведенного сигнала и остаточного сигнала, выбирается (т.е. кодированный сигнал не проходит этап преобразования) тогда, когда средства принятия решения принимают решение о перцептуальном M/S-декодировании, а кодирование, на основе псевдостереофонического сигнала, генерируемом этапом преобразования, выбирается (т.е. кодированный проходит этап преобразования) тогда, когда средства принятия решения принимают решение о перцептуальном L/R-декодировании.

Система кодера согласно любому из обсужденных выше вариантов осуществления изобретения может включать дополнительный SBR-кодер (репликации спектральной полосы). SBR представляет собой одну из форм HFR (высокочастотной реконструкции). SBR-кодер определяет дополнительную информацию для реконструкции более высокого частотного диапазона звукового сигнала в декодере. Перцептуальным кодером кодируется только более низкий частотный диапазон, что уменьшает битовую скорость передачи данных. Предпочтительно SBR-кодер присоединяется в восходящем направлении относительно PS-кодера. Таким образом, SBR-кодер может находиться в стереофонической области и генерировать параметры SBR для стереофонического сигнала. Это будет более подробно обсуждаться в связи с графическими материалами.

Предпочтительно PS-кодер (т.е. этап понижающего микширования и этап определения параметров) выполняет операции в передискретизированной частотной области (PS-кодер, который обсуждается ниже, также предпочтительно выполняет операции в передискретизированной частотной области). Для преобразования из временной области в частотную в восходящем направлении относительно PS-кодера может использоваться гибридный блок комплекснозначных фильтров, содержащий QMF (квадратурный зеркальный фильтр) и фильтр Найквиста, как описано в стандарте MPEG Surround (см. документ ISO/IEC 23003-1). Это позволяет выполнять адаптивную обработку сигнала во времени и по частоте в отсутствие слышимых артефактов наложения спектров. Адаптивное L/R- или M/S-кодирование, с другой стороны, предпочтительно осуществляется в области критически дискретизированного MDCT (например, как описано в ААС) с целью обеспечения эффективного представления квантованного сигнала.

Конверсия между низведенным и остаточным сигналами и псевдо-L/R-стереофоническим сигналом может осуществляться во временной области, поскольку PS-кодер и перцептуальный стереофонический кодер, как правило, в любом случае связываются во временной области. Таким образом, этап преобразования, предназначенный для генерирования сигнала псевдо-L/R может выполнять операции во временной области.

В других вариантах осуществления изобретения, которые обсуждаются в связи с графическими материалами, этап преобразования выполняет операции в передискретизированной частотной области или области критически дискретизированного MDCT.

Второй аспект заявки относится к системе декодера, предназначенной для декодирования сигнала битового потока, генерируемого обсужденной выше системой кодера.

Согласно одному из вариантов осуществления системы декодера, система декодера включает средства перцептуального декодирования, предназначенные для декодирования на основе сигнала битового потока. Средства декодирования сконфигурированы для генерирования посредством декодирования (внутреннего) первого сигнала и (внутреннего) второго сигнала и для вывода низведенного сигнала и остаточного сигнала. Низведенный сигнал и остаточный сигнал селективно основываются на

- сумме первого сигнала и второго сигнала и на разности первого сигнала и второго сигнала

или

- на первом сигнале и на втором сигнале.

Как обсуждалось выше в связи с системой кодера, в данном случае, выбор также может быть зависящим от частоты и независящим от частоты.

Кроме того, система включает этап повышающего микширования, предназначенный для генерирования стереофонического сигнала на основе низведенного сигнала и остаточного сигнала, где операция повышающего микширования на этапе повышающего микширования зависит от одного или нескольких параметров параметрического стереофонического кодирования.

Аналогично системе кодера, система декодера фактически позволяет переключаться между L/R-декодированием и PS-декодированием с остаточным сигналом, предпочтительно зависящим от времени и от частоты образом.

Согласно другому варианту осуществления изобретения система декодера включает перцептуальный стереофонический декодер (например, составляющий часть средств декодирования), предназначенный для декодирования сигнала битового потока, где декодер генерирует псевдостереофонический сигнал. Перцептуальный декодер может представлять собой декодер на базе ААС. Для перцептуального стереофонического декодера перцептуальное L/R-декодирование или перцептуальное M/S-декодирование выбирается зависящим от частоты или независящим от частоты образом (фактический выбор предпочтительно управляется решением кодера, которое передастся как дополнительная информация в битовом потоке). Декодер делает выбор схемы декодирования на основе схемы кодирования, использованной для кодирования. Используемая схема кодирования может указываться декодеру посредством информации, содержащейся в принимаемом битовом потоке.

Кроме того, предусматривается этап преобразования, предназначенный для генерирования низведенного сигнала и остаточного сигнала путем выполнения преобразования псевдостереофонического сигнала. Иными словами, псевдостереофонический сигнал, получаемый из перцептуального декодера конвертируется обратно в низведенный и остаточный сигналы. Это преобразование представляет собой преобразование в сумму и разность: результирующий низведенный сигнал пропорционален сумме левого канала и правого канала псевдостереофонического сигнала, результирующий остаточный сигнал пропорционален разности левого канала и правого канала псевдостереофонического сигнала. Таким образом, осуществляется квазипреобразование L/R в M/S. Псевдостреофонический сигнал с двумя каналами Lp, Rp может конвертироваться в низведенный и остаточный сигналы в соответствии со следующими уравнениями:

.

В приведенных выше уравнениях нормировочный коэффициент усиления g может, например, иметь значение . Остаточный сигнал RES, используемый в декодере, может покрывать весь используемый диапазон частот звукового сигнала или только часть используемого диапазона частот звукового сигнала.

Низведенный и остаточный сигналы затем обрабатываются на этапе повышающего микширования PS-декодера для получения конечного стереофонического выходного сигнала. Повышающее микширование низведенного и остаточного сигналов в стереофонический сигнал зависит от принимаемых параметров PS-кодирования.

Согласно альтернативному варианту осуществления изобретения средства перцептуального декодирования могут включать этап преобразования в сумму и разность, предназначенный для выполнения преобразования на основе первого сигнала и второго сигнала для одной или нескольких частотных полос (например, для всего используемого диапазона частот). Таким образом, этап преобразования генерирует низведенный сигнал и остаточный сигнал в случае, когда низведенный сигнал и остаточный сигнал базируются на сумме первого сигнала и второго сигнала и на разности первого сигнала и второго сигнала. Этап преобразования может выполнять операции во временной облает или в частотной области.

Как сходным образом обсуждалось в связи с системой кодера, этап преобразования может представлять собой этап преобразования M/S в L/R, составляющий часть перцептуального декодера с адаптивным выбором между стереофоническим L/R- и M/S-декодированием (возможно, коэффициент усиления, в отличие от традиционного этапа преобразования M/S в L/R, отличается). Следует отметить, что выбор между стереофоническим L/R- и M/S-декодированием должен быть обратимым.

Система декодера согласно любому из предшествующих вариантов осуществления изобретения может включать дополнительный SBR-декодер, предназначенный для декодирования дополнительной информации из SBR-кодера и для генерирования высокочастотной составляющей звукового сигнала. Предпочтительно SBR-декодер располагается в нисходящем направлении относительно PS-декодера. Это будет более подробно обсуждаться в связи с графическими материалами.

Предпочтительно этап повышающего микширования выполняет операции в передискретизированной частотной области, например, в восходящем направлении относительно PS-декодера может, как описывалось выше, использоваться гибридный блок фильтров.

Преобразование L/R в M/S может проводиться во временной области, поскольку перцептуальный декодер и PS-декодер (включая этап повышающего микширования), как правило, связаны во временной области.

В других вариантах осуществления изобретения, описанных в связи с графическими материалами, преобразование L/R в M/S проводится в передискретизированной частотной области (например, QMF) или в критически дискретизированной частотной области (например, MDCT).

Третий аспект заявки относится к способу кодирования стереофонического сигнала в сигнал битового потока. Способ выполняет операции аналогично системе кодера, обсужденной выше. Таким образом, приведенные выше ремарки, относящиеся к системе кодера в основном также применимы и к способу кодирования.

Четвертый аспект заявки относится к способу декодирования сигнала битового потока, включающего параметры PS-кодирования, с целью генерирования стереофонического сигнала. Способ выполняет операции так же, как система декодера, обсужденная выше. Таким образом, приведенные выше ремарки, относящиеся к системе декодера в основном также применимы и к способу декодирования.

Ниже изобретение разъясняется посредством иллюстративных примеров с отсылкой к сопроводительным графическим материалам, где

фиг. 1 - один из вариантов осуществления системы кодера, где, необязательно, параметры PS-кодирования содействуют психоакустическому управлению в перцептуальном стереофоническом кодере;

фиг. 2 - один из вариантов осуществления PS-кодера;

фиг. 3 - один из вариантов осуществления системы декодера;

фиг. 4 - один из дополнительных вариантов осуществления PS-кодера, включающего детектор, предназначенный для деактивации PS-кодирования, если предпочтительным является L/R-кодирование;

фиг. 5 - один из вариантов осуществления традиционной системы PS-кодера, содержащей дополнительный SBR-кодер для низведенного сигнала;

фиг. 6 - один из вариантов осуществления системы кодера, содержащей дополнительный SBR-кодер для низведенного сигнала;

фиг. 7 - один из вариантов осуществления системы кодера, содержащей дополнительный SBR-кодер в стереофонической области;

фиг. 8а-8d - различные частотно-временные представления одного из двух выходных каналов на выходе декодера;

фиг. 9а - один из вариантов осуществления базового кодера;

фиг. 9b - один из вариантов осуществления кодера, который позволяет осуществлять переключение между кодированием в области линейного предсказания (как правило, только для монофонических сигналов) и кодированием в области преобразования (как правило, и для монофонических, и для стереофонических сигналов);

фиг. 10 - один из вариантов осуществления системы кодера;

фиг. 11а - часть одного из вариантов осуществления системы кодера;

фиг. 11b - иллюстративная реализация варианта осуществления изобретения по фиг. 11а;

фиг. 11с - альтернатива варианту осуществления изобретения по фиг. 11а;

фиг. 12 - один из вариантов осуществления системы кодера;

фиг. 13 - один из вариантов осуществления стереофонического кодера, составляющего часть системы кодера по фиг. 12;

фиг. 14 - один из вариантов осуществления системы декодера, предназначенной для декодирования сигнала битового потока, генерируемого системой кодера по фиг. 6;

фиг. 15 - один из вариантов осуществления системы декодера, предназначенной для декодирования сигнала битового потока, генерируемого системой кодера по фиг. 7;

фиг. 16а - часть одного из вариантов осуществления системы декодера;

фиг. 16b - иллюстративная реализация варианта осуществления изобретения по фиг. 16а;

фиг. 16c - альтернатива варианту осуществления изобретения по фиг. 16а:

фиг. 17 - один из вариантов осуществления системы кодера; и

фиг. 18 - один из вариантов осуществления системы декодера.

На фиг. 1 показан вариант осуществления системы кодера, которая объединяет PS-кодирование с использованием остаточного сигнала и адаптивное перцептуальное стереофоническое L/R- или M/S-кодирование. Этот вариант осуществления изобретения является лишь иллюстрацией принципов настоящей заявки. Следует понимать, что модификации и изменения этого варианта осуществления изобретения будут очевидны для специалистов в данной области. Система кодера включает PS-кодер 1, принимающий стереофонический сигнал L, R. PS-кодер 1 содержит этап понижающего микширования, предназначенный для генерирования низведенного DMX и остаточного RES сигналов на основе стереофонического сигнала L, R. Эту операцию можно описать при помощи матрицы H-1 понижающего микширования H-1 размера 2×2, которая конвертирует сигналы L и R в низведенный сигнал DMX и остаточный сигнал RES:

.

Как правило, матрица H-1 является зависящей от частоты или зависящей от времени, т.е. элементы матрицы Н-1 изменяются с частотой и изменяются от одного кванта времени к другому. Матрица H-1 может обновляться с каждым кадром (например, каждые 21 или 48 мс) и может иметь частотное разрешение множества полос, например, 28, 20 или 10 полос (называемых «полосами параметров») на перцептуально ориентированной шкале частот (типа шкалы Барка).

Элементы матрицы H-1 зависят от зависящих от времени и от частоты параметров PS-кодирования: IID (разности интенсивностей между каналами; также называется CLD - разность уровней каналов) и ICC (взаимной корреляции между каналами). Для определения параметров 5 PS-кодирования, например, IID и ICC, PS-кодер 1 включает этап определения параметров. Пример вычисления матричных элементов обратной матрицы Н имеет следующий вид и описан в спецификации стандарта MPEG Surround, документ ISO/IEC 23003-1, подпункт 6.5.3.2, которая ссылкой включается в настоящее описание: