Аудиодекодирование

Иллюстрации

Показать все

Изобретение относится к аудиодекодированию и в особенности к декодированию сигналов MPEG Surround. Аудиодекодер включает в себя приемник (801) для приема входных данных, состоящий из N-канального сигнала, соответствующего понижено микшированному сигналу М-канального аудиосигнала, M>N, с примененными матрицами кодирования комплекснозначных поддиапазонов в частотных поддиапазонах и параметрическими многоканальными данными. Группа фильтров поддиапазона (805) генерирует вещественнозначные частотные поддиапазоны для N-канального сигнала. Матричный процессор (809) определяет матрицы декодирования вещественнозначных поддиапазонов для компенсации применения матриц кодирования по параметрическим многоканальным данным. Процессор компенсации (807) генерирует данные понижающего микширования, соответствующие понижено микшированному сигналу с помощью умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах. Данные понижающего микширования могут использоваться для генерации понижено микшированного сигнала и М-канального аудиосигнала. Декодер может вводить поправку на операции MPEG Матричной Окружающей Совместимости, выполняемые в кодере, используя вещественнозначные частотные поддиапазоны. Технический результат - эффективное осуществление и/или улучшение качества аудио. 10 н. и 10 з.п. ф-лы, 15 ил.

Реферат

Настоящее изобретение относится к аудиодекодированию и в особенности, но не исключительно, к декодированию сигналов MPEG Surround.

За последние десятилетия цифровое кодирование сигналов различных источников стало все более важным, в то время когда цифровое представление сигналов и коммуникация все больше и больше заменяла аналоговое представление и коммуникацию. Например, распространение медиа контента, такого как видео и музыка, все больше и больше основываются на цифровом кодировании контента.

Более того, в последнее десятилетие были тенденции в направлении многоканального аудио, особенно в направлении пространственного аудио, выходящего за рамки традиционных стереосигналов. Например, традиционные стереозаписи включали только два канала, тогда как современные продвинутые аудиосистемы обычно используют пять или шесть каналов, как в широко известных системах 5.1 звук вокруг. Это предусматривает более вовлеченное прослушивание, при котором пользователь может быть окружен источниками звука.

Для передачи таких многоканальных сигналов были разработаны различные технологии и стандарты. Например, шесть дискретных каналов, представляющих системы 5.1 звук вокруг, могут передаваться в соответствии со стандартами, такими как AAC (Advanced Audio Coding - улучшенное кодирование звука) или со стандартами Dolby Digital.

Однако для обеспечения обратной совместимости они известны для понижающего микширования большего числа каналов на меньшее число каналов, и особенно они часто используются для понижающего микширования сигналов 5.1 звук вокруг в стереосигнал, позволяя воспроизводить стереосигнал с помощью традиционных (стерео) декодеров, а 5.1 сигнал с помощью декодеров звук вокруг.

Одним из примеров является обратно совместимый способ кодирования MPEG2. Многоканальный сигнал понижено микшируется в стереосигнал. Дополнительные сигналы кодируются как многоканальные данные в дополнительные порции данных, позволяя MPEG2 многоканальному декодеру генерировать представление многоканального сигнала. MPEG1 декодер будет пренебрегать дополнительными данными и таким образом будет декодировать только понижающее микширование стерео. Основным недостатком метода кодирования, применяемого в MPEG2, является то, что скорость передачи дополнительных данных, необходимых для дополнительных сигналов, является величиной того же порядка, что и скорость передачи данных, требуемая для кодирования стереосигнала. Поэтому значительной является дополнительная скорость передачи битов для расширения стереосигнала в многоканальный аудиосигнал.

Другие существующие методы обратно совместимой многоканальной передачи без дополнительной многоканальной информации могут обычно характеризоваться как матричные круговые методы. Примеры кодирования матричных круговых методов включают такие методы, как Dolby Prologic II и Logic-7. Общим принципом этих методов является то, что они матричным способом умножают множество каналов входного сигнала посредством подходящей матрицы, тем самым генерируя выходной сигнал с низким числом каналов. В особенности матричное кодирование обычно применяет фазовый сдвиг к окружающим каналам перед тем, как смешивать их с передним и центральным каналами.

Другой причиной для преобразования каналов является эффективность кодирования. Было выяснено, что, например, аудиосигналы звука вокруг могут кодироваться как аудиосигналы стереоканалов, объединенные с потоком битов параметров, описывающим пространственные свойства аудиосигнала. Декодер может воспроизводить аудио- стереосигналы с очень удовлетворительной степенью точности. Таким способом может быть получена значительная экономия в скорости передачи битов.

Существует несколько параметров, которые могут использоваться для описания пространственных свойств аудиосигналов. Одним из таких параметров является внутриканальная кросс-корреляция, такая как кросс-корреляция между левым каналом и правым каналом для стереосигналов. Другим параметром является отношение мощности каналов. В так называемых (параметрических) пространственных аудиокодерах, таких как кодеры окружающего MPEG, эти и другие параметры извлекаются из первоначальных аудиосигналов так, чтобы производить аудиосигнал с уменьшенным числом каналов, например только с одним каналом, плюс набор параметров, описывающих пространственные свойства первоначального аудиосигнала. В так называемых (параметрических) пространственных аудиодекодерах пространственные свойства переустанавливаются, как описывается посредством переданных пространственных параметров.

Такое пространственное аудиокодирование предпочтительно использует каскадную или древовидную иерархическую структуру, включающую в себя стандартные модули в кодере и декодере. В кодере эти стандартные модули могут быть понижающими микшерами, объединяющими каналы в меньшее число каналов, такими как 2 в 1, 3 в 1, 3 в 2 и т.д. понижающими микшерами, в то время как в декодере соответствующие стандартные модули могут быть повышающими микшерами, разбивающими каналы на большее число каналов, такими как 1 на 2, 2 на 3 повышающими микшерами.

На Фиг.1 представлена иллюстрация примера кодера для кодирования многоканальных аудиосигналов в соответствии с подходом, стандартизующимся в настоящее время MPEG под именем MPEG Surround (окружающий MPEG). Система окружающего MPEG кодирует многоканальный сигнал как моно- или стереопонижающее микширование, сопровождающееся набором параметров. Сигнал понижающего микширования может кодироваться посредством традиционного аудиокодера, такого как, например, кодер MP3 или ACC. Параметры представляют пространственное изображение многоканального аудиосигнала и могут кодироваться и встраиваться в обратно совместимой форме в традиционный аудиопоток.

На стороне декодера основной поток битов сначала декодируется, в результате чего генерируется моно или стереосигнал понижающего микширования. Традиционные декодеры, например декодеры, которые не используют декодирование окружающего MPEG, все еще могут декодировать этот сигнал понижающего микширования. Если несмотря на это доступен декодер окружающего MPEG, пространственные параметры переустанавливаются, что приводит к многоканальному представлению, которое воспринимается близко к начальному многоканальному входному сигналу. Пример декодера окружающего MPEG звука представлен на Фиг.2.

В стороне от основного пространственного кодирования/декодирования, как показано на Фиг.1 и на Фиг.2, система окружающего MPEG предлагает богатый набор особенностей, открывающих большую область применения. Одна из наиболее заметных особенностей относится к Матрице Соответствия или Матричной Окружающей Совместимости.

Примерами традиционных матричных окружающих систем являются Dolby Pro Logic I и II и Circle Surround. Эти системы работают, как показано на Фиг.3. Многоканальный PCM входящий сигнал преобразуется в так называемый матричный сигнал понижающего микширования с использованием обычно матрицы 5(.1) в 2. Идея систем матриц вокруг заключается в том, что передние и окружающие (задние) каналы смешиваются синфазно и не синфазно соответственно в стереосигнале понижающего микширования. В некотором роде это разрешает инверсию на стороне декодера, приводя к многоканальной реконструкции.

В матричных системах окружения стереосигнал может передаваться с использованием традиционных каналов, предназначенных для передачи стереосигналов. Поэтому, подобно системе окружающей MPREG, матричные системы окружения также предлагают форму обратной совместимости. Однако из-за специфичных фазовых свойств стереосигнала понижающего микширования, возникающего из матричного окружающего кодирования, эти сигналы часто не обладают высоким качеством звука, когда прослушиваются как стереосигналы из, например, динамиков или наушников.

В декодерах матричного окружения от M до N (где M=2, а N=5(.1)) матрица применяется для формирования многоканального PCM выходного сигнала. Однако, в общем, от N до M матричных систем, с (N>M) необратимо, и таким образом, матричные системы окружения, в общем, не способны точно восстановить первоначальные многоканальные PCM выходные сигналы, которые стремятся иметь очень заметные артефакты.

В отличие от таких традиционных матричных систем окружения Матричная Окружающая Совместимость MPEG Surround достигается посредством применения матрицы 2×2 к комплексным выборочным значениям в частотных поддиапазонах кодера MPEG Surround, который следует за окружным кодированием MPEG. Пример такого кодера представлен на Фиг.4. Матрица 2×2 обычно представляет собой матрицу комплексных значений с коэффициентами, зависящими от пространственных параметров. В такой системе пространственными параметрами являются как временные, так и частотные разновидности, и поэтому матрица 2×2 также временная и частотная. Таким образом, действие комплексной матрицы обычно применяется к частотно-временной мозаике.

Применение функции Матричной Окружающей Совместимости в кодерах MPEG окружения позволяет результирующему стереосигналу быть совместимым с сигналом, генерируемым посредством традиционных кодеров матричного окружения, таких как Dolby Pro-LogicTM. Это позволит традиционным декодерам декодировать круговые сигналы. Более того, действие Матричной Окружающей Совместимости может быть реверсировано в совместимый MPEG Surround декодер, тем самым обеспечивая высокое качество генерируемого многоканального сигнала.

Матрица кодирования матричной совместимости может быть описана следующим образом:

где L, R - традиционное MPEG стереопонижающее микширование, LMTX, RMTX - кодированное круговой матрицей понижающее микширование, и где hxy - комплексные коэффициенты, определенные в соответствии с многоканальными параметрами.

Основным преимуществом предоставления стереосигналов, совместимых с матрицей посредством матрицы 2×2, является тот факт, что эти матрицы могут быть инвертированы. В результате MPEG Surround декодер все еще может поставлять то же самое качество выходного аудиосигнала вне зависимости от того, используется ли в кодере понижающее микширование стереосигналов, совместимое с матрицей. Пример декодера, совместимого с круговым MPEG, представлен на Фиг.5.

Инверсная обработка на стороне декодера в обычном MPEG Surround декодере может определяться таким образом:

Таким образом, так как H может быть инвертировано, действие кодера матричной совместимости может быть перевернуто.

В системе MPEG Surround, обработка, включающая действия матричной совместимости, происходит в частотном домене. Более специфически, так называемые комплексно-экспоненциально модулированные группы квадратурных зеркальных фильтров (Quadrature Mirror Filter - QMF) используются для разделения частотной оси на несколько зон.

Во многих отношениях этот тип QMF групп может приравниваться к группе перекрывающихся дополнительных дискретных преобразований Фурье (Discrete Fourier Transform - DFT) или к ее эффективной копии - быстрому Фурье преобразованию (Fast Fourier Transform - FFT). Группа QMF, так же как группа DFT, совместно характеризуется следующими желаемыми свойствами для обработки сигнала.

- Представление частотного домена передискретизировано. Из-за этого свойства возможно применить манипуляции, такие как, например, компенсация (масштабирование индивидуальных зон) без введения ступенчатого искажения. Критически дискретизированные представления, такие как, например, известное модифицированное дискретное косинусное преобразование (Modified Discrete Cosine Transform - MDCT), которое, например, используется в AAC, не подчиняется этому свойству. Поэтому временная и частотная разновидности модификации MDCT коэффициентов перед синтезом приводит к ступенчатости, которая, в свою очередь, является причиной слышимых артефактов в выходном сигнале.

- Представление частотного домена комплексное. В отличие от вещественнозначных представлений комплексное представление дает возможность простой модификации фазы сигналов.

Несмотря на то что существует ряд преимуществ над критически дискретизированным вещественнозначным представлением на основе манипуляций с сигналом, значительным недостатком по сравнению с таким представлением является вычислительная комплексность. Основная часть комплексности MPEG Surround декодера вызвана QMF группами фильтров анализа и синтеза и соответствующей обработкой комплекснозначных сигналов.

Соответственно, предложено выполнять часть обработки в вещественнозначном домене в так называемом декодере малой мощности (Low Power - LP). Для этой цели комплексно модулированная группа фильтров была заменена вещественнозначной косинусной модулированной группой фильтров, за которой следует частичное расширение до комплекснозначного домена для низкочастотных зон. Такие группы фильтров представлены на Фиг.6.

В нормальном режиме работы MPEG Surround декодер применяет вещественнозначную обработку к выборкам области комплексных поддиапазонов, или в случае LP применяет ее к выборкам области вещественнозначных поддиапазонов. Однако особенность матричной совместимости в декодере включает сдвиги фаз, для того чтобы восстановить первоначальное стереопонижающее микширование в частотном домене. Эти сдвиги фаз выполнены посредством комплекснозначной обработки. Другими словами, матрица декодирования матричной совместимости H -1 является по своей природе комплексной, для представления требуемого сдвига фаз. Соответственно, в таких системах действие матричной круговой совместимости не может быть инвертировано в вещественнозначную часть представления LP частотного домена, приводящую к уменьшению качества декодирования.

Следовательно, улучшенное аудиодекодирование было бы благоприятным.

Соответственно, изобретение стремится к предпочтительному подавлению, облегчению и устранению одного или более из вышеуказанных недостатков, отдельно или в любой комбинации.

В соответствии с первым аспектом изобретения представлен аудиодекодер, включающий в себя средство для приема входных данных, включающих в себя N-канальный сигнал, соответствующий понижено микшированному сигналу M-канального аудиосигнала, где M>N, с матрицами кодирования комплекснозначных поддиапазонов, применяемых в частотных поддиапазонах, и с параметрическими, многоканальными данными, связанными с понижено микшированным сигналом; средства для генерации частотных поддиапазонов для N-канального сигнала, по крайней мере, некоторые частотные поддиапазоны являются вещественнозначными частотными поддиапазонами; средство определения матриц декодирования вещественнозначного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным; средство для генерации данных понижающего микширования, соответствующих понижено микшированному сигналу, выполненному посредством умножения матриц декодирования вещественнозначных поддиапазонов и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.

Изобретение может делать возможным улучшенное и/или облегченное декодирование. В особенности изобретение может делать возможным существенное снижение комплексности, наряду с достижением высокого качества аудио. Изобретение может, например, делать возможным эффект, когда умножение матриц комплекснозначных поддиапазонов будет, по крайней мере, частично обратным в декодере с использованием вещественнозначных частотных поддиапазонов.

В качестве особого примера изобретение может, например, делать возможным кодирование Совместимое с Матрицей MPEG частично обратимым в круговом MPEG декодере с использованием вещественнозначных частотных поддиапазонов.

Декодер может включать в себя средства генерации сигнала понижающего микширования по данным понижающего микширования и может также включать в себя средства генерации M-канального аудиосигнала по данным понижающего микширования и параметрическим многоканальным данным. Изобретение может в таких вариантах реализации генерировать точный многоканальный аудиосигнал, по крайней мере, частично основываясь на вещественнозначных частотных поддиапазонах.

Различная матрица декодирования может быть определена для каждого частотного поддиапазона.

В соответствии с дополнительной особенностью изобретения средства определения организованы для определения инверсных матриц комплекснозначного поддиапазона матриц кодирования и для определения матриц декодирования по инверсным матрицам.

Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования.

В соответствии с дополнительной особенностью изобретения средства определения организованы для определения каждого коэффициента вещественнозначной матрицы декодирования по абсолютному значению коэффициента соответствующей инверсной матрицы.

Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования. Каждый вещественнозначный коэффициент матрицы декодирования может быть определен по абсолютному значению только соответствующего коэффициента инверсных матриц без рассмотрения других коэффициентов матрицы. Соответствующий коэффициент матрицы может быть коэффициентом, расположенным в том же месте инверсной матрицы для того же частотного поддиапазона.

В соответствии с дополнительной особенностью изобретения средства определения организованы для определения каждого коэффициента вещественнозначной матрицы, главным образом как абсолютное значение соответствующего коэффициента инверсных матриц.

Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования.

В соответствии с дополнительной особенностью изобретения средства определения организованы для определения матриц декодирования по матрицам переноса поддиапазонов, которые представляют собой умножение соответствующих матриц декодирования и матриц кодирования.

Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования. Соответствующие матрицы кодирования и декодирования могут быть матрицами кодирования и декодирования для одного и того же частотного поддиапазона. Средства определения могут в особенности быть организованными для выбора значений коэффициентов матриц декодирования таких, чтобы матрицы переноса обладали желаемыми характеристиками.

В соответствии с дополнительной особенностью изобретения средства определения организованы для определения матриц декодирования по величине, измеренной только в матрицах переноса.

Это может делать возможным особенно эффективное осуществление и/или улучшенное качество декодирования. В особенности средства определения могут быть организованы для игнорирования фазовых измерений при определении матриц декодирования. Это может снизить комплексность и при этом сохранить низкую воспринимаемую деградацию аудиокачества.

В соответствии с дополнительной особенностью изобретения матрицы переноса каждого поддиапазона имеют вид:

где G - поддиапазон матрицы декодирования, а H - поддиапазон матрицы кодирования, и средство определения организовано для выбора коэффициентов матрицы

так, что измерения мощности p12 и p21 удовлетворяют критерию.

Это может сделать возможным особенно эффективное осуществление и/или улучшенное качество кодирования. Матрица декодирования может быть выбрана для того, чтобы привести к тому, что измерение мощности будет ниже порогового значения (которое может быть определено по ограничивающему условию или другим параметрам), или может, например, быть выбрана как матрица декодирования, приводящая к минимальному измерению мощности.

В соответствии с дополнительной особенностью изобретения измерение амплитуды определяется по

Это может сделать возможным особенно эффективное осуществление и/или улучшенное качество кодирования.

В соответствии с дополнительной особенностью изобретения средство определения также организовано для выбора коэффициентов матрицы под действием ограничивающих условий амплитуды p11 и p22, равной по существу единице.

Это может сделать возможным особенно эффективное осуществление и/или улучшенное качество кодирования.

В соответствии с дополнительной особенностью изобретения сигнал понижающего микширования и параметрические многоканальные данные находятся в соответствии со стандартом окружающего MPEG.

Изобретение может давать возможность особо эффективной, низкой комплексности и/или улучшенного качества декодирования аудиосигнала для сигнала, совместимого с окружающим MPEG.

В соответствии с дополнительной особенностью изобретения матрица кодирования представляет собой матрицу кодирования Матричной Окружающей Совместимости MPEG, а первый N-канальный сигнал является сигналом Матричной Окружающей Совместимости MPEG.

Изобретение может давать возможность особо эффективной, низкой комплексности и/или улучшенного качества аудио и может в особенности давать возможность низко комплексному декодированию эффективно компенсировать операции Матричной Окружающей Совместимости MPEG, выполняемые в кодере.

В соответствии с другим аспектом изобретения обеспечен способ аудиодекодирования, способ включает в себя прием входных данных, включающих в себя N-канальный сигнал, соответствующий сигналу понижающего микширования M-канального аудиосигнала, M>N, с применением матриц кодирования комплекснозначного поддиапазона в частотных поддиапазонах и с параметрическими многоканальными данными, связанными с сигналом понижающего микширования; генерацию частотных поддиапазонов для N-канального сигнала, по крайней мере, несколько частотных поддиапазонов являются вещественнозначными частотными поддиапазонами; определение матриц декодирования вещественнозначного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным; генерацию данных понижающего микширования, соответствующих сигналу понижающего микширования посредством умножения матриц декодирования вещественнозначного поддиапазона и данных N-канального сигнала в, по крайней мере, некоторых вещественных частотных поддиапазонах.

В соответствии с другим аспектом изобретения обеспечен приемник для приема N-канального сигнала, приемник включает в себя средство приема входных данных, включающих в себя N-канальный сигнал, соответствующий сигналу понижающего микширования M-канального аудиосигнала, M>N, с применением комплекснозначных матриц кодирования поддиапазона в частотных поддиапазонах и с параметрическими многоканальными данными, связанными с сигналом понижающего микширования; средство для генерации частотных поддиапазонов для N-канального сигнала, при этом, по крайней мере, несколько частотных поддиапазонов являются вещественнозначными; средство определения матриц декодирования вещественного поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным; средство генерации данных понижающего микширования, соответствующих сигналу понижающего микширования посредством умножения вещественнозначных матриц декодирования поддиапазона и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.

В соответствии с другим аспектом изобретения обеспечена система передачи для передачи аудиосигнала, система передачи включает в себя передатчик, включающий в себя средство генерации N-канального сигнала понижающего микширования M-канального аудиосигнала, M>N, средство генерации параметрических многоканальных данных, связанных с сигналом понижающего микширования, средство для формирования первого N-канального сигнала посредством применения комплексных матриц кодирования поддиапазонов к N-канальному понижено микшированному сигналу в частотных поддиапазонах, средство генерации второго N-канального сигнала, включающего в себя первый N-канальный сигнал и параметрические многоканальные данные, и средство передачи второго N-канального сигнала на приемник; приемник, включающий в себя средство приема второго N-канального сигнала, средство для генерации частотных поддиапазонов для первого N-канального сигнала, по крайней мере, несколько частотных вещественнозначных поддиапазонов, средство определения вещественнозначных матриц декодирования поддиапазонов для компенсации приложения матриц кодирования по параметрическим многоканальным данным, и средство генерации данных понижающего микширования, отвечающих N-канальному сигналу понижающего микширования, посредством умножения вещественнозначных матриц декодирования поддиапазонов и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.

Второй N-канальный сигнал может иметь дополнительный связанный канал, включающий в себя параметрические многоканальные данные.

В соответствии с другим аспектом изобретения обеспечен способ приема аудиосигнала из масштабируемого аудиопотока битов, способ включает в себя входные принимаемые данные, включающие в себя N-канальный сигнал, соответствующий сигналу понижающего микширования M-канального аудиосигнала, M>N, с применением комплекснозначных матриц кодирования поддиапазона в частотных поддиапазонах и с параметрическими многоканальными данными, связанными с сигналом понижающего микширования; генерацию частотных поддиапазонов для N-канального сигнала, по крайней мере, несколько из частотных поддиапазонов являются вещественнозначными; определение вещественнозначных матриц декодирования поддиапазона для компенсации применения матриц кодирования по параметрическим многоканальным данным и генерацию данных понижающего микширования, соответствующих понижено микшированному сигналу, посредством умножения вещественнозначных матриц декодирования поддиапазона и данных N-канального сигнала в, по крайней мере, некоторых вещественнозначных частотных поддиапазонах.

В соответствии с другим аспектом изобретения обеспечен способ приема и передачи аудиосигнала, способ включает в себя передатчик, выполняющий следующие действия: генерацию N-канального понижено микшированного сигнала M-канального аудиосигнала, M>N, генерацию параметрических многоканальных данных, связанных с понижено микшированным сигналом, генерацию первого N-канального сигнала посредством применения комплекснозначных матриц кодирования поддиапазона к N-канальному понижено микшированному сигналу в частотных поддиапазонах, генерацию второго N-канального сигнала, включающего в себя первый N-канальный сигнал и параметрические многоканальные данные, и передачу второго N-канального сигнала на приемник; на приемнике выполняются следующие операции: прием второго N-канального сигнала; генерация частотных поддиапазонов для первого N-канального сигнала, по крайней, мере несколько частотных поддиапазонов являются вещественнозначными; определение вещественнозначных матриц декодирования поддиапазонов для компенсации применения матриц кодирования по параметрическим многоканальным данным; генерация данных понижающего микширования, отвечающих N-канальному сигналу понижающего микширования посредством матричного умножения вещественнозначных матриц декодирования поддиапазона и данных N-канального сигнала в, по крайней мере, нескольких вещественнозначных частотных поддиапазонах.

Эти и другие аспекты, особенности и преимущества изобретения будут очевидны из и объясняться с помощью ссылок на вариант(ы) осуществления, описанные далее в этом документе.

Будут описаны варианты реализации изобретения, только в качестве примера, со ссылками на чертежи, которые иллюстрируют:

Фиг.1 - пример кодера для кодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;

Фиг.2 - пример декодера для декодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;

Фиг.3 - пример систем матричного окружного кодирования/декодирования в соответствии с предыдущим уровнем техники;

Фиг.4 - пример кодера для кодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;

Фиг.5 - пример декодера для декодирования многоканальных аудиосигналов в соответствии с предыдущим уровнем техники;

Фиг.6 - пример группы фильтров для генерации комплексных и вещественнозначных частотных поддиапазонов;

Фиг.7 - систему передачи для связи аудиосигнала в соответствии с некоторыми вариантами реализации изобретения;

Фиг.8 - декодер в соответствии с некоторыми вариантами реализации изобретения;

Фиг.9-14 - эксплуатационные характеристики декодера в соответствии с некоторыми вариантами реализации изобретения; и

Фиг.15 - способ декодирования в соответствии с некоторыми вариантами реализации изобретения.

Последующее описание сосредоточено на вариантах осуществления изобретения, применимых к декодеру для декодирования окружающего MPEG кодированного сигнала, включая кодирование Матричной Окружающей Совместимости. Несмотря на это будет оценено, что изобретение не ограничено этим применением, но может применяться ко многим другим стандартам кодирования.

На Фиг.7 представлена система передачи 700 для передачи аудиосигнала в соответствии с некоторыми вариантами реализации изобретения. Система передачи 700 включает в себя передатчик 701, который связан с приемником 703 посредством сети 705, которой, в частности, может быть Интернет.

В частном примере передатчик 701 представляет собой записывающее устройство, а приемник 703 представляет собой устройство проигрывания сигнала, но будет оценено по достоинству, что в других реализациях передатчик и приемник могут использоваться в других приложениях и для других целей.

В частном примере, где поддерживается функция записи сигнала, передатчик 701 включает в себя цифратор 707, который принимает аналоговый многоканальный сигнал, который преобразуется в цифровой PCM (Pulse Code Modulated - импульсно-кодовая модуляция) многоканальный сигнал посредством дискретизации и аналогово-цифрового преобразования.

Передатчик 701 связан с кодером 709, представленным на Фиг.1, который кодирует PCM сигнал в соответствии с алгоритмом кодирования окружающего MPEG, который включает в себя функциональность для кодирования Матричной Окружающей Совместимости (Matrix Surround Compatibility). Кодер 709 может, например, быть декодером известного уровня техники, представленным на Фиг.4. В примере кодер 709, в частности, генерирует стерео MPEG Матричной Окружающей Совместимости стереосигнала понижающего микширования.

Таким образом, кодер 709 формирует следующий сигнал:

где L, R - традиционное окружающий MPEG стереопонижающее микширование, а LMTX, RMTX - кодированное кодером 709 круговой матрицей понижающее микширование на выходе. Кроме того, сигнал, сгенерированный кодером 709, включает в себя многоканальные параметрические данные, сгенерированные посредством окружающего MPEG кодирования. Кроме того, hxy являются комплексными коэффициентами, определяемыми по многоканальным параметрам. Специалистами в технике будет очевидно, что обработка, выполняемая кодером 709, производится в комплекснозначных поддиапазонах и использует комплексные действия.

Кодер 709 связан с сетевым передатчиком 711, который принимает кодированный сигнал и является интерфейсом с сетью 705. Сетевой передатчик 711 может передавать кодированный сигнал на приемник 703 через сеть 705.

Приемник 703 включает в себя сетевой интерфейс 713, который находится на границе с сетью 705 и который организован для приема кодированного сигнала с передатчика 701.

Сетевой интерфейс 713 связан с декодером 715. Декодер 715 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования. В примере декодер 715 генерирует исходный многоканальный сигнал. В частности, декодер 715 сначала генерирует сбалансированное стереопонижающее микширование, соответствующее понижающему микшированию, сгенерированному посредством окружающего MPEG кодирования, предшествующего выполнению операций совместимых с окружающим MPEG матрицей. Затем из этого понижающего микширования и принятых многоканальных параметрических данных формируется декодированный многоканальный сигнал.

В частном примере, в котором поддерживается функция воспроизведения сигнала, приемник 703 также включает в себя устройство воспроизведения сигнала 717, которое принимает декодированный многоканальный аудиосигнал с декодера 715 и представляет его пользователю. В частности, устройство воспроизведения сигнала 717 может включать в себя цифроаналоговый преобразователь, усилители и динамики, как требуется для вывода декодированного аудиосигнала.

На Фиг.8 более подробно представлен декодер 715.

Декодер 715 включает в себя приемник 801, который принимает сигнал, сгенерированный кодером 709. Как упоминалось выше, сигнал представляет собой стереосигнал, который отвечает сигналу понижающего микширования, который был обработан посредством опорных комплексных значений в комплексных частотных поддиапазонах, умноженных на комплексную матрицу кодирования Н. Кроме того, принятый сигнал включает в себя многоканальные параметрические данные, которые отвечают сигналу понижающего микширования. В частности, принятый сигнал представляет собой кодированный окружающий MPEG сигнал с матричной окружающей совместимостью.

Приемник 801, кроме того, обеспечивает основное декодирование принятого сигнала для генерации РСМ сигнала понижающего микширования.

Приемник 801 связан с процессором параметрических данных 803, который извлекает из принятого сигнала многоканальные параметрические данные.

Приемник 801, кроме того, связан с набором фильтров поддиапазона 805, который преобразует принятый стереосигнал в частотную область. В частности, набор фильтров поддиапазона 805 генерирует множество частотных поддиапазонов. По крайней мере, несколько из этих частотных поддиапазонов являются вещественнозначными частотными поддиапазонами. Набор фильтров поддиапазона 805 может, в частности, соответствовать функциональности, проиллюстрированной на Фиг.6. Таким образом, набор фильтров поддиапазона 805 может формировать К комплекснозначных поддиапазонов и М-К вещественнозначных поддиапазонов. Вещественнозначные поддиапазоны будут типично поддиапазонами более высоких частот, таких как поддиапазоны выше 2 кГц. Использование вещественнозначных поддиапазонов по существу служат для генерации поддиапазона, так же как и операции, выполняемые на фрагментах этих поддиапазонов. Таким образом, в декодере 715 М-К поддиапазонов обрабатываются как вещественные данные и операции скорее, чем комплексные данные и операции, тем самым обеспечивая по существу комплексность и снижение стоимости.

Набор фильтров поддиапазона 805 связан с процессором компенсации 807, который генерирует данные понижающего микширования, отвечающие сигналу понижающего микширования. В частности, процессор компенсации 807, скомпенсированный для операций матричной окружной совместимости посредством попыток перевернуть умножение на матрицу кодирования Н в частотных поддиапазонах кодера 709. Эта компенсация выполняется посредством умножения значений данных поддиапазонов на матрицу декодирования поддиапазона G. Однако в отличие от обработки в кодере 709 умножение матриц в вещественнозначных поддиапазонах декодера 715 выполняется исключительно в вещественной области. Таким образом, не только выборочные значения вещественной выборки, но и матричные коэффициенты матрицы декодирования G являются вещественнозначными коэффициентами.

Процессор компенсации 807 связан с матричным п