Способы и устройства для объединенного многоканального кодирования
Иллюстрации
Показать всеИзобретение относится к средствам кодирования и декодирования для кодирования каналов аудиосистемы с по меньшей мере четырьмя каналами. Технический результат заключается в повышении эффективности кодирования многоканального аудио. Устройство декодирования имеет первый компонент стереодекодирования, который подвергает первую пару входных каналов первому стереодекодированию, и второй компонент стереодекодирования, который подвергает вторую пару входных каналов второму стереодекодированию. Результаты первого и второго компонентов стереодекодирования крест-накрест связываются с третьим и четвертым компонентом стереодекодирования, при этом каждый выполняет стереодекодирование в отношении одного канала, полученного из первого компонента стереодекодирования, и одного канала, полученного из второго компонента стереодекодирования. 8 н. и 31 з.п. ф-лы, 21 ил.
Реферат
ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
По данной заявке испрашивается приоритет Предварительной Патентной Заявки США № 61/877,189, поданной 12 сентября 2013г., которая во всей своей полноте включена в настоящее описание посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Раскрываемое в данном документе изобретение в целом относится к аудио кодированию и декодированию. В частности, оно относится к аудио кодеру и аудио декодеру, выполненным с возможностью кодирования и декодирования каналов многоканальной аудиосистемы посредством выполнения множества стерео преобразований.
ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ
Существуют методики известного уровня техники для кодирования каналов многоканальной аудиосистемы. Примером многоканальной аудиосистемы является 5.1 канальная система, содержащая центральный канал (C), левый передний канал (Lf), правый передний канал (Rf), левый пространственный канал (Ls), правый пространственный канал (Rs), и канал низкочастотных эффектов (Lfe). Существующий подход кодирования такой системы состоит в том, чтобы кодировать канал C отдельно, и выполнять объединенное стереокодирование передних каналов Lf и Rf, и объединенное стереокодирование пространственных каналов Ls и Rs. Lfe канал также кодируется отдельно и в нижеследующем всегда будет предполагаться в качестве кодируемого отдельно.
Существующий подход обладает некоторыми недостатками. Например, рассмотрим ситуацию, когда Lf канал и Ls канал содержат сходный аудио сигнал сходной громкости. Такой аудио сигнал будет звучать, как если исходит из виртуального источника звука, располагающегося между Lf и Ls громкоговорителем. Тем не менее, описанный выше подход неспособен эффективно кодировать такой аудио сигнал, поскольку он предписывает, что Lf канал должен кодироваться с Rf каналом, вместо выполнения объединенного кодирования Lf и Ls канала. Таким образом, сходства между аудио сигналами Lf и Ls громкоговорителей не могут быть использованы для того, чтобы добиться эффективного кодирования.
Таким образом, существует потребность в инфраструктуре кодирования/декодирования, которая обладает повышенной гибкостью, когда речь заходит о кодировании многоканальных систем.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
В дальнейшем, примерные варианты осуществления будут описаны более подробно и со ссылкой на сопроводительные чертежи, на которых:
Фиг. 1a иллюстрирует примерную двухканальную структуру.
Фиг. 1b и 1c иллюстрируют компоненты стереокодирования и декодирования в соответствии с примером.
Фиг. 2a иллюстрирует примерную трехканальную структуру.
Фиг. 2b и 2c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для трехканальной структуры в соответствии с примером.
Фиг. 3a иллюстрирует примерную четырехканальную структуру.
Фиг. 3b и 3c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для четырехканальной структуры в соответствии с примерным вариантом осуществления.
Фиг. 4a иллюстрирует примерную пятиканальную структуру.
Фиг. 4b и 4c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для пятиканальной структуры в соответствии с примерным вариантом осуществления.
Фиг. 5a иллюстрирует примерную многоканальную структуру.
Фиг. 5b и 5c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для многоканальной структуры в соответствии с примерным вариантом осуществления.
Фиг. 6a, 6b, 6c, 6d и 6e иллюстрируют конфигурации кодирования пятиканальной аудиосистемы в соответствии с примером.
Фиг. 7 иллюстрирует устройство декодирования в соответствии с вариантами осуществления.
ПОДРОБНОЕ ОПИСАНИЕ
В свете вышеупомянутого, цель состоит в том, чтобы предоставить устройство кодирования и устройство декодирования и ассоциированные способы, которые обеспечивают гибкое и эффективное кодирование каналов в многоканальной аудиосистеме.
I. Обзор – Кодер
В соответствии с первым аспектом, предоставляется способ кодирования, устройство кодирования и компьютерный программный продукт в многоканальной аудиосистеме.
В соответствии с примерными вариантами осуществления, предоставляется способ кодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащий этапы, на которых: принимают первую пару входных каналов и вторую пару входных каналов; подвергают первую пару входных каналов первому стереокодированию; подвергают вторую пару входных каналов второму стереокодированию; подвергают первый канал, полученный в результате первого стереокодирования, и аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, третьему стереокодированию с тем, чтобы получить первую пару выходных каналов; подвергают второй канал, полученный в результате первого стереокодирования, и второй канал, полученный в результате второго стереокодирования, четвертому стереокодированию с тем, чтобы получить вторую пару выходных каналов; и выводят первую и вторую пару выходных каналов.
Первая пара и вторая пара входных каналов соответствуют каналам, которые должны быть закодированы. Первая пара и вторая пара выходных каналов соответствуют закодированным каналам.
Рассмотрим примерную аудиосистему, содержащую Lf канал, Rf канал, Ls канал, и Rs канал. Если Lf канал и Ls канал ассоциированы с первой парой входных каналов, а Rf канал и Rs канал ассоциированы со второй парой входных каналов, вышеупомянутый примерный вариант осуществления будет подразумевать, что сначала кодируются объединенным образом Lf и Ls каналы, и кодируются объединенным образом Rf и Rs каналы. Другими словами, каналы сначала кодируются в направлении вперед-назад. Результат первого (вперед-назад) кодирования затем вновь кодируется, означая, что кодирование применяется в направлении влево-вправо.
Другая опция состоит в том, чтобы ассоциировать Lf канал и Rf канал с первой парой входных каналов, и Ls канал и Rs канал со второй парой входных каналов. Такое отображение каналов будет подразумевать, что сначала выполняется кодирование в направлении влево-вправо, за которым следует кодирование в направлении вперед-назад.
Другими словами, вышеупомянутый способ кодирования обеспечивает повышенную гибкость в отношении того, как объединенным образом кодировать каналы многоканальной системы.
В соответствии с примерными вариантами осуществления, аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, является первым каналом, полученным в результате второго стереокодирования. Такой вариант осуществления эффективен, при выполнении кодирования для четырехканальной структуры.
В соответствии с другими примерными вариантами осуществления второй канал, полученный в результате первого стереокодирования, является дополнительно кодированным перед тем, как подвергаться четвертому стереокодированию. Например, способ кодирования может дополнительно содержать этапы, на которых: принимают пятый входной канал; подвергают пятый входной канал и первый канал, полученный в результате второго стереокодирования, пятому стереокодированию; при этом аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, является первым каналом, полученным в результате пятого стереокодирования; и при этом второй канал, полученный в результате пятого стереокодирования, выводится в качестве пятого выходного канала.
Таким образом, пятый входной канал, следовательно, объединенным образом кодируется со вторым каналом, полученным в результате первого стереокодирования. Например, пятый входной канал может соответствовать центральному каналу, а второй канал, полученный в результате первого стереокодирования, может соответствовать объединенному кодированию Rf и Rs каналов или объединенному кодированию Lf и Ls каналов. Другими словами, в соответствии с примерами, центральный канал C может быть объединенным образом кодированным что касается левой стороны или правой стороны структуры каналов.
Примерные варианты осуществления, описываемые выше, относятся к аудиосистемам, содержащим четыре или пять каналов. Тем не менее, раскрываемые в данном документе принципы могут быть расширены на шесть каналов, семь каналов и т.д. В частности, дополнительная пара входных каналов может быть добавлена к четырехканальной структуре, чтобы прийти к шестиканальной структуре. Подобным образом, дополнительная пара входных каналов может быть добавлена к пятиканальной структуре, чтобы прийти к семиканальной структуре, и т.д.
В частности, в соответствии с примерными вариантами осуществления способ кодирования может дополнительно содержать этапы, на которых: принимают третью пару входных каналов; подвергают второй канал из первой пары входных каналов и первый канал из третьей пары входных каналов шестому стереокодированию; подвергают второй канал из второй пары входных каналов и второй канал из третьей пары входных каналов седьмому стереокодированию; при этом первый канал, полученный в результате шестого стереокодирования, и первый канал из первой пары входных каналов подвергаются первому стереокодированию;
при этом первый канал, полученный в результате седьмого стереокодирования, и первый канал из второй пары входных каналов подвергаются второму стереокодированию; и подвергают второй канал, полученный в результате шестого стереокодирования, и второй канал, полученный в результате седьмого стереокодирования, восьмому стереокодированию с тем, чтобы получить третью пару выходных каналов.
Вышеупомянутое обеспечивает гибкий подход добавления дополнительных пар каналов к структуре каналов.
В соответствии с примерными вариантами осуществления, первое, второе, третье и четвертое стереокодирование и пятое, шестое, седьмое и восьмое стереокодирование, если применимо, содержат выполнение стереокодирования в соответствии со схемой кодирования, включающей в себя левое-правое кодирование (LR-кодирование), суммарно-разностное кодирование (или среднее-остаточное кодирование, MS-кодирование), и улучшенное суммарно-разностное кодирование (или улучшенное среднее-остаточное кодирование, улучшенное MS-кодирование).
Это обладает преимуществом в том, что это дополнительно добавляет гибкости системе. В частности, посредством выбора разных типов схем кодирования кодирование может быть адаптировано, чтобы оптимизировать кодирование для наличных аудио сигналов.
Разные схемы кодирования будут описаны более подробно ниже. Тем не менее, вкратце, левое-правое кодирование означает, что осуществляется сквозной пропуск входных сигналов (выходные сигналы равны входным сигналам). Суммарно-разностное кодирование означает, что один из выходных сигналов является суммой входных сигналов, а другой выходной сигнал является разностью входных сигналов. Улучшенное MS-кодирование означает, что один из выходных сигналов является взвешенной суммой входных сигналов, а другой выходной сигнал является взвешенной разностью входных сигналов.
Первое, второе, третье, и четвертое стереокодирование и пятое, шестое, седьмое, и восьмое стереокодирование, если применимо, все могут применять одну и туже схему стереокодирования. Тем не менее, первое, второе, третье, и четвертое стереокодирование и пятое, шестое, седьмое, и восьмое стереокодирование, если применимо, также могут применять разные схемы стереокодирования.
В соответствии с примерными вариантами осуществления, разные схемы кодирования могут быть использованы для разных полос частот. Таким образом, кодирование может быть оптимизировано касательно аудио содержимого в разных полосах частот. Например, более усовершенствованное кодирование (в единицах количества бит, затрачиваемых при кодировании) может быть применено к полосам низких частот, к которым ухо наиболее чувствительно.
В соответствии с примерными вариантами осуществления, разные схемы кодирования могут быть использованы для разных временных кадров. Таким образом, кодирование может быть адаптировано и оптимизировано касательно аудио содержимого в разных временных кадрах.
Первое, второе, третье, четвертое и пятое, шестое, седьмое и восьмое стереокодирование, если применимо, выполняются в области модифицированного дискретного косинусного преобразования, MDCT, с критической дискретизацией. Под критической дискретизацией подразумевается то, что количество элементов дискретизации кодированных сигналов равно количеству элементов дискретизации исходных сигналов.
MDCT преобразует сигнал из временной области в область MDCT на основании последовательности окон. Помимо некоторых исключительных случаев, входные каналы преобразуются в область MDCT, используя одинаковое окно, как касательно размера окна, так и длины преобразования. Это позволяет стереокодированию применять среднее-остаточное и улучшенное MS-кодирование сигналов.
Примерные варианты осуществления также относятся к компьютерному программному продукту, содержащему компьютерно-читаемый носитель с инструкциями для выполнения любого из способов кодирования, раскрытых выше. Компьютерно-читаемый носитель может быть не временным компьютерно-читаемым носителем.
В соответствии с примерными вариантами осуществления, предоставляется устройство кодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащее: компонент приема, выполненный с возможностью приема первой пары входных каналов и второй пары входных каналов; первый компонент стереокодирования, выполненный с возможностью подвергать первую пару входных каналов первому стереокодированию;
второй компонент стереокодирования, выполненный с возможностью подвергать вторую пару входных каналов второму стереокодированию; третий компонент стереокодирования, выполненный с возможностью подвергать первый канал, полученный в результате первого стереокодирования, и аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, третьему стереокодированию с тем, чтобы получить первую пару выходных каналов; четвертый компонент стереокодирования, выполненный с возможностью подвергать второй канал, полученный в результате первого стереокодирования, и второй канал, полученный в результате второго стереокодирования, четвертому стереокодированию с тем, чтобы получить вторую пару выходных каналов; и компонент вывода, выполненный с возможностью вывода первой и второй пары выходных каналов.
Примерные варианты осуществления также предоставляют аудиосистему, содержащую устройство кодирования в соответствии с вышеупомянутым.
II. Обзор – Декодер
В соответствии со вторым аспектом, предоставляется способ декодирования, устройство декодирования, и компьютерный программный продукт в многоканальной аудиосистеме.
Второй аспект может в целом обладать точно такими же признаками и преимуществами, что и первый аспект.
В соответствии с примерными вариантами осуществления, предоставляется способ декодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащий этапы, на которых: принимают первую пару входных каналов и вторую пару входных каналов; подвергают первую пару входных каналов первому стереодекодированию; подвергают вторую пару входных каналов второму стереодекодированию; подвергают первый канал, полученный в результате первого стереодекодирования, и первый канал, полученный в результате второго стереодекодирования, третьему стереодекодированию с тем, чтобы получить первую пару выходных каналов; подвергают аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, и второй канал, полученный в результате второго стереодекодирования, четвертому стереодекодированию с тем, чтобы получить вторую пару выходных каналов; и выводят первую и вторую пару выходных каналов.
Первая и вторая пара входных каналов соответствуют закодированным каналам, которые должны быть декодированы. Первая и втора пара выходных каналов соответствуют декодированным каналам.
В соответствии с примерными вариантами осуществления, аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, может быть равен второму каналу, полученному в результате первого стереодекодирования.
Например, способ может дополнительно содержать этапы, на которых: принимают пятый входной канал; подвергают пятый входной канал и второй канал, полученный в результате первого стереодекодирования, пятому стереодекодированию; при этом аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, равен первому каналу, полученному в результате пятого стереодекодирования; и при этом второй канал, полученный в результате пятого стереодекодирования, выводится в качестве пятого выходного канала.
Способ декодирования может дополнительно содержать этапы, на которых: принимают третью пару входных каналов; подвергают третью пару входных каналов шестому стереодекодированию; подвергают второй канал из первой пары выходных каналов и первый канал, полученный в результате шестого стереодекодирования, седьмому стереодекодированию; подвергают второй канал из второй пары выходных каналов и второй канал, полученный в результате шестого стереодекодирования, восьмому стереодекодированию; и выводят первый канал из первой пары выходных каналов, пару каналов, полученных в результате седьмого стереодекодирования, первый канал из второй пары выходных каналов и пару каналов, полученных в результате восьмого стереодекодирования.
В соответствии с примерными вариантами осуществления, первое, второе, третье, и четвертое стереодекодирование и пятое, шестое, седьмое, и восьмое стереодекодирование, если применимо, содержит выполнение стереодекодирования в соответствии со схемой кодирования, включающей в себя левое-правое кодирование, суммарно-разностное кодирование, и улучшенное суммарно-разностное кодирование.
Разные схемы кодирования используются для разных полос частот. Разные схемы кодирования могут быть использованы для разных временных кадров.
Первое, второе, третье, четвертое и пятое, шестое, седьмое, и восьмое стереодекодирование, если применимо, предпочтительно выполняются в области модифицированного дискретного косинусного преобразования, MDCT, с критической дискретизацией. Предпочтительно, все входные каналы преобразуются в область MDCT, используя одинаковое окно, как касательно формы окна, так и длины преобразования.
Вторая пара входных каналов может иметь спектральное содержимое, соответствующее полосам частот вплоть до первого порогового значения частоты, в соответствии с чем пара каналов, полученная в результате второго стереодекодирования, равна нулю для полос частот выше первого порогового значения частоты. Например, спектральное содержимое второй пары входных каналов может быть установлено равным нулю на стороне кодера для того, чтобы уменьшить объем данных, которые должны быть переданы декодеру.
В случае, когда вторая пара входных каналов имеет только спектральное содержимое соответствующее полосам частот вплоть до первого порогового значения частоты, а первая пара входных каналов имеет спектральное содержимое, соответствующее полосам частот вплоть до второго порогового значения частоты, которое больше первого порогового значения частоты, способ может дополнительно применять методики параметрического повышающего микширования для частот выше первой частоты, чтобы компенсировать ограничение частоты второй пары входных каналов. В частности, способ может содержать этапы, на которых: представляют первую пару выходных каналов как первый сигнал суммы и первый сигнал разности, и представляют вторую пару выходных каналов как второй сигнал суммы и второй сигнал разности; расширяют первый сигнал суммы и второй сигнал суммы до диапазона частот выше второго порогового значения частоты посредством выполнения реконструкции высокой частоты; микшируют первый сигнал суммы и первый сигнал разности, при этом для частот ниже первого порогового значения частоты микширование содержит выполнение обратного суммарно-разностного преобразования первого сигнала суммы и первого сигнала разности, а для частот выше первого порогового значения частоты, микширование содержит выполнение параметрического повышающего микширования части первого сигнала суммы, соответствующей полосам частот выше первого порогового значения частоты; и микшируют второй сигнал суммы и второй сигнал разности, при этом для частот ниже первого порогового значения частоты микширование содержит выполнение обратного суммарно-разностного преобразования второго сигнала суммы и второго сигнала разности, а для частот выше первого порогового значения частоты микширование содержит выполнение параметрического повышающего микширования части второго сигнала суммы, соответствующей полосам частот выше первого порогового значения частоты.
Этапы расширения первого сигнала суммы и второго сигнала суммы до диапазона частот выше второго порогового значения частоты, микширования первого сигнала суммы и первого сигнала разности, и микширования второго сигнала суммы и второго сигнала разности предпочтительно выполняются в области квадратурного зеркального фильтра, QMF. В этом заключается отличие от первого, второго, третьего и четвертого стереодекодирования, которое, как правило, проводится в области MDCT. В соответствии с примерными вариантами осуществления, предоставляется компьютерный программный продукт, содержащий компьютерно-читаемый носитель с инструкциями для выполнения способа в виде любого из предшествующих пунктов формулы изобретения. Компьютерно-читаемый носитель может быть не временным компьютерно-читаемым носителем.
В соответствии с примерными вариантами осуществления, предоставляется устройство декодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащее: компонент приема, выполненный с возможностью приема первой пары входных каналов и второй пары входных каналов; первый компонент стереодекодирования, выполненный с возможностью подвергать первую пару входных каналов первому стереодекодированию; второй компонент стереодекодирования, выполненный с возможностью подвергать вторую пару входных каналов второму стереодекодированию; третий компонент стереодекодирования, выполненный с возможностью подвергать первый канал, полученный в результате первого стереодекодирования, и первый канал, полученный в результате второго стереодекодирования, третьему стереодекодированию с тем, чтобы получить первую пару выходных каналов; четвертый компонент стереодекодирования, выполненный с возможностью подвергать аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, и второй канал, полученный в результате второго стереодекодирования, четвертому стереодекодированию с тем, чтобы получить вторую пару выходных каналов; и компонент вывода, выполненный с возможностью вывода первой и второй пары выходных каналов.
В соответствии с примерными вариантами осуществления, предоставляется аудиосистема, содержащая устройство декодирования в соответствии с вышеупомянутым.
III. Обзор – Формат сигнализации
В соответствии с третьим аспектом, предоставляется формат сигнализации для указания декодеру посредством кодера конфигурации кодирования, чтобы использовать при декодировании сигнала, представляющего собой аудио содержимое многоканальной аудиосистемы, причем многоканальная аудиосистема содержащая, по меньшей мере, четыре канала, при этом упомянутые, по меньшей мере, четыре канала являются разделяемыми на разные группы в соответствии со множеством конфигураций, причем каждая группа соответствует каналам, которые кодируются объединенным образом, причем формат сигнализации содержит, по меньшей мере, два бита, указывающие одну из множества конфигураций, которая должна быть применена декодером.
В этом есть преимущество, которое состоит в том, что это обеспечивает эффективный способ сигнализации декодеру того, какую конфигурацию кодирования, среди множества возможных конфигураций кодирования, использовать при декодировании.
Конфигурации кодирования могут быть ассоциированы с идентификационным номером. По этой причине, по меньшей мере, два бита указывают одну из множества конфигураций, посредством указания идентификационного номера упомянутой одной из множества конфигураций.
В соответствии с примерными вариантами осуществления, многоканальная аудиосистема содержит пять каналов и конфигурации кодирования соответствуют: объединенному кодированию пяти каналов; объединенному кодированию четырех каналов и отдельному кодированию последнего канала; объединенному кодированию трех каналов и отдельному объединенному кодированию двух других каналов; и объединенному кодированию двух каналов, отдельному объединенному кодированию двух других каналов, и отдельному кодированию последнего канала.
В случае, когда, по меньшей мере, два бита указывают объединенное кодирование двух каналов, отдельное объединенное кодирование двух других каналов, и отдельное кодирование последнего канала, по меньшей мере, два бита могут дополнительно включать бит, указывающий на то, какие два канала должны быть кодированы объединенным образом и какие другие два канала должны быть кодированы объединенным образом.
IV. Примерные варианты осуществления
Фиг. 1a иллюстрирует структуру 100 каналов аудиосистемы, содержащую первый канал 102, который в данном случае соответствует левому громкоговорителю L, и второй канал 104, который в данном случае соответствует правому громкоговорителю R. Первый 102 и второй 104 канал могут быть подвергнуты объединенному стереокодированию и декодированию.
Фиг. 1b иллюстрирует компонент 110 стереокодирования, который может быть использован, чтобы выполнять объединенное стереокодирование первого канала 102 и второго канала 104 с Фиг. 1a. В целом, компонент 110 стереокодирования преобразует первый канал 112 (такой как первый канал 102 на Фиг. 1a), здесь обозначенный как Ln, и второй канал 114 (такой как второй канал 104 на Фиг. 1a), здесь обозначенный как Rn, в первый выходной канал 116, здесь обозначенный как An, и второй выходной канал 118, здесь обозначенный как Bn. Во время процесса кодирования, компонент 110 стереокодирования может извлекать дополнительную информацию 115, включающую в себя параметр, которая будет рассмотрен более подробно ниже. Параметр может быть разным для разных полос частот.
Компонент 110 кодирования квантует первый выходной канал 116, второй выходной канал 118, и дополнительную информацию 115 и кодирует это в форме битового потока, который отправляется соответствующему декодеру.
Фиг. 1c иллюстрирует соответствующий компонент 120 стереодекодирования. Компонент 120 стереодекодирования принимает битовый поток от устройства 110 кодирования и декодирует и деквантует первый канал 116’ An (соответствующий первому выходному каналу 116 на стороне кодера), второй канал 118’ Bn (соответствующий второму выходному каналу 118 на стороне кодера), и дополнительную информацию 115’. Компонент 120 стереодекодирования выводит первый выходной канал 112’ Ln и второй выходной канал 114’ Rn. Компонент 120 стереодекодирования может дополнительно брать дополнительную информацию 115’ в качестве ввода, которая соответствует дополнительной информации 115, которая была извлечена на стороне кодера.
Компоненты 110, 120 кодирования/декодирования могут применять разные схемы кодирования. То, какую схему кодирования применять, может быть просигнализировано компоненту 120 декодирования посредством компонента 110 кодирования в дополнительной информации 115. Компонент 110 кодирования решает, какую из трех разных схем кодирования, описываемых ниже, использовать. Данное решение является адаптивным к сигналу и, следовательно, может варьироваться по времени от кадра к кадру. Кроме того, оно даже может варьироваться между разными полосами частот. Фактический процесс принятия решения в кодере довольно сложен, и, как правило, учитывает эффекты квантования/кодирования в области MDCT, как впрочем и аспекты относящиеся к восприятию и затраты на дополнительную информацию.
В соответствии с первой схемой кодирования, именуемой в данном документе как левое-правое кодирование «LR-кодирование» входные и выходные каналы компонентов 110 и 120 стерео преобразования связаны в соответствии со следующими выражениями:
Ln = An; Rn = Bn.
Другими словами, LR-кодирование подразумевает лишь сквозной пропуск входных каналов. Такое кодирование может быть полезно, если входные каналы очень разные.
В соответствии со второй схемой кодирования, именуемой в данном документе как среднее-остаточное кодирование (или суммарно-разностное кодирование) «MS-кодирование» входные и выходные каналы компонентов 110 и 120 стереокодирования/декодирования связаны в соответствии со следующими выражениями:
Ln = (An + Bn); Rn = (An – Bn).
С точки зрения кодера, соответствующими выражениями являются:
An = 0.5(Ln + Rn); Bn = 0.5(Ln – Rn).
Другими словами, MS-кодирование задействует вычисление суммы и разности входных каналов. По этой причине канал An (первый выходной канал 116 на стороне кодера, и первый входной канал 116’ на стороне декодера) можно рассматривать как средний-сигнал (суммарный-сигнал) первого и второго каналов Ln и Rn, а канал Bn можно рассматривать как остаточный-сигнал (разностный-сигнал) первого и второго каналов Ln и Rn. MS-кодирование может быть полезно, если входные каналы Ln и Rn сходны касательно формы сигнала, как, впрочем, и громкости, поскольку тогда остаточный-сигнал Bn будет близок к нулю. В такой ситуации источник звука звучит, как если бы он располагался в середине между первым каналом 102 и вторым каналом 104 на Фиг. 1a.
Схема среднего-остаточного кодирования может быть обобщена третьей схемой кодирования, именуемой в данном документе как «улучшенное MS-кодирование» (или улучшенное суммарно-разностное кодирование). В улучшенном MS-кодировании, входные и выходные каналы компонентов 110 и 120 стереокодирования/декодирования связаны в соответствии со следующими выражениями:
Ln = (1 + α)An + Bn; Rn = (1 - α)An – Bn,
где α является параметром, который может формировать часть дополнительной информации 115, 115’. Уравнения выше описывают процесс с точки зрения декодера, т.е., переходя от An, Bn к Ln, Rn. Также в данном случае сигнал An может представляться в качестве среднего-сигнала, а сигнал Bn в качестве модифицированного остаточного-сигнала. В особенности, для α = 0, схема улучшенного MS-кодирования вырождается в среднее-остаточное кодирование. Улучшенное MS-кодирование может быть полезно, чтобы кодировать сигналы, которые сходны, но с разной громкостью. Например, если левый канал 102 и правый канал 104 на Фиг. 1a содержат один и тот же сигнал, но громкость выше в левом канале 102, источник звука будет звучать, как если бы он располагался ближе к левой стороне, как иллюстрируется элементом 105 на Фиг. 1a. В такой ситуации, среднее-остаточное кодирование будет генерировать ненулевой остаточный-сигнал. Тем не менее, посредством выбора надлежащего значения α между нулем и единицей, модифицированный остаточный-сигнал Bn может быть равен или близок к нулю. Подобным образом, значения α между нулем и минус единицей соответствуют случаям, где громкость выше в правом канале.
В соответствии с вышеупомянутым, компоненты 110 и 120 стереокодирования/декодирования могут таким образом быть сконфигурированы, чтобы применять разные схемы стереокодирования. Компоненты 110 и 120 стереокодирования/декодирования также могут применять разные схемы стереокодирования для разных полос частот. Например, первая схема стереокодирования может быть применена для частот вплоть до первой частоты, а вторая схема стереокодирования может быть применена для полос частот выше первой частоты. Более того, параметр α может быть частотно-зависимым.
Компоненты 110 и 120 стереокодирования/декодирования выполнены с возможностью оперирования сигналами в области модифицированного дискретного косинусного преобразования (MDCT) с критической дискретизацией, которая является областью перекрывающейся последовательности окон. Под критической дискретизацией подразумевается то, что количество элементов дискретизации в сигнале частотной области равно количеству элементов дискретизации в сигнале временной области. В случае, когда компоненты 110 и 120 стереокодирования/декодирования выполнены с возможностью применения схемы LR-кодирования, входные каналы 112 и 114 могут быть кодированными, используя разные окна. Тем не менее, если компоненты 110 и 120 стереокодирования/декодирования выполнены с возможностью применения любого из MS-кодирования или улучшенного MS-кодирования, входные каналы должны быть кодированными, используя одинаковое окно касательно формы окна, как, впрочем, и длины преобразования.
Компоненты 110 и 120 стереокодирования/декодирования могут быть использованы в качестве строительных блоков для того, чтобы реализовать гибкие схемы кодирования/декодирования для аудиосистем, содержащих более двух каналов. Чтобы проиллюстрировать принципы, трехканальная структура 200 многоканальной аудиосистемы иллюстрируется на Фиг. 2a. Аудиосистема содержит первый аудиоканал 202 (здесь левый канал L), второй аудиоканал 204 (здесь правый канал R), и третий канал 206 (здесь центральный канал C).
Фиг. 2b иллюстрирует устройство 210 кодирования для кодирования трех каналов 202, 204, и 206 с Фиг. 2a. Устройство 210 кодирования содержит первый компонент 210a стереокодирования и второй компонент 210b стереокодирования, которые сгруппированы в каскад.
Устройство 210 кодирования принимает первый входной канал 212 (например, соответствующий первому каналу 202 с Фиг. 2a), второй входной канал 214 (например, соответствующий второму каналу 204 с Фиг. 2a), и третий входной канал 216 (например, соответствующий третьему каналу 206 с Фиг. 2a). Первый канал 212 и третий входной канал 216 вводятся в первый компонент 210a стереокодирования, который выполняет стереокодирование в соответствии с любой из схем стереокодирования, описанных выше. В результате, первый компонент 210a стереокодирования выводит первый промежуточный выходной канал 213 и второй промежуточный выходной канал 215. Используемый в данном документе промежуточный выходной канал относится к результату стереокодирования или стереодекодирования. Промежуточный выходной канал, как правило, не является физическим сигналом в том смысле, что он обязательно генерируется или может быть измерен в конкретной реализации. Наоборот, промежуточные выходные каналы используются в данном документе, чтобы проиллюстрировать то, каким образом разные компоненты стереокодирования или декодирования могут быть сгруппированы и/или организованы относительно друг друга. Промежуточный означает, что выходные каналы 213 и 215 представляют собой промежуточные стадии устройства 210 кодирования, как противоположность выходным каналам, которые представляют собой закодированные каналы. Например, первый промежуточный выходной канал 213 может быть средним-сигналом, а второй промежуточный выходной канал 215 может быть модифицированным остаточным-сигналом.
Со ссылкой на примерную структуру 200 каналов на Фиг. 1a, обработка, выполняемая посредством первого компонента 210a стереокодирования, может, например, соответствовать объединенному стереокодированию 207 левого канала 202 и центрального канала 206. В случае сходных сигналов в левом канале 202 и центральном канале 206 с разными громкостями, такое объединенное стереокодирование может быть эффективным, чтобы захватить виртуальный источник 205 звука, расположенный между левым каналом 202 и центральным каналом 206.
Первый промежуточный выходной канал 213, и второй входной канал 214 затем вводятся во второй компонент 210b стереокодирования, который выполняет стереокодирование в соответствии с любой из схем стереокодирования, описанных выше. Второй компонент 210