Совместимое многоканальное кодирование/декодирование
Иллюстрации
Показать всеИзобретение относится к устройству и способу обработки многоканального звукового сигнала в совместимом стереоформате. При обработке многоканального звукового сигнала, имеющего, по меньшей мере, три исходных канала, предоставляют (12) первый канал сведения и второй канал сведения, которые извлекают из исходных каналов. Для выбранного исходного канала из исходных каналов вычисляют (14) дополнительную канальную информацию, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации, приводили к аппроксимации выбранного исходного канала. Дополнительная канальная информация и первый и второй канал сведения формируют выходные данные (20), которые должны быть переданы декодеру, который, в случае низкоуровневого декодера, декодирует только первый и второй каналы сведения или, в случае высокоуровневого декодера, предоставляет полный многоканальный звуковой сигнал на основе каналов сведения и дополнительной канальной информации. Технический результат - поскольку дополнительная канальная информация занимает совсем небольшое число бит и поскольку декодер не использует обратное матрицирование, получают эффективное и высококачественное многоканальное расширение для стереопроигрывателей и многоканальных проигрывателей. 5 н. и 24 з.п. ф-лы, 10 ил.
Реферат
Область техники, к которой относится изобретение
Настоящее изобретение относится к устройству и способу обработки многоканального звукового сигнала и, в частности, к устройству и способу обработки многоканального звукового сигнала в совместимом стереоформате.
Уровень техники
В последнее время методика воспроизведения многоканального звука становится все более важной. Это может быть обусловлено тем фактом, что методики сжатия/кодирования звука, такие как широко распространенная методика MP3, сделали возможным распространять звукозаписи посредством Интернета или других каналов передачи, имеющих ограниченную полосу пропускания.
Методика кодирования MP3 стала такой известной из-за того, что она позволяет распространение всех записей в стереоформате, т.е. цифровом представлении звуковой записи, включающем в себя первый, или левый, стереоканал и второй, или правый, стереоканал.
Тем не менее, в традиционных двухканальных звуковых системах существуют основные недостатки. Поэтому разработана методика объемного звучания. Рекомендованное многоканальное представление объемного звучания включает в себя, помимо двух стереоканалов L и R, дополнительный центральный канал C и два канала объемного звучания Ls, Rs. Этот эталонный формат звука также указывается как три/два-стерео, что означает, что предусмотрено три фронтальных канала и два канала объемного звучания. Как правило, требуется пять каналов передачи. В окружении воспроизведения требуется, по меньшей мере, пять динамиков в соответствующих пяти различных местах для получения оптимальной зоны наилучшего восприятия на определенном расстоянии от пяти правильно размещенных громкоговорителей.
В данной области техники известно несколько методик уменьшения объема данных, требуемого для передачи многоканального звукового сигнала. Эти методики называются методиками объединенного стерео. С этой целью делается ссылка на фиг.10, которая показывает объединенное стереоустройство 60. Это устройство может быть устройством, реализующим, к примеру, стереокодирование по интенсивности (IS) или стереокодирование по меткам (BCC). Это устройство, как правило, принимает в качестве входа, по меньшей мере, два канала (CH1, CH2,..., CHn) и выводит один канал несущей частоты и параметрические данные. Параметрические данные задаются таким образом, чтобы в декодере аппроксимация исходного канала (CH1, CH2,..., CHn) могла быть вычислена.
Обычно канал несущей частоты включает в себя выборки поддиапазонов, спектральные коэффициенты, выборки временной области и т.д., которые предоставляют сравнительно точное представление базового сигнала, тогда как параметрические данные не включают в себя такие выборки спектральных коэффициентов, но включают в себя управляющие параметры для управления определенным алгоритмом восстановления, таким как взвешивание посредством умножения, временной манипуляции, частотной манипуляции и т.д. Параметрические данные, таким образом, включают в себя только сравнительно грубое представление сигнала или ассоциативно связанного канала. Если в числах, то объем данных, требуемый каналом несущей частоты, находится в диапазоне 60-70 Кбит/с, тогда как объем данных, требуемый параметрической информацией для одного канала, находится в диапазоне 1,5-2,5 Кбит/с. Примером параметрических данных являются широко распространенные масштабные коэффициенты, информация о стереокодировании по интенсивности или параметры стереокодирования по меткам, как описано ниже.
Стереокодирование по интенсивности описано в препринте AES 3799, "Intensity Stereo Coding", J. Herre, K. H. Brandenburg, D. Lederer, февраль 1994 года, Амстердам. Как правило, понятие стереокодирования по интенсивности основано на преобразовании основных осей, которое должно быть применено к данным обоих стереофонических звуковых каналов. Если большинство точек данных сконцентрировано вокруг первой принципиальной оси, кодирование может быть выполнено посредством поворота обоих сигналов на определенный угол перед кодированием. Тем не менее, это не всегда правильно для методик реального стереофонического генерирования. Поэтому эта методика изменена посредством исключения второго ортогонального компонента из передачи в потоке битов. Таким образом, восстановленные сигналы для левых и правых каналов состоят из по-разному взвешенных или масштабированных версий одного и того же передаваемого сигнала. Тем не менее, восстановленные сигналы отличаются по амплитуде, но идентичны в отношении фазовой информации. Энергетические временные огибающие обоих исходных звуковых каналов, тем не менее, сохраняются посредством операции выборочного масштабирования, которое типично выполняется частотно-селективным способом. Это соответствует человеческому восприятию звука на высоких частотах, когда доминирующие пространственные метки определяются посредством энергетических огибающих.
Помимо этого, в практических реализациях передаваемый сигнал, т.е. сигнал несущей частоты генерируется из суммирующего сигнала левого канала и правого канала вместо вращения обоих компонентов. Более того, эта обработка, т.е. генерирование параметров стереокодирования по интенсивности для выполнения операции масштабирования, выполняется частотно-селективно, т.е. независимо для каждой полосы масштабных коэффициентов, т.е. частотного разбиения кодера. Предпочтительно оба канала объединяются для формирования объединенного канала или канала несущей частоты, и помимо объединенного канала определяется информация о стереокодировании по интенсивности, которая зависит от энергии первого канала, энергии второго канала или энергии объединенного канала.
Методика BCC описана в документе по соглашению AES 5574, "Binaural cue coding applied to stereo and multi-channel audio compression", C. Faller, F. Baumgarte, май 2002 года, Мюнхен. При BCC-кодировании число входных звуковых каналов преобразуется в спектральное представление с использованием основанного на DFT преобразования с помощью перекрывающихся окон. Результирующий равномерный спектр делится на неперекрывающиеся сегменты, каждый из которых имеет индекс. Каждый сегмент имеет полосу пропускания, пропорциональную эквивалентной прямоугольной полосе пропускания (ERB). Межканальные разности уровней (ICLD) и межканальные разности времен (ICTD) оцениваются для каждого сегмента по каждому кадру k. ICLD и ICTD квантуются и кодируются, что приводит к потоку битов BCC. Межканальные разности уровней и межканальные разности времени даны для каждого канала относительно опорного канала. Затем вычисляются параметры в соответствии с заданной формулой, которая зависит от конкретных сегментов сигнала, который должен быть обработан.
На стороне декодера декодер принимает моносигнал и поток битов BCC. Моносигнал преобразуется в частотную область и сходит в блок пространственного синтеза, который также принимает декодированные значения ICLD и ICTD. В блоке пространственного синтеза значения параметров BCC (ICLD и ICTD) используются, чтобы выполнить операцию взвешивания моносигнала, чтобы синтезировать многоканальные сигналы, которые после частотно-временного преобразования представляют восстановление оригинального многоканального звукового сигнала.
В случае BCC объединенный стереомодуль 60 предназначен для вывода дополнительной канальной информации, с тем чтобы параметрическими канальными данными были квантованные и кодированные параметры ICLD или ICTD, при этом один из исходных каналов используется в качестве опорного канала для кодирования дополнительной канальной информации.
Обычно канал несущей частоты формируется из суммы участвующих исходных каналов.
Разумеется, вышеуказанные методики предоставляют только монофоническое представление декодеру, который может обрабатывать только канал несущей частоты, но не может обрабатывать параметрические данные для генерирования одного или более приближений нескольких входных каналов.
Чтобы передавать пять каналов совместимым способом, т.е. в формате потока битов, который также понятен для обычного стереодекодера, использована так называемая методика матрицирования, описанная в документе "MUSICAM surround: a universal multi-channel coding system compatible with ISO 11172-3", G. Theile и G. Stoll, препринт AES 3403, октябрь 1992 года, Сан-Франциско. Пять входных каналов L, R, C, Ls и Rs подаются в устройство матрицирования, выполняющее операцию матрицирования для рассчета базовых или совместимых стереоканалов Lo, Ro из пяти входных каналов. В частности, эти базовые стереоканалы вычисляются, как изложено ниже:
Lo = L+xC+yLs;
Ro = R+xC+yRs,
x и y - константы.
Другие три канала C, Ls, Rs передаются так, как если они находятся на уровне расширения, помимо базового стереоуровня, который включает в себя кодированную версию базовых стереосигналов Lo/Ro. В отношении потока битов этот базовый стереоуровень Lo/Ro включает в себя заголовок, такую информацию, как масштабные коэффициенты и выборки поддиапазонов. Многоканальный уровень расширения, т.е. центральный канал и два канала объемного звучания включены в поле многоканального расширения, которое также называется полем служебных данных.
На стороне декодера выполняется операция обратного матрицирования для формирования восстановлений левого и правого каналов в пятиканальном представлении, использующем базовые стереоканалы Lo, Ro и три дополнительных канала. Дополнительно, три дополнительных канала декодированы из служебной информации, чтобы получить декодированное пятиканальное или представление объемного звучания исходного многоканального звукового сигнала.
Другой подход к многоканальному кодированию описан в публикации "Improved MPEG-2 audio multi-channel encoding", B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, препринт AES 3865, февраль 1994 года, Амстердам, в которой, чтобы достичь обратной совместимости, рассматриваются обратно-совместимые режимы. С этой целью используется матрица совместимости, чтобы получить два так называемых канала сведения Lc, Rc из исходных пяти входных каналов. Более того, можно динамически выбирать три дополнительных канала, передаваемых как служебные данные.
Чтобы использовать стереонерелевантность, методика объединенного стерео применяется к группам каналов, к примеру, трем фронтальным каналам, т.е. левому каналу, правому каналу и центральному каналу. С этой целью эти три канала объединены для получения объединенного канала. Этот объединенный канал квантуется и упаковывается в поток битов. Далее этот объединенный канал вместе с соответствующей информацией по объединенному стерео входит в модуль декодирования объединенного стерео для получения декодированных объединенных стереоканалов, т.е. декодированный объединенный левый стереоканал, декодированный объединенный правый стереоканал и декодированный объединенный центральный стереоканал. Эти декодированные объединенные стереоканалы вместе с левым каналом объемного звучания и правым каналом объемного звучания входят в блок матрицы совместимости для формирования первого и второго каналов сведения Lc, Rc. Далее квантованные версии обоих каналов сведения и квантованная версия объединенного канала упаковываются в поток битов вместе с параметрами объединенного стереокодирования.
Следовательно, с помощью стереокодирования по интенсивности группа независимых сигналов исходных каналов передается в рамках одной части данных несущей. Декодер далее восстанавливает связанные сигналы как идентичные данные, которые заново масштабируются согласно исходным энергетическим временным огибающим. Следовательно, линейная комбинация передаваемых каналов приводит к результатам, которые отличаются от исходного сведения. Это применяется к любому типу объединенного стереокодирования, основанного на концепции стереокодирования по интенсивности. Для системы кодирования, предоставляющей совместимые каналы сведения, есть прямое следствие. Восстановление посредством обратного матрицирования, как описано в предыдущей публикации, имеет недостатки, обусловленные неполным восстановлением. Использование так называемой схемы предыскажения объединенного стерео, в которой объединенное стереокодирование левого, правого и центрального канала выполняется для матрицирования в кодере, уменьшает эту проблему. Таким образом, схема обратного матрицирования для восстановления предоставляет меньше недостатков, поскольку на стороне кодера декодированные объединенные стереосигналы используются для генерирования каналов сведения. Таким образом, процесс неполного восстановления сдвигается в совместимые каналы сведения Lc и Rc, где он с гораздо большей вероятностью маскируется самим звуковым сигналом.
Хотя эта система привела к меньшему количеству недостатков из-за обратного матрицирования на стороне декодера, тем не менее, она имеет некоторые изъяны. Изъян состоит в том, что стереосовместимые каналы сведения Lc и Rc получаются не из исходных каналов, а из закодированных/декодированных с помощью стереокодирования по интенсивности версий исходных каналов. Поэтому потери данных вследствие системы стереокодирования по интенсивности включены в совместимые каналы сведения. Декодер только для стерео, который декодирует только совместимые каналы, а не кодированные с помощью стереокодирования по интенсивности каналы расширения, следовательно, предоставляет выходной сигнал, на который оказывают влияние вынужденные потери данных вследствие стереокодирования по интенсивности.
Дополнительно, полный дополнительный канал должен быть передан помимо двух каналов сведения. Этот канал является объединенным каналом, который сформирован посредством объединенного стереокодирования левого канала, правого канала и центрального канала. Дополнительно, информация о стереокодировании по интенсивности, чтобы восстанавливать исходные каналы L, R, C из объединенного канала, также должна быть передана декодеру. В декодере выполняется обратное матрицирование, т.е. операция обратного матрицирования, чтобы извлечь каналы объемного звучания из двух каналов сведения. Дополнительно, исходный левый, правый и центральный каналы аппроксимируются посредством объединенного стереодекодирования с помощью передаваемого объединенного канала и передаваемых параметров объединенного стерео. Следует отметить, что исходный левый, правый и центральный каналы извлекаются из объединенного стереодекодирования объединенного канала.
Сущность изобретения
Задача настоящего изобретения - предоставить концепцию эффективной по битам и с меньшим числом недостатков обработки или обратной обработки многоканального звукового сигнала.
В соответствии с первым аспектом настоящего изобретения эта задача решается посредством устройства для обработки многоканального звукового сигнала, причем многоканальный звуковой сигнал имеет, по меньшей мере, три исходных канала, содержащего средство предоставления первого канала сведения и второго канала сведения, при этом первый и второй каналы сведения извлекаются из исходных каналов; средство вычисления дополнительной канальной информации для выбранного исходного канала исходных сигналов, причем средство для вычисления предназначено для вычисления дополнительной канальной информации, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала; и средство генерирования выходных данных, причем выходные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения.
В соответствии со вторым аспектом настоящего изобретения эта задача решается посредством способа обработки многоканального звукового сигнала, причем многоканальный звуковой сигнал имеет, по меньшей мере, три исходных канала, заключающегося в том, что предоставляют первый канал сведения и второй канал сведения, причем первый и второй каналы сведения извлекают из исходных каналов; вычисляют дополнительную канальную информацию для выбранного исходного канала исходных сигналов, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала; и генерируют выходные данные, причем выходные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения.
В соответствии с третьим аспектом настоящего изобретения эта задача решается посредством устройства для обратной обработки входных данных, причем входные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения, причем первый канал сведения и второй канал сведения извлекаются из, по меньшей мере, трех исходных каналов многоканального звукового сигнала, дополнительная канальная информация вычисляется, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый канал сведения и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала, при этом устройство содержит устройство считывания входных данных для считывания входных данных, предназначенное для получения первого канала сведения или сигнала, извлеченного из первого канала сведения, и второго канала сведения или сигнала, извлеченного из второго канала сведения, и дополнительной канальной информации; и устройство восстановления канала для восстановления аппроксимации выбранного исходного канала с помощью дополнительной канальной информации и канала сведения или объединенного канала сведения для получения аппроксимации выбранного исходного канала.
В соответствии с четвертым аспектом настоящего изобретения эта задача решается посредством способа обратной обработки входных данных, причем входные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения, причем первый канал сведения и второй канал сведения извлекают из, по меньшей мере, трех исходных каналов многоканального звукового сигнала, и при этом дополнительную канальную информацию вычисляют, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый канал сведения и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала, при этом способ заключается в том, что считывают входные данные для получения первого канала сведения или сигнала, извлеченного из первого канала сведения, и второго канала сведения или сигнала, извлеченного из второго канала сведения, и дополнительной канальной информации; и восстанавливают аппроксимацию выбранного исходного канала с помощью дополнительной канальной информации и канала сведения или объединенного канала сведения, для получения аппроксимации выбранного исходного канала.
В соответствии с пятым аспектом и шестым аспектом настоящего изобретения эта задача решается посредством компьютерной программы, включающей в себя способ обработки или способ обратной обработки.
Настоящее изобретение основано на обнаружении того, что эффективное кодирование многоканального звукового сигнала с меньшим числом недостатков получается, когда каналы сведения, предпочтительно представляющие левый и правый стереоканалы, упакованы в выходные данные.
Параметрическая дополнительная канальная информация для одного или нескольких исходных каналов извлекается так, чтобы они относились к одному из каналов сведения, а не (как в предшествующем уровне техники) к дополнительному "объединенному" стереоканалу. Это означает, что параметрическая дополнительная канальная информация вычисляется таким образом, чтобы на стороне декодера устройство восстановления канала использовало дополнительную канальную информацию и один из каналов сведения или комбинация каналов сведения для восстановления аппроксимации исходного звукового канала, которому назначена дополнительная канальная информация.
Изобретательская концепция является выгодной в том, что она предоставляет эффективное по битам многоканальное расширение, так чтобы многоканальный звуковой сигнал мог воспроизводиться в декодере.
Дополнительно, изобретательская концепция является обратно совместимой, поскольку декодер меньшего масштаба, который адаптирован только для двухканальной обработки, может просто игнорировать информацию о расширении, т.е. дополнительную канальную информацию. Декодер меньшего масштаба может воспроизводить только два канала сведения для получения стереопредставления исходного многоканального звукового сигнала. Декодер большего масштаба, тем не менее, который поддерживает многоканальную работу, может использовать передаваемую дополнительную канальную информацию, чтобы восстанавливать аппроксимации исходных каналов.
Настоящее изобретение имеет преимущество в том, что оно является эффективным по битам, поскольку, в отличие от предшествующего уровня техники, не требуется дополнительных каналов несущей частоты помимо первого и второго каналов сведения Lc, Rc. Вместо этого дополнительная канальная информация относится к одному или обоим каналам сведения. Это означает, что каналы сведения сами выступают в качестве канала несущей частоты, с которым объединяется дополнительная канальная информация для восстановления исходного звукового канала. Это означает, что дополнительная канальная информация предпочтительно является параметрической информацией, т.е. информацией, которая не включает в себя какие-либо выборки поддиапазонов или спектральные коэффициенты. Наоборот, параметрическая информация - это информация, используемая для взвешивания (по времени и/или частоте) соответствующего канала сведения или комбинации соответствующих каналов сведения для получения восстановленной версии выбранного исходного канала.
В предпочтительном варианте осуществления настоящего изобретения получено обратно совместимое кодирование многоканального сигнала на основе совместимого стереосигнала. Предпочтительно, совместимый стереосигнал (сигнал сведения) генерируется с помощью матрицирования исходных каналов многоканального звукового сигнала.
Информация о выбранном исходном канале получается на основе методик объединенного стерео, таких как стереокодирование по интенсивности или стереокодирование по меткам. Таким образом, на стороне декодера операцию обратного матрицирования не требуется выполнять. Проблемы, связанные с обратным матрицированием, т.е. определенные недостатки, относящиеся к нежелательному распространению шума квантования при операциях обратного матрицирования, устраняются. Это обусловлено тем фактом, что декодер использует устройство восстановления канала, которое восстанавливает исходный сигнал посредством использования одного из каналов сведения или комбинации каналов сведения и передаваемой дополнительной канальной информации.
Предпочтительно, изобретательская концепция применяется к многоканальному звуковому сигналу, имеющему пять каналов. Этими пятью каналами являются левый канал L, правый канал R, центральный канал C, левый канал объемного звучания Ls и правый канал объемного звучания Rs. Предпочтительно, каналы сведения - это стереосовместимые каналы сведения Ls и Rs, которые предоставляют стереопредставление исходного многоканального звукового сигнала.
В соответствии с предпочтительным вариантом осуществления настоящего изобретения для каждого исходного канала дополнительная канальная информация вычисляется на стороне декодера, упакованная в выходные данные. Дополнительная канальная информация для исходного левого канала извлекается с помощью левого канала сведения. Дополнительная канальная информация для исходного левого объемного канала извлекается с помощью левого канала сведения. Дополнительная канальная информация для исходного правого канала извлекается с помощью правого канала сведения. Дополнительная канальная информация для исходного правого объемного канала извлекается с помощью правого канала сведения.
В соответствии с предпочтительным вариантом осуществления настоящего изобретения дополнительная канальная информация для исходного центрального канала извлекается с помощью первого канала сведения, а также второго канала сведения, т.е. комбинации двух каналов сведения. Предпочтительно, эта комбинация является суммированием.
Таким образом, группировки, т.е. отношение между дополнительной канальной информацией и сигналом несущей частоты, т.е. используемом канале сведения для предоставления информации о выбранном исходном канале, таковы, что для оптимального качества выбирается определенный канал сведения, который содержит наибольшую возможную величину соответствующего исходного многоканального сигнала, которая представляется посредством дополнительной канальной информации. В качестве такого сигнала несущей частоты объединенного стерео используются первый и второй каналы сведения. Предпочтительно, также сумма первого и второго каналов сведения может быть использована. Естественно, сумма первого и второго каналов сведения может быть использована для вычисления дополнительной канальной информации по каждому из исходных каналов. Тем не менее, предпочтительно, сумма каналов сведения используется для вычисления дополнительной канальной информации исходного центрального канала в окружении объемного звучания, таком как пятиканальное объемное звучание, семиканальное объемное звучание, объемное звучание 5.1 или объемное звучание 7.1. Использование суммы первого и второго каналов сведения особенно выгодно, поскольку не требуется дополнительной передачи служебных данных. Это обусловлено тем фактом, что оба канала сведения присутствуют в декодере, так что суммирование этих каналов сведения может быть легко выполнено в декодере без необходимости каких-либо дополнительных бит передачи.
Предпочтительно, дополнительная канальная информация, формирующая многоканальное окружение, входит в поток битов выходных данных совместимым способом, с тем чтобы декодер меньшего масштаба просто игнорировал данные многоканального расширения и предоставлял только стереопредставление многоканального звукового сигнала. Тем не менее, кодер большего масштаба использует два канала сведения, но, кроме того, использует дополнительную канальную информацию для восстановления полного многоканального представления исходного звукового сигнала.
Декодер согласно изобретению предназначен во-первых, для декодирования обоих каналов сведения и считывания дополнительной канальной информации для выбранных исходных каналов. Затем дополнительная канальная информация и каналы сведения используются для восстановления аппроксимаций исходных каналов. С этой целью операция обратного матрицирования предпочтительно вообще не выполняется. Это означает, что в этом варианте осуществления каждый из, к примеру, пяти исходных каналов восстанавливается с помощью, к примеру, пяти наборов различной дополнительной канальной информации. В декодере выполняется такая же группировка, что и в кодере, для вычисления восстановленной аппроксимации канала. В пятиканальном окружении объемного звучания это означает, что для восстановления исходного левого канала используется левый канал сведения и дополнительная канальная информация для левого канала. Чтобы восстановить исходный правый канал, используется правый канал сведения и дополнительная канальная информация о правом канале. Чтобы восстановить исходный левый канал объемного звучания, используется левый канал сведения и дополнительная канальная информация о левом канале объемного звучания. Чтобы восстановить исходный правый канал объемного звучания, используется дополнительная канальная информация о правом канале объемного звучания и правый канал сведения. Чтобы восстановить исходный центральный канал, используется объединенный канал, сформированный из первого канала сведения и второго канала сведения, и дополнительная информация о центральном канале.
Естественно, также можно воспроизводить первый и второй каналы сведения как левый и правый каналы, так что только три набора параметров (из, к примеру, пяти) дополнительной канальной информации предназначены для передачи. Тем не менее, это рекомендуется только в случае, когда предусмотрены менее строгие правила в отношении качества. Это обусловлено тем фактом, что обычно левый канал сведения и правый канал сведения отличаются от исходного левого канала или исходного правого канала. Только в случае, когда нельзя передавать дополнительную канальную информацию для каждого из исходных каналов, эта обработка выгодна.
Краткое описание чертежей
Предпочтительные варианты осуществления настоящего изобретения описаны далее со ссылками на прилагаемые чертежи, из которых:
Фиг.1 - блок-схема предпочтительного варианта осуществления изобретаемого кодера.
Фиг.2 - блок-схема предпочтительного варианта осуществления изобретаемого декодера.
Фиг.3A - блок-схема предпочтительной реализации средства вычисления, чтобы получить частотно-селективную дополнительную канальную информацию.
Фиг.3B - предпочтительный вариант осуществления средства вычисления, реализующего обработку объединенного стерео, такую как стереокодирование по интенсивности или стереокодирование по меткам.
Фиг.4 иллюстрирует еще один предпочтительный вариант осуществления средства вычисления дополнительной канальной информации, в котором дополнительной канальной информацией являются коэффициенты усиления.
Фиг.5 иллюстрирует предпочтительный вариант осуществления реализации декодера, когда декодер реализован как на фиг.4.
Фиг.6 иллюстрирует предпочтительную реализацию средства предоставления каналов сведения.
Фиг.7 иллюстрирует группировки исходных каналов и каналов сведения для вычисления дополнительной канальной информации для соответствующих исходных каналов.
Фиг.8 иллюстрирует еще один предпочтительный вариант осуществления изобретаемого кодера.
Фиг.9 иллюстрирует еще одну реализацию изобретаемого декодера.
Фиг.10 иллюстрирует стереодекодер предшествующего уровня техники.
Подробное описание предпочтительных вариантов осуществления
Фиг.1 иллюстрирует устройство обработки многоканального звукового сигнала 10, имеющего, по меньшей мере, три исходных канала, таких как R, L и C. Предпочтительно, исходный звуковой сигнал имеет более трех каналов, например пять каналов, в окружении объемного звучания, которое проиллюстрировано на фиг. 1. Пять каналов - это левый канал L, правый канал R, центральный канал C, левый канал объемного звучания Ls и правый канал объемного звучания Rs. Устройство согласно изобретению включает в себя средство 12 предоставления первого канала сведения Lc и второго канала сведения Rc, причем первый и второй каналы сведения извлекаются из исходных каналов. Для извлечения каналов сведения из исходных каналов существует несколько вариантов. Один вариант - извлечение каналов сведения Lc и Rc посредством матрицирования исходных каналов с помощью операции матрицирования, проиллюстрированной на фиг.6. Эта операция матрицирования выполняется во временной области.
Параметры матрицирования a, b и t выбираются таким образом, чтобы они были меньше или равны 1. Предпочтительно, значения a и b составляют 0,7 или 0,5. Общий параметр взвешивания t предпочтительно выбирается таким образом, чтобы не допустить ограничения канала.
Альтернативно, как указано на фиг.1, каналы сведения Lc и Rc также могут быть внешними. Это может быть выполнено, когда каналы сведения Lc и Rc являются результатом операции "микширования вручную". В этом случае звукооператор микширует каналы сведения самостоятельно вместо использования операции автоматического матрицирования. Звукооператор выполняет творческое микширование для получения оптимизированных каналов сведения Lc и Rc, которые обеспечивают наилучшее стереопредставление исходного многоканального звукового сигнала.
В случае внешних каналов сведения средство предоставления не выполняет операцию матрицирования, а просто переадресует внешние каналы сведения последующему средству 14 вычисления.
Средство 14 вычисления предназначено для вычисления дополнительной канальной информации, например li, lsi, ri или rsi для выбранных исходных каналов, например L, Ls, R или Rs, соответственно. В частности, средство 14 вычисления предназначено для вычисления дополнительной канальной информации, так чтобы канал сведения, при взвешивании с помощью дополнительной канальной информации приводил к аппроксимации выбранного исходного канала.
Альтернативно, или кроме того, средство вычисления дополнительной канальной информации дополнительно предназначено для вычисления дополнительной канальной информации для выбранного исходного канала, так чтобы объединенный канал сведения, включающий в себя комбинацию первого и второго канала сведения, при взвешивании с помощью вычисленной дополнительной канальной информации приводил к аппроксимации выбранного исходного канала. Чтобы показать этот признак, на чертеже проиллюстрирован сумматор 14a и средство 14b вычисления информации об объединенном канале.
Специалистам в данной области техники должно быть очевидно, что эти элементы необязательно реализованы как отдельные элементы. Наоборот, все функциональные возможности блоков 14, 14a и 14b могут быть реализованы посредством определенного процессора, которым может быть процессор общего назначения или любое другое средство выполнения требуемых функциональных возможностей.
Дополнительно, здесь следует отметить, что сигналы каналов, являющиеся выборками поддиапазонов или значениями частотной области, указываются заглавными буквами. Информация о каналах, в отличие от самих каналов, указывается строчными буквами. Дополнительная канальная информация ci - это, следовательно, дополнительная канальная информация для исходного центрального канала C.
Дополнительная канальная информация, а также каналы сведения Lc и Rc или кодированная версия Lc' и Rc', генерируемые аудиокодером 16, входят в устройство 18 форматирования выходных данных. Как правило, устройство 18 форматирования выходных данных выступает в качестве средства генерирования выходных данных, при этом выходные данные включают в себя дополнительную канальную информацию для, по меньшей мере, одного исходного канала, первого канала сведения или сигнала, извлеченного из первого канала сведения (к примеру, его кодированная версия), и второго канала сведения или сигнала, извлеченного из второго канала сведения (к примеру, его кодированная версия).
Выходные данные или выходной поток битов 20 затем может быть передан декодеру выходного потока битов или может быть сохранен или распространен. Предпочтительно, выходной поток битов 20 - это совместимый поток битов, который также может быть считан декодером меньшего масштаба, не имеющим функции многоканального расширения. Такие кодеры меньшего масштаба, к примеру, самые распространенные в современном уровне техники MP3-декодеры, просто игнорируют данные многоканального расширения, т.е. дополнительную канальную информацию. Они декодируют только первый и второй каналы сведения для выходного генерирования стереосигнала. Декодеры большего масштаба, такие как декодеры с поддержкой многоканального режима, считывают дополнительную канальную информацию и затем генерируют аппроксимацию исходных звуковых кана