2380767 - Способ и устройство для декодирования аудиосигнала

Способ и устройство для декодирования аудиосигнала

Иллюстрации

Показать все

Изобретение относится к обработке аудиосигналов, более конкретно к способу и устройству для декодирования аудиосигнала. Способ включает в себя прием аудиосигнала и пространственной информации, формирование модифицированной пространственной информации с использованием пространственной информации и декодирование аудиосигнала с использованием модифицированной пространственной информации, при этом модифицированная пространственная информация включает в себя, по меньшей мере, одно из частичной пространственной информации, комбинированной пространственной информации и расширенной пространственной информации. При этом аудиосигнал декодируют в конфигурацию, отличную от конфигурации, определенной посредством устройства декодирования. Даже если число громкоговорителей меньше или более числа множества каналов до выполнения понижающего микширования, можно сформировать выходные каналы в количестве, равном числу громкоговорителей, из аудиосигнала понижающего микширования. Технический результат - обеспечение формирования аудиосигнала, имеющего конфигурацию, отличную от заранее определенной древовидной конфигурации, формируя по-разному сконфигурированные выходные сигналы, а также существенное снижение нагрузки операций, требуемых для декодирования аудиосигнала. 2 н. и 16 з.п. ф-лы, 17 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к обработке аудиосигналов, а более конкретно, к устройству декодирования аудиосигнала и способу для этого. Хотя настоящее изобретение применимо для широкого диапазона применений, оно конкретно применимо для декодирования аудиосигналов.

Уровень техники

В общем, когда кодер кодирует аудиосигнал, в случае если аудиосигнал, который должен быть закодирован, является многоканальным аудиосигналом, многоканальный аудиосигнал через понижающее микширование преобразуется на два канала или один канал, чтобы сформировать аудиосигнал понижающего микширования, и из многоканального аудиосигнала извлекается пространственная информация. Пространственная информация - это информация, используемая при повышающем микшировании многоканального аудиосигнала из аудиосигнала понижающего микширования. Между тем, кодер выполняет понижающее микширование многоканального аудиосигнала согласно заранее определенной древовидной конфигурации. В этом случае заранее определенной древовидной конфигурацией может быть структура(ы), согласованная между декодером аудиосигнала и кодером аудиосигнала. В частности, если идентификационная информация, указывающая тип одной из заранее определенных древовидных конфигураций, присутствует, декодер может знать структуру аудиосигнала, для которого выполняется повышающее микширование, к примеру число каналов, позицию каждого из каналов и т.д.

Таким образом, если кодер выполняет понижающее микширование многоканального сигнала согласно заранее определенной древовидной конфигурации, пространственная информация, извлекаемая в этом процессе, также зависит от структуры. Таким образом, в случае если декодер выполняет повышающее микширование аудиосигнала понижающего микширования с помощью пространственной информации, зависимой от структуры, то формируется многоканальный аудиосигнал согласно упомянутой структуре. То есть в случае, если декодер использует пространственную информацию, сформированную кодером, как есть, повышающее микширование выполняется согласно структуре, согласованной только между кодером и декодером. Таким образом, невозможно сформировать аудиосигнал выходного канала, если не следовать согласованной структуре. Например, невозможно выполнить повышающее микширование сигнала в аудиосигнал, имеющий номер канала, отличающийся (меньше или больше) от числа каналов, определенных согласно согласованной структуре.

Сущность изобретения

Следовательно, настоящее изобретение направлено на устройство декодирования аудиосигнала и способ для этого, которые во многом устраняют одну или более проблем, обусловленных ограничениями и недостатками предшествующего уровня техники.

Цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых аудиосигнал может быть декодирован так, чтобы иметь структуру, отличающуюся от определенной кодером.

Другая цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых аудиосигнал может быть декодирован с помощью пространственной информации, сформированной из модификации предыдущей пространственной информации, сформированной из кодирования.

Дополнительные признаки и преимущества изобретения будут изложены в последующем описании и частично должны явствовать из описания или могут быть изучены при практическом использовании изобретения. Цели и другие преимущества изобретения должны быть реализованы и достигнуты посредством структуры, в частности, раскрытой в письменном описании и формуле изобретения, а также на прилагаемых чертежах.

Чтобы достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, осуществленным и подробно описанным в данном документе, способ декодирования аудиосигнала согласно настоящему изобретению включает в себя прием аудиосигнала и пространственной информации, идентификацию типа модифицированной пространственной информации, формирование модифицированной пространственной информации с использованием пространственной информации и декодирование аудиосигнала с использованием модифицированной пространственной информации, при этом тип модифицированной пространственной информации включает в себя, по меньшей мере, одно из частичной пространственной информации, комбинированной пространственной информации и расширенной пространственной информации.

Чтобы дополнительно достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, способ декодирования аудиосигнала включает в себя прием пространственной информации, формирование комбинированной пространственной информации с использованием пространственной информации и декодирование аудиосигнала с использованием комбинированной пространственной информации, при этом комбинированная пространственная информация формируется посредством комбинирования пространственных параметров, включенных в пространственную информацию.

Чтобы дополнительно достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, способ декодирования аудиосигнала включает в себя прием пространственной информации, включающей в себя, по меньшей мере, одну пространственную информацию, и информации пространственной фильтрации, включающей в себя, по меньшей мере, один параметр фильтрации, формирование комбинированной пространственной информации, имеющей эффект объемного звучания, посредством комбинирования пространственного параметра и параметра фильтрации и преобразование аудиосигнала в виртуальный сигнал объемного звучания с использованием комбинированной пространственной информации.

Чтобы дополнительно достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, способ декодирования аудиосигнала включает в себя прием аудиосигнала, прием пространственной информации, включающей в себя информацию древовидной конфигурации и пространственные параметры, формирование модифицированной пространственной информации посредством добавления расширенной пространственной информации к пространственной информации и повышающее микширование аудиосигнала с использованием модифицированной пространственной информации, которое содержит включение преобразования аудиосигнала в первичный подвергнутый повышающему микшированию аудиосигнал на основе пространственной информации и преобразования первичного подвергнутого повышающему микшированию аудиосигнала во вторичный подвергнутый повышающему микшированию аудиосигнал на основе расширенной пространственной информации.

Следует понимать, что вышеприведенное общее описание и последующее подробное описание являются примерными и пояснительными и предназначены для того, чтобы предоставить дополнительное пояснение изобретения согласно формуле изобретения.

Краткое описание чертежей

Прилагаемые чертежи, которые включены для того, чтобы обеспечить дополнительное понимание изобретения, и включены, и составляют часть данного подробного описания, иллюстрируют варианты осуществления изобретения и вместе с описанием служат, чтобы объяснять принципы изобретения.

На чертежах:

фиг.1 - блок-схема устройства кодирования аудиосигналов и устройства декодирования аудиосигналов согласно настоящему изобретению;

фиг.2 - схематичное представление примера применения частичной пространственной информации;

фиг.3 - схематичное представление другого примера применения частичной пространственной информации;

фиг.4 - схематичное представление дополнительного примера применения частичной пространственной информации;

фиг.5 - схематичное представление примера применения комбинированной пространственной информации;

фиг.6 - схематичное представление другого примера применения комбинированной пространственной информации;

фиг.7 - схема путей звука от громкоговорителей к слушателю, на которой показаны позиции громкоговорителей;

фиг.8 - схема для пояснения сигнала, выводимого из каждой позиции громкоговорителя для эффекта объемного звучания;

фиг.9 - концептуальная схема для пояснения способа формирования 3-канального сигнала с помощью 5-канального сигнала;

фиг.10 - схема примера конфигурирования расширенных каналов на основе конфигурационной информации расширенных каналов;

фиг.11 - схема для пояснения конфигурации расширенных каналов, показанной на фиг.10, и взаимосвязь с расширенным пространственным параметром;

фиг.12 - схема позиций многоканального аудиосигнала для 5.1-каналов и аудиосигнала выходного канала для 6.1-каналов;

фиг.13 - схема для пояснения взаимосвязи между позицией виртуального источника звука и разностью уровней между двумя каналами;

фиг.14 - схема для пояснения уровней двух задних каналов и уровня заднего центрального канала;

Фиг.15 - схема для пояснения позиции многоканального аудиосигнала для 5.1-каналов и позиции аудиосигнала выходного канала для 7.1-каналов;

фиг.16 - схема для пояснения уровней двух левых каналов и уровня левого переднего бокового канала (Lfs); и

фиг.17 - это схема для пояснения уровней трех передних каналов и уровня левого переднего бокового канала (Lfs).

Оптимальный режим осуществления изобретения

Далее приводится подробное описание предпочтительных вариантов осуществления настоящего изобретения, примеры которых проиллюстрированы на прилагаемых чертежах.

Общие термины, глобально используемые в настоящее время, выбираются в качестве терминов в настоящем изобретении. Кроме того, предусмотрены термины, произвольно выбранные заявителем для специальных случаев, подробное значение которых поясняется детально в описании предпочтительных вариантов осуществления настоящего изобретения. Следовательно, настоящее изобретение следует понимать не с названиями терминов, а со значениями терминов.

Во-первых, настоящее изобретение формирует модифицированную пространственную информацию с помощью пространственной информации, а затем декодирует аудиосигнал с помощью сформированной модифицированной пространственной информации. В этом случае пространственная информация - это пространственная информация, извлеченная в ходе понижающего микширования согласно заранее определенной древовидной конфигурации, а модифицированная пространственная информация - это пространственная информация, вновь сформированная с помощью пространственной информации.

Настоящее изобретение подробно поясняется со ссылкой на фиг.1 следующим образом.

Фиг.1 - это блок-схема устройства кодирования аудиосигналов и устройства декодирования аудиосигналов согласно варианту осуществления настоящего изобретения.

Ссылаясь на фиг.1, устройство 100 кодирования аудиосигнала (далее сокращенно устройство кодирования) включает в себя блок 110 понижающего микширования и блок 120 извлечения пространственной информации. Помимо этого, устройство 200 декодирования аудиосигнала (далее сокращенно устройство декодирования) включает в себя блок 210 формирования выходного сигнала и блок 220 формирования модифицированной пространственной информации.

Блок 110 понижающего микширования устройства 100 кодирования формирует аудиосигнал d понижающего микширования посредством понижающего микширования многоканального аудиосигнала IN_M. Аудиосигналом d понижающего микширования может быть сигнал, сформированный из понижающего микширования многоканального аудиосигнала IN_M посредством блока 110 понижающего микширования, или произвольный аудиосигнал понижающего микширования, произвольно сформированный пользователем из понижающего микширования многоканального аудиосигнала IN_M.

Блок 120 извлечения пространственной информации устройства 100 кодирования извлекает пространственную информацию s из многоканального аудиосигнала IN_M. В этом случае пространственная информация - это информация, требуемая для того, чтобы выполнить повышающее или понижающее микширование аудиосигнала d в многоканальный аудиосигнал IN_M.

Пространственной информацией может быть информация, извлеченная в ходе понижающего микширования многоканального аудиосигнала IN_M согласно заранее определенной древовидной конфигурации. В этом случае древовидная конфигурация может соответствовать древовидной(ым) конфигурации(ям), согласованной(ым) между устройствами декодирования и кодирования аудиосигналов, которая не ограничивается настоящим изобретением.

Помимо этого, пространственная информация может включать в себя информацию древовидной конфигурации, индикатор, пространственные параметры и т.п. Информация древовидной конфигурации - это информация типа древовидной конфигурации. Таким образом, число каналов в многоканальной конфигурации, последовательность понижающего микширования на канал и т.п. варьируются согласно типу древовидной конфигурации. Индикатор - это информация, указывающая то, присутствует расширенная пространственная информация или нет, и т.п. Помимо этого, пространственные параметры могут включать в себя разность канальных уровней (далее сокращенно CLD) в ходе понижающего микширования, по меньшей мере, двух каналов в самое большее два канала, межканальную корреляцию или когерентность (далее сокращенно ICC), коэффициенты прогнозирования каналов (далее сокращенно CPC) и т.п.

Блок 120 извлечения пространственной информации может дополнительно извлекать расширенную пространственную информацию, а также пространственную информацию. В этом случае расширенная пространственная информация - это информация, требуемая для того, чтобы дополнительно расширять аудиосигнал d понижающего микширования, подвергнутый повышающему микшированию с помощью пространственного параметра. Помимо этого, расширенная пространственная информация может включать в себя конфигурационную информацию расширенных каналов и расширенные пространственные параметры. Расширенная пространственная информация, которая поясняется ниже, не ограничена информацией, извлекаемой посредством блока 120 извлечения пространственной информации.

Помимо этого, устройство 100 кодирования может дополнительно включать в себя блок кодирования с помощью базового кодека (не показан на чертеже), формирующий поток битов аудио, полученный через понижающее микширование, посредством декодирования аудиосигнала понижающего микширования d, блок кодирования пространственной информации (не показан на чертеже), формирующий поток битов пространственной информации посредством кодирования пространственной информации s, и блок мультиплексирования (не показан на чертеже), формирующий поток битов аудиосигнала посредством мультиплексирования потока битов аудио, полученного через понижающее микширование, и потока битов пространственной информации, на который настоящее изобретение не накладывает ограничений.

Кроме того, устройство 200 декодирования дополнительно может включать в себя блок демультиплексирования (не показан на чертеже), разделяющий поток битов аудиосигнала на поток битов аудио, полученный через понижающее микширование, и поток битов пространственной информации, блок декодирования с помощью базового кодека (не показан на чертеже), декодирующий поток битов аудио, полученный через понижающее микширование, и блок декодирования пространственной информации (не показан на чертеже), декодирующий поток битов пространственной информации, на который настоящее изобретение не накладывает ограничений.

Блок 220 формирования модифицированной пространственной информации устройства 200 декодирования идентифицирует тип модифицированной пространственной информации с помощью пространственной информации и затем формирует модифицированную пространственную информацию s' типа, который идентифицируется на основе пространственной информации. В этом случае пространственной информацией может быть пространственная информация s, переносимая из устройства 100 кодирования. Помимо этого, модифицированная пространственная информация - это информация, которая вновь сформирована с помощью пространственной информации.

Могут существовать различные типы модифицированной пространственной информации. Кроме того, различные типы модифицированной пространственной информации могут включать в себя, по меньшей мере, одно из: a) частичной пространственной информации, b) комбинированной пространственной информации и c) расширенной пространственной информации, на которые настоящее изобретение не накладывает ограничений.

Частичная пространственная информация включает в себя частичные пространственные параметры, комбинированная пространственная информация формируется из комбинирования пространственных параметров, а расширенная пространственная информация формируется с помощью пространственной информации и расширенной пространственной информации.

Блок 220 формирования модифицированной пространственной информации формирует модифицированную пространственную информацию способом, который может варьироваться согласно типу модифицированной пространственной информации. Помимо этого, способ формирования модифицированной пространственной информации по каждому типу модифицированной пространственной информации подробнее поясняется ниже.

Опорные данные для определения типа модифицированной пространственной информации могут соответствовать древовидной конфигурационной информации в пространственной информации, индикатору в пространственной информации, информации выходного канала и т.п. Древовидная конфигурационная информация и индикатор могут быть включены в пространственную информацию s от устройства кодирования. Информация выходного канала - это информация для громкоговорителей, взаимодействующих с устройством 200 декодирования, и она может включать в себя число выходных каналов, информацию позиции для каждого выходного канала и т.п. Информация выходного канала может быть введена заранее производителем или введена пользователем.

Ниже подробно поясняется способ определения типа модифицированной пространственной информации с помощью этих типов информации.

Блок 210 формирования выходного канала устройства 200 декодирования формирует аудиосигнал OUT_N выходного канала из аудиосигнала d понижающего микширования с помощью модифицированной пространственной информации s'.

Информация 230 пространственного фильтра - это информация для путей звука, и она предоставляется в блок 220 формирования модифицированной пространственной информации. В случае если блок 220 формирования модифицированной пространственной информации формирует комбинированную пространственную информацию, имеющую эффект объемного звучания, может быть использована информация пространственной фильтрации.

Далее поясняется способ декодирования аудиосигнала посредством формирования модифицированной пространственной информации по типу модифицированной пространственной информации в порядке (1) частичная пространственная информация, (2) комбинированная пространственная информация и (3) более детализированная пространственная информация.

(1) Частичная пространственная информация

Поскольку пространственные параметры вычисляются в ходе понижающего микширования многоканального аудиосигнала согласно заранее определенной древовидной конфигурации, исходный многоканальный аудиосигнал до понижающего микширования может быть восстановлен, если аудиосигнал понижающего микширования декодируется с помощью нетронутых пространственных параметров. В случае попытки сделать число N каналов аудиосигнала выходного канала меньше числа M каналов многоканального аудиосигнала, можно декодировать аудиосигнал понижающего микширования посредством частичного применения пространственных параметров.

Этот способ может варьироваться согласно порядку и способу понижающего микширования многоканального аудиосигнала в устройстве кодирования, т.е. типу древовидной конфигурации. Также тип древовидной конфигурации может быть запрошен с помощью древовидной конфигурационной информации из пространственной информации. Помимо этого, данный способ может варьироваться согласно числу выходных каналов. Более того, можно запрашивать число выходных каналов с помощью информации выходных каналов.

Затем, в случае если число каналов аудиосигнала выходного канала меньше числа каналов многоканального аудиосигнала, способ декодирования аудиосигнала посредством применения частичной пространственной информации, включающей в себя частичные пространственные параметры, поясняется посредством рассмотрения различных древовидных конфигураций в качестве примеров в нижеследующем описании.

(1)-1. Первый пример древовидной конфигурации (древовидная конфигурация 5-2-5)

Фиг.2 - это схематичное представление примера применения частичной пространственной информации.

В левой части фиг.2 показаны последовательность понижающего микширования многоканального аудиосигнала, имеющего число каналов 6 (левый передний канал L, левый канал объемного звучания L_s, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания R_s), в полученные через понижающее микширование стереоканалы L_o и R_o, и взаимосвязь между многоканальным аудиосигналом и пространственными параметрами.

Во-первых, выполняется понижающее микширование между левым каналом L и левым каналом объемного звучания L_s, понижающее микширование между центральным каналом C и низкочастотным каналом LFE и понижающее микширование между правым каналом R и правым каналом объемного звучания R_s. В этом первичном процессе понижающего микширования формируются левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t. Помимо этого, пространственные параметры, вычисляемые в этом первичном процессе понижающего микширования, включают в себя CLD₂ (включая ICC₂), CLD₁ (включая ICC₁), CLD₀ (включая ICC₀) и т.д.

Во вторичном процессе, следующем после первичного процесса понижающего микширования, выполняется совместное понижающее микширование левого совокупного канала L_t, центрального совокупного канала C_t и правого совокупного канала R_t, чтобы сформировать левый канал L_o и правый канал R_o. Помимо этого, пространственные параметры, вычисляемые в этом вторичном процессе понижающего микширования, могут включать в себя CLD_TTT, CPC_TTT, ICC_TTT и т.д.

Другими словами, понижающее микширование многоканального сигнала из всего шести каналов выполняется вышеописанным последовательным способом, чтобы сформировать полученные через понижающее микширование стереоканалы L_o и R_o.

Если пространственные параметры (CLD₂, CLD₁, CLD₀, CLD_TTT и т.д.), вычисленные вышеописанным последовательным способом, используются как есть, их повышающее микширование выполняется в обратной последовательности порядку понижающего микширования, чтобы сформировать многоканальный аудиосигнал, имеющий число каналов 6 (левый передний канал L, левый канал объемного звучания L_s, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания R_s).

Согласно правой части фиг.2, в случае если частичная пространственная информация соответствует CLD_TTT из пространственных параметров (CLD₂, CLD₁, CLD₀, CLD_TTT и т.д.), выполняется повышающее микширование в левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t. Если левый совокупный канал L_t и правый совокупный канал R_t выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из двух каналов L_tи R_t. Если левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из трех каналов L_t, C_t и R_t. После того как повышающее микширование выполнено с помощью CLD₁ помимо прочего, если выбраны левый совокупный канал L_t, правый совокупный канал R_t, центральный канал C и низкочастотный канал LFE, можно сформировать аудиосигнал выходного канала из четырех каналов (L_t, R_t, C и LFE).

(1)-2. Второй пример древовидной конфигурации (древовидная конфигурация 5-1-5)

Фиг.3 - это схематичное представление другого примера применения частичной пространственной информации.

В левой части фиг.3 показаны последовательность понижающего микширования многоканального аудиосигнала, имеющего число каналов 6 (левый передний канал L, левый канал объемного звучания L_s, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания R_s), в моноаудиосигнал M, полученный через понижающее микширование, и взаимосвязь между многоканальным аудиосигналом и пространственными параметрами.

Во-первых, как и в первом примере, выполняется понижающее микширование между левым каналом L и левым каналом объемного звучания L_s, понижающее микширование между центральным каналом C и низкочастотным каналом LFE и понижающее микширование между правым каналом R и правым каналом объемного звучания R_s. В этом первичном процессе понижающего микширования формируются левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t. Кроме того, пространственные параметры, вычисляемые в этом первичном процессе понижающего микширования, включают в себя CLD₃ (включая ICC₃), CLD₄ (включая ICC₄), CLD₅ (включая ICC₅) и т.д. (в этом случае CLD_x и ICC_x отличаются от предшествующего CLD_xв первом примере).

Во вторичном процессе, следующем после первичного процесса понижающего микширования, выполняется совместное понижающее микширование левого совокупного канала L_t и правого совокупного канала R_t, чтобы сформировать левый центральный канал LC, и выполняется совместное понижающее микширование центрального совокупного канала C_t и правого совокупного канала R_t, чтобы сформировать правый центральный канал RC. Помимо этого, пространственные параметры, вычисляемые в этом вторичном процессе понижающего микширования, могут включать в себя CLD₂ (включая ICC₂), CLD₁ (включая ICC₁) и т.д.

После этого в третичном процессе понижающего микширования выполняется понижающее микширование левого центрального канала LC и правого центрального канала RC, чтобы сформировать моносигнал M, полученный через понижающее микширование. Также пространственные параметры, вычисленные в третичном процессе понижающего микширования, включают в себя CLD₀ (включая ICC₀) и т.д.

Согласно правой части фиг.3, в случае если частичная пространственная информация соответствует CLD₀ из пространственных параметров (CLD₃, CLD₄, CLD₅, CLD₁, CLD₂, CLD₀ и т.д.), формируются левый центральный канал LC и правый центральный канал RC. Если левый центральный канал LC и правый центральный канал RC выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из двух каналов LC и RC.

Если частичная пространственная информация соответствует CLD₀, CLD₁ и CLD₂ из пространственных параметров (CLD₃, CLD₄, CLD₅, CLD₁, CLD₂, CLD₀ и т.д.), формируются левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t.

Если левый совокупный канал L_t и правый совокупный канал R_t выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из двух каналов L_tи R_t. Если левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из трех каналов L_t, C_t и R_t.

В случае если частичная пространственная информация включает в себя CLD₄ помимо прочего, после того как выполнено повышающее микширование до центрального канала и низкочастотного канала LFE, если левый совокупный канал L_t, правый совокупный канал R_t, центральный канал C и низкочастотный канал LFE выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из четырех каналов (L_t, R_t, C и LFE).

(1)-3. Третий пример древовидной конфигурации (древовидная конфигурация 5-1-5)

Фиг.4 - это схематичное представление дополнительного примера применения частичной пространственной информации.

В левой части фиг.4 показаны последовательность понижающего микширования многоканального аудиосигнала, имеющего число каналов 6 (левый передний канал L, левый канал объемного звучания L_s, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания R_s), в моноаудиосигнал M, полученный через понижающее микширование, и взаимосвязь между многоканальным аудиосигналом и пространственными параметрами.

Во-первых, как в первом и втором примере, выполняется понижающее микширование между левым каналом L и левым каналом объемного звучания L_s, понижающее микширование между центральным каналом C и низкочастотным каналом LFE и понижающее микширование между правым каналом R и правым каналом объемного звучания R_s. В этом первичном процессе понижающего микширования левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t формируются. Кроме того, пространственные параметры, вычисляемые в этом первичном процессе понижающего микширования, включают в себя CLD₁ (включая ICC₁), CLD₂ (включая ICC₂), CLD₃ (включая ICC₃) и т.д. (в этом случае CLD_x и ICC_x отличаются от предшествующих CLD_x и ICC_x в первом или втором примере).

Во вторичном процессе, следующем после первичного процесса понижающего микширования, выполняется совместное понижающее микширование левого совокупного канала L_t, центрального совокупного канала C_t и правого совокупного канала R_t, чтобы сформировать левый центральный канал LC и правый центральный канал RC. Кроме того, вычисляется пространственный параметр CLD_TTT (включая ICC_TTT).

После этого в третичном процессе понижающего микширования выполняется понижающее микширование левого центрального канала LC и правого канала R, чтобы сформировать моносигнал M, полученный через понижающее микширование. Также вычисляется пространственный параметр CLD₀ (включая ICC₀).

Согласно правой части фиг.4, в случае если частичная пространственная информация соответствует CLD₀ и CLD_TTT из пространственных параметров (CLD₁, CLD₂, CLD₃, CLD_TTT, CLD₀ и т.д.), формируется левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t.

Если левый совокупный канал L_t, центральный совокупный канал C_t и правый совокупный канал R_t выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из трех каналов L_t, C_t и R_t.

В случае если частичная пространственная информация включает в себя CLD₂ помимо прочего, после того как выполнено повышающее микширование до центрального канала C и низкочастотного канала LFE, если левый совокупный канал L_t, правый совокупный канал R_t, центральный канал C и низкочастотный канал LFE выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из четырех каналов (L_t, R_t, C и LFE).

В вышеприведенном описании процесс формирования аудиосигнала выходного канала посредством только частичного применения пространственных параметров пояснен посредством использования трех типов древовидных конфигураций в качестве примеров. Помимо этого, также можно дополнительно применять комбинированную пространственную информацию или расширенную пространственную информацию, как и частичную пространственную информацию. Таким образом, можно обрабатывать процесс применения модифицированной пространственной информации к аудиосигналу иерархически или совместно и синтетически.

(2) Комбинированная пространственная информация

Поскольку пространственная информация вычисляется в ходе понижающего микширования многоканального аудиосигнала согласно заранее определенной древовидной конфигурации, исходный многоканальный аудиосигнал до понижающего микширования может быть восстановлен, если аудиосигнал понижающего микширования декодируется с помощью пространственных параметров пространственной информации, как они есть. В случае если число каналов M многоканального аудиосигнала отличается от числа каналов N аудиосигнала выходного канала, новая комбинированная пространственная информация формируется посредством комбинирования пространственной информации, и затем можно выполнять повышающее микширование аудиосигнала, понижающее микширование с помощью сформированной информации. В частности, посредством применения пространственных параметров к формуле преобразования можно сформировать комбинированные пространственные параметры.

Этот способ может варьироваться согласно последовательности и способу понижающего микширования многоканального аудиосигнала в устройстве кодирования. Также можно запрашивать последовательность и способ понижающего микширования с помощью древовидной конфигурационной информации в пространственной информации. Помимо этого, данный способ может варьироваться согласно числу выходных каналов. Более того, можно запрашивать число выходных каналов и т.п. с помощью информации выходных каналов.

Далее поясняются подробные варианты осуществления способа модификации пространственной информации и варианты осуществления для предоставления виртуального трехмерного эффекта.

(2)-1. Общая комбинированная пространственная информация

Способ формирования комбинированных пространственных параметров посредством комбинирования пространственных параметров пространственной информации предусмотрен для повышающего микширования согласно древовидной конфигурации, отличающейся от конфигурации в процессе понижающего микширования. Таким образом, этот способ применим ко всем видам сигналов понижающего микширования вне зависимости от того, какая имеется древовидная конфигурация согласно информации древовидной конфигурации.

В случае если многоканальный аудиосигнал является 5.1-канальным, а аудиосигнал понижающего микширования является 1-канальным (моноканал), способ формирования аудиосигнала выходного канала из двух каналов поясняется со ссылкой на два вида примеров как следующие.

(2)-1-1. Четвертый вариант осуществления древовидной конфигурации (древовидная конфигурация 5-1-5₁)

Фиг.5 - это схематичное представление примера применения комбинированной пространственной информации.

Ссылаясь на левую часть фиг.5, CLD₀-CLD₄ и ICC₀-ICC₄ (не показаны на чертеже) могут быть названы пространственными параметрами, которые могут быть вычислены в процессе понижающего микширования многоканального аудиосигнала для 5.1-каналов. Например, в пространственных параметрах межканальная разность уровней между сигналом L левого канала и сигналом R правого канала - это CLD₃, а межканальная корреляция между L и R - это ICC₃. Помимо этого, межканальная разность уровней между левым каналом L_s объемного звучания и правым каналом R_s объемн

Способ и устройство для декодирования аудиосигнала

Патент 2380767