Способ и устройство для декодирования аудиосигнала

Иллюстрации

Показать все

Изобретение относится к обработке аудиосигналов, а более конкретно к устройству и способу декодирования аудиосигнала. Способ декодирования содержит этапы приема аудиосигнала с помощью пространственного информационного сигнала, получения информации позиции с помощью числа временных интервалов и параметров аудиосигнала, установления многоканального аудиосигнала посредством применения пространственного информационного сигнала к сигналу понижающего микширования и выполнения многоканальной матрицы для многоканального аудиосигнала в ответ на выходной канал. Технический результат - обеспечить возможность более эффективного сжатия и передачи аудиосигнала. 2 н. и 14 з.п. ф-лы, 8 ил., 1 табл.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к обработке аудиосигналов, а более конкретно к устройству декодирования аудиосигнала и способу для этого.

Уровень техники

В общем, в случае аудиосигнала устройство кодирования аудиосигнала сжимает аудиосигнал в сигнал понижающего микширования моно- или стереофонического типа вместо сжатия каждого многоканального аудиосигнала. Устройство кодирования аудиосигнала передает сжатый сигнал понижающего микширования в устройство декодирования вместе с пространственным информационным сигналом или сохраняет сжатый сигнал понижающего микширования и пространственный информационный сигнал в носителе хранения. В этом случае пространственный информационный сигнал, который извлекается при понижающем микшировании многоканального аудиосигнала, используется при восстановлении исходного многоканального аудиосигнала из сигнала понижающего микширования.

Конфигурационная информация, в общем, является неизменяемой, и заголовок, включающий в себя эту информацию, вставляется в аудиосигнал один раз. Поскольку конфигурационная информация передается посредством вставки в аудиосигнал один раз, устройство декодирования аудиосигнала имеет проблему при декодировании пространственной информации вследствие отсутствия конфигурационной информации в случае воспроизведения аудиосигнала из случайной точки времени.

Устройство кодирования аудиосигнала формирует сигнал понижающего микширования и пространственный информационный сигнал в потоки битов совместно или в указанном порядке, а затем передает их в устройство декодирования аудиосигнала. Так что, если ненужная информация и т.п. включается в пространственный информационный сигнал, эффективность сжатия и передачи сигналов снижается.

Сущность изобретения

Техническая задача

Цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых аудиосигнал может быть воспроизведен из произвольной точки времени посредством выборочного включения пространственного информационного сигнала в заголовок.

Другая цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых позиция временного интервала, к которой применяется набор параметров, может быть эффективно представлена с помощью произвольного числа битов.

Другая цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых эффективность сжатия и передачи аудиосигналов может быть повышена посредством представления количества информации, требуемого для осуществления компоновки сигнала понижающего микширования или привязки многоканального сигнала к громкоговорителю, как минимального переменного числа битов.

Дополнительная цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых количество информации, требуемое для компоновки сигнала, может быть уменьшено посредством привязки многоканального сигнала к громкоговорителю без выполнения компоновки сигнала понижающего микширования.

Техническое решение

Вышеупомянутые цели, признаки и преимущества изобретения излагаются в нижеприведенном описании и частично должны стать очевидными из описания. Варианты осуществления настоящего изобретения, которые допускают вышеупомянутые цели, излагаются со ссылкой на прилагаемые чертежи.

Далее приводится подробное описание одного предпочтительного варианта осуществления настоящего изобретения, примеры которого проиллюстрированы на прилагаемых чертежах.

Фиг.1 - это конфигурационная схема аудиосигнала, передаваемого в устройство декодирования аудиосигналов из устройства кодирования аудиосигналов, согласно одному варианту осуществления настоящего изобретения.

Ссылаясь на фиг.1, аудиосигнал включает в себя дескриптор 101 аудио, сигнал 103 понижающего микширования и пространственный информационный сигнал 105.

В случае использования схемы кодирования для воспроизведения аудиосигнала в широковещательной передаче и т.п. аудиосигнал может включать в себя вспомогательные данные, а также дескриптор 101 аудио и сигнал 103 понижающего микширования. Также настоящее изобретение включает пространственный информационный сигнал 105 в качестве вспомогательных данных. Чтобы устройство декодирования аудиосигнала знало базовую информацию по аудиокодеку без анализа аудиосигнала, аудиосигнал может выборочно включать в себя дескриптор 101 аудио. Дескриптор 101 аудио сконфигурирован с небольшим количеством элементов базовой информации, требуемых для декодирования аудио, таких как скорость передачи для передаваемого аудиосигнала, число каналов, частота дискретизации сжатых данных, идентификатор, указывающий текущий использованный кодек, и т.п.

Устройство декодирования аудиосигнала может узнать тип кодека, применяемого к аудиосигналу, с помощью дескриптора 101 аудио. В частности, с помощью дескриптора 101 аудио устройство декодирования аудиосигнала может знать то, конфигурирует ли аудиосигнал многоканальный сигнал с помощью пространственного информационного сигнала 105 и сигнала 103 понижающего микширования. Дескриптор 101 аудио размещается независимо от сигнала 103 понижающего микширования или пространственного информационного сигнала 105, включенного в аудиосигнал. Например, дескриптор 101 аудио размещается в отдельном поле, указывающем аудиосигнал. В случае если заголовок не включен в сигнал 103 понижающего микширования, устройство декодирования аудиосигнала может декодировать сигнал 103 понижающего микширования с помощью дескриптора 101 аудио.

Сигнал 103 понижающего микширования - это сигнал, формируемый из многоканального сигнала понижающего микширования. Кроме того, сигнал 103 понижающего микширования может быть сформирован из блока понижающего микширования, включенного в устройство кодирования аудиосигнала, или сформирован искусственно. Сигнал 103 понижающего микширования может быть классифицирован на случай включения заголовка и случай невключения заголовка. В случае если сигнал 103 понижающего микширования включает в себя заголовок, заголовок включается в каждый кадр посредством блока кадров. В случае если сигнал 103 понижающего микширования не включает в себя заголовок, как упоминалось в предшествующем описании, сигнал 103 понижающего микширования может быть декодирован с помощью дескриптора 101 аудио. Сигнал 103 понижающего микширования принимает либо форму включения заголовка для каждого кадра, либо форму невключения заголовка в кадр. Также сигнал 103 понижающего микширования включается в аудиосигнал таким же образом, пока содержимое не завершается.

Пространственный информационный сигнал 105 также классифицируется на случай включения заголовка 107 и пространственной информации 111 и случай включения только пространственной информации 111 без включения заголовка. Заголовок 107 пространственного информационного сигнала 105 отличается от заголовка сигнала 103 понижающего микширования тем, что он необязательно должен вставляться в каждый кадр идентично. В частности, пространственный информационный сигнал 105 может совместно использовать и кадр, включающий в себя заголовок, и кадр, не включающий в себя заголовок. Большая часть информации, включенная в заголовок 107 пространственного информационного сигнала 105, - это конфигурационная информация 109, которая декодирует пространственную информацию 111 посредством интерпретации пространственной информации 111. Пространственная информация 111 сконфигурирована с помощью кадров, каждый из которых включает в себя временные интервалы. Временной интервал означает каждый временной интервал в случае деления кадра по временным интервалам. Число временных интервалов, включенных в один кадр, включается в конфигурационную информацию 109.

Конфигурационная информация 109 включает в себя информацию компоновки сигнала, число блоков преобразования сигнала, информацию конфигурации канала, информацию привязки к громкоговорителю и т.п., а также число временных интервалов.

Информация компоновки сигнала - это идентификатор, который указывает то, будет ли аудиосигнал скомпонован для повышающего сведения до восстановления декодированного сигнала 103 понижающего микширования в многоканальный сигнал.

Блок преобразования сигналов означает модуль OTT (один-в-два), преобразующий один сигнал 103 понижающего микширования в два сигнала, или модуль TTT (два-в-три), преобразующий два сигнала 103 понижающего микширования в три сигнала, при формировании многоканального сигнала посредством повышающего сведения сигнала 103 понижающего микширования. В частности, OTT- или TTT-модуль - это концептуальный модуль, используемый при восстановлении многоканального сигнала посредством включения в блок повышающего сведения (не показан на чертеже) устройства декодирования аудиосигнала. Помимо этого, информация для типов и числа блоков преобразования сигнала включена в пространственный информационный сигнал 105.

Информация конфигурации канала - это информация, указывающая конфигурацию блока повышающего сведения, включенного в устройство декодирования аудиосигнала. Информация конфигурации канала включает в себя идентификатор, указывающий то, проходит или нет аудиосигнал через блок преобразования сигнала. Устройство декодирования аудиосигнала может знать, проходит ли аудиосигнал, вводимый в блок повышающего сведения, через блок преобразования сигнала, или не использует информацию конфигурации канала. Устройство декодирования аудиосигнала выполняет повышающее сведение сигнала 103 понижающего микширования в многоканальный аудиосигнал с помощью информации для блока преобразования сигналов, информации конфигурации канала и т.п. Устройство декодирования аудиосигналов формирует многоканальный сигнал посредством повышающего сведения сигнала 103 понижающего микширования с помощью информации блока преобразования сигнала, информации конфигурации канала и т.п., включенной в пространственную информацию 111.

Информация привязки к громкоговорителям - это информация, указывающая то, к какому громкоговорителю должен быть привязан многоканальный аудиосигнал, при выводе многоканальных аудиосигналов, формируемых посредством повышающего сведения для громкоговорителей, соответственно. Устройство декодирования аудиосигналов выводит многоканальный аудиосигнал в соответствующий громкоговоритель с помощью информации привязки к громкоговорителю, включенной в конфигурационную информацию 109.

Пространственная информация 111 - это информация, используемая для того, чтобы предоставлять пространственную чувствительность при формировании многоканальных аудиосигналов посредством комбинирования с сигналом понижающего микширования. Пространственная информация включает в себя CLD (разности уровней каналов), указывающие разность энергии между аудиосигналами, ICC (межканальные корреляции), указывающие тесную корреляцию или похожесть между аудиосигналами, CPC (коэффициенты прогнозирования каналов), указывающие коэффициент для того, чтобы прогнозировать значение аудиосигнала с помощью других сигналов и т.п. Помимо этого, набор параметров указывает пакет этих параметров.

Кроме того, идентификатор кадра, указывающий то, является позиция временного интервала, к которому применяется набор параметров, фиксированной или нет, число наборов параметров, применяемых к одному кадру, информация позиции временного интервала, к которому применяется набор параметров, и т.п. включены в пространственную информацию 111.

Фиг.2 - это блок-схема последовательности операций способа декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.

Ссылаясь на фиг.2, устройство декодирования аудиосигналов принимает пространственный информационный сигнал 105, передаваемый в форме потока битов, посредством устройства кодирования аудиосигналов (S201). Пространственный информационный сигнал 105 может передаваться в форме потока отдельно от потока сигнала 103 понижающего микширования или передаваться посредством включения во вспомогательные данные или данные расширения сигнала 103 понижающего микширования.

В случае если пространственный информационный сигнал 105 передается посредством комбинирования с сигналом 103 понижающего микширования, блок демультиплексирования (не показан) устройства декодирования аудиосигналов разделяет аудиосигнал на кодированный сигнал 103 понижающего микширования и кодированный пространственный информационный сигнал 105. Кодированный пространственный информационный сигнал 105 включает в себя заголовок 107 и пространственную информацию 111. Устройство декодирования аудиосигнала определяет то, включен ли заголовок 107 в пространственный информационный сигнал 105 (S203).

Если заголовок 107 включен в пространственный информационный сигнал 105, устройство декодирования аудиосигналов извлекает конфигурационную информацию 109 из заголовка 107 (S205).

Устройство декодирования аудиосигналов определяет то, извлечена ли конфигурационная информация из первого заголовка 107, включенного в пространственный информационный сигнал 105 (S207).

Если конфигурационная информация 109 извлечена из заголовка 107, извлеченного из пространственного информационного сигнала 105, устройство декодирования аудиосигналов декодирует конфигурационную информацию 109 (S215) и декодирует пространственную информацию 111, передаваемую после конфигурационной информации 109, согласно декодированной конфигурационной информации 109.

Если заголовок 107, извлеченный из аудиосигнала, не является заголовком 107, извлеченным первым из пространственного информационного сигнала 105, устройство декодирования аудиосигналов определяет то, является ли конфигурационная информация 109, извлеченная из заголовка 107, идентичной конфигурационной информации 109, извлеченной из первого заголовка 107 (S209).

Если конфигурационная информация 109 идентична конфигурационной информации 109, извлеченной из первого заголовка 107, устройство декодирования аудиосигналов декодирует пространственную информацию 111 с помощью декодированной конфигурационной информации 109, извлеченной из первого заголовка 107. Если извлеченная конфигурационная информация 109 не идентична конфигурационной информации 109, извлеченной из первого заголовка 107, устройство декодирования аудиосигнала определяет то, возникает ли ошибка в аудиосигнале или пути передачи от устройства кодирования аудиосигналов к устройству декодирования аудиосигналов (S211).

Если конфигурационная информация 109 является переменной, ошибки не возникает даже в том случае, если конфигурационная информация 109 не идентична конфигурационной информации 109, извлеченной из первого заголовка 107. Следовательно, устройство декодирования аудиосигнала обновляет заголовок 107 в переменный заголовок 107 (S213). Устройство декодирования аудиосигналов затем декодирует конфигурационную информацию 109, извлеченную из обновленного заголовка 107 (S215).

Устройство декодирования аудиосигналов декодирует пространственную информацию 111, передаваемую после конфигурационной информации 109, согласно декодированной конфигурационной информации 109.

Если конфигурационная информация 109, которая не является переменной, не идентична конфигурационной информации 109, извлеченной из первого заголовка 107, это означает то, что возникает ошибка в пути передачи аудиосигнала. Соответственно, устройство декодирования аудиосигналов удаляет пространственную информацию 111, включенную в пространственный информационный сигнал 105, в том числе ошибочную конфигурационную информацию 109, или исправляет ошибку пространственной информации 111 (S217).

Фиг.3 - это блок-схема последовательности операций способа декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.

Ссылаясь на фиг.3, устройство декодирования аудиосигналов принимает аудиосигнал, включающий в себя сигнал 103 понижающего микширования и пространственный информационный сигнал 105, из устройства кодирования аудиосигнала (S301).

Устройство декодирования аудиосигналов разделяет принимаемый аудиосигнал на пространственный информационный сигнал 105 и сигнал 103 понижающего микширования (S303), а затем отправляет отделенную пространственную информацию 105 и отделенный сигнал 103 понижающего микширования в базовый блок декодирования (не показан) и блок декодирования пространственной информации (не показан), соответственно.

Устройство декодирования аудиосигналов извлекает число временных интервалов и число наборов параметров из пространственного информационного сигнала 105. Устройство декодирования аудиосигналов находит позицию временного интервала, к которому должен быть применен набор параметров, с помощью извлеченного числа временных интервалов и наборов параметров. Согласно порядку соответствующего набора параметров позиция временного интервала, к которой должен быть применен соответствующий набор параметров, представляется как переменное число битов. Помимо этого, посредством уменьшения числа битов, представляющих позицию временного интервала, к которой должен быть применен соответствующий набор параметров, можно эффективно представить пространственный информационный сигнал 105. Помимо этого, позиция временного интервала, к которой должен быть применен соответствующий набор параметров, подробнее поясняется со ссылкой на фиг.4 и фиг.5.

После того как получена позиция временного интервала, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения соответствующего набора параметров к соответствующей позиции (S305). Также устройство декодирования аудиосигналов декодирует сигнал 103 понижающего микширования в базовом блоке декодирования (S305).

Устройство декодирования аудиосигналов может формировать многоканальный сигнал посредством повышающего сведения декодированного сигнала 103 понижающего микширования как есть. Но устройство декодирования аудиосигналов может скомпоновать последовательность декодированных сигналов 103 понижающего микширования до того, как устройство декодирования аудиосигналов выполняет повышающее сведение соответствующих сигналов (S307).

Устройство декодирования аудиосигналов формирует многоканальный сигнал с помощью декодированного сигнала 103 понижающего микширования и декодированного пространственного информационного сигнала 105 (S309). Устройство декодирования аудиосигналов использует пространственный информационный сигнал 105 для того, чтобы сформировать сигнал 103 понижающего микширования в многоканальный сигнал. Как упоминалось в вышеприведенном описании, пространственный информационный сигнал 105 включает в себя ряд блоков преобразования сигнала и информацию конфигурации канала для представления того, проходит ли сигнал 103 понижающего микширования через блок преобразования сигналов при повышающем сведении или выводе без прохождения через блок преобразования сигналов. Устройство декодирования аудиосигналов выполняет повышающее сведение сигнала 103 понижающего микширования с помощью ряда блоков преобразования сигналов, информации конфигурации канала и т.п. (S309). Способ представления информации конфигурации канала и способ конфигурирования информации конфигурации канала с помощью меньшего числа битов поясняется со ссылками на фиг.6 и фиг.7 ниже.

Устройство декодирования аудиосигналов привязывает многоканальный аудиосигнал к громкоговорителю в заранее заданной последовательности, чтобы вывести сформированные многоканальные аудиосигналы (S311). В этом случае, поскольку последовательность привязанных аудиосигналов возрастает, число битов для привязки многоканального аудиосигнала к громкоговорителю становится меньше. В частности, в случае если номера предоставляются многоканальным аудиосигналам по порядку, поскольку первый аудиосигнал может быть привязан к одному или более громкоговорителей, количество информации, необходимое для привязки аудиосигнала к громкоговорителю, больше, чем требуется для привязки второго или последующего аудиосигнала. Поскольку второй или последующий аудиосигнал привязывается к одному из остальных громкоговорителей за исключением первого громкоговорителя, привязанного к первому аудиосигналу, количество информации, требуемое для привязки, уменьшается. В частности, за счет снижения количества информации, требуемой для привязки аудиосигнала по мере того, как последовательность привязанных аудиосигналов возрастает, можно эффективно представлять пространственный информационный сигнал 105. Этот способ также применим к способу компоновки сигналов 103 понижающего микширования на этапе S307.

Фиг.4 - это синтаксис информации позиции временного интервала, к которой применяется набор параметров, согласно одному варианту осуществления настоящего изобретения.

Ссылаясь на фиг.4, синтаксис относится к FramingInfo 401, чтобы представлять информацию для числа наборов параметров и информацию для временного интервала, к которому применяется набор параметров.

Поле 403 bsFramingType указывает то, является ли кадр, включенный в пространственный информационный сигнал 105, фиксированным кадром или переменным кадром. Фиксированный кадр означает кадр, в котором позиция временного интервала, к которой набор параметров должен быть применен, заранее задана. В частности, позиция временного интервала, к которой должен быть применен набор параметров, определяется согласно заранее заданному правилу. Переменный кадр означает кадр, в котором позиция временного интервала, к которой набор параметров должен быть применен, еще не задана. Так что переменный кадр дополнительно требует информации позиции временного интервала для представления позиции временного интервала, к которой должен быть применен набор параметров. В нижеследующем описании bsFramingType 403 должен быть назван "идентификатором кадра", указывая то, является кадр фиксированным кадром или переменным кадром.

В случае переменного кадра поле 407 или 411 для bsParamSlot указывает информацию позиции временного интервала, к которой должен быть применен набор параметров. Поле 407 bsParamSlot[0] указывает позицию временного интервала, к которой должен быть применен первый набор параметров, а поле 411 bsParamSlot[ps] указывает позицию временного интервала, к которой второй или последующий набор параметров должен быть применен. Позиция временного интервала, к которой первый набор параметров должен быть применен, представляется как начальное значение, а позиция временного интервала, к которой второй или последующий набор параметров должен быть применен, представляется как значение разности bsDiffParamSlot[ps] 409, т.е. разность между bsParamSlot[ps] и bsParamSlot[ps-1].

В этом случае "ps" означает набор параметров. Первый набор параметров представляется как ps=0. Также ps может представлять значение в диапазоне от 0 до значения, меньшего общего числа набора параметров.

(i) Позиция 407 или 409 временного интервала, к которой должен быть применен набор параметров, увеличивается по мере того, как возрастает значение ps (bsParamSlot[ps]>bsParamSlot[ps-1]).

(ii) Для первого набора параметров максимальное значение позиции временного интервала, к которой должен быть применен первый набор параметров, соответствует значению, получающемуся в результате прибавления 1 к разности между номером временного интервала и номером набора параметров, и позиция временного интервала представляется как количество информации nBitsParamSlot(0) 413.

(iii) Для второго или последующего набора параметров позиция временного интервала, к которой N-ный набор параметров должен быть применен, больше, по меньшей мере, на 1, чем позиция временного интервала, к которой должен быть применен (N-1)-ый набор параметров, и даже может иметь значение, получающееся в результате прибавления значения N к значению, получающемуся в результате вычитания номера набора параметров из номера временного интервала. Позиция временного интервала bsParamSlot[ps], к которой должен быть применен второй или последующий набор параметров, представляется как значение разности bsDiffParamSlot[ps] 409. Кроме того, это значение представляется как количество информации по nBitsParamSlot[ps]. Таким образом, можно найти позицию временного интервала, к которой должен быть применен набор параметров, с помощью (i)-(iii).

Например, если имеется десять временных интервалов, включенных в один пространственный кадр, и если имеется три набора параметров, позиция временного интервала, к которой должен быть применен первый набор параметров (ps=0), применима к позиции временного интервала, получающейся в результате прибавления 1 к значению, получающемуся в результате вычитания общего числа параметров из общего числа временных интервалов. В частности, соответствующая позиция применима к одному из временных интервалов, принадлежащих к диапазону между 1 до максимум 8. Посредством рассмотрения того, что позиция временного интервала, к которой должен быть применен набор параметров, увеличивается согласно числу наборов параметров, можно понять, что позиции временного интервала, к которым применимы два оставшихся набора параметров, составляют максимум 9 и 10, соответственно. Таким образом, позиция 407 временного интервала, к которой должен быть применен первый набор параметров, требует трех битов для того, чтобы указать 1-8, что может быть представлено как ceil{log2(k-i+1)}. В этом случае "k" - это число временных интервалов, а "i" - это число параметров.

Если позиция 407 временного интервала, к которой должен быть применен первый набор параметров, равна 5, позиция временного интервала bsParamSlot[1], к которой должен быть применен второй набор параметров, должна быть выбрана из значений между "5+1=6" и "10-3+2=9". В частности, позиция временного интервала, к которой должен быть применен второй набор параметров, может быть представлена как значение, получающееся в результате прибавления значения разности bsDiffParamSlot[ps] 409 к значению, получающемуся в результате прибавления 1 к позиции временного интервала, к которой должен быть применен первый набор параметров. Таким образом, значение 409 разности может соответствовать от 0 до 3, что может быть представлено, как два бита. Для второго или последующего набора параметров посредством представления позиции временного интервала, к которой должен быть применен набор параметров, как значения 409 разности вместо представления позиции временного интервала непосредственно, можно уменьшить число битов. В первом примере четыре бита требуется для того, чтобы представить одно из 6-9 в случае представления позиции временного интервала непосредственно. Тем не менее, только два бита требуются для того, чтобы представить позицию временного интервала в качестве значения разности.

Следовательно, информация позиции, указывающая количество nBitsParamSlot(0) или nBitsParamSlot(ps) 413 или 415 временного интервала, к которому должен быть применен набор параметров, может быть представлена не как фиксированное число битов, а как переменное число битов.

Фиг.5 - это блок-схема последовательности операций способа декодирования пространственного информационного сигнала посредством применения набора параметров к временному интервалу согласно другому варианту осуществления настоящего изобретения.

Ссылаясь на фиг.5, устройство декодирования аудиосигналов принимает аудиосигнал, включающий в себя сигнал 103 понижающего микширования и пространственный информационный сигнал 105 (S501).

Если заголовок 107 существует в пространственном информационном сигнале, устройство декодирования аудиосигналов извлекает число временных интервалов, включенных в кадр, из конфигурационной информации 109, включенной в заголовок 107 (S503). Если заголовок 107 не включен в пространственный информационный сигнал, устройство декодирования аудиосигналов извлекает число временных интервалов из конфигурационной информации 109, включенной в ранее извлеченный заголовок 107.

Устройство декодирования аудиосигналов извлекает число наборов параметров, которые должны быть применены к кадру, из пространственного информационного сигнала 105 (S505).

Устройство декодирования аудиосигналов определяет то, являются позиции временных интервалов, к которым наборы параметров должны быть применены, фиксированными или переменными, с помощью идентификатора кадров, включенного в пространственный информационный сигнал 105 (S507).

Если кадр является фиксированным кадром, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения набора параметров к соответствующему интервалу согласно заранее заданному правилу (S513).

Если кадр является переменным кадром, устройство декодирования аудиосигналов извлекает информацию для позиции временного интервала, к которой первый набор параметров должен быть применен (S509). Как упоминалось в вышеприведенном описании, позиция временного интервала, к которой должен быть применен первый набор параметров, максимально может быть значением, получающимся в результате прибавления 1 к разности между числом временных интервалов и числом наборов параметров.

Устройство декодирования аудиосигналов получает информацию для позиции временного интервала, к которой должен быть применен второй или последующий набор параметров, с помощью информации для позиции временного интервала, к которой должен быть применен первый набор параметров (S511). Если N - это натуральное число, равное или больше 2, позиция временного интервала, к которой должен быть применен набор параметров, может быть представлена как минимальное число битов, с помощью того факта, что позиция временного интервала, к которой должен быть применен N-ный набор параметров, больше, по меньшей мере, на 1, чем позиция временного интервала, к которой должен быть применен (N-1)-ый набор параметров, и может даже иметь значение, получающееся в результате прибавления N к значению, получающемуся в результате вычитания числа наборов параметров из числа временных интервалов.

Кроме того, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения набора параметров к полученной позиции временного интервала (S513).

Фиг.6 и фиг.7 - это схемы блока повышающего сведения устройства декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.

Устройство декодирования аудиосигналов разделяет аудиосигнал, принимаемый от устройства кодирования аудиосигналов, на сигнал 103 понижающего микширования и пространственный информационный сигнал 105, а затем декодирует сигнал 103 понижающего микширования и пространственный информационный сигнал 105, соответственно. Как упоминалось в вышеприведенном описании, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения параметра к временному интервалу. Также устройство декодирования аудиосигналов формирует многоканальные аудиосигналы с помощью декодированного сигнала 103 понижающего микширования и декодированного пространственного информационного сигнала 105.

Если устройство кодирования аудиосигналов сжимает N входных каналов в M аудиосигналов и передает M аудиосигналов в форме потока битов в устройство декодирования аудиосигналов, устройство декодирования аудиосигналов восстанавливает и выводит исходные N каналов. Эта конфигурация называется структурой N-M-N. В некоторых случаях, если устройство декодирования аудиосигналов не может восстановить N каналов, сигнал 103 понижающего микширования выводится в два стереосигнала без учета пространственного информационного сигнала 105. Тем не менее, это не поясняется дополнительно. Структура, при которой значения N и M являются фиксированными, должна быть названа фиксированной структурой каналов. Структура, при которой значения N и M представляются как произвольные значения, должна быть названа произвольной структурой каналов. В случае такой фиксированной структуры каналов, как 5-1-5, 5-2-5, 7-2-7 и т.п., устройство декодирования аудиосигналов передает аудиосигнал посредством включения структуры каналов в аудиосигнал. Устройство декодирования аудиосигналов затем декодирует аудиосигнал посредством прочтения структуры каналов.

Устройство декодирования аудиосигналов использует блок повышающего сведения, включающий в себя блок преобразования сигналов, для того, чтобы восстановить M аудиосигналов в N многоканальных сигналов. Блок преобразования сигналов - это концептуальный модуль, используемый для того, чтобы преобразовать один сигнал 103 понижающего микширования в два сигнала, или преобразовать два сигнала 103 понижающего микширования в три сигнала, при формировании многоканального сигнала посредством повышающего сведения сигналов 103 понижающего микширования.

Устройство декодирования аудиосигналов может получать информацию для структуры блока повышающего сведения посредством извлечения информации конфигурации канала из информации 109 конфигурации, включенной в пространственный информационный сигнал 105. Как упоминалось в вышеприведенном описании, информация конфигурации канала - это информация, указывающая конфигурацию блока повышающего сведения, включенного в устройство декодирования аудиосигналов. Информация конфигурации канала включает в себя идентификатор, который указывает то, проходит ли аудиосигнал через блок преобразования сигнала. В частности, информация конфигурации каналов может быть представлена как сегментирующий идентификатор, поскольку число входных и выходных сигналов блока преобразования сигналов изменяется в случае, если декодированный сигнал понижающего микширования проходит через блок преобразования сигналов в блок повышающего сведения. Также информация конфигурации канала может быть представлена как несегментирующий идентификатор, поскольку входной сигнал блока преобразования сигналов выводится нетронутым в случае, если декодированный сигнал понижающего микширования не проходит через блок преобразования сигналов, включенный в блок повышающего сведения. В настоящем изобретении сегментирующий идентификатор должен быть представлен как 1, а несегментирующий идентификатор должен быть представлен как 0.

Информация конфигурации канала может быть представлена двумя способами, горизонтальным способом и вертикальным способом.

В горизонтальном способе, если аудиосигнал проходит через блок преобразования сигналов, т.е. если информация конфигурации канала равна 1, то, проходит ли сигнал нижнего уровня, выводимый посредством блока преобразования сигналов, еще через один блок преобразования сигналов, последовательно указывается посредством сегментирующего или несегментирующего идентификатора. Если информация конфигурации канала равна 0, то, проходит ли следующий аудиосигнал того же или верхнего уровня через блок преобразования сигналов, указывается посредством сегментирующего или несегментирующего идентификатора.

В вертикальном способе то, проходит ли каждый из всех аудиосигналов верхнего уровня через блок преобразования сигналов, последовательно указывается посредством сегментирующего или несегментирующего идентификатора независимо от того, проходит ли аудиосигнал верхнего уровня через блок преобразования сигналов, а затем указывается, проходит ли аудиосигнал нижнего уровня через блок преобразования сигналов.

Для структуры того же блока повышающего сведения фиг.6 примерно показывает то, что информация конфигурации канала представляется посредством горизонтального способа, а фиг.7 примерно показывает, что информация конфигурации канала представляется посредством вертикального способа. На фиг.6 и фиг.7 блок преобразования сигналов использует OTT-модуль, например.

Ссылаясь на фиг.6, четыре аудиосигнал