Способ и устройство для рендеринга акустического сигнала и машиночитаемый носитель записи

Иллюстрации

Показать все

Изобретение относится к обработке аудиосигнала аудиоизображения. Технический результат – уменьшение искажения аудиоизображения, когда угол подъема входного канала отличается от стандартного угла подъема входного канала. Способ для рендеринга акустического сигнала содержит этапы: приема многоканального сигнала, содержащего множество входных каналов, которые должны преобразовываться во множество выходных каналов; получения параметров рендеринга подъема для входного высотного канала, имеющего стандартный угол подъема, так что каждый выходной канал предоставляет аудиоизображение, имеющее ощущение подъема; и обновления параметров рендеринга подъема для входного высотного канала, имеющего заданный угол подъема, отличный от стандартного угла подъема. 3 н. и 22 з.п. ф-лы, 15 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу и устройству для рендеринга аудиосигнала, а более конкретно к способу и устройству рендеринга для более точного воспроизведения местоположения и тона аудиоизображения, чем раньше, посредством коррекции коэффициента панорамирования подъема или коэффициента фильтрации подъема, когда подъем входного канала выше или ниже подъема согласно стандартной схеме размещения.

Уровень техники

Стереофонический звук указывает звук, имеющий ощущение объемного окружения посредством воспроизведения не только основного тона и тона звука, но также и направления, и ощущение расстояния, и имеющий дополнительную пространственную информацию, посредством которой слушатели, которые не находятся в пространстве, в котором формируется источник звука, имеют сведения по ощущению направления, ощущению расстояния и ощущению пространства.

Когда многоканальный сигнал, к примеру, из 22.2 каналов, подвергается рендерингу в 5.1 каналов, трехмерный стереофонический звук может воспроизводиться посредством двумерного выходного канала. Тем не менее, когда угол подъема входного канала отличается от стандартного угла подъема, и входной сигнал подвергается рендерингу с использованием параметров рендеринга, определенных согласно стандартному углу подъема, возникает искажение аудиоизображения.

Подробное описание изобретения

Техническая задача

Как описано выше, когда многоканальный сигнал, к примеру, из 22.2 каналов, подвергается рендерингу в 5.1 каналов, трехмерные аудиосигналы могут воспроизводиться посредством двумерного выходного канала. Тем не менее, когда угол подъема входного канала отличается от стандартного угла подъема, и входной сигнал подвергается рендерингу с использованием параметров рендеринга, определенных согласно стандартному углу подъема, возникает искажение аудиоизображения.

Цель настоящего изобретения заключается в том, чтобы решать вышеописанную проблему в существующей технологии и уменьшать искажение аудиоизображения, даже когда подъем входного канала выше или ниже стандартного подъема.

Техническое решение

Характерная конфигурация настоящего изобретения для того, чтобы достигать цели, описанной выше, заключается в следующем.

Согласно аспекту варианта осуществления, способ рендеринга аудиосигнала включает в себя этапы: приема многоканального сигнала, включающего в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; получения параметров рендеринга подъема для входного высотного канала, имеющего стандартный угол подъема, чтобы предоставлять приподнятое звуковое изображение посредством множества выходных каналов; и обновления параметров рендеринга подъема для входного высотного канала, имеющего предварительно определенный угол подъема, отличный от стандартного угла подъема.

Преимущества изобретения

Согласно настоящему изобретению, трехмерный аудиосигнал может подвергаться рендерингу таким образом, что искажение аудиоизображения уменьшается, даже когда подъем входного канала выше или ниже стандартного подъема.

Краткое описание чертежей

Фиг. 1 является блок-схемой, иллюстрирующей внутреннюю структуру устройства воспроизведения стереофонического аудио согласно варианту осуществления.

Фиг. 2 является блок-схемой, иллюстрирующей конфигурацию модуля рендеринга в устройстве воспроизведения стереофонического аудио, согласно варианту осуществления.

Фиг. 3 иллюстрирует схему размещения каналов, когда множество входных каналов микшируется с понижением во множество выходных каналов, согласно варианту осуществления.

Фиг. 4A иллюстрирует схему размещения каналов, когда каналы верхнего уровня просматриваются спереди.

Фиг. 4B иллюстрирует схему размещения каналов, когда каналы верхнего уровня просматриваются сверху.

Фиг. 4C иллюстрирует трехмерную схему размещения каналов верхнего уровня.

Фиг. 5 является блок-схемой, иллюстрирующей конфигурацию декодера и модуля трехмерного акустического рендеринга в устройстве воспроизведения стереофонического аудио, согласно варианту осуществления.

Фиг. 6 является блок-схемой последовательности операций, иллюстрирующей способ рендеринга трехмерного аудиосигнала, согласно варианту осуществления.

Фиг. 7A иллюстрирует местоположение каждого канала, когда подъемы высотных каналов составляют 0°, 35° и 45°, согласно варианту осуществления.

Фиг. 7B иллюстрирует разность между сигналами, ощущаемыми посредством левого и правого уха слушателей, когда аудиосигнал выводится в каждом канале согласно варианту осуществления по фиг. 7B.

Фиг. 7C иллюстрирует признаки тонального фильтра согласно частотам, когда углы подъема каналов составляют 35° и 45°, согласно варианту осуществления.

Фиг. 8 иллюстрирует явление, в котором левое и правое аудиоизображения переставляются, когда угол подъема входного канала составляет пороговое значение или больше, согласно варианту осуществления.

Фиг. 9 является блок-схемой последовательности операций, иллюстрирующей способ рендеринга трехмерного аудиосигнала, согласно другому варианту осуществления.

Фиг. 10 и 11 являются схемами последовательности сигналов для описания работы каждого устройства согласно варианту осуществления, включающего в себя, по меньшей мере, одно внешнее устройство и устройство воспроизведения аудио.

Оптимальный режим осуществления изобретения

Характерные конфигурации настоящего изобретения для того, чтобы достигать цели, описанной выше, заключаются в следующем.

Согласно аспекту варианта осуществления, способ рендеринга аудиосигнала включает в себя этапы: приема многоканального сигнала, включающего в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; получения параметра рендеринга подъема для входного высотного канала, имеющего стандартный угол подъема, так что каждый выходной канал предоставляет аудиоизображение, имеющее ощущение подъема; и обновления параметра рендеринга подъема для входного высотного канала, имеющего заданный угол подъема, отличный от стандартного угла подъема.

Параметр рендеринга подъема включает в себя, по меньшей мере, одно из коэффициентов фильтрации подъема и коэффициентов панорамирования подъема.

Коэффициенты фильтрации подъема вычисляются посредством отражения динамической характеристики HRTF.

Этап обновления параметра рендеринга подъема включает в себя этап применения весового коэффициента к коэффициентам фильтрации подъема на основе стандартного угла подъема и заданного угла подъема.

Весовой коэффициент определяется таким образом, что признак фильтрации подъема демонстрируется умеренно, когда заданный угол подъема меньше стандартного угла подъема, и определяется таким образом, что признак фильтрации подъема демонстрируется сильно, когда заданный угол подъема превышает стандартный угол подъема.

Этап обновления параметра рендеринга подъема включает в себя этап обновления коэффициентов панорамирования подъема на основе стандартного угла подъема и заданного угла подъема.

Когда заданный угол подъема меньше стандартного угла подъема, обновленные коэффициенты панорамирования подъема, которые должны применяться к выходным каналам, существующим таким образом, что они являются ипсилатеральными относительно выходного канала, имеющего заданный угол подъема из обновленных коэффициентов панорамирования подъема, превышают коэффициенты панорамирования подъема до обновления, и сумма квадратов обновленных коэффициентов панорамирования подъема, которые, соответственно, должны применяться к выходным каналам, равна 1.

Когда заданный угол подъема превышает стандартный угол подъема, обновленные коэффициенты панорамирования подъема, которые должны применяться к выходным каналам, существующим таким образом, что они являются ипсилатеральными относительно выходного канала, имеющего заданный угол подъема из обновленных коэффициентов панорамирования подъема, меньше коэффициентов панорамирования подъема до обновления, и сумма квадратов обновленных коэффициентов панорамирования подъема, которые, соответственно, должны применяться к выходным каналам, равна 1.

Этап обновления параметра рендеринга подъема включает в себя этап обновления коэффициентов панорамирования подъема на основе стандартного угла подъема и порогового значения, когда заданный угол подъема составляет пороговое значение или больше.

Способ дополнительно включает в себя этап приема ввода заданного угла подъема.

Ввод принимается из отдельного устройства.

Способ включает в себя этапы: рендеринга принимаемого многоканального сигнала на основе обновленного параметра рендеринга подъема; и передачи подвергнутого рендерингу многоканального сигнала в отдельное устройство.

Согласно аспекту другого варианта осуществления, устройство для рендеринга аудиосигнала включает в себя: приемный модуль для приема многоканального сигнала, включающего в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; и модуль рендеринга для получения параметра рендеринга подъема для входного высотного канала, имеющего стандартный угол подъема, так что каждый выходной канал предоставляет аудиоизображение, имеющее ощущение подъема, и обновления параметра рендеринга подъема для входного высотного канала, имеющего заданный угол подъема, отличный от стандартного угла подъема.

Параметр рендеринга подъема включает в себя, по меньшей мере, одно из коэффициентов фильтрации подъема и коэффициентов панорамирования подъема.

Коэффициенты фильтрации подъема вычисляются посредством отражения динамической характеристики HRTF.

Обновленный параметр рендеринга подъема включает в себя коэффициенты фильтрации подъема, к которым применяется весовой коэффициент на основе стандартного угла подъема и заданного угла подъема.

Весовой коэффициент определяется таким образом, что признак фильтрации подъема демонстрируется умеренно, когда заданный угол подъема меньше стандартного угла подъема, и определяется таким образом, что признак фильтрации подъема демонстрируется сильно, когда заданный угол подъема превышает стандартный угол подъема.

Обновленный параметр рендеринга подъема включает в себя коэффициенты панорамирования подъема, обновленные на основе стандартного угла подъема и заданного угла подъема.

Когда заданный угол подъема меньше стандартного угла подъема, обновленные коэффициенты панорамирования подъема, которые должны применяться к выходным каналам, существующим таким образом, что они являются ипсилатеральными относительно выходного канала, имеющего заданный угол подъема из обновленных коэффициентов панорамирования подъема, превышают коэффициенты панорамирования подъема до обновления, и сумма квадратов обновленных коэффициентов панорамирования подъема, которые, соответственно, должны применяться к выходным каналам, равна 1.

Когда заданный угол подъема превышает стандартный угол подъема, обновленные коэффициенты панорамирования подъема, которые должны применяться к выходным каналам, существующим таким образом, что они являются ипсилатеральными относительно выходного канала, имеющего заданный угол подъема из обновленных коэффициентов панорамирования подъема, меньше коэффициентов панорамирования подъема до обновления, и сумма квадратов обновленных коэффициентов панорамирования подъема, которые, соответственно, должны применяться к выходным каналам, равна 1.

Обновленный параметр рендеринга подъема включает в себя коэффициенты панорамирования подъема, обновленные на основе стандартного угла подъема и порогового значения, когда заданный угол подъема составляет пороговое значение или больше.

Устройство дополнительно включает в себя модуль ввода для приема ввода заданного угла подъема.

Ввод принимается из отдельного устройства.

Модуль рендеринга выполняет рендеринг принимаемого многоканального сигнала на основе обновленного параметра рендеринга подъема, и устройство дополнительно включает в себя передающий модуль для передачи подвергнутого рендерингу многоканального сигнала в отдельное устройство.

Согласно аспекту другого варианта осуществления, машиночитаемый носитель записи имеет записанную компьютерную программу для осуществления способа, описанного выше.

Кроме того, дополнительно предоставляются другой способ и другая система для реализации настоящего изобретения и машиночитаемый носитель записи, имеющий записанную компьютерную программу для осуществления способа.

Оптимальный режим осуществления изобретения

Подробное описание настоящего изобретения, которое приводится ниже, ссылается на прилагаемые чертежи, показывающие, в качестве примера, конкретные варианты осуществления, посредством которых может выполняться настоящее изобретение. Эти варианты осуществления описываются подробно, так что специалисты в данной области техники могут в достаточной степени выполнять настоящее изобретение. Следует понимать, что различные варианты осуществления настоящего изобретения отличаются друг от друга, но не должны быть единственными друг для друга.

Например, конкретная форма, структура и характеристика, изложенные в настоящем описании изобретения, могут реализовываться посредством изменения в зависимости от варианта осуществления без отступления от сущности и объема настоящего изобретения. Помимо этого, следует понимать, что местоположения или схема размещения отдельных компонентов в каждом варианте осуществления также могут изменяться без отступления от сущности и объем настоящего изобретения. Следовательно, подробное описание, которое приводится, служит не для целей ограничения, и следует понимать, что объем настоящего изобретения включает в себя заявленный объем формулы изобретения и все объемы, эквивалентные заявленному объему.

Аналогичные ссылки с номерами на чертежах обозначают идентичные или аналогичные элементы в различных аспектах. Кроме того, на чертежах части, нерелевантные для описания, опускаются, чтобы ясно описывать настоящее изобретение, и аналогичные ссылки с номерами обозначают аналогичные элементы во всем подробном описании.

В дальнейшем в этом документе подробно описываются варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи, так что специалисты в области техники, которой принадлежит настоящее изобретение, могут легко выполнять настоящее изобретение. Тем не менее настоящее изобретение может реализовываться в различных специальных формах и не ограничено вариантами осуществления, описанными в данном документе.

Во всем подробном описании, когда описывается то, что определенный элемент "соединен" с другим элементом, это включает в себя случай "непосредственного соединения" и случай "электрического соединения" через другой элемент в середине. Помимо этого, когда определенная часть "включает в себя" определенный компонент, это указывает то, что часть дополнительно может включать в себя другой компонент вместо исключения другого компонента, если только это не специально отличающееся раскрытие сущности.

Далее подробно описывается настоящее изобретение со ссылкой на прилагаемые чертежи.

Фиг. 1 является блок-схемой, иллюстрирующей внутреннюю структуру устройства воспроизведения стереофонического аудио согласно варианту осуществления.

Устройство 100 воспроизведения стереофонического аудио согласно варианту осуществления может выводить многоканальный аудиосигнал, в котором множество входных каналов сводятся во множество выходных каналов, которые должны воспроизводиться. В том случае, если число выходных каналов меньше числа входных каналов, входные каналы микшируются с понижением с тем, чтобы удовлетворять числу выходных каналов.

Стереофонический звук указывает звук, имеющий ощущение объемного окружения посредством воспроизведения не только основного тона и тона звука, но также и направления, и ощущение расстояния, и имеющий дополнительную пространственную информацию, посредством которой слушатели, которые не находятся в пространстве, в котором формируется источник звука, имеют сведения по ощущению направления, ощущению расстояния и ощущению пространства.

В нижеприведенном описании выходные каналы аудиосигнала могут указывать число динамиков, через которые выводится звук. Чем больше число выходных каналов, тем больше число динамиков, через которые выводится звук. Согласно варианту осуществления, устройство 100 воспроизведения стереофонического аудио может выполнять рендеринг и сводить многоканальный акустический входной сигнал в выходные каналы, которые должны воспроизводиться, так что многоканальный аудиосигнал, имеющий большее число входных каналов, может выводиться и воспроизводиться в окружении, имеющем меньшее число выходных каналов. В этом случае многоканальный аудиосигнал может включать в себя канал, в котором может выводиться приподнятый звук.

Канал, в котором может выводиться приподнятый звук, может указывать канал, в котором аудиосигнал может выводиться посредством динамика, расположенного над головами слушателей, так что слушатели ощущают подъем. Горизонтальный канал может указывать канал, в котором аудиосигнал может выводиться посредством динамика, расположенного на горизонтальной поверхности относительно слушателей.

Вышеописанное окружение, имеющее меньшее число выходных каналов, может указывать окружение, в котором звук может выводиться посредством динамиков, размещаемых на горизонтальной поверхности, без выходных каналов, в которых может выводиться приподнятый звук.

Помимо этого, в нижеприведенном описании, горизонтальный канал может указывать канал, включающий в себя аудиосигнал, который может выводиться посредством динамика, расположенного на горизонтальной поверхности. Надголовный канал может указывать канал, включающий в себя аудиосигнал, который может выводиться посредством динамика, расположенного на приподнятой позиции выше горизонтальной поверхности, чтобы выводить приподнятый звук.

Ссылаясь на фиг. 1, устройство 100 воспроизведения стереофонического аудио согласно варианту осуществления может включать в себя аудиоядро 110, модуль 120 рендеринга, микшер 130 и модуль 140 постобработки.

Согласно варианту осуществления, устройство 100 воспроизведения стереофонического аудио может выводить каналы, которые должны воспроизводиться, посредством рендеринга и сведения многоканальных входных аудиосигналов. Например, многоканальный входной аудиосигнал может представлять собой 22.2-канальный сигнал, и выходные каналы, которые должны воспроизводиться, могут составлять 5.1 или 7.1 каналов. Устройство 100 воспроизведения стереофонического аудио может выполнять рендеринг посредством определения выходного канала, который соответствует каждому каналу многоканального входного аудиосигнала, и сводить подвергнутые рендерингу аудиосигналы посредством синтезирования сигналов каналов, соответствующих каналу, который должен воспроизводиться, и вывода синтезированного сигнала в качестве конечного сигнала.

Кодированный аудиосигнал вводится в аудиоядро 110 в формате потока битов, и аудиоядро 110 декодирует входной аудиосигнал посредством выбора инструментального средства декодера, подходящего для схемы, посредством которой кодирован аудиосигнал.

Модуль 120 рендеринга может выполнять рендеринг многоканального входного аудиосигнала в многоканальный выходной канал согласно каналам и частотам. Модуль 120 рендеринга может выполнять трехмерный рендеринг и двумерный рендеринг многоканального аудиосигнала, при этом каждый из сигналов согласно надголовному каналу и горизонтальному каналу. Ниже подробнее описывается конфигурация модуля рендеринга и конкретного способа рендеринга со ссылкой на фиг. 2.

Микшер 130 может выводить конечный сигнал посредством синтезирования сигналов каналов, соответствующих горизонтальному каналу посредством модуля 120 рендеринга. Микшер 130 может сводить сигналы каналов для каждой заданной секции. Например, микшер 130 может сводить сигналы каналов для каждого I-кадра.

Согласно варианту осуществления, микшер 130 может выполнять сведение на основе значений мощности сигналов, подвергнутых рендерингу в соответствующие каналы, которые должны воспроизводиться. Другими словами, микшер 130 может определять амплитуду конечного сигнала или усиление, которое должно применяться к конечному сигналу, на основе значений мощности сигналов, подвергнутых рендерингу в соответствующие каналы, которые должны воспроизводиться.

Модуль 140 постобработки выполняет управление динамическим диапазоном и бинаурализацию многополосного сигнала для выходного сигнала микшера 130 с тем, чтобы удовлетворять каждому устройству воспроизведения (динамику или наушнику). Выходной аудиосигнал, выводимый из модуля 140 постобработки, выводится посредством такого устройства, как динамик, и выходной аудиосигнал может воспроизводиться двумерным или трехмерным способом согласно обработке каждого компонента.

Устройство 100 воспроизведения стереофонического аудио согласно варианту осуществления, показанному на фиг. 1, показано на основе конфигурации аудиодекодера, и вспомогательная конфигурация опускается.

Фиг. 2 является блок-схемой, иллюстрирующей конфигурацию модуля рендеринга в устройстве воспроизведения стереофонического аудио, согласно варианту осуществления.

Модуль 120 рендеринга включает в себя модуль 121 фильтрации и модуль 123 панорамирования.

Модуль 121 фильтрации может корректировать тон и т.п. декодированного аудиосигнала согласно местоположению и фильтровать входной аудиосигнал посредством использования фильтра на основе передаточной функции восприятия звука человеком (HRTF).

Модуль 121 фильтрации может выполнять рендеринг надголовного канала, который проходит через HRTF-фильтр, посредством различных способов согласно частотам для трехмерного рендеринга надголовного канала.

HRTF-фильтр обеспечивает возможность распознавания стереофонического звука посредством явления, в котором не только простые разности в тракте, такие как интерауральная разность уровней (ILD) и интерауральная разность времен (ITD), но также и усложненные характеристики тракта, такие как преломление на поверхности головы и отражение на ушной раковине, варьируются согласно направлениям акустического поступления. HRTF-фильтр может изменять качество звука аудиосигнала с тем, чтобы обрабатывать аудиосигналы, включенные в надголовный канал, таким образом, что может распознаваться стереофонический звук.

Модуль 123 панорамирования получает и применяет коэффициент панорамирования, который должен применяться для каждой полосы частот и каждого канала, чтобы панорамировать входной аудиосигнал в каждый выходной канал. Панорамирование аудиосигнала указывает управление абсолютной величиной сигнала, который должен применяться к каждому выходному каналу, чтобы выполнять рендеринг источника звука в конкретное местоположение между двумя выходными каналами.

Модуль 123 панорамирования может выполнять рендеринг низкочастотного сигнала для сигнала надголовного канала согласно способу добавления к ближайшему каналу и выполнять рендеринг высокочастотного сигнала согласно способу многоканального панорамирования. Согласно способу многоканального панорамирования, значение усиления, по-разному заданное для каждого канала, который должен подвергаться рендерингу в сигнал каждого канала, может применяться к сигналу каждого канала многоканального аудиосигнала таким образом, что сигнал подвергается рендерингу, по меньшей мере, в один горизонтальный канал. Сигналы соответствующих каналов, к которым применяются значения усиления, могут быть синтезированы посредством сведения и вывода в качестве конечного сигнала.

Поскольку низкочастотный сигнал имеет свойство сильного преломления, даже когда низкочастотный сигнал подвергается рендерингу только в один канал без отдельного рендеринга каждого канала многоканального аудиосигнала в несколько каналов согласно способу многоканального панорамирования, один канал может демонстрировать аналогичное качество звука, когда слушатели прослушивают низкочастотный сигнал. Следовательно, согласно варианту осуществления, устройство 100 воспроизведения стереофонического аудио может выполнять рендеринг низкочастотного сигнала согласно способу добавления к ближайшему каналу, чтобы предотвращать ухудшение качества звука, которое может возникать посредством сведения нескольких каналов в один выходной канал. Иными словами, поскольку качество звука может быть ухудшено вследствие усиления или уменьшения согласно помехам между сигналами каналов, когда несколько каналов сводятся в один выходной канал, один канал может сводиться в один выходной канал, чтобы предотвращать ухудшение качества звука.

Согласно способу добавления к ближайшему каналу, каждый канал многоканального аудиосигнала может подвергаться рендерингу в ближайший канал из каналов, которые должны воспроизводиться, вместо отдельного рендеринга в несколько каналов.

Помимо этого, устройство 100 воспроизведения стереофонического аудио может расширять зону наилучшего восприятия без ухудшения качества звука посредством выполнения рендеринга посредством различных способов согласно частотам. Иными словами, посредством рендеринга низкочастотного сигнала, имеющего характеристику сильного преломления согласно способу добавления к ближайшему каналу, может предотвращаться ухудшение качества звука, которое может возникать посредством сведения нескольких каналов в один выходной канал. Зона наилучшего восприятия указывает предварительно определенный диапазон, в котором слушатели могут оптимально прослушивать стереофонический звук без искажения.

Поскольку зона наилучшего восприятия является широкой, слушатели могут оптимально прослушивать стереофонический звук без искажения в широком диапазоне, и когда слушатели не находятся в зоне наилучшего восприятия, слушатели могут прослушивать звук с искаженным качеством звука или аудиоизображением.

Фиг. 3 иллюстрирует схему размещения каналов, когда множество входных каналов микшируется с понижением во множество выходных каналов, согласно варианту осуществления.

Чтобы предоставлять идентичное или более глубокое ощущение реализма и ощущение погружения относительно реальности, аналогично трехмерному изображению, разработаны технологии для предоставления трехмерного стереофонического звука вместе с трехмерным стереоскопическим изображением. Стереофонический звук указывает звук, в котором сам аудиосигнал имеет ощущение подъема и ощущение пространства звука, и для того, чтобы воспроизводить такой стереофонический звук, требуются, по меньшей мере, два громкоговорителя, т.е. выходных канала. Помимо этого, за исключением бинаурального стереофонического звука с использованием HRTF, большее число выходных каналов требуется для того, чтобы более точно воспроизводить ощущение подъема, ощущение расстояния и ощущение пространства звука.

Следовательно, предложена и разработана стереосистема, имеющая два выходных канала и различные многоканальные системы, такие как 5.1-канальная система, система Auro 3D, 10.2-канальная система Holman, 10.2-канальная система ETRI/Samsung и 22.2-канальная система NHK.

Фиг. 3 иллюстрирует случай, в котором 22.2-канальный трехмерный аудиосигнал воспроизводится посредством 5.1-канальной выходной системы.

5.1-канальная система является общим названием многоканальной звуковой системы объемного звучания с пятью каналами и представляет собой систему, наиболее часто используемую в качестве домашних кинотеатров и звуковых киносистем. Сумма 5.1 каналов включает в себя передний левый (FL) канал, центральный (C) канал, передний правый (FR) канал, левый канал объемного звучания (SL) и правый канал объемного звучания (SR). Как показано на фиг. 3, поскольку все выводы 5.1 каналов находятся на идентичной плоскости, 5.1-канальная система физически соответствует двумерной системе, и для того, чтобы воспроизводить трехмерный аудиосигнал посредством использования 5.1-канальной системы, должен выполняться процесс рендеринга для предоставления трехмерного эффекта для сигнала воспроизводиться.

5.1-канальная система широко используется в различных областях техники, не только в области техники кинофильмов, но также и в области техники DVD-изображений, области техники DVD-звука, области техники супераудио-компакт-дисков (SACD) или области техники цифровой широковещательной передачи. Тем не менее, хотя 5.1-канальная система предоставляет улучшенное ощущение пространства по сравнению со стереосистемой, существует несколько ограничений при формировании более широкого пространства прослушивания. В частности, поскольку зона наилучшего восприятия формируется узкой, и вертикальное аудиоизображение, имеющее угол подъема, не может предоставляться, 5.1-канальная система не может быть подходящей для широкого пространства прослушивания, к примеру, в кинотеатре.

22.2-канальная система, предложенная посредством NHK, включает в себя трехуровневые выходные каналы, как показано на фиг. 3. Верхний уровень 310 включает в себя канал гласа Божьего (VoG), T0-канал, T180-канал, TL45-канал, TL90-канал, TL135-канал, TR45-канал, TR90-канал и TR45-канал. В данном документе индекс T, который является первым символом названия каждого канала, указывает верхний уровень, индексы L и R указывают левый и правый, соответственно, и следующее число указывает азимутальный угол от центрального канала. Верхний уровень обычно называется верхним уровнем.

VoG-канал представляет собой канал, существующий над головами слушателей, имеет угол подъема 90° и не имеет азимутального угла. Тем не менее, когда VoG-канал располагается неправильно даже в небольшой степени, VoG-канал имеет азимутальный угол и угол подъема, которые отличаются от 90°, и в силу этого VoG-канал не может больше выступать в качестве VoG-канала.

Средний уровень 320 находится на плоскости, идентичной плоскости существующих 5.1 каналов, и включает в себя ML60-канал, ML90-канал, ML135-канал, MR60-канал, MR90-канал и MR135-канал, помимо выходных каналов для 5.1 каналов. В данном документе, индекс M, который является первым символом названия каждого канала, указывает средний уровень, и следующее число указывает азимутальный угол от центрального канала.

Нижний уровень 330 включает в себя L0-канал, LL45-канал и LR45-канал. В данном документе, индекс L, который является первым символом названия каждого канала, указывает нижний уровень, и следующее число указывает азимутальный угол от центрального канала.

В 22.2 каналах, средний уровень называется горизонтальным каналом, а VOG-, T0-, T180-, M180-, L- и C-каналы, соответствующие азимутальному углу 0° или 180°, называются вертикальным каналом.

Когда 22.2-канальный входной сигнал воспроизводится с использованием 5.1-канальной системы, согласно наиболее общему способу, межканальный сигнал может быть распределен с использованием выражения низведения. Альтернативно, может выполняться рендеринг для предоставления виртуального ощущения подъема, так что 5.1-канальная система воспроизводит аудиосигнал, имеющий ощущение подъема.

Фиг. 4 иллюстрирует схему размещения каналов верхнего уровня согласно подъемам верхнего уровня в схеме размещения каналов, согласно варианту осуществления.

Когда сигнал входного канала представляет собой 22.2-канальный трехмерный аудиосигнал и размещается согласно схеме размещения по фиг. 3, верхний уровень из входных каналов имеет схему размещения, как показано на фиг. 4. В этом случае, предполагается, что углы подъема составляют 0°, 25°, 35° и 45°, и VoG-канал, соответствующий углу подъема 90°, опускается. Каналы верхнего уровня, имеющие угол подъема в 0°, задаются так, как если они расположены на горизонтальной поверхности (на среднем уровне 320).

Фиг. 4A иллюстрирует схему размещения каналов, когда каналы верхнего уровня просматриваются спереди.

Ссылаясь на фиг. 4A, поскольку восемь каналов верхнего уровня имеют разность азимутальных углов в 45° между собой, когда каналы верхнего уровня просматриваются спереди на основе вертикальной оси канала, показаны шесть каналов, остающихся посредством исключения TL90-канала и TR90-канала, так что TL45-канал и TL135-канал, T0-канал и T180-канал и TR45-канал и TR135-канал перекрываются два по два. Это должно быть очевиднее по сравнению с фиг. 4B.

Фиг. 4B иллюстрирует схему размещения каналов, когда каналы верхнего уровня просматриваются сверху. Фиг. 4C иллюстрирует трехмерную схему размещения каналов верхнего уровня. Можно видеть, что восемь каналов верхнего уровня размещаются с равным интервалом и разностью азимутальных углов в 45° между собой.

Если контент, который должен воспроизводиться в качестве стереофонического звука посредством рендеринга подъема, является фиксированным таким образом, что он имеет, например, угол подъема в 35°, то он является высококачественным, даже если рендеринг подъема выполняется для всех входных аудиосигналов для угла подъема в 35°, и может получаться оптимальный результат.

Тем не менее, согласно контенту, угол подъема может применяться к стереофоническому звуку соответствующего контента, и как показано на фиг. 4, местоположение и расстояние каждого канала варьируются согласно подъемам каналов, и соответственно, также может варьироваться характеристика сигналов.

Следовательно, когда виртуальный рендеринг выполняется для фиксированного угла подъема, возникает искажение аудиоизображения, и для того, чтобы получать оптимальную производительность рендеринга, необходимо выполнять рендеринг с учетом угла подъема входного трехмерного аудиосигнала, т.е. угла подъема входного канала.

Фиг. 5 является блок-схемой, иллюстрирующей конфигурацию декодера и модуля трехмерного акустического рендеринга при воспроизведении стереофонического аудио, согласно варианту осуществления.

Ссылаясь на фиг. 5, согласно варианту осуществления, устройство 100 воспроизведения стереофонического аудио показано на основе конфигурации декодера 110 и модуля 120 трехмерного акустического рендеринга, и остальная конфигурация опускается.

Аудиосигнал, вводимый в устройство 100 воспроизведения стереофонического аудио, представляет собой кодированный сигнал и вводится в формате потока битов. Декодер 110 декодирует входной аудиосигнал посредством выбора инструментального средства декодера, подходящего для схемы, посредством которой кодирован аудиосигнал, и передает декодированный аудиосигнал в модуль 120 трехмерного акустического рендеринга.

Модуль 120 трехмерного акустического рендеринга включает в себя модуль 125 инициализации для получения и обновления коэффициента фильтрации и коэффициента панорамирования и модуль 127 рендеринга для выполнения фильтрации и панорамирования.

Модуль 127 рендеринга выполняет фильтрацию и панорамирование для аудиосигнала, передаваемого из декодера. Модуль 1271 фильтрации обрабатывает информацию относительно местоположения звука таким образом, что подвергнутый рендерингу аудиосигнал воспроизводится в требуемом местоположении, и модуль 1272 панорамирования обрабатывает информацию относительно тона звука таким образом, что подвергнутый рендерингу аудиосигнал имеет тон, подходящий для требуемого местоположения.

Модуль 1271 фильтрации и модуль 1272 панорамирования выполняют функции, аналогичные функциям модуля 121 фильтрации и модуля 123 панорамирования, описанных со ссылкой на фиг. 2. Тем не менее модуль фильтрации и модуль 123 панорамирования по фиг. 2 показаны схематично, и следует понимать, что такая конфигурация как модуль инициализации, для получения коэффициента фильтрации и коэффициента пано