Способ и устройство вывода аудиосигнала, способ и устройство кодирования, способ и устройство декодирования и программа

Иллюстрации

Показать все

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала. Вычисляют расстояние между позицией идеального громкоговорителя, воспроизводящего аудиосигнал, и позицией реального громкоговорителя, воспроизводящего аудиосигнал. Вычисляют коэффициент усиления воспроизведения аудиосигнала на основании указанного расстояния. Выполняют регулировку коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения. Корректируют коэффициент усиления воспроизведения на основании отношения между полной мощностью выходного звука и полной мощностью входного звука. Причем полная мощность выходного звука основана на аудиосигнале, подвергнутом регулировке коэффициента усиления посредством коэффициента усиления воспроизведения. 7 н. и 12 з.п. ф-лы, 11 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу и устройству вывода аудиосигнала, способу и устройству кодирования, способу и устройству декодирования и программе и, более конкретно, к способу и устройству вывода аудиосигнала, способу и устройству кодирования, способу и устройству декодирования и программе, которые предназначены для получения более реалистичного звука при его воспроизведении.

Уровень техники

При многоканальном воспроизведении звука, позиции громкоговорителей на стороне воспроизведения, предпочтительно соответствуют позициям источников звука. В действительности, однако, позиции громкоговорителей на стороне воспроизведения нередко отличаются от позиций источников звука.

В случае, когда позиции громкоговорителей на воспроизводящей стороне отличаются от позиций источников звука, появляется источник звука, который не находится на позиции громкоговорителя, поэтому, важным моментом является вопрос, каким образом воспроизводится звук таких источников звука.

Технология под названием VBAP (векторное амплитудное панорамирование) была предложен в качестве способа воспроизведения звука источника звука, расположенного в нужной позиции, посредством громкоговорителя, расположенного в желаемой позиции (см. непатентный документ 1, например).

Согласно VBAP, целевая нормальная позиция изображения звука выражается линейной суммой векторов, проходящих в направлении двух или трех громкоговорителей, расположенных вокруг нормальной позиции. Коэффициенты, на которые соответствующие векторы умножаются в линейной сумме, используются в качестве коэффициентов усиления аудиосигналов для вывода из соответствующих громкоговорителей, и регулировка коэффициента усиления выполняется таким образом, что звуковой образ фиксируется на целевой позиции.

Перечень ссылок

Непатентный документ

Непатентный документ 1: Ville Pulkki, "Позиционирование виртуального источника звука посредством использования векторного амплитудного панорамирования", журнал AES, vol. 45, №6, стр. 456-466, 1997 г.

Раскрытие изобретения

Технические задачи, решаемые с помощью изобретения

При этом, был предложен способ воспроизведения звука для обычной ситуации, где количество каналов и расположение громкоговорителя на стороне источника звука и количество каналов громкоговорителей и расположение громкоговорителя на стороне воспроизведения определяются заранее, как 7.1 расположение канала и 5.1 расположение канала, 5.1 расположение канала и 2.1 расположение канала, или 22.2 расположение канала и 5.1 расположение канала, как это рекомендовано на нескольких международных конференциях по стандартизации. В таком случае, звуки выводятся из соответствующих громкоговорителей с соответствующими коэффициентами усиления благодаря процессу конвертирования 6-канального звука в стереофонический звук, и, таким образом, может быть реализовано воспроизведение реалистичного звука.

В других случаях, таких как случай, когда источники звука или громкоговорители расположены на позициях, которые отличаются от заданных позиций, однако, звук может не воспроизводиться посредством предложенного способа воспроизведения, или качество звука и определение звукового образа может быть серьезно ухудшено, хотя воспроизведение может быть выполнено с помощью предлагаемого способа воспроизведения.

В случае, когда источники звукового канала воспроизводятся с помощью вышеупомянутой технологии VBAP, большинство звуковых образов источников звукового канала различаются расположением от идеальных громкоговорителей, воспроизводящие звуки источников. В результате, определение звукового образа в значительной степени искажается.

Посредством упомянутой технологии, сложно осуществить воспроизведение реалистичного звука.

Настоящее изобретение было разработано с учетом этих обстоятельств, и направлено на реализацию воспроизведения реалистичного звука. Решения технической задачи

Устройство вывода аудиосигнала по первому аспекту настоящего изобретения включает в себя: блок вычисления расстояния, который вычисляет расстояние между позицией идеального громкоговорителя, который воспроизводит звуковой сигнал, и позицией реального громкоговорителя, который воспроизводит звуковой сигнал; блок вычисления коэффициента усиления, который вычисляет коэффициент усиления воспроизведения аудиосигнала на основании расстояния; и блок регулировки коэффициента усиления, который выполняет регулировку коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения аудиосигнала.

Блок вычисления коэффициента усиления может вычислять коэффициент усиления воспроизведения на основании информации кривой для получения коэффициента усиления воспроизведения, соответствующего расстоянию.

Информация кривой может быть информацией, указывающая на ломаную кривую или кривую функции.

Когда идеальной громкоговоритель расположен не на единичной окружности, имеющей заданную опорную точку в качестве центральной точки, блок регулировки коэффициента усиления может дополнительно выполнять регулировку коэффициента усиления аудиосигнала с учетом коэффициента усиления, определенного на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

Блок регулировки коэффициента усиления может задерживать аудиосигнал на основании времени задержки, определенной на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

Когда реальный громкоговоритель расположен не на единичной окружности, имеющей заданную опорную точку в качестве центральной точки, блок регулировки коэффициента усиления может дополнительно выполнять регулировку коэффициента усиления аудиосигнала с учетом коэффициента усиления, определенного на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

Блок регулировки коэффициента усиления может задерживать аудиосигнал на основании времени задержки, определенной на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

Устройство вывода аудиосигнала может дополнительно включать в себя блок коррекции коэффициента усиления, который корректирует коэффициент усиления воспроизведения в зависимости от расстояния между позицией идеального центрального громкоговорителя и позицией реального громкоговорителя.

Устройство вывода аудиосигнала может дополнительно включать в себя блок коррекции нижнего предельного значения, который корректирует коэффициент усиления воспроизведения, когда коэффициент усиления воспроизведения меньше заданного нижнего предельного значения.

Устройство вывода аудиосигнала может дополнительно включать в себя блок коррекции общего коэффициента усиления, который вычисляет соотношение между полной мощностью выходного звука на основании звукового сигнала, подвергнутого регулировке усиления посредством коэффициента усиления воспроизведения, и полной мощностью входного звукового сигнала, и корректирует коэффициент усиления воспроизведения на основании соотношения, соотношение вычисляется на основании коэффициента усиления воспроизведения и ожидаемого значения звукового давления входного звукового сигнала на основании входного звукового сигнала.

Способ вывода аудиосигнала или программа согласно первому аспекту настоящего изобретения включает в себя этапы, на которых осуществляется: вычисление расстояния между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал; вычисление коэффициента усиления воспроизведения аудиосигнала на основании расстояния; и выполнение регулировки коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения.

В первом аспекте настоящего изобретения, вычисляется расстояние между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, коэффициент усиления воспроизведения аудиосигнала вычисляется на основании расстояния, и регулировка коэффициента усиления аудиосигнала выполняется на основании коэффициента усиления воспроизведения.

Устройство кодирования по второму аспекту настоящего изобретения включает в себя: блок генерирования корректирующей информации, который генерирует корректирующую информацию для корректировки коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит звуковой сигнал, и позицией реального громкоговорителя, который воспроизводит звуковой сигнал; блок кодирования, который кодирует аудиосигнал; и блок вывода, который выводит битовый поток, включающий в себя корректирующую информацию и кодированный аудиосигнал.

Способ кодирования согласно второму аспекту настоящего изобретения включает в себя этапы: генерирования корректирующей информации для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал; кодирование аудиосигнала; и вывод битового потока, включающего в себя корректирующую информацию и кодированный аудиосигнал.

Во втором аспекте настоящего изобретения, генерируется корректирующая информация для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, аудиосигнал генерируется и выводится битовый поток, включающий в себя корректирующую информацию и кодированный аудиосигнал.

Устройство декодирования по третьему аспекту настоящего изобретения включает в себя: блок извлечения, который извлекает из битового потока корректирующую информацию для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, и кодированный аудиосигнал; блок декодирования, который декодирует кодированный аудиосигнал; и блок вывода, который выводит декодированный аудиосигнал и корректирующую информацию.

Корректирующая информация может представлять собой информацию о местоположении идеального громкоговорителя.

Корректирующая информация может представлять собой информацию кривой для получения коэффициента усиления, соответствующего расстоянию.

Информация кривой может быть информацией, указывающей на ломаную кривую или кривую функции.

Способ декодирования по третьему аспекту настоящего изобретения включает в себя этапы: извлечения из битового потока корректирующей информации для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, и кодированного аудиосигнала; декодирования кодированного аудиосигнала; и вывода декодированного аудиосигнала и корректирующей информации.

В третьем аспекте настоящего изобретения, корректирующая информации для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией в реального громкоговорителя, который воспроизводит аудиосигнал, и кодированный аудиосигнал извлекаются из битового потока, кодированный аудиосигнал декодируется, и выводятся декодированный аудиосигнал и корректирующая информация. Результаты изобретения

Согласно аспектам с первого по третий настоящего изобретения может быть осуществлено воспроизведение более реалистичного звука. Краткое описание чертежей

Фиг. 1 показывает схему, предназначенную для пояснения общего принципа настоящей технологии.

Фиг. 2 показывает схему, предназначенную для пояснения ломаной кривой.

Фиг. 3 показывает схему, предназначенную для пояснения кривой функции.

Фиг. 4 показывает схему, предназначенную для пояснения коэффициентов усиления воспроизведения.

Фиг. 5 показывает схему, иллюстрирующую пример структуры устройства воспроизведения.

Фиг. 6 представляет собой блок-схему алгоритма, поясняющую процесс конвертирования 6-канального звука в стереофонический звук.

Фиг. 7 является схемой, показывающей пример конфигурации аудиосистемы.

Фиг. 8 показывает схему, предназначенную для пояснения метаданных.

Фиг. 9 представляет собой блок-схему алгоритма, поясняющую процесс кодирования.

Фиг. 10 является блок-схемой алгоритма для пояснения процесса декодирования.

Фиг. 11 является схемой, показывающей пример конфигурации компьютера.

Описание вариантов осуществления

Ниже приводится описание вариантов осуществления, к которым применяется настоящее изобретение, со ссылкой на чертежи.

Первый вариант осуществления

Общее описание настоящей технологии

Настоящая технология относится к способу воспроизведения источника звука канала с требуемым количеством громкоговорителей, и способу кодирования и декодирования необходимой информации (метаданные) для реализации способа воспроизведения.

Сначала будет приведено общее описание настоящей технологии.

Аудиосигналы каналов и метаданные этих аудиосигналов поставляются в устройство воспроизведения, и устройство воспроизведения управляет воспроизведением звука на основе метаданных и аудиосигналов, например.

Аудиосигналы соответствующих каналов являются сигналами, генерируемые для воспроизведения через громкоговорители, размещенные на идеальных позициях, указанных метаданными. В приведенном ниже описании, виртуальные громкоговорители, которые размещаются на позициях, указанных метаданными, и воспроизводящие аудиосигналы соответствующих каналов, будет называться идеальными громкоговорителями. Кроме того, реальные громкоговорители, которые выводят звуки на основании аудиосигналов, выведенных из устройства воспроизведения, будет упоминаться как громкоговорителя воспроизведения.

В настоящей технологии, аудиосигналы всех каналов подразделяются на аудиосигналы для LFE (канал низкочастотных эффектов) и аудиосигналы не для LFE. То есть, все идеальные громкоговорители подразделяются на громкоговорители для LFE и громкоговорители не для LFE. Аналогично, громкоговорители воспроизведения подразделяются на громкоговорители для LFE и громкоговорители не для LFE.

Во-первых, будет приведено описание воспроизведение аудиосигналов каналов не для LFE.

При воспроизведении аудиосигналов каналов не для LFE, регулировка коэффициента усиления аудиосигнала выполняется на основании расстояния между идеальным громкоговорителем и громкоговорителями воспроизведения, как показано на фиг. 1, например.

На фиг. 1, идеальный громкоговоритель VSP1 и громкоговорители с RSP11-I по RSP11-3 воспроизведения расположены на поверхности сферы РН 11, которая имеет радиус ru и имеет свой центр на позиции пользователя U11, который является зрителем. Идеальный громкоговоритель VSP1 и громкоговорители с RSP11-1 по RSP11-3 воспроизведения являются громкоговорителями не для LFE.

Далее, громкоговорители с RSP11-1 по RSP11-3 воспроизведения будут также упоминается просто, как и громкоговорители RSP11 воспроизведения, если нет особой необходимости отличать их друг от друга. Хотя в данном примере показаны только один идеальный громкоговоритель и три громкоговорителя воспроизведения, в реальности могут использоваться другие идеальные громкоговорители и громкоговорители воспроизведения.

Например, звук, основанный на аудиосигнале канала, соответствующий идеальному громкоговорителю VSP1, идеально фиксирует звуковой образ на позиции идеального громкоговорителя VSP1.

Таким образом, в настоящем изобретении, коэффициенты усиления воспроизведения соответствующих громкоговорителей RSP11 воспроизведения определяются в соответствии с расстояниями между идеальным громкоговорителем VSP1 громкоговорителями RSP11 воспроизведения, и звук, основанный на аудиосигнале, вырабатывается из каждого громкоговорителя RSP11 воспроизведения с определенными коэффициентами усиления воспроизведения, так что звуковой образ фиксируется на позиции идеального громкоговорителя VSP1.

В частности, расстояние между идеальным громкоговорителем VSP1 и громкоговорителем RSP11 воспроизведения является углом между вектором в направлении от пользователя U11 по отношению к идеальному громкоговорителю VSP1 и вектором в направлении от пользователя U11 в направлении громкоговорителя RSP11 воспроизведения.

Другими словами, расстояние между идеальным громкоговорителем VSP1 и громкоговорителем RSP11 воспроизведения на поверхности сферы РН 11, или длина дуги, соединяющая два громкоговорителя, является расстоянием между идеальным громкоговорителем VSP1 и громкоговорителем RSP11 воспроизведения.

В примере, показанном на фиг. 1, угол между стрелкой АН и стрелкой А12 является расстоянием DistM1 между идеальным громкоговорителем VSP1 и громкоговорителем RSP11-1 воспроизведения. Аналогично, угол между стрелкой АН и стрелкой А13 является расстоянием DistM2 между идеальным громкоговорителем VSP1 и громкоговорителем RSP11-2 воспроизведения, и угол между стрелкой АН и стрелкой А14 является расстоянием DistM3 между идеальным громкоговорителем VSP1 и громкоговорителем RSP11-3 воспроизведения.

Аудиосигнал канала идеального громкоговорителя VSP1 подвергается регулировке коэффициента усиления в зависимости от расстояния DistM1, и воспроизводится громкоговорителем RSP11-1 воспроизведения. Аудиосигнал канала идеального громкоговорителя VSP1 также подвергается регулировке коэффициента усиления в зависимости от расстояния DistM2 и расстояния DistM3, и воспроизводится громкоговорителем RSP11-2 воспроизведения и громкоговорителем RSP11-3 воспроизведения.

Соответственно, даже в случае, когда существуют различия в положении между идеальным VSP1 громкоговорителем и громкоговорителями RSP11 воспроизведения, различия, вызванные в звуковом образе различиями в положении, могут быть уменьшены, и может быть осуществлено более реалистичное воспроизведение звука.

Далее будет приведено более подробное описание воспроизведения аудиосигналов каналов не для LFE.

В частности, в примере, описанном ниже, аудиосигналы М идеальных громкоговорителей не для LFE, или М каналов, которые микшируются с понижением, генерируют аудиосигналы N каналов, и аудиосигналы N каналов воспроизводятся посредством N громкоговорителей воспроизведения не для LFE.

В процессе понижающего микширования, шесть процессов с STE1 по STE6, показанные ниже, в основном, осуществляется в последовательном порядке.

Процесс STE1: Определяются расстояния между идеальными громкоговорителями и громкоговорителями воспроизведения.

Процесс STE2: Определяются коэффициенты усиления воспроизведения ответствующих громкоговорителей воспроизведения для каждого идеального громкоговорителя, на основании определенных расстояний и заданной кривой затухания.

Процесс STE3: Корректируются коэффициенты усиления воспроизведения в соответствии с позицией громкоговорителя воспроизведения.

Процесс STE4: Корректируются коэффициенты усиления воспроизведения в соответствии с нижним пределом.

Процесс STE5: Корректируются коэффициенты усиления воспроизведения так, чтобы полная выходная мощность звука аппроксимирует общую входную мощность сигнала.

Процесс STE6: Применяются коэффициенты усиления воспроизведения к аудиосигналам, и выполняется регулировка коэффициента усиления.

Далее дополнительно приводится подробное описание этих процессов с STE1 по STE6.

Процесс STE1

Во-первых, в процессе STE1, определяются расстояния между громкоговорителями. Позиция каждого громкоговорителя представлена горизонтальным углом θ(-180°≤8≤+180°), вертикальным углом γ(-90°≤γ≤+90°), и расстоянием от пользователя до громкоговорителя r(0≤r≤+∞).

Например, фиг. 1 показывает трехмерную систему координат, образованную х-осью, y-осью y и z-осью, где позиции пользователя U11 является исходной.

Где х-y плоскость является плоскостью, включающая в себя прямую линию, проходящую в направлении глубины чертежа, и прямую линию, проходящую в поперечном направлении чертежа, угол между прямой линией, проходящей в опорном направлении в х-y плоскости, или y-оси, и вектором в направлении от пользователя U11 в направлении громкоговорителя является горизонтальным углом θ, например. То есть, горизонтальный угол θ представляет собой угол в горизонтальном направлении на фиг. 1.

Кроме того, угол между вектором в направлении от пользователя U11 в направлении громкоговорителя и х-y плоскости является вертикальным углом γ, и длина прямой линии, соединяющей U11 пользователя и громкоговоритель является расстоянием г.

Горизонтальные углы θ, вертикальные углы γ и расстояния r, которые указывают на позиции соответствующих идеальных громкоговорителей, поставляются как метаданные аудиосигналов в устройство воспроизведения. Горизонтальные углы θ, вертикальные углы γ и расстояния r, которые указывают на позиции соответствующих громкоговорителей воспроизведения, также поставляются в устройство воспроизведения.

В приведенном ниже описании, горизонтальный угол θ, вертикальный угол γ и расстояние r m-ого идеального громкоговорителя среди М идеальных громкоговорителей будут представлены как θim, γim и rim, соответственно. Точно так же, горизонтальный угол θ, вертикальный угол γ, расстояние г n-ого громкоговорителя воспроизведения среди N громкоговорителей воспроизведения будут представлены как θon, γon и ron, соответственно.

Устройство воспроизведения вычисляет расстояния между каждым из М идеальных громкоговорителей и N громкоговорителей воспроизведения.

Например, расстояние Dist (m, n) между m-ым идеальным громкоговорителем и n-ым громкоговорителем воспроизведения вычисляется согласно уравнению (1), показанному ниже.

Устройство воспроизведения выполняет расчет по уравнению (1) для каждой из комбинаций М идеальных громкоговорителей и N громкоговорителей воспроизведения, и рассчитывает общую величину (М×N) расстояния Dist(m, n).

Если соответствующие идеальные громкоговорители и соответствующие громкоговорители воспроизведения расположены на единичной окружности, имеющей радиус ru или на сфере РН 11, показанной на фиг. 1, звуки, выводимые из соответствующих громкоговорителей, достигают пользователя U11 одновременно. Если один из громкоговорителей не находится на сфере РН 11, однако, звук из этого громкоговорителя достигает пользователя U11 раньше или позже, чем звуки от других громкоговорителей, и, более того, изменение, вызванное в звуковом давлении звука, будет услышано пользователем.

Таким образом, устройство воспроизведения выполняет коррекцию звукового давления, используя значение коррекции SoundPressureCorrectionim аудиосигнала идеального громкоговорителя, имеющий расстояние rim, не равное ru, и выполняет процесс задержки с использованием времени задержки Delayim.

Таким образом, можно считать, что идеальный громкоговоритель расположен на сфере РН 11.

В частности, расчет по уравнению (2), показанному ниже, выполняется на основании расстояния rim и радиуса ru, так что получается значение коррекции SoundPressureCorrectionim.

Значение коррекции SoundPressureCorrectionim, определенное в соответствии с уравнением (2), используется в коррекции, которое выполняется на аудиосигнале на стороне идеального громкоговорителя, или аудиосигнале канала т, который поступает на вход устройства воспроизведения. В приведенном ниже описании, аудиосигнал, который подается на вход устройства воспроизведения, будет также упоминаться как входной аудиосигнал, и аудиосигнал, выводимый из устройства воспроизведения, будет также упоминаться как выходной аудиосигнал.

Время задержки Delayim для процесса задержки, который выполняется на входном аудиосигнале идеального рассчитывается согласно уравнению (3) как показано ниже, на основании расстояния rim и радиуса ru. Если rim>ru время задержки Delayim имеет отрицательное значение и в процессе задержки, аудиосигнал задерживается в отрицательном направлении, или аудиосигнал сдвигается назад по времени.

Значение коррекции SoundPressureCorrectionim и время задержки Delayim рассчитываются для каждого идеального громкоговорителя, имеющего расстояние rim, не равное ru. Аналогично, значение коррекции SoundPressureCorrectionim и время задержки Delayim рассчитываются для каждого громкоговорителя воспроизведения, имеющего расстояние ron, не равное ru.

В частности, значение коррекции SoundPressureCorrectionon рассчитывается согласно уравнению (4), как показано ниже, и временя задержки Delayon рассчитывается согласно уравнению (5), как показано ниже.

Значения коррекции SoundPressureCorrectionon и время задержки Delayon, рассчитанные указанным выше образом, являются значением коррекции звукового давления и временем задержки для стороны громкоговорителя воспроизведения или выходного аудиосигнала. Таким образом, устройство воспроизведения выполняет коррекцию звукового давления, используя значение коррекции SoundPressureCorrectionon аудиосигнала, подаваемого в громкоговоритель воспроизведения, имеющий расстояние ron, не равное ru, и выполняет процесс задержки с использованием времени задержки Delayon.

Процесс STE2

В процессе STE2 вычисляются коэффициенты усиления воспроизведения соответствующих громкоговорителей воспроизведения по отношению к каждому идеальному громкоговорителю.

Во-первых, для каждого из М идеальных громкоговорителей, осуществляет проверка для определения факта того, что громкоговоритель воспроизведения находится на расстоянии Dist(m, n) "0" от идеального громкоговорителя. Соответствующие идеальные громкоговорители, затем классифицируются на громкоговорители, расположенные на позициях громкоговорителей воспроизведения и громкоговорители, не расположенные в позициях громкоговорителя воспроизведения.

Для m-ого идеального громкоговорителя, определенного, как расположенного на позиции громкоговорителя воспроизведения, вычисляется коэффициент MixGain (m, n) усиления воспроизведения n-ого громкоговорителя воспроизведения по отношению к аудиосигналу канала m, соответствующего m-ого идеального громкоговорителя, с использованием уравнения (6), как показано ниже.

В соответствии с уравнением (6), коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist(m, n) "0" или громкоговоритель воспроизведения находится на той же позиции, что и m-ый идеальный громкоговоритель, равен 0 дБ. Кроме того, коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist(m, n), который не равен "0" или громкоговоритель воспроизведения находится на иной позиции, чем m-ый идеальный громкоговоритель, равен -∞ дБ.

Соответственно, аудиосигнал канала m, соответствующий m-ому идеальному громкоговорителю, воспроизводится посредством громкоговорителя воспроизведения, расположенный на той же позиции, что и идеальный громкоговоритель. То есть, любая составляющая звука канала m не выводится из других громкоговорителей воспроизведения.

Для m-ого идеального громкоговорителя, определенного, как находящегося на позиции громкоговорителя воспроизведения, с другой стороны, коэффициент MixGain (m, n) усиления воспроизведения каждого громкоговорителя воспроизведения по отношению к идеальному громкоговорителю рассчитывается с использованием кривой затухания, которая представляет собой ломанную кривую или кривую функции.

В частности, метаданные, поставляемые в устройство воспроизведения, включают в себя информацию кривой, указывающую, какая из ломаной кривой и кривой функции должна быть использована при вычислении коэффициента усиления, и устройство воспроизведения вычисляет коэффициент усиления воспроизведения, используя кривую типа, указанного информацией кривой, включенной в состав метаданных.

Метаданные также включают в себя индекс кривой, в частности, указывающий, когда одна из кривых, указанных в информации кривой, должна быть использована. Индекс кривой может быть информацией, указывающей на новую кривую, не записанную в устройстве воспроизведения.

В случае, когда индекс кривой является информацией, указывающей на предварительно заданную кривую, устройство воспроизведения вычисляет коэффициент усиления воспроизведения, используя информацию, которая записывается заранее, и предназначена для получения кривой, такой как коэффициенты. В случае, когда индекс кривой представляет собой информацию, указывающую на новую кривую, с другой стороны, устройство воспроизведения считывает информацию для получения новой кривой из метаданных, и вычисляет коэффициент усиления воспроизведения, используя кривую, полученную из этой информации.

Например, ломаная кривая, которая будет использоваться при вычислении коэффициента усиления воспроизведения, выражается в виде числовой последовательности, образованной значениями коэффициентов усиления воспроизведения, в соответствии с соответствующими расстояниями Dist (m, n).

В частности, числовая последовательность, образованная значениями коэффициентов усиления воспроизведения, [0, -1.5, -4.5, -6, -9, -10,5, -12, -13,5, -15, -15, -16,5, -16,5, -18, -18, -18, -19.5, -19.5, -21, -21, -21, -∞, -∞, -∞, -∞, -∞, -∞] (дБ) является информацией для получения коэффициента усиления воспроизведения.

В таком случае, значение в начале числовой последовательности является коэффициентом усиления воспроизведения в момент, когда расстояние Dist (m, n) равно 0 градусов, и значение в конце числовой последовательности является коэффициентом усиления воспроизведения в момент, когда расстояние Dist (m, n) равно 180 градусов. Кроме того, значение в точке kth в числовой последовательности является коэффициентом усиления воспроизведения в момент времени, когда расстояние Dist (m, n) равно значению, которое выражается уравнением (7), как показано ниже.

Между соседними точками в числовой последовательности, коэффициент усиления воспроизведения линейно изменяется в зависимости от расстояния Dist (m, n). Ломаная кривая, полученная посредством такой числовой последовательности, является кривой, представляющая отображение коэффициента MixGain (m, n) усиления воспроизведения и расстояния Dist (m, n).

Например, ломаная кривая, показанная на фиг. 2, получается из вышеописанной числовой последовательности.

На фиг. 2, ось ординат показывает значение коэффициента усиления воспроизведения, и ось абсцисс указывает расстояние между идеальным громкоговорителем и громкоговорителем воспроизведения. Кроме того, ломаная кривая CV11 представляет собой ломаную кривую, и каждый квадрат на ломаной кривой представляет собой числовое значение числовой последовательности, образованной значениями коэффициента усиления воспроизведения.

В этом примере, когда расстояние Dist (m, n) между n-ым громкоговорителем воспроизведения и m-ым идеальным громкоговорителем является DistM1, коэффициент MixGain (m, n) усиления воспроизведения n-ого громкоговорителя воспроизведения равен -3.5 дБ, которое является значением коэффициента DistM1 усиления на ломаной кривой.

Кроме того, коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM2 равен -8 дБ, которое является значением коэффициента усиления на DistM2 на ломаной кривой, и коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM3 равен -16,5 дБ, которое является значением коэффициента усиления на DistM3 на ломаной кривой.

Между тем, кривая функции, которые будут использоваться при вычислении коэффициента усиления воспроизведения, выражается тремя коэффициентами усиления coef1, coef2 и coef3, и коэффициентом MinGain усиления, значение которого является предварительно заданным нижним пределом.

В этом случае, устройство воспроизведения выполняет расчет по уравнению (9), как показано ниже, используя функцию F (Dist (m, n)), показанную в уравнении (8), выраженной коэффициентами с coef1 по coef3, коэффициентом MinGain усиления и расстоянием Dist (m, n). Таким образом, устройство воспроизведения вычисляет коэффициент MixGain (m, n) усиления воспроизведения каждого громкоговорителя воспроизведения по отношению к m-ому идеальному громкоговорителю.

В уравнении (9), Cut_thre представляет наименьшее значение, которое удовлетворяет уравнению (10), показанному ниже.

Кривая функции, выраженная такой функцией f (Dist (m, n)) и т.п. является кривой, показанной на фиг. 3, например. На фиг. 3, ось ординат показывает значение коэффициента усиления воспроизведения, и ось абсцисс указывает расстояние между идеальным громкоговорителем и громкоговорителем воспроизведения. Кривая CV 21 представляет кривую функции.

В соответствии с кривой функции, показанной на фиг. 3, после того, как значение коэффициента усиления воспроизведения, указанного функцией f (Dist (m, n)), становится меньше, чем значение коэффициента MinGain усиления, который является нижним пределом, то значение коэффициента усиления воспроизведения на каждом расстоянии Dist (m, n) является "-∞". Пунктирная линия на чертеже представляет значения исходной функции f (Dist (m, n)) на соответствующих расстояниях Dist (m, n).

В этом примере, когда расстояние Dist (m, n) между n-ым громкоговорителем воспроизведения и m-ым идеальным громкоговорителем является DistM1, коэффициент MixGain (m, n) усиления воспроизведения n-ого громкоговорителя воспроизведения равен -6 дБ, который является значением коэффициента усиления на DistM1 на кривой функции.

Кроме того, коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM2 равен -12 дБ, который является значением коэффициента усиления на DistM2 на кривой функции, и коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM3 равен -18 дБ, который является значением коэффициента усиления на DistM3 на кривой функции.

В случае, когда коэффициент MixGain (m, n) усиления воспроизведения рассчитывается по кривой функции, комбинация [coef1, coef2, coef3] коэффициентов с coef1 по coef3 может представлять собой [8, -12, 6], [1, -3, 3] или [2, -5.3, 4.2], например.

Посредством выполнения упомянутых процессов получают коэффициенты MixGain (m, n) усиления воспроизведения N громкоговорителей воспроизведения для каждого из М идеальных громкоговорителей. Значения коэффициентов усиления воспроизведения этих громкоговорителей воспроизведения больше, когда расстояние Dist (m, n) до идеального громкоговорителя меньше. То же самое относится и к объему звуков из этих громкоговорителей воспроизведения. Где М>N, коэффициенты MixGain (m, n) усиления воспроизведения являются микшированными коэффициентами усиления.

Процесс STE3

Дополнительно, в процессе STE3, (М×N) коэффициенты MixGain (m, n) усиления воспроизведения, полученные в процессе STE2, корректируются в соответствии с позицией n-ого громкоговорителя воспроизведения.

Например, если звук от источника звука, расположенно