Устройство для определения преобразованного пространственного звукового сигнала
Иллюстрации
Показать всеИспользование: данное изобретение относится к сфере обработки звукового сигнала, главным образом, обработки пространственного звукового сигнала, и преобразования различных форматов пространственных звуковых сигналов. Сущность: улучшенная обработка звукового сигнала может быть достигнута, если звуковые сигналы преобразуются в направленные компоненты. Другими словами, данное изобретение показывает, что улучшенная пространственная обработка может быть достигнута, когда формат пространственного звукового сигнала соответствует направленным компонентам, таким как записанные, например, направленным микрофоном В-формата. Кроме того, данное изобретение показывает, что направленные или всенаправленные компоненты из различных источников могут обрабатываться совместно и, к тому же, с повышенной эффективностью. Другими словами, особенно при обработке пространственных звуковых сигналов из множественных источников звука, обработка может быть выполнена более эффективно, если сигналы множественных источников звука доступны в формате их всенаправленных и направленных компонентов, поскольку они могут обрабатываться совместно. В осуществлениях, поэтому, генераторы звукового эффекта или звуковые процессоры могут использоваться более эффективно, обрабатывая объединенные компоненты множественных источников. Технический результат: улучшение пространственной обработки звукового сигнала. 3 н. и 13 з.п. ф-лы, 11 ил.
Реферат
Данное изобретение относится к сфере обработки звукового сигнала, главным образом, обработки пространственного звукового сигнала, и преобразования различных форматов пространственных звуковых сигналов.
Звуковое кодирование DirAC (DirAC=Направленное звуковое кодирование) является способом воспроизведения и обработки пространственного звукового сигнала. В обычных системах применяется DirAC для двухмерного и трехмерного высококачественного воспроизведения записанного звука, для организации телеконференций, для направленных микрофонов, и повышающего микширования от стерео до окружающего звучания, сравните,
В. Пулкки и К. Фоллер, «Направленное звуковое кодирование: Гребенка фильтров и схема на основе STFT (краткосрочное преобразование Фурье)», на 120-ом собрании AES (Общество инженеров-звукотехников), 20-23 мая 2006 г., Париж, Франция, май 2006 г.,
В. Пулкки и К. Фоллер, «Направленное звуковое кодирование при воспроизведении пространственного звукового сигнала и стерео повышающем микшировании», на 28-ой Международной Конференции AES (Общество инженеров-звукотехников), Питео, Швеция, июнь 2006 г.,
В. Пулкки, «Пространственное воспроизведение звука с направленным звуковым кодированием». Журнал AES (Общество инженеров-звукотехников), 55 (6): 503-516, июнь 2007 г.,
Юкка Ахонен, В. Пулкки и Тапио Локки, «Организация телеконференции и установка микрофона В-формата для направленного звукового кодирования», на 30-ой Международной Конференции AES (Общество инженеров-звукотехников).
Другими обычными случаями использования DirAC является, например, универсальный формат кодирования и шумоподавления. В DirAC некоторые свойства звука, зависящие от направления, анализируются в частотных диапазонах, зависящих от времени. Данные анализа передаются вместе со звуковыми данными и синтезируются для различных целей. Анализ обычно выполняется посредством использования сигналов В-формата, хотя, теоретически, DirAC не ограничивается этим форматом. В-формат, сравните, Майкл Герзон, «Психоакустика окружающего звука», в журнале Беспроводной Мир, том 80, страницы 483-486, декабрь 1974 г., был создан в ходе разработки техники воспроизведения и передачи окружающего звука (амбиофония); система разработана британскими исследователями в 70-ые годы, чтобы перенести окружающий звук концертных залов в жилые дома. В-формат состоит из четырех сигналов, а именно, w(t), x(t), y(t) и z(t). Первый соответствует давлению, измеренному всенаправленным микрофоном, тогда как последние три - показатели давления микрофонов, имеющих восьмиобразные конфигурации съемки сигнала, направленные по трем осям Декартовой системы координат. Сигналы x(t), y(t) и z(t) пропорциональны компонентам вектора скорости частицы, направленным на x, у и z, соответственно.
Поток DirAC состоит из 1-4 каналов звукового сигнала с направленными метаданными. При организации телеконференций и в некоторых других случаях, поток состоит только из одного звукового канала с метаданными, называемого моно потоком DirAC. Это очень компактный способ описания пространственного звукового сигнала, поскольку только один звуковой канал должен быть передан вместе с дополнительной информацией, что, например, дает хорошее пространственное разделение между абонентами. Однако в таких случаях некоторые типы звуковых сигналов, такие как сценарии реверберированных звуковых сигналов или сигналов окружающей среды, могут воспроизводиться с ограниченным качеством. Чтобы получить лучшее качество в этих случаях, должны быть переданы дополнительные звуковые каналы.
Преобразование от В-формата в DirAC описано в работе В. Пулкки, «Способ воспроизведения естественного или модифицированного пространственного впечатления при многоканальном прослушивании», Патент WO 2004/077884 А1, сентябрь 2004 г. Направленное звуковое кодирование - эффективный подход к анализу и воспроизведению пространственного звука. DirAC использует параметрическое представление звуковых областей, основанное на характеристиках, которые важны для восприятия пространственного звука, а именно, DOA (DOA=направление поступления (сигнала)) и диффузность звуковой области в частотных поддиапазонах. Фактически, DirAC предполагает, что межакустические различия времени (ITD) и межакустические различия уровня (ILD) воспринимаются правильно, когда DOA звуковой области воспроизводится правильно, в то время как межакустическая последовательность (IC) воспринимается правильно, если диффузность воспроизводится точно. Эти параметры, а именно, DOA и диффузность, представляют дополнительную информацию, которая сопровождает моно сигнал в том, что относится к моно потоку DirAC.
Фиг.7 показывает кодирующее устройство DirAC, которое из соответствующих сигналов микрофона вычисляет моно звуковой канал и дополнительную информацию, а именно, диффузность Ψ(k,n) и направление поступления eDOA(k,n). Фиг.7 показывает кодирующее устройство DirAC 200, которое приспособлено для вычисления моно звукового канала и дополнительной информации из соответствующих сигналов микрофона. Другими словами, фиг.7 иллюстрирует кодирующее устройство DirAC 200 для определения диффузности и направления поступления от подходящих сигналов микрофона. Фиг.7 показывает кодирующее устройство DirAC 200, включающее P/U блок оценки 210, где P(k,n) представляет сигнал давления, и U(k,n) представляет вектор скорости частицы. P/U блок оценки получает сигналы микрофона как входную информацию, на которой основывается P/U оценка. Энергетическая стадия анализа 220 позволяет оценивать направление получения и параметр диффузности моно потока DirAC.
Параметры DirAC, например, моно звуковое представление W(k,n), параметр диффузности Ψ(k,n) и направление поступления (DOA) eDOA(k,n), могут быть получены из частотно-временного представления сигналов микрофона. Поэтому, параметры зависят от времени и от частоты. На стороне воспроизведения эта информация учитывает точную пространственную визуализацию. Чтобы восстановить пространственный звук в желательном положении прослушивания, требуется установка с несколькими громкоговорителями. Однако его геометрия может быть произвольной. Фактически, каналы громкоговорителей могут определяться как функция параметров DirAC.
Имеются существенные различия между DirAC и параметрическим многоканальным звуковым кодированием, таким как MPEG (Экспертная группа по кинематографии) Окружающее, сравните, Ларе Виллемокс, Йорген Херре, Йероен Бреебаарт, Джерард Хото, Саша Диш, Хейко Пурнхаген, и Кристофер Кьерлинг, MPEG окружающий: будущий стандарт ISO (Международной Организации по Стандартизации) для пространственного звукового кодирования, на 28-ой Международной Конференции AES, Питео, Швеция, июнь 2006 г., хотя они совместно используют подобные структуры обработки. В то время как MPEG Окружающий базируется на временном/частотном анализе различных каналов громкоговорителя, DirAC в качестве входа использует каналы совпадающих микрофонов, которые эффективно описывают звуковую область в одной точке. Таким образом, DirAC также представляет эффективную технику записи пространственного звукового сигнала.
Другой системой, имеющей дело с пространственным звуковым сигналом, является SAOC (SAOC=Пространственное кодирование звукового объекта), сравните, Джонас Энгдегард, Барбара Реш, Корнелия Фальч, Оливер Хелльмут, Йоханнес Хилперт, Андреас Хоэлцер, Леонид Терентьев, Йероен Бреебаарт, Йероен Коппенс, Эрик Шуйерс, и Вернер Оомен, «Пространственный звуковой объект (SAOC), будущий стандарт MPEG параметрического объекта, основывающийся на звуковом кодировании», на 12-ом собрании AES, 17-20 мая 2008 г., Амстердам, Нидерланды, 2008 г., в настоящее время находится в процессе стандартизации ISO/MPEG. Он основывается на средстве визуализации MPEG Окружающий, и рассматривает различные источники звука как объекты. Это звуковое кодирование предлагает очень высокую эффективность, в переводе на скорость передачи битов, и дает беспрецедентную свободу взаимодействия на стороне воспроизведения. Этот подход обещает новые убедительные свойства и функциональные возможности в унаследованных системах, а так же в несколько других новаторских применениях.
Задача данного изобретения - обеспечить усовершенствованную концепцию пространственной обработки.
Это достигается посредством устройства для определения преобразованного пространственного звукового сигнала, согласно пункту 1, и соответствующего способа согласно пункту 15.
Данное изобретение основано на обнаружении того, что улучшенная пространственная обработка может быть достигнута, например, в ходе преобразования пространственного звукового сигнала, закодированного как моно поток DirAC, в сигнал В-формата. В осуществлениях преобразованный сигнал В-формата может обрабатываться или визуализироваться до добавления к некоторым другим звуковым сигналам, и кодироваться обратно в поток DirAC. Осуществления могут использовать различные приложения, например, смешивание различных типов DirAC и потоков В-формата, основанных на DirAC, и т.д. Осуществления могут вводить операцию, обратную WO 2004/077884 А1, а именно, преобразование из моно потока DirAC в В-формат.
Данное изобретение основывается на обнаружении того, что улучшенная обработка может быть достигнута, если звуковые сигналы преобразуются в направленные компоненты. Другими словами, данное изобретение показывает, что улучшенная пространственная обработка может быть достигнута, когда формат пространственного звукового сигнала соответствует направленным компонентам, таким как записанные, например, направленным микрофоном В-формата. Кроме того, данное изобретение показывает, что направленные или всенаправленные компоненты из различных источников могут обрабатываться совместно и, к тому же, с повышенной эффективностью. Другими словами, особенно при обработке пространственных звуковых сигналов из множественных источников звука, обработка может быть выполнена более эффективно, если сигналы множественных источников звука доступны в формате их всенаправленных и направленных компонентов, поскольку они могут обрабатываться совместно. В осуществлениях, поэтому, генераторы звукового эффекта или звуковые процессоры могут использоваться более эффективно, обрабатывая объединенные компоненты множественных источников.
В осуществлениях пространственные звуковые сигналы могут быть представлены как моно поток DirAC, обозначающий DirAC потоковую технику, где медиа данные при передаче сопровождаются только одним звуковым каналом. Этот формат может быть преобразован, например, в поток В-формата, имеющий множественные направленные компоненты. Осуществления могут обеспечить улучшенную пространственную обработку посредством преобразования пространственных звуковых сигналов в направленные компоненты.
Осуществления могут обеспечить преимущество перед моно DirAC декодированием, где только один звуковой канал используется для создания всех сигналов громкоговорителей, при этом возможна дополнительная пространственная обработка, основанная на направленных звуковых компонентах, которые определяются до создания сигналов громкоговорителей. Осуществления могут обеспечить то преимущество, что проблемы создания реверберирующихся звуков уменьшаются.
В осуществлениях, например, поток DirAC может использовать звуковой стерео сигнал вместо звукового моно сигнала, где стерео каналы - L (L=левый стерео канал) и R (R=правый стерео канал) и передаются, чтобы быть использованными в декодировании DirAC. Осуществления могут обеспечить лучшее качество реверберирующихся звуков и обеспечить прямую совместимость, например, со стерео системами громкоговорителя.
Осуществления могут иметь то преимущество, что могут сделать возможным DirAC декодирование с виртуальным микрофоном. Детали относительно декодирования DirAC с виртуальным микрофоном можно найти в работе В.Пулкки, «Пространственное звуковое воспроизведение с направленным звуковым кодированием», Журнал Общества инженеров-звукотехников, 55 (6): 503-516, июнь 2007 г. Эти осуществления получают звуковые сигналы для громкоговорителей, размещая виртуальные микрофоны, ориентируемые на положение громкоговорителей и имеющие точечные источники звука, положение которых определяется параметрами DirAC. Осуществления могут иметь то преимущество, что посредством преобразования может быть обеспечена удобная линейная комбинация звуковых сигналов.
Осуществления данного изобретения будут детализированы с использованием сопровождающих рисунков, где
Фиг.1А показывает осуществление устройства для определения преобразованного пространственного звукового сигнала;
Фиг.1B показывает давление и компоненты вектора скорости частицы в плоскости комплексного переменного для плоской волны;
Фиг.2 показывает другое осуществление для преобразования моно DirAC потока в сигнал В-формата;
Фиг.3 показывает осуществление для объединения множественных преобразованных пространственных звуковых сигналов;
Фиг.4A-4D показывают осуществления для объединения множественных основанных на DirAC пространственных звуковых сигналов посредством использования различных звуковых эффектов;
Фиг.5 изображает осуществление генератора звукового эффекта;
Фиг.6 показывает осуществление генератора звукового эффекта, применяющего множественные звуковые эффекты к направленным компонентам; и
Фиг.7 показывает современный технический уровень кодирующего устройства DirAC.
Фиг.1А показывает устройство 100 для определения преобразованного пространственного звукового сигнала; преобразованный пространственный звуковой сигнал имеет всенаправленный компонент и, по крайней мере, один направленный компонент (X; Y; Z) из входного пространственного звукового сигнала; входной пространственный звуковой сигнал имеет входное звуковое представление (W) и входное направление поступления (ϕ).
Устройство 100 включает блок оценки (эстиматор, оценочная функция) 110 для оценки волнового представления, включающего меру волнового поля и меру направления поступления волны, основанные на входном звуковом представлении (W) и входном направлении поступления (ϕ). Кроме того, устройство 100 включает процессор 120 для обработки меры волнового поля и меры направления поступления волны для получения всенаправленного компонента и, по крайней мере, одного направленного компонента. Блок оценки 110 может быть приспособлен для оценки волнового представления как представления плоской волны.
В осуществлениях процессор может быть приспособлен для обеспечения входного звукового представления (W) как всенаправленного звукового компонента (W'). Другими словами, всенаправленный звуковой компонент W' может быть равным входному звуковому представлению W. Поэтому, согласно пунктирам на фиг.1а, входное звуковое представление может обойти блок оценки 110, процессор 120, или оба. В других осуществлениях всенаправленный звуковой компонент W' может быть основан на интенсивности волны и направлении поступления волны, обрабатываемой процессором 120 вместе с входным звуковым представлением W. В осуществлениях множественные направленные звуковые компоненты (X; Y; Z) могут обрабатываться, как, например, первый (X), второй (Y) и/или третий (Z) направленные звуковые компоненты, соответствующие различным пространственным направлениям. В осуществлениях, например, три различных направленных звуковых компонента (X; Y; Z) могут быть получены в соответствии с различными направлениями Декартовой системы координат.
Блок оценки 110 может быть приспособлен для оценки меры волнового поля, исходя из амплитуды волнового поля и фазы волнового поля. Другими словами, в осуществлениях мера волнового поля может быть оценена как комплекснозначная величина. Амплитуда волнового поля может соответствовать величине звукового давления, а фаза волнового поля может соответствовать фазе звукового давления в некоторых осуществлениях.
В осуществлениях мера направления поступления волны может соответствовать любой направленной величине, выраженной, например, вектором, одним или несколькими углами и т.д., и это может быть получено из любой направленной меры, представляющей звуковой компонент как, например, вектор интенсивности, вектор скорости частицы, и т.д. Мера волнового поля может соответствовать любой физической величине, описывающей звуковой компонент, который может быть действительным или комплекснозначным, соответствовать сигналу давления, амплитуде или значению скорости частицы, громкости и т.д. Кроме того, меры могут рассматриваться во временной и/или частотной области.
Осуществления могут основываться на оценке представления плоской волны для каждого входного потока, которая может выполняться блоком оценки 110 на фиг.1А. Другими словами, мера волнового поля может быть смоделирована посредством использования представления плоской волны. Обычно существует несколько эквивалентных исчерпывающих (то есть, полных) описаний плоской волны или волн вообще. В дальнейшем будет введено математическое описание для вычисления параметров диффузности и направлений поступления или мер направления для различных компонентов. Хотя только несколько описаний имеют отношение непосредственно к физическим величинам, как например, давление, скорость частицы и т.д., потенциально существует бесконечное число различных способов описать волновые представления, одно из которых впоследствии должно быть представлено в качестве примера, однако, в любом случае, не предназначается для ограничения осуществлений данного изобретения. Любая комбинация может соответствовать мере волнового поля и направлению поступления волны.
Чтобы далее детализировать различные потенциальные описания, рассматриваются два действительных числа, а и b. Информация, содержащаяся в а и b, может быть передана посредством пересылки c и d, когда
[ c d ] = Ω [ a b ] ,
где Ω - известная 2×2 матрица. Пример рассматривает только линейные комбинации, как правило, любую комбинацию, то есть возможна также нелинейная комбинация.
В дальнейшем скаляры представлены строчными буквами а, b, c, в то время как вектор-столбцы представлены выделенными жирными строчными буквами а, b, c. Верхний индекс ()T обозначает транспозицию матрицы, соответственно, ( ⋅ ) ¯ и ( ⋅ ) ∗ обозначают комплексное сопряжение. Нотация комплексного вектора отличается от временной. Например, давление p(t), которое является действительным числом, и из которого может быть получена возможная мера волнового поля, может быть выражено посредством комплексного вектора Р, который является комплексным числом, и из которого может быть получена другая возможная мера волнового поля,
p ( t ) = Re { P e j ω t } ,
где Re { ⋅ } обозначает действительную часть, a ω=2πf - угловая частота. Кроме того, в дальнейшем заглавные буквы, используемые для физических величин, представляют комплексный вектор. Для дальнейшего вводного примера нотации, и чтобы избежать путаницы, пожалуйста, заметьте, что все величины с нижним индексом «PW» относятся к плоским волнам.
Для идеальной монохроматической плоской волны вектор скорости частицы UPW может быть обозначен как
U P W = P P W ρ 0 c e d = [ U x U y U z ] ,
где единичный вектор ed указывает на направление распространения волны, например, соответствующее мере направления. Можно доказать, что
I a = 1 2 ρ 0 c | P P W | 2 e d
E = 1 2 ρ 0 c 2 | P P W | 2
ψ = 0, (a)
где Ia обозначает активную интенсивность, ρ0 обозначает плотность воздуха, c обозначает скорость звука, Е обозначает энергию звукового поля, и Ψ обозначает диффузность.
Интересно отметить, что, так как все компоненты ed - действительные числа, все компоненты UPW совпадают по фазе с PPW. Фиг.1B иллюстрирует типичные UPW и PPW в плоскости комплексного переменного. Как только что было упомянуто, все компоненты UPW делят ту же самую фазу, что и PPW, а именно, θ. Их величины, с другой стороны, ограничены
| P P W | c = | U x | 2 + | U y | 2 + | U z | 2 = ‖ U P W ‖ .
Осуществления данного изобретения могут обеспечить способ преобразования моно потока DirAC в сигнал В-формата. Моно поток DirAC может быть представлен сигналом давления, захваченным, например, всенаправленным микрофоном, и дополнительной информацией. Дополнительная информация может включать зависящие от времени-частоты меры диффузности и направления поступления звука.
В осуществлениях входной пространственный звуковой сигнал может далее включать параметр диффузности ψ, а блок оценки 110 может быть приспособлен для оценки меры волнового поля, далее основывающийся на параметре диффузности ψ.
Входное направление поступления и мера направления поступления волны могут относиться к контрольной точке, соответствующей местоположению записанного входного пространственного звукового сигнала, то есть, другими словами, все направления могут относиться к той же самой контрольной точке. Контрольная точка может быть тем местом, где расположен микрофон, или где расположены множественные направленные микрофоны для записи звукового поля.
В осуществлениях преобразованный пространственный звуковой сигнал может включать первый (X), второй (Y) и третий (Z) направленный компонент. Процессор 120 может быть приспособлен к дальнейшей обработке меры волнового поля и меры направления поступления для получения первого (X) и/или второго (Y) и/или третьего (Z) направленного компонента и/или всенаправленных звуковых компонентов.
В дальнейшем будут введены нотации и модель данных.
Пусть p(t) и u(t)=[ux(t), uy(t), uz(t)]T - давление и вектор скорости частицы, соответственно, для определенной точки в пространстве, где [·]Т обозначает транспозицию. p(t) может соответствовать звуковому представлению, и u(t)=[ux(t), uy(t), uz(t)]Т может соответствовать направленным компонентам. Эти сигналы могут быть преобразованы в частотно-временную область посредством подходящей гребенки фильтров или STFT (STFT=Краткосрочное преобразование Фурье), как предложено, например, в работе В.Пулкки и К.Фоллера, «Направленное звуковое кодирование: гребенка фильтров и основанная на STFT схема», на 120-ом собрании AES (Общество инженеров-звукотехников), 20-23 мая 2006 г., Париж, Франция, май 2006 г.
Пусть P(k,n) и U(k,n)=[Ux(k,n), Uy(k,n), Uz(k,n)]Т обозначают преобразованные сигналы, где k и n - индексы для частоты (или частотного диапазона) и времени, соответственно. Вектор активной интенсивности Ia(k,n) может быть определен как
I a ( k , n ) = 1 2 Re { P ( k , n ) ⋅ U ∗ ( k , n ) } , ( 1 )
где (·)* обозначает комплексное сопряжение, и Re{·} выделяет действительную часть. Вектор активной интенсивности может выражать чистый поток энергии, характеризующий звуковое поле, сравните, Ф.Дж. Фэхи, «Интенсивность звука», Эссекс: Научные публикации издательства Эльзевир, 1989 г.
Пусь c обозначает скорость звука в рассматриваемой среде, и Е - энергия звукового поля, определенная Ф.Дж. Фэхи
E ( k , n ) = ρ 0 4 ‖ U ( k , n ) ‖ 2 + 1 4 ρ 0 c 2 | P ( k , n ) | 2 , ( 2 )
где ‖ ⋅ ‖ вычисляет 2-норму. В дальнейшем будет детализирован контент моно потока DirAC.
Моно DirAC поток может состоять из моно сигнала p(t) или звукового представления и из дополнительной информации, например, мера направления поступления. Эта дополнительная информация может включать зависящее от частоты-времени направление поступления и зависящую от частоты-времени меру диффузности. Первое может быть обозначено eDOA(k,n), что является единичным вектором, указывающим на направление, от которого поступает звук, то есть, может моделироваться направление поступления. Последнее, диффузность, может быть обозначено
ψ (k,n).
В осуществлениях блок оценки 110 и/или процессор 120 может быть приспособлен для оценки/обработки входного DOA и/или меры волнового DOA, исходя из единичного вектора eDOA(k,n). Направление поступления может быть получено как
eDOA(k,n)=-eI(k,n),
где единичный вектор eI(k,n) указывает на направление, на которое указывает активная интенсивность, а именно
I a ( k , n ) = ‖ I a ( k , n ) ‖ ⋅ e I ( k , n ) ,
e I ( k , n ) = I a ( k , n ) / ‖ I a ( k , n ) ‖ , ( 3 )
соответственно. Альтернативно, в осуществлениях DOA или мера DOA могут быть выражены, исходя из азимута и углов возвышения в сферической системе координат. Например, если φ(k,n) и ϑ(k,n) - азимут и углы возвышения, соответственно, то
e D O A ( k , n ) = [ cos ( φ ( k , n ) ) ⋅ cos ( ϑ ( k , n ) ) , sin ( φ ( k , n ) ) ⋅ cos ( ϑ ( k , n ) ) , sin ( ϑ ( k , n ) ) ] T = [ e D O A , x ( k , n ) , e D O A , y ( k , n ) , e D O A , z ( k , n ) ] , ( 4 )
где eDOA,x(k,n) - компонент единичного вектора eDOA(k,n) входного направления поступления вдоль х-оси Декартовой системы координат, eDOA,y(k,n) - компонент eDOA(k,n) вдоль y-оси, и eDOA,z(k,n) - компонент eDOA(k,n) вдоль z-оси.
В осуществлениях блок оценки 110 может быть приспособлен для оценки меры волнового поля, далее основывающейся на параметре диффузности ψ, который дополнительно также может быть выражен ψ(k,n) способом, зависимым от частоты-времени. Блок оценки 110 может быть приспособлен для оценки, основывающейся на параметре диффузности, исходя из
ψ ( k , n ) = 1 − ‖ < I a ( k , n ) > t ‖ c < E ( k , n ) > t , ( 5 )
где <·>t показывает временное среднее число.
На практике существуют различные стратегии получения P(k,n) и U(k,n). Одна возможность состоит в том, чтобы использовать микрофон В-формата, который поставляет 4 сигнала, а именно, w(t), x(t), y(t) и z(t). Первый, w(t), может соответствовать показанию давления всенаправленного микрофона. Последние три могут соответствовать показаниям давления микрофонов, имеющих восьмиобразные конфигурации съемки сигнала, направленные по трем осям Декартовой системы координат. Эти сигналы также пропорциональны скорости частицы. Поэтому в некоторых осуществлениях
P ( k , n ) = W ( k , n ) U ( k , n ) = − 1 2 ρ o c [ X ( k , n ) , Y ( k , n ) , Z ( k , n ) ] T ( 6 )
где W(k,n), X(k,n), Y(k,n) и Z(k,n) - преобразованные сигналы В-формата, соответствующие всенаправленному компоненту W(k,n) и трем направленным компонентам X(k,n), Y(k,n), Z(k,n). Заметьте, что множитель 2 в (6) происходит из условного обозначения, используемого в определении сигналов В-формата, сравните, Майкл Герзон, «Психоакустика окружающего звука», в журнале Беспроводной Мир, том 80, страницы 483-486, декабрь 1974 г.
Альтернативно, P(k,n) и U(k,n) могут быть оценены посредством массива всенаправленных микрофонов, как предложено в работе Дж. Меримаа, «Использование массива 3-D микрофонов», на 112-ом собрании AES (Общество инженеров-звукотехников), Документ 5501, Мюнхен, май 2002 г. Стадии обработки, описанные выше, также проиллюстрированы на фиг.7.
Фиг.7 показывает кодирующее устройство DirAC 200, приспособленное для вычисления моно звукового канала и дополнительной информации из соответствующих сигналов микрофона. Другими словами, фиг.7 иллюстрирует кодирующее устройство DirAC 200 для определения диффузности ψ(k,n) и направления поступления eDOA(k,n) из соответствующих сигналов микрофона. Фиг.7 показывает кодирующее устройство DirAC 200, включающее P/U блок оценки 210. Р/U блок оценки получает сигналы микрофона в качестве входной информации, на которой основывается P/U оценка. Так как вся информация доступна, P/U оценка является прямой согласно вышеупомянутым уравнениям. Стадия энергического анализа 220 позволяет оценить направление поступления и параметр диффузности объединенного потока.
В осуществлениях блок оценки 110 может быть приспособлен для определения меры волнового поля или амплитуды, основанной на фракции β(k,n) входного звукового представления P(k,n). Фиг.2 показывает стадии обработки осуществления для вычисления сигналов В-формата из моно потока DirAC. Все величины зависят от индексов времени и частоты (k,n) и в дальнейшем частично опущены для простоты.
Другими словами, фиг.2 иллюстрирует другое осуществление. Согласно уравнению (6), W(k,n) равно давлению P(k,n). Поэтому, проблема синтезирования В-формата из моно потока DirAC приводит к оценке вектора скорости частицы U(k,n), поскольку его компоненты пропорциональны X(k,n), Y(k,n), и Z(k,n).
Осуществления могут подходить к оценке, основанной на предположении о том, что поле состоит из плоской волны, суммированной с диффузным полем. Поэтому давление и скорость частицы могут быть выражены как
P ( k , n ) = P P W ( k , n ) + P d i f f ( k , n ) ( 7 )
U ( k , n ) = U P W ( k , n ) + U d i f f ( k , n ) . ( 8 )
где нижние индексы «PW» и «diff» обозначают плоскую волну и диффузное поле, соответственно.
Параметры DirAC несут информацию только относительно активной интенсивности. Поэтому вектор скорости частицы U(k,n) оценивается посредством U ⌢ P W ( k , n ) , который является блоком оценки только скорости частицы плоской волны. Это может определяться как
U ⌢ P W ( k , n ) = − 1 ρ 0 c β ( k , n ) ⋅ P ( k , n ) ⋅ e D O A ( k , n ) , ( 9 )
где действительное число β(k,n) - подходящий весовой коэффициент, который обычно зависит от частоты и может проявлять обратную пропорциональность диффузности ψ(k,n). Фактически, для низкой диффузности, то есть, ψ(k,n), близком к 0, можно предположить,