Устройство для генерирования декоррелированного сигнала, используя переданную фазовую информацию
Иллюстрации
Показать всеИзобретение относится к области декодирования аудио. Техническим результатом является исключение случаев, когда компоненты переходных сигналов имеют отрицательные акустические воздействия на выходные сигналы. Устройство для генерирования декоррелированного сигнала содержит блок (650) приема для приема фазовой информации, блок (310; 410; 510; 610; 710; 910) отделения сигнала переходного процесса, декоррелятор (320; 420; 520; 620; 720; 920) переходного процесса, второй декоррелятор (330; 430; 530; 630; 730; 930) и блок (340; 440; 540; 640; 740; 940) объединения, блок (310; 410; 510; 610; 710; 910) отделения сигнала переходного процесса приспособлен для разделения входного сигнала на первый и второй компоненты сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала переходного процесса входного сигнала и второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала. Декоррелятор (320; 420; 520; 620; 720; 920) переходного процесса адаптирован для применения фазовой информации, принятой блоком (650) приема, к компоненту сигнала переходного процесса. 3 н. и 9 з.п. ф-лы, 10 ил.
Реферат
Настоящее изобретение относится к области обработки аудио и декодирования аудио, в частности, к декодированию сигнала, содержащего переходные процессы.
Обработка и/или декодирование аудио развились многими способами. В частности, пространственные аудио приложения стали более важными. Обработка аудио сигнала часто используется для декорреляции или воспроизведения сигналов. Кроме того, декорреляция и воспроизведение сигналов используются в процессе повышающего микширования из моно в стерео, из моно/стерео в множество каналов с повышающим микшированием, искусственной реверберации звука, стерео расширения или пользовательского интерактивного микширования/воспроизведения.
Несколько систем обработки аудио сигнала используют декорреляторы. Важным примером является применение систем декорреляции в параметрических пространственных аудио декодерах, чтобы восстановить специфичные свойства декорреляции между двумя или более сигналами, которые реконструированы из одного или нескольких сигналов понижающего микширования. Применение декорреляторов значительно улучшает перцепционное качество выведенного сигнала, например, при сравнении со стерео интенсивности. В частности, использование декорреляторов обеспечивает надлежащий синтез пространственного звука с широким звуковым изображением, несколькими параллельными звуковыми объектами и/или средой. Однако декорреляторы, как также известно, вводят артефакты, такие как изменения во временной структуре сигнала, тембре и т.д.
Другими примерными применениями декорреляторов в обработке аудио являются, например, генерирование искусственной реверберации (остаточного звучания) звука, чтобы изменить стереофонический эффект или использование декорреляторов в многоканальных системах подавления эхо-сигналов, чтобы улучшить поведение конвергенции.
Обычное современное применение декоррелятора в повышающем микшировании из моно в стерео, например, примененное в параметрическом стерео (PS), иллюстрировано на Фиг. 1, где монофонический введенный сигнал М ("сухой" (исходный) сигнал) выдается в декоррелятор 110. Декоррелятор 110 декоррелирует монофонический введенный сигнал М согласно способу декорреляции, чтобы выдать декоррелированный сигнал D ("мокрый" (обработанный) сигнал) на своем выходе. Декоррелированный сигнал D вводится в микшер 120 в качестве первого введенного сигнала микшера наряду с ′′сухим′′ монофоническим сигналом М в качестве второго введенного сигнала микшера. Кроме того, блок 130 управления повышающим микшированием вводит параметры управления повышающим микшированием в микшер 120. Микшер 120 затем генерирует два выходных канала L и R (L = левый выходной стерео канал; R = правый выходной стерео канал) согласно матрице H микширования. Коэффициенты матрицы микширования могут быть фиксированными, зависеть от сигнала или управляться пользователем.
Альтернативно, матрица микширования управляется дополнительной информацией, которая передается наряду с сигналом понижающего микширования, содержащим параметрическое описание относительно того, как микшировать с повышением сигналы понижающего микширования, чтобы сформировать желаемый многоканальный выходной сигнал. Эта пространственная дополнительная информация обычно генерируется во время процесса понижающего микширования монофонического сигнала в соответственном кодере сигнала.
Этот принцип широко применяется в пространственном кодировании аудио, например, параметрическом стерео, см., например, J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates" in Proceedings of the AES 116th Convention, Berlin, Preprint 6072, май 2004.
Другая обычная современная структура параметрического стерео декодера иллюстрирована на Фиг. 2, в которой процесс декорреляции выполняется в области преобразования. Набор 210 фильтров для анализа сигнала преобразует монофонический введенный сигнал в область преобразования, например, в частотную область. Декорреляция преобразованного монофонического введенного сигнала М затем выполняется декоррелятором 220, который генерирует декоррелированный сигнал D. Как преобразованный монофонический введенный сигнал М, так и декоррелированный сигнал D вводятся в матрицу 230 микширования. Матрица 230 микширования затем генерирует два выходных сигнала L и R, учитывая параметры повышающего микширования, которые выданы блоком 240 модификации параметров, который снабжен пространственными параметрами и который соединен с блоком 250 управления параметрами. На Фиг. 2 пространственные параметры могут быть модифицированы пользователем или дополнительными инструментами, например, последующей обработкой для бинаурального воспроизведения/презентации. В этом примере параметры повышающего микширования объединены с параметрами от бинауральных фильтров, чтобы сформировать параметры ввода для матрицы повышающего микширования. Наконец, выведенные сигналы, сгенерированные матрицей 230 микширования, выдаются в набор 260 фильтров для синтеза сигнала, который определяет стерео выведенный сигнал.
Выходной сигнал L/R матрицы 230 микширования вычисляется из монофонического введенного сигнала М и декоррелированного сигнала D согласно правилу микширования, например, посредством применения следующей формулы:
В этой матрице микширования величина декоррелированного звука, поданного на выход, управляется на основе переданных параметров, например, межканальной корреляции/когерентности (ICC) и/или фиксированных или определенных пользователем параметров настройки.
Концептуально, выведенный выходной сигнал D декоррелятора заменяет остаточный сигнал, который будет идеально учитывать точное декодирование исходных сигналов L/R. Использование выходного сигнала D декоррелятора вместо остаточного сигнала в повышающем микшировании приводит к экономии скорости передачи битов, которая иначе может требоваться для передачи остаточного сигнала. Задача декоррелятора состоит в том, чтобы таким образом сгенерировать сигнал D из монофонического сигнала М, который проявляет аналогичные свойства, как остаточный сигнал, который заменен посредством D.
Соответственно, со стороны кодера выявлены два типа пространственных параметров: первая группа параметров содержит параметры корреляции/когерентности (например, параметры ICC=параметры межканальной корреляции/когерентности), представляющие когерентность или кросс-корреляцию между двумя каналами ввода, которые должны быть закодированы. Вторая группа параметров содержит параметры разности уровней (например, параметры ILD=параметры межканальной разности уровней), представляющие разность уровней между двумя каналами ввода.
Кроме того, сигнал понижающего микширования генерируется посредством понижающего микширования двух входных каналов. Кроме того, генерируется остаточный сигнал. Остаточные сигналы являются сигналами, которые могут быть использованы для восстановления исходных сигналов посредством дополнительного использования сигнала понижающего микширования и матрицы повышающего микширования. Когда, например, N сигналов микшируются с понижением в 1 сигнал, сигнал понижающего микширования обычно составляет 1 из N компонентов, которые возникают в результате отображения N введенных сигналов. Оставшиеся компоненты, возникающие в результате отображения (например, N-1 компонентов), являются остаточными сигналами и позволяют реконструировать исходные N сигналов посредством обратного отображения. Отображение может, например, быть вращением. Отображение должно проводиться таким образом, чтобы сигнал понижающего микширования максимизировался, и остаточные сигналы минимизировались, например, аналогично преобразованию главной оси. Например, энергия сигнала понижающего микширования должна быть максимизирована, а энергии остаточных сигналов должны быть минимизированы. При понижающем микшировании 2 сигналов в 1 сигнал, сигнал понижающего микширования обычно составляет один из двух компонентов, которые возникают в результате отображения 2 введенных сигналов. Оставшийся компонент, возникающий в результате отображения, является остаточным сигналом и позволяет реконструировать исходные 2 сигнала посредством обратного отображения.
В некоторых случаях остаточный сигнал может представлять ошибку, ассоциированную с представлением двух сигналов посредством их понижающего микширования и ассоциированных параметров. Например, остаточный сигнал может быть сигналом ошибки, который представляет ошибку между исходными каналами L, R и каналами L', R', возникающими в результате повышающего микширования сигнала понижающего микширования, который был сгенерирован на основании исходных каналов L и R.
Другими словами, остаточный сигнал может быть рассмотрен как сигнал во временной области или частотной области, или области частотного поддиапазона, который вместе с только сигналом понижающего микширования или с сигналом понижающего микширования и параметрической информацией допускает корректную или почти корректную реконструкцию исходного канала. Термин ′′почти корректная реконструкция′′ должен быть понят, что реконструкция с остаточным сигналом, имеющим энергию, больше чем ноль, является более близкой к исходному каналу по сравнению с реконструкцией, использующей понижающее микширование без остаточного сигнала или использующей понижающее микширование и параметрическую информацию без остаточного сигнала.
При рассмотрении окружения MPEG (MPS), структуры, аналогичные PS, которые называются блоками ′′один в два′′ (полем OTT), используются в деревьях пространственного декодирования аудио. Это может быть видно в качестве обобщения понятия "повышающего микширования из моно в стерео" для многоканальных схем пространственного кодирования/декодирования аудио. В MPS также существуют системы повышающего микширования ′′два в три′′ (блоки TTT), которые могут применять декорреляторы в зависимости от режима работы TTT. Подробности описаны в J. Herre, K. Kjorling, J. Breebaart и др., "MPEG surround - ISO/MPEG standard for efficient and compatible multi-channel audio coding" in Proceedings AES 122th, Vienna, Austria, May 2007.
Относительно направленного кодирования аудио (DirAC), DirAC относится к параметрической схеме кодирования звукового поля, которая не связана с фиксированным количеством аудио каналов вывода с фиксированными позициями громкоговорителя. DirAC применяет декорреляторы в устройстве воспроизведения DirAC, то есть, в пространственном аудио декодере, чтобы синтезировать некогерентные компоненты звуковых полей. Больше информации, касающейся направленного кодирования аудио, можно найти в Pulkki, Ville: "Spatial Sound Reproduction with Directional Audio Coding" в J. Audio Eng. Soc, том 55, №6, 2007.
Относительно современных декорреляторов в пространственных аудио декодерах, ссылка делается на "Information Technology- MPEG audio technologies - Parti: MPEG Surround", ISO/IEC 23003-1:2007 а также на J. Engdegard, H. Purnhagen, J. Roden, L.Liljeryd, "Synthetic Ambience in Parametric Stereo Coding" in Proceedings of the AES 116th Convention, Berlin, Preprint, May 2004. Решетчатые частотонезависимые структуры IIR используются в качестве декорреляторов в пространственных аудио декодерах, например, MPS, как описано в J. Herre, K. Kjorling, J. Breebaart, et al., "MPEG surround- the ISO/MPEG standard for efficient and compatible multi-channel audio coding," in Proceedings of the 122th AES Convention, Vienna, Austria, May 2007, и как описано в ISO/IEC International Standard "Information Technology- MPEG audio technologies - Parti: MPEG Surround", ISO/IEC 23003-1:2007. Другие современные декорреляторы применяют (потенциально в зависимости от частоты) задержки, чтобы декоррелировать сигналы или сворачивать введенные сигналы, например, с экспоненциальным снижением шумовых всплесков. Для краткого обзора состояния декорреляторов настоящего уровня техники для пространственных аудио систем повышающего микширования, см. "Synthetic Ambience in Parametric Stereo Coding" AES 116th Convention, Berlin, Preprint, May 2004.
Другим способом обработки сигналов является "семантическая обработка повышающего микширования". Семантическая обработка повышающего микширования является способом для разбиения сигналов на компоненты с разными семантическими свойствами (то есть, классами сигнала) и применения разных стратегий повышающего микширования к различным компонентам сигнала. Различные алгоритмы повышающего микширования могут быть оптимизированы согласно различным семантическим свойствам, чтобы улучшить общую схему обработки сигнала. Эта концепция описана в WO/2010/017967, An apparatus for determining a spatial output multichannel-channel audio signal, международная заявка на патент, PCT/EP2009/005828, 11.8.2009, 11.6.2010 (FH090802PCT).
Дополнительная схема пространственного кодирования аудио является "способом временной перестановки", как описано в Hotho, G., van de Par, S. и Breebaart, J.: "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art.. 10. DOI=http://dx.doi.org/l 0.1155/2008/. В этом документе предложена схема пространственного кодирования аудио, которая приспособлена для кодирования/декодирования подобных аплодисментам сигналов. Эта схема основана на перцепционном подобии сегментов монофонического аудио сигнала, в частности сигнала понижающего микширования пространственного аудио кодера. Монофонический аудио сигнал сегментируют на перекрывающиеся временные сегменты. Эти сегменты переставляют во времени псевдослучайным образом (взаимно независимо для n каналов вывода) в "супер"-блоке, чтобы сформировать декоррелированные выходные каналы.
Дополнительным способом пространственного аудио кодирования является "способ временной задержки и перестановки". В DE 10 2007 018032 A: 20070417, Erzeugung dekorrelierter Signale, 17.4.2007, 23.10.2008 (FH070414PDE), предложена схема, которая также приспособлена для кодирования/декодирования подобных аплодисментам сигналов для бинаурального представления. Эта схема также основана на перцепционном подобии сегментов монофонического аудио сигнала и задержках в выходных каналах относительно другого. Чтобы избежать локализации смещения в направлении к ведущему каналу, периодически меняются ведущий и отстающий канал.
В целом, стерео или многоканальные подобные аплодисментам сигналы, кодированные/декодированные в параметрических пространственных аудио кодерах, как известно, приводят к уменьшенному качеству сигнала (см., например, Hotho, G., van de Par, S. и Breebaart, J.: "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693, см. также DE 10 2007 018032 A). Подобные аплодисментам сигналы характеризуются содержанием временных плотных комбинаций переходных процессов с различных направлений. Примерами таких сигналов являются аплодисменты, звук дождя, скачущие галопом лошади и т.д. Подобные аплодисментам сигналы часто также содержат звуковые компоненты от удаленных звуковых источников, которые перцепционно вплавлены в подобное шуму, гладкое, фоновое звуковое поле.
Современные способы декорреляции, используемые в пространственных аудио декодерах, например, окружении MPEG, содержат решетчатые частотонезависимые структуры. Они действуют как искусственные генераторы отражения звука и, следовательно, хорошо подходят для генерирования гомогенных, гладких, подобных шуму, иммерсивных звуков (как оконечных частей отражения звука в помещении). Однако имеются примеры звуковых полей с негомогенной пространственно-временной структурой, которые все еще вовлекают слушателя: одним известным примером являются подобные аплодисментам звуковые поля, которые создают окружение для слушателя не только посредством гомогенных подобных шуму полей, но также и посредством довольно плотных последовательностей отдельных хлопков с различных направлений. Следовательно, негомогенный компонент звуковых полей аплодисментов может быть характеризован пространственно распределенной комбинацией переходных процессов. Очевидно, эти отличные хлопки не являются гомогенными, гладкими и подобными шуму в целом.
Из-за своего поведения, подобному отражению звука, решетчатые частотонезависимые декорреляторы не способны генерировать иммерсивное звуковое поле с характеристиками, например, аплодисментов. Вместо этого, применяясь к подобным аплодисментам сигналам, они имеют тенденцию временно подавлять переходные процессы в сигналах. Нежелательным результатом является подобное шуму иммерсивное звуковое поле без отличительной пространственно-временной структуры подобных аплодисментам звуковых полей. Дополнительно, случаи переходных процессов, такие как отдельный хлопок, могут вызвать звонящие артефакты фильтров декоррелятора.
Система согласно Hotho, G., van de Par, S. и Breebaart, J.: "Multichannel coding of applause signals", EURASIP Journal on Advances in Signal Processing, Jan. 2008, art. 10. DOI=http://dx.doi.org/10.1155/2008/531693, будет показывать заметное ухудшение выведенного звука из-за некоторого повторяющегося качества в выходном аудио сигнале. Причина состоит в том, что один и тот же сегмент входного сигнала кажется неизменным в каждом выходном канале (хотя в другой точке во времени). Кроме того, чтобы избежать увеличенной плотности аплодисментов, некоторые исходные каналы должны быть пропущены при повышающем микшировании, и, таким образом, некоторое важное слуховое событие может быть пропущено в получающемся в результате сигнале повышающего микширования. Способ применяется, только если возможно найти сегменты сигнала, которые совместно используют одни и те же перцепционные свойства, то есть: сегменты сигнала, которые звучат одинаково. Способ в целом значительно изменяет временную структуру сигналов, которые могут применяться только для очень немногих сигналов. В случае применения схемы к неподобным аплодисментам сигналам (например, из-за некорректной классификации сигналов), временная перестановка чаще всего приведет к недопустимым результатам. Временная перестановка дополнительно ограничивает применимость случаями, когда несколько сегментов сигнала могут быть микшированы вместе без артефактов, таких как эхо-сигнал или гребенчатое фильтрование. Аналогичные недостатки относятся к способу, описанному в DE 10 2007 018032 A.
Семантическая обработка повышающего микширования, описанная в WO/2010/017967, разделяет компоненты переходного процесса сигналов до применения декорреляторов. Оставшийся (свободный от переходных процессов) сигнал вводится в обычный процессор декорреляции и повышающего микширования, тогда как сигналы с переходными процессами обрабатываются по-иному: последние (например, случайным образом) распределяются различным каналам стерео или многоканального выходного сигнала посредством применения способов амплитудного панорамирования. Амплитудное панорамирование обнаруживает несколько недостатков:
Амплитудное панорамирование не обязательно производит выходной сигнал, который близок к оригиналу. Выходной сигнал может быть близок к оригиналу, только если распределение переходных процессов в исходном сигнале может быть описано законами амплитудного панорамирования. То есть: амплитудное панорамирование может просто корректно воспроизвести события панорамированной амплитуды, но не фазовые или временные различия между переходными компонентами в различных выходных каналах.
Кроме того, применение подхода амплитудного панорамирования в MPS будет требовать обхода не только декоррелятора, но также и матрицы повышающего микширования. Так как матрица повышающего микширования отражает пространственные параметры (межканальные корреляции: корреляции ICC; разности уровней канала: разности ILD), которые необходимы, чтобы синтезировать выходной сигнал повышающего микширования, который показывает корректные пространственные свойства, сама система панорамирования должна применить некоторое правило, чтобы синтезировать выходное сигналы с корректными пространственными свойствами. Общее правило для этого неизвестно. Дополнительно, эта структура добавляет сложность, так как пространственные параметры должны учитываться дважды: один раз для части сигнала без переходного процесса и второй - для амплитудно-панорамированной части сигнала с переходным процессом.
Поэтому задача настоящего изобретения состоит в обеспечении улучшенного понятия для генерирования декоррелированного сигнала. Задача настоящего изобретения решена устройством для генерирования декоррелированного сигнала по п. 1 формулы изобретения, устройством для кодирования аудио сигнала согласно п. 11 формулы изобретения способом для генерирования декоррелированного сигнала по п. 14 формулы изобретения и в соответствии с компьютерной программой по п. 15 формулы изобретения.
Устройство согласно варианту осуществления содержит блок отделения сигнала переходного процесса для разделения входного сигнала на первый компонент сигнала и на второй компонент сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала переходного процесса входного сигнала, и таким образом, чтобы второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала. Блок отделения сигнала переходного процесса может отделить эти различные компоненты сигнала друг от друга, чтобы обеспечить, чтобы компоненты сигнала, которые содержат переходные процессы, могли быть обработаны по-другому, чем компоненты сигнала, которые не содержат переходные процессы.
Кроме того, устройство содержит декоррелятор переходного процесса для декорреляции компонентов сигнала, содержащих переходные процессы, согласно способу декорреляции, который в частности подходит для декорреляции компонентов сигнала, содержащих переходные процессы. Кроме того, устройство содержит второй декоррелятор для декорреляции компонентов сигнала, которые не содержат переходные процессы.
Таким образом, устройство способно или обрабатывать компоненты сигнала, используя стандартный декоррелятор, или альтернативно обрабатывать компоненты сигнала, используя декоррелятор переходного процесса, в частности, подходящий для обработки компонентов сигнала переходного процесса. В варианте осуществления блок отделения сигнала переходного процесса решает, вводится ли компонент сигнала в стандартный декоррелятор, или в декоррелятор переходного процесса.
Кроме того, устройство может быть приспособлено для разделения компонента сигнала таким образом, чтобы компонент сигнала частично вводился в декоррелятор переходного процесса и частично вводился во второй декоррелятор.
Кроме того, устройство содержит блок объединения для объединения компонентов сигнала, сформированных стандартным декоррелятором и декоррелятором переходного процесса, чтобы сгенерировать декоррелированный сигнал комбинации.
В варианте осуществления устройство содержит блок приема для приема фазовой информации, причем декоррелятор переходного процесса приспособлен для применения этой фазовой информации к первому компоненту сигнала.
В варианте осуществления блок отделения сигнала переходного процесса приспособлен или для ввода рассмотренной части сигнала входного сигнала устройства в декоррелятор переходного процесса или ввода рассмотренной части сигнала во второй декоррелятор в зависимости от информации разделения сигнала переходного процесса, которая или указывает, что рассмотренная часть сигнала содержит переходный процесс, или которая указывает, что рассмотренная часть сигнала не содержит переходный процесс. Такой вариант осуществления допускает легкую обработку информации разделения сигнала переходного процесса.
В другом варианте осуществления блок отделения сигнала переходного процесса приспособлен для частичного ввода рассмотренной части сигнала входного сигнала устройства в декоррелятор переходного процесса и частичного вывода рассмотренной части сигнала во второй декоррелятор. Величина рассмотренной части сигнала, которая вводится в блок отделения сигнала переходного процесса, и величина рассмотренной части сигнала, которая вводится во второй декоррелятор, зависит от информации разделения сигнала переходного процесса. Посредством этого может быть принят во внимание уровень переходного процесса.
В дополнительном варианте осуществления блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала устройства, который представлен в частотной области. Это обеспечивает зависимую от частоты обработку переходного процесса (разделение и декорреляцию). Таким образом, некоторые компоненты сигнала первого частотного диапазона могут быть обработаны согласно способу декорреляции сигнала переходного процесса, в то время как компоненты сигнала другого частотного диапазона могут быть обработаны согласно другому, например, способу обычной декорреляции. Соответственно, в варианте осуществления блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала устройства на основании зависимой от частоты информации разделения сигнала переходного процесса. Однако в альтернативном варианте осуществления блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала устройства на основании независимой от частоты информации разделения. Это позволяет обеспечить более эффективную обработку сигнала переходного процесса.
В другом варианте осуществления блок отделения сигнала переходного процесса может быть адаптирован для разделения входного сигнала устройства, который представлен в частотной области, таким образом, чтобы все части сигнала входного сигнала устройства в первом диапазоне частот вводились во второй декоррелятор. Поэтому соответствующее устройство приспособлено, чтобы ограничить обработку сигнала переходного процесса, чтобы сигнализировать компоненты с частотами сигнала во втором частотном диапазоне, в то время как компоненты сигнала с частотами сигнала в первом диапазоне частот не вводятся в декоррелятор переходного процесса (но вместо этого во второй декоррелятор).
В дополнительном варианте осуществления декоррелятор переходного процесса может быть приспособлен для декорреляции первого компонента сигнала посредством применения фазовой информации, представляющей разность фаз между остаточным сигналом и сигналом понижающего микширования. На стороне кодера матрица "обратного" микширования может быть использована для создания сигнала понижающего микширования и остаточного сигнала, например, из двух каналов стерео сигнала, как было объяснено выше. В то время как сигнал понижающего микширования может быть передан на декодер, остаточный сигнал может быть отклонен. Согласно варианту осуществления, разность фаз, используемая декоррелятором переходного процесса, может быть разностью фаз между остаточным сигналом и сигналом понижающего микширования. Таким образом, может быть возможно реконструировать "искусственный" остаточный сигнал посредством применения исходной фазы остаточного сигнала к сигналу при понижающем микшировании. В варианте осуществления разность фаз может относиться к некоторому частотному диапазону, то есть, может зависеть от частоты. Альтернативно, разность фаз не относится к некоторым частотным диапазонам, но может применяться как независимый от частоты широкополосный параметр.
В дополнительном варианте осуществления фазовая составляющая может быть применена к первому компоненту сигнала посредством умножения фазовой составляющей на первый компонент сигнала.
В дополнительном варианте осуществления второй декоррелятор может быть обычным декоррелятором, например, решетчатым IIR декоррелятором.
В варианте осуществления устройство содержит микшер, приспособленный для приема входных сигналов и, кроме того, адаптированный для генерирования выходных сигналов на основании входных сигналов и правила микширования. Входной сигнал устройства подается на блок отделения переходных процессов и затем декорреллируется с помощью блока отделения переходных процессов и/или второго декорреллятора, как описано выше. Блок объединения и микшер могут быть скомпонованы так, что декорреллированный сигнал комбинации подается в микшер в качестве первого входного сигнала микшера. Вторым входным сигналом микшера может быть входной сигнал устройства или сигнал, выведенный из входного сигнала устройства. Когда процесс декоррелляции уже завершен, когда декорреллированный сигнал комбинации подается в микшер, декоррелляция переходного процесса не должна быть принята во внимание микшером. Поэтому может быть использован обычный микшер.
В дополнительном варианте осуществления микшер адаптирован для приема данных параметров корреляции/когерентности, указывающие корреляцию или когерентность между двумя сигналами и адаптирован для генерирования выходных сигналов на основании упомянутых данных параметров корреляции/когерентности. В другом варианте осуществления микшер адаптирован для приема данных параметров разности уровней, указывающих разность энергий, и адаптирован для генерирования выходных сигналов на основании упомянутых данных параметров упомянутых данных параметров разности уровней. В таком варианте осуществления декорреллятор переходного процесса, второй декорреллятор и блок объединения не должны быть адаптированы для обработки таких данных параметров, так как микшер будет заботиться об обработке соответствующих данных. С другой стороны, обычный микшер с обычной обработкой параметров корреляции/когерентности и разности уровней может быть использован в таком варианте осуществления.
Варианты осуществления более подробно объяснены со ссылками на чертежи, на которых:
Фиг. 1 иллюстрирует современное состояние применения декоррелятора при повышающем микшировании из моно в стерео;
Фиг. 2 изображает дополнительное современное состояние применения декоррелятора при повышающем микшировании из моно в стерео;
Фиг. 3 иллюстрирует устройство для генерирования декоррелированного сигнала согласно варианту осуществления;
Фиг. 4 иллюстрирует устройство для декодирования сигнала согласно варианту осуществления;
Фиг. 5 является кратким обзором системы ′′один в два′′ (OTT) согласно варианту осуществления;
Фиг. 6 иллюстрирует устройство для генерирования декоррелированного сигнала, содержащего блок приема, согласно дополнительному варианту осуществления;
Фиг. 7 является кратким обзором системы ′′один в два′′ согласно другому дополнительному варианту осуществления;
Фиг. 8 иллюстрирует примерные отображения от измерений фазовой согласованности в уровень отделения сигнала переходного процесса;
Фиг. 9 является кратким обзором системы ′′один в два′′ согласно другому дополнительному варианту осуществления;
Фиг. 10 иллюстрирует устройство для кодирования аудио сигнала, имеющего множество каналов.
Фиг. 3 иллюстрирует устройство для генерирования декоррелированного сигнала согласно варианту осуществления. Устройство содержит блок 310 отделения сигнала переходного процесса, декоррелятор 320 сигнала переходного процесса, обычный декоррелятор 330 и блок 340 объединения. Подход к обработке переходного процесса из настоящего варианта осуществления имеет целью генерировать декоррелированные сигналы из подобных аплодисментам аудио сигналов, например, для применения в процессе повышающего микширования пространственных аудио декодеров.
На Фиг. 3 входной сигнал вводится в блок 310 отделения сигнала переходного процесса. Входной сигнал может быть преобразован в частотную область, например, посредством применения набора фильтров гибридного QMF. Блок 310 отделения сигнала переходного процесса может решать для каждого рассмотренного компонента сигнала входного сигнала, содержит ли он переходный процесс. Кроме того, блок 310 отделения сигнала переходного процесса может быть скомпонован, чтобы вводить рассмотренную часть сигнала или в декоррелятор 320 сигнала переходного процесса, если рассмотренная часть сигнала содержит переходный процесс (компонент s1 сигнала), или он может вводить рассмотренную часть сигнала в обычный декоррелятор 330, если рассмотренная часть сигнала не содержит переходный процесс (компонент s2 сигнала). Блок 310 отделения сигнала переходного процесса также может быть скомпонован, чтобы разбить рассмотренную часть сигнала в зависимости от наличия переходного процесса в рассмотренной части сигнала и выдать их частично в декоррелятор 320 сигнала переходного процесса и частично в обычный декоррелятор 330.
В варианте осуществления декоррелятор 320 сигнала переходного процесса декоррелирует компонент s1 сигнала согласно способу декорреляции сигнала переходного процесса, который в частности является подходящим для декорреляции компонентов сигнала переходного процесса. Например, декорреляция компонентов сигнала переходного процесса может быть выполнена посредством применения фазовой информации, например, применения фазовых составляющих. Способ декорреляции, в котором фазовые составляющие применяются к компонентам сигнала переходного процесса, объяснены ниже относительно варианта осуществления Фиг. 5. Такой способ декорреляции также может быть использован как способ декорреляции сигнала переходного процесса декоррелятора 320 сигнала переходного процесса из варианта осуществления согласно Фиг. 3.
Компонент s2 сигнала, который содержит части сигнала без переходного процесса, вводится в обычный декоррелятор 330. Обычный декоррелятор 330 может затем декоррелировать компонент s2 сигнала согласно способу обычной декорреляции, например, посредством применения решетчатых частотонезависимых структур, например, решетчатого IIR фильтра (с бесконечным импульсным откликом).
После декорреляции посредством обычного декоррелятора 330, декоррелированный компонент сигнала из обычного декоррелятора 330 вводится в блок 340 объединения. Декоррелированный компонент сигнала с переходным процессом из декоррелятора 320 сигнала переходного процесса также вводится в блок 340 объединения. Блок 340 объединения затем объединяет оба декоррелированных компонента сигнала, например, посредством суммирования обоих компонентов сигнала, чтобы получить декоррелированный сигнал комбинации.
В целом, способ декорреляции сигнала, содержащий переходные процессы согласно варианту осуществления, может осуществляться следующим образом:
На этапе разделения входной сигнал делится на два компонента: один компонент s1 содержит переходные процессы входного сигнала, другой компонент s2 содержит оставшуюся (без переходных процессов) часть входного сигнала. Компонент s2 без переходных процессов сигнала может быть обработан в системах без применения способа декорреляции декоррелятора сигнала переходного процесса из этого варианта осуществления. То есть: сигнал s2 без переходных процессов может быть введен в одну или несколько обычных структур обработки декорреляции сигнала, например, решетчатые IIR частотонезависимые структуры.
Кроме того, компонент сигнала, содержащий переходные процессы (поток s1 сигнала с переходным процессом) вводится в структуру "декоррелятора сигнала переходного процесса", которая декоррелирует поток сигнала с переходным процессом, в то же время поддерживая специальные свойства сигнала лучше, чем обычные структуры декорреляции. Декорреляция потока сигнала переходного процесса осуществляется посредством применения фазовой информации при высоком временном разрешении. Предпочтительно, фазовая информация содержит фазовые составляющие. Кроме того, предпочтительно, чтобы фазовая информация могла быть выдана посредством кодера.
Кроме того, выходные сигналы как обычного декоррелятора, так и декоррелятора сигнала переходного процесса объединяются, чтобы сформировать декоррелированный сигнал, который может быть использован в процессе повышающего микширования пространственных аудио кодеров. Элементы (h11, h12, h21, h22) матрицы микширования (Mmix) пространственного аудио декодера могут оставаться неизменными.
Фиг. 4 иллюстрирует устройство для декодирования входного сигнала устройства согласно варианту осуществления, в котором входной сигнал устройства вводится в блок 410 отделения сигнала переходного процесса. Устройство содержит блок 410 отделения сигнала переходного процесса, декоррелятор 420 сигнала переходного процесса, обычный декоррелятор 430, блок 440 объединения и микшер 450. Блок 410 отделения сигнала переходного процесс