Аудио кодер и декодер, увеличивающий полосу частот

Иллюстрации

Показать все

Изобретение относится к средствам формирования выровненного многоканального аудиосигнала. Технический результат заключается в увеличении качества кодирования сигнала при высоком битрейте. Аудиокодер для получения выходного сигнала с использованием входного аудио сигнала включает генератор патчей, компаратор и выходной интерфейс. Генератор патчей создает, как минимум, один сигнал с расширенной полосой частот, который имеет полосу высоких частот. Полоса высоких частот сигнала с расширенной полосой частот основывается на полосе низких частот входного аудио сигнала. Компаратор вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с расширенной полосой частот. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот. Далее компаратор определяет параметр сравнения из множества параметров сравнения, при этом выделенный параметр сравнения соответствует заранее заданному критерию. 8 н.з. и 9 з.п. ф-лы, 22 ил.

Реферат

Варианты осуществления изобретения связаны с обработкой аудио сигнала, а именно, с аудио кодером, способом получения выходного сигнала, декодером, который обеспечивает расширение диапазона частот, и способом получения аудио сигнала с увеличенным диапазоном частот.

Кодирование аудио сигналов с учетом их последующего восприятия для того, чтобы уменьшить объем данных для эффективного хранения и передачи информации нашло применение во многих сферах. Известными алгоритмами кодирования являются, например, MPEG 1/2 LAYER 3 "МР3" или MPEG 4 ААС. Применение данных алгоритмов кодирования, особенно при самых низких битрейтах, приводит к снижению качества звука. Это часто вызвано тем, что кодер имеет ограниченный диапазон передаваемых частот. Сигнал, пропущенный через фильтр нижних частот, кодируется при помощи так называемого центрального кодера, а области с более высокими частотами представляются в виде параметров и затем восстанавливаются из области, пропущенной через фильтр нижних частот.

Согласно WO 9857436 аудио сигнал подвергается процедуре уменьшения диапазона частот на стороне кодера, при этом кодируется только область низких частот аудио сигнала с помощью кодера высокого качества. Область высоких частот характеризуется очень примерно с помощью набора параметров, которые позволяют восстановить исходный спектр области высоких частот. Затем, на стороне декодера синтезируется полоса высоких частот. Для этой цели предлагается гармоническая транспозиция, когда полоса низких частот декодированного аудио сигнала направляется в банк фильтров. Каналы банка фильтров полосы низких частот соединяются с каналами банка фильтров полосы высоких частот, или «приводятся в соответствие», и каждый такой сигнал, пропущенный через полосно-пропускающий фильтр, подвергается корректировке. Синтезирующий банк фильтров, принадлежащий особому анализирующему банку фильтров, получает фильтрованный сигнал в диапазоне низких частот и скорректированный фильтрованный сигнал диапазона низких частот, который соответствует области высоких частот. Сигнал на выходе синтезирующего банка фильтров представляет собой сигнал, расширенный в соответствии с диапазоном частот аудио сигнала, переданного из кодера в декодер при низкой скорости передачи данных, т.к. вычисления банка фильтров и процесс определения соответствий между диапазонами высоких и низких частот представляет значительные трудности.

Менее затратные с точки зрения вычислений способы расширения диапазона частот аудио сигнала с ограниченным диапазоном частот применяют копирование низкочастотных областей сигнала (LF) в область высоких частот (HF) для того, чтобы приблизительно заполнить недостающую информацию, которая отсутствует из-за ограничения диапазона. Подобные способы описаны в следующих работах: М.Dietz, L.Liljeryd, K.Kjörling and 0.Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002; S.Meltzer, R. Böhm and F.Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112th AES Convention, Munich, May 2002; Т.Ziegler, A.Ehret, P.Ekstrand and М.Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3 PRO Algorithm," in 112th AES Convention, Munich, May 2002; International Standard ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002, or "Speech bandwidth extension method and apparatus", Vasu Iyengar et al. US Patent Nr. 5,455,888.

Данные способы не применяют гармоническую транспозицию. Согласно этим способам полосовой сигнал низкой частоты искусственно копируется в смежную область полосового сигнала высоких частот. Это приводит к неточному представлению диапазона высоких частот. Грубое приближение полученного сигнала к исходному сигналу затем корректируется на следующем этапе путем определения контрольных параметров на основе исходного сигнала. Например, стандарт MPEG-4 использует масштабные коэффициенты для корректировки спектральной огибающей, сочетание обратной фильтрации и добавления порога шума для корректировки тональности, а также вставку синусоидальныхных частей сигнала для добавления тональных компонентов.

Кроме этого существует так называемое «слепое расширение диапазона частот», описанное в работах Е.Larsen, R.M.Aarts, and М.Danessis, "Efficient high-frequency bandwidth extension of music and speech". Однако об этом способе не упоминалось на 112-й конференции AES в Мюнхене, Германия, май 2002 г. Также существует так называемый способ «искусственного расширения диапазона частот», который рассматривается в работе K.Käyhkö, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.

В работе J.Makinen et al.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP ′05 описывается способ расширения диапазона частот, при котором операция копирования компонентов низких частот в диапазон высоких частот производится с помощью зеркального отражения, получаемого при увеличении частоты дискретизации низкочастотного фильтрованного сигнала.

В качестве альтернативы может применяться одностороння модуляция диапазона, которая в целом эквивалентна операции копирования в области фильтра. Способы, которые применяют гармоническое расширение диапазона? обычно используют этап определения тона (pitch tracking), этап нелинейного искажения (см. "U.Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, in: Proceedings of the IWAENC, Darmstadt, Germany, September 2001, pp.215-218") или применяют фазовые голосовые кодеры, что указано в заявке на патент F.Nagel, S.Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" with the application number US 61/025129.

Стандарт WO 02/41302 A1, например, описывает способ повышения эффективности кодирующих систем, которые применяют реконструкцию высоких частот. Он показывает, как повысить общую эффективность таких систем при помощи постепенной адаптации частоты перехода между полосой низких частот, кодированной основным кодером, и полосой высоких частот, кодированной системой, которая применяет реконструкцию диапазона высоких частот. Согласно этому способу, основной кодер должен работать с различными частотами перехода как на стороне кодера, так и на стороне декодера. Таким образом, структура основного кодера усложняется.

Способы расширения диапазона частот описываются также в следующих работах: R.М.Aarts, E.Larsen, and О.Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003", E.Larsen and R.М.Aarts: Audio Bandwidth Extension - Application to psychoacoustics. Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004", E.Larsen, R.М.Aarts, and М.Danessis: Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002", "J.Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), June 1973", "United States Patent Application 08/951,029, Ohmori et al.: Audio band width extending system and method" and "United States Patent 6895375, Malah, D & Cox, R. VS.: System for bandwidth extension of Narrow-band speech.

Способы гармонического расширения диапазона частот обычно являются очень сложными, а при упрощении способов расширения диапазона частот ухудшается качество. В конкретном случае, когда низкий битрейт сочетается с небольшой полосой низких частот, могут появиться такие помехи, как резкие переходы и искажения тембра.

Причиной этому является то, что порция высоких частот часто получена приблизительно на основе операции копирования, которая не определяет гармонические соотношения между частями тонального сигнала. Это относится как к гармоническому соотношению между диапазонами низкой и высокой частот, так и к гармоническому соотношению между последующими патчами в пределах диапазона высоких частот. Например, в SBR соседнее расположение кодированных компонентов и копируемых компонентов, которое случается на границе полос высоких и низких частот, может стать причиной тому, что звук воспринимается как неравномерный. Это показано на фиг.18, где тональные порции, скопированные из диапазона низких частот в диапазон высоких частот, спектрально близко примыкают к тональным порциям диапазона низких частот.

Фиг.18A иллюстрирует исходную спектрограмму 1800A сигнала, состоящего из трех тонов. Фиг.18B показывает диаграмму 1800B сигнала с увеличенным диапазоном, который соответствует исходному сигналу на фиг.18A. Абсцисса указывает время, ордината - частоту. В частности, что касается последнего тона, то здесь можно наблюдать потенциальные проблемы 1810 (размытые линии 1810).

Если известные способы рассматривают гармоническое отношение, то это происходит всегда на основе F0-оценки. В этом случае успех этих способов в значительной мере зависит от надежности этой оценки.

В целом, известные способы увеличения диапазона частот позволяют получить аудио сигналы при низком битрейте, при высоком битрейте качество аудио сигнала не всегда может быть высоким.

Задачей настоящего изобретения является улучшение схемы кодирования аудио сигналов.

Эта задача решается при помощи аудио кодера согласно п.1, декодера, увеличивающего диапазон частот, согласно п.3 и п.8 и способу согласно п.12, 13 и 14.

При осуществлении настоящего изобретения применяется аудио кодер, который генерирует выходной сигнал на основе входного аудио сигнала. Аудио кодер включает генератор патчей, компаратор и выходной интерфейс.

Генератор патчей генерирует, как минимум, один сигнал с увеличенным диапазоном высоких частот. Сигнал с увеличенным диапазоном высоких частот включает полосу высоких частот, которая основана на низких частотах входного аудио сигнала.

Если создавались разные сигналы с увеличенным диапазоном высоких частот, то различные сигналы будут включать различные частоты.

Компаратор вычисляет множество сравнительных параметров. Сравнительный параметр вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с увеличенным диапазоном высоких частот. Каждый параметр из множества параметров сравнения вычисляется на основе отдельной частоты смещения между входным аудио сигналом и созданным сигналом с увеличенным диапазоном высоких частот. Далее компаратор выделяет параметр сравнения из множества параметров сравнения таким образом, что выделенный параметр соответствовал заранее заданному критерию.

Иначе говоря, компаратор может быть сконфигурирован таким образом, что он будет определять тот параметр сравнения среди множества параметров сравнения, который наилучшим образом соответствует заданному критерию.

Выходной интерфейс обеспечивает выходной сигнал для его передачи или хранения. Выходной сигнал включает индикацию сигнала на основе частоты смещения, соответствующей определенному параметру сравнения.

Иначе говоря, выходной сигнал включает выбранный параметр сравнения, который указывает оптимальную частоту смещения.

Следующий вариант изобретения включает декодер, который увеличивает диапазон частот, для получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала и параметрического сигнала. Параметрический сигнал содержит указание на частоту смещения и параметр плотности мощности. Декодер, увеличивающий диапазон частот, включает генератор патчей, блок объединения и выходной интерфейс.

Генератор патчей создает сигнал с увеличенным диапазоном высоких частот, который включает полосу высоких частот. Полоса высоких частот данного сигнала генерируется на основе одного или более сдвига полосы частот входного аудио сигнала. Сдвиги частот основаны на частоте смещения.

Генератор патчей может расширять или уменьшать полосу высоких частот сигнала с увеличенным диапазоном высоких частот с помощью коэффициента, равного значению параметра плотности мощности или обратной величине параметра плотности мощности соответственно.

Блок объединения соединяет сигнал с полосой высоких частот и входной аудио сигнал для того, чтобы получить сигнал с увеличенным диапазоном высоких частот.

Выходной интерфейс обеспечивает выход сигнала с увеличенным диапазоном.

Следующий вариант реализации настоящего изобретения имеет декодер, увеличивающий полосу частот, для получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала. Декодер, увеличивающий полосу частот, включает генератор патчей, компаратор, блок объединения и выходной интерфейс.

Генератор патчей создает, как минимум, один сигнал с полосой высоких частот, включающий полосу высоких частот, полученную на основе входного аудио сигнала. При этом нижняя предельная частота полосы высоких частот созданного сигнала оказывается ниже, чем верхняя предельная частота входного аудио сигнала. Если генерируются разные сигналы с полосой высоких частот, то полученные сигналы с полосой высоких частот имеют различные частоты в рамках своих высокочастотных полос.

Компаратор вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе разных частот смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот. Далее компаратор выделяет параметр сравнения из множества параметров сравнения так, чтобы определенный параметр соответствовал заранее заданному критерию.

Иначе говоря, компаратор определяет тот параметр сравнения среди множества параметров, который максимально соответствует заданному критерию.

Блок объединения объединяет входной аудио сигнал и сигнал с полосой высоких частот для получения аудио сигнала с увеличенным диапазоном частот. При этом сигнал с полосой высоких частот, используемый для получения сигнала с увеличенным диапазоном частот, основывается на частоте смещения, соответствующей выделенному параметру сравнения.

Выходной интерфейс обеспечивает выход аудио сигнала с увеличенным диапазоном частот.

Варианты реализации настоящего изобретения основываются на основной идее о том, что можно создавать сигнал с полосой высоких частот, который также называется патч, на базе исходного входного сигнала, а также их сравнивать. При помощи различных частот смещения сигнала с полосой высоких частот или нескольких сигналов с полосой высоких частот с различными частотами смещения может быть вычислено множество параметров сравнения, соответствующих этим частотам смещения. Параметры сравнения могут быть соотнесены с числом, которое ассоциируется с качеством аудио сигнала. Таким образом, при определении параметра сравнения гарантируется соответствие сигнала с полосой высоких частот и входного аудио сигнала, вследствие чего повышается качество звука.

Битрейт для передачи и хранения кодированного аудио сигнала может быть уменьшен при помощи указания параметра на основе частоты смещения, соответствующего определенному параметру сравнения для реконструкции полосы высоких частот исходного входного аудио сигнала. В этом случае для хранения и передачи необходимы только порция низких частот входного аудио сигнала и индикация параметра.

Термины ′параметр сравнения′, ′частота перехода′ и ′индикация параметра′ будут определены позже.

Некоторые варианты реализации настоящего изобретения включают компаратор, который использует взаимную корреляцию при сравнении входного аудио сигнала и созданного сигнала с полосой высоких частот для вычисления параметра сравнения.

Некоторые варианты реализации настоящего изобретения включают генератор патчей, который создает сигнал с полосой высоких частот во временной области на основе односторонней модуляции полосы частот.

Преимуществом предпочтительных форм реализации настоящего изобретения является улучшенная схема кодирования аудио сигналов, которая позволяет увеличить качество звука и/или уменьшить битрейт для передачи или хранения сигнала.

Варианты реализации настоящего изобретения будут далее детально рассмотрены в соответствии со следующими фигурами, которые даны в приложении:

Фиг.1 - блок-схема аудио кодера;

Фиг.2 - схематическая иллюстрация процесса создания сигнала с полосой высоких частот, сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот, а также процесса адаптации мощности сигнала с полосой высоких частот;

Фиг.3- схематическая иллюстрация процесса создания сигнала с полосой высоких частот, сравнения входного аудио сигнала и сигнала с полосой высоких частот, а также процесса адаптации мощности сигнала с полосой высоких частот;

Фиг.4 - блок-схема кодера, увеличивающего полосу частот;

Фиг.5 - блок-схема декодера, увеличивающего полосу частот;

Фиг.6 - блок-схема декодера, увеличивающего полосу частот;

Фиг.7- схема способа получения выходного сигнала на основе входного аудио сигнала;

Фиг.8 - схема способа получения сигнала с увеличенным диапазоном частот;

Фиг.9- схема способа получения выходного сигнала на основе входного аудио сигнала;

Фиг.10 - схема способа вычисления параметра сравнения;

Фиг.11 - схематическая иллюстрация интерполяции частоты смещения;

Фиг.12 - блок-схема декодера, увеличивающего полосу частот;

Фиг.13 - схема способа получения сигнала с увеличенным диапазоном частот;

Фиг.14 - блок-схема способа получения сигнала с увеличенным диапазоном частот;

Фиг.15 - блок-схема кодера, увеличивающего полосу частот;

Фиг.16A - спектрограмма трех тонов при использовании переменной переходной частоты;

Фиг.16B - спектрограмма исходного аудио сигнала, состоящего из трех тонов;

Фиг.17 - диаграмма спектра мощности исходного аудио сигнала и сигнала с увеличенным диапазоном частот, которые используют постоянную частоту перехода, и сигнала с увеличенным диапазоном частот, который использует переменную частоту перехода;

Фиг.18A - спектрограмма трех тонов при использовании известного способа увеличения диапазона частот;

Фиг.18B - спектрограмма исходного аудио сигнала, состоящего из трех тонов.

В последующем описании объекты и функциональные модули, имеющие одинаковые или схожие функциональные свойства, будут указываться одними и теми же порядковыми номерами на схемах. Описания, касающиеся какой-либо схемы, будут относиться и к другим схемам во избежание повторов в описании вариантов изобретения.

Фиг.1 показывает блок-схему аудио кодера 100 для получения выходного сигнала 132 в соответствии с настоящим изобретением, используя входной аудио сигнал 102. Выходной сигнал может применяться для расширения полосы частот на стороне декодера. Таким образом, аудио кодер также называется кодер увеличения полосы частот. Кодер увеличения полосы частот 100 включает генератор патчей 110, компаратор 120 и выходной интерфейс 130. Генератор патчей 110 соединяется с компаратором 120, а компаратор 120 соединяется с выходным интерфейсом 130.

Генератор патчей 110 генерирует, как минимум, один сигнал с полосой высоких частот 112. Сигнал 112 имеет полосу высоких частот, которая создана на основе полосы низких частот входного аудио сигнала 102. В том случае, если генерируются различные сигналы с полосами высоких частот 112, то сигналы 112 имеют различные частоты в диапазоне высоких частот.

Компаратор 120 вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала 102 и созданного сигнала с полосой высоких частот 112. Каждый параметр сравнения из множества параметров сравнения на основе разных частот смещения между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот 112. Далее компаратор определяет параметр сравнения из множества параметров сравнения так, чтобы он соответствовал заранее заданному критерию.

Выходной интерфейс 130 обеспечивает выходной сигнал 132 для последующей передачи или хранения. Выходной сигнал 132 имеет индикацию параметра на основе частоты смещения в соответствии с определенным параметром сравнения.

При помощи вычисления множества параметров сравнения для различных частот смещения может быть найден сигнал с полосой высоких частот 122, который максимально соответствует исходному входному сигналу 102. Это достигается путем генерации множества сигналов с полосой высоких частот 112, каждый из которых имеет различную частоту смещения, или путем создания одного сигнала с полосой высоких частот 112 и дальнейшим сдвигом полосы высоких частот сигнала 112 при помощи различных частот смещения. Также возможна комбинация создания множества сигналов с полосой высоких частот 112 с различными частотами смещения и дальнейшего сдвига полос высоких частот этих сигналов при помощи других частот смещения. Например, генерируются пять различных сигналов с полосой высоких частот 112, и каждый их них сдвигается пять раз на определенную частоту смещения.

На фиг.2 представлена схематическая иллюстрация 200 процесса создания сигнала с полосой высоких частот, сравнения сигнала с полосой высоких частот с входным сигналом и опциональную адаптацию мощности сигнала с полосой высоких частот в случае, если генерируется только один сигнал с полосой высоких частот, который сдвигается на величину различных частот смещения.

Первая диаграмма «мощность vs. частота» 210 схематично показывает входной аудио сигнал 102. На основе этого входного сигнала 102 генератор патчей 110 может создавать сигнал с полосой высоких частот 112, например, при помощи сдвига 222 полосы низких частот входного аудио сигнала 102 в сторону более высоких частот (как указано порядковым номером на схеме). Например, полоса низкой частоты сдвигается на частоту, равную частоте перехода основного кодера, не показанного на фиг.1, который может быть частью кодера 100, увеличивающего полосу частот, или на другую заранее заданную частоту.

Созданный сигнал с полосой высоких частот 112 затем может сдвигаться на различные частоты смещения 232, для каждой частоты смещения 232 (на схеме обозначено номером 230) компаратором 120 может быть вычислен параметр сравнения. Частота смещения 232 может быть определена, например, по отношению к частоте перехода основного кодера, по отношению к другой заданной частоте или как абсолютное частотное значение.

Далее компаратор 120 определяет параметр сравнения, соответствующий заранее заданному критерию. Таким образом может быть определен сигнал с полосой высоких частот 112 с частотой смещения 242, соответствующей определенному параметру сравнения (на схеме указано номером 240).

Дополнительно может быть определен параметр плотности мощности 252 (на схеме указан номером 250). Параметр плотности мощности 252 показывает отношение полосы высоких частот созданного сигнала с частотой смещения согласно определенному параметру сравнения к соответствующей полосе частот входного аудио сигнала. Например, это отношение может быть представлено коэффициентом плотности мощности, коэффициентом мощности или другим коэффициентом, который относится к плотности мощности частотного диапазона.

В отличие от предыдущих схем, фиг.3 представляет собой схематическую иллюстрацию 300 процесса создания сигнала с полосой высоких частот, сравнения созданных сигналов с входным аудио сигналом и возможной адаптации мощности созданного сигнала с полосой высоких, если создается множество сигналов с полосами высоких частот, которые имеют различные частоты смещения.

В отличие от последовательности, показанной на фиг.2, генератор патчей 110 создает множество сигналов с полосами высоких частот 112 с различными частотами смещения (показано номером 320). Это происходит, как и в предыдущем случае, с помощью частотного сдвига 222 полосы низких частот входного аудио сигнала 102 в диапазон высоких частот. Полоса низких частот входного аудио сигнала 102 может сдвигаться на постоянную частоту плюс индивидуальная частота смещения 232 каждого сигнала с полосой высоких частот 112. Постоянная частота может быть равной частоте перехода основного кодера или другой определенной частоте.

Затем компаратором 120 вычисляется параметр сравнения для каждого созданного сигнала с полосой высоких частот 112, а также параметр сравнения 240, соответствующий заранее заданному критерию.

Параметр плотности мощности 250 определяется так, как это указано выше.

Схемы, показанные на фиг.2 и 3, могут быть также скомбинированы.

Сравнение входного аудио сигнала 102 и созданного сигнала с полосой высоких частот 112 может проводиться на основе взаимной корреляции обоих сигналов. В этом случае параметр сравнения может быть, например, результатом взаимной корреляции между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот 112 для определенной частоты смещения.

Индикация параметра выходного сигнала 132 может быть представлена самой частотой смещения, квантованной частотой смещения или другой величиной, основанной на частоте смещения.

При передаче или хранении только индикации параметра вместо полосы высоких частот входного аудио 102 битрейт для передачи или хранения может быть понижен. Выбор параметра, основанного на частоте смещения согласно параметру сравнения, соответствующего заданному критерию, приводит к улучшению качества звука по сравнению с декодированием аудио сигнала с ограниченной полосой частот.

Согласно заранее заданному критерию определяется параметр сравнения из множества параметров сравнения, который указывает, например, на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который соответствует входному аудио сигналу 102 лучше, чем остальные 70% сигналов с полосами высоких частот с другими частотами смещения. Параметр сравнения может также указывать на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который является одним из трех лучших соответствий входному аудио сигналу 102, или на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который максимально соответствует входному сигналу. Это относится к той ситуации, когда генерируется множество сигналов с полосой высоких частот 112 с различными частотами смещения или к ситуации, когда генерируется один сигнал с полосой высоких часто 112, который сдвигается при помощи разных частот смещения, или к комбинации этих схем.

Параметр сравнения может быть результатом взаимной корреляции или другой величиной, которая указывает, как максимально сигнал с полосой высоких частот 112 с определенной частотой смещения соответствует входному аудио сигналу 102.

Кодер, увеличивающий диапазон частот, 100 может включать основной кодер для кодирования полосы низких частот входного аудио сигнала 102. Основной кодер может работать с частотой перехода, которая соответствует верхней предельной частоте кодируемой полосы низких частот входного аудио сигнала 102. Переходная частота основного кодера может быть постоянной или переменной. Применение переменной частоты перехода усложняет функционирование основного кодера, но может также увеличить гибкость процесса кодирования.

Процесс, показанный на фиг.2 и/или фиг.3 может повторяться для полос с более высокими частотами или патчей. Например, полоса низких частот входного аудио сигнала 102 имеет верхнюю предельную частоту 4 кГц. Таким образом, если полоса нижних частот входного аудио сигнала 102 сдвигается на величину, равную верхней предельной частоте полосы нижних частот, для того, чтобы получить сигнал с полосой высоких часто 112, то сигнал 112 имеет полосу высоких частот с нижней предельной частотой 4 кГц и верхней предельной частотой 8 кГц. Процесс можно повторить, если сдвинуть полосу нижних частот входного аудио сигнала 102 на величину, равную верхней предельной частоте полосы нижних частот, увеличенную в два раза. Так, созданный сигнал с полосой высоких частот 112 будет иметь полосу высоких частот с нижней предельной частотой 8 кГц и верхней предельной частотой 12 кГц. Этот процесс может повторяться до тех пор, пока не будет достигнута необходимая высокая частота.

В качестве альтернативы эту процедуру можно осуществить путем создания одного сигнала со множеством полос высоких частот.

Как показано на примере, ширина полосы низких частот входного аудио сигнала и ширина полосы высоких частот созданного сигнала одинаковы. В качестве альтернативы полоса низких частот входного аудио сигнала может быть растянута или сдвинута для того, чтобы получить сигнал с полосой высоких частот.

При определении сигнала с полосой высоких частот 112 с частотой смещения 232, соответствующей определенному параметру сравнения, может остаться пробел между полосой низких частот входного аудио сигнала 102 и полосой высоких частот созданного сигнала 112 в зависимости от частоты смещения 242. Этот пробел можно заполнить путем создания частотных порций, соответствующих пробелу и содержащих, например, шум, ограниченный по полосе. Пробел можно также оставить незаполненным, т.к. качество звука существенно не пострадает.

На фиг.4 показана блок-схема кодера, увеличивающего диапазон частот, 400, который создает выходной сигнал 132 в процессе обработки входного аудио сигнала 102 в соответствии с одним из вариантов реализации настоящего изобретения. Кодер, увеличивающий диапазон частот, 400 включает генератор патчей 110, компаратор 120, выходной интерфейс 130, основной кодер 410, полосовой фильтр 420 и блок выделения параметров 430. Основной кодер 410 соединен с выходным интерфейсом 130 и генератором патчей 110, генератор патчей 110 соединен с компаратором 120, компаратор 120 соединен с блоком выделения параметров 430, блок выделения параметров 430 соединен с выходным интерфейсом 130 и полосовой фильтр 420 соединен с компаратором 120.

Генератор патчей 110 может быть реализован как модулятор для создания сигнала с полосой высоких частот 112 на основе входного сигнала 102. Компаратор 120 выполняет сравнение входного аудио сигнала 102, отфильтрованного с помощью полосового фильтра 420, и созданного сигнала с полосой высоких частот 112 на основе их взаимной корреляции. Определение параметра сравнения, соответствующего заранее заданному критерию, может быть также названо вычислением отставания.

Выходной интерфейс может также иметь функцию блока формирования битового потока и включать блок объединения для соединения низкочастотного сигнала, который обеспечивается основным кодером 410, и параметрического сигнала, включающего параметр, определенный на основе частоты смещения, который обеспечивается блоком выделения параметров 430. Далее выходной интерфейс 130 может включать энтропийный кодер или дифференциальный кодер для уменьшения битрейта выходного сигнала 132. Блок объединения и энтропийный или дифференциальный кодер могут быть частью выходного интерфейса 130, как показано в этом примере, или представлять собой отдельные блоки.

Аудио сигнал 102 может быть разделен на две части: с низкими частотами и высокими частотами. Разделение проводится с помощью фильтра нижних частот основного кодера 410 или полосового фильтра 420. Фильтр нижних частот может быть частью основного кодера 410 или быть независимым фильтром, соединенным с основным кодером 410.

Низкочастотная часть обрабатывается основным кодером 410, подобным MPEG 1/2 Layer 3 "МР3" или MPEG 4 AAC standard или голосовым кодером.

Полоса низких частот сдвигается на фиксированную величину посредством преобразования полосы боковых частот или быстрого преобразования Фурье (FFT) в частотной области. Таким образом, она располагается выше исходной области низких частот в соответствующем патче. Кроме этого полоса низких частот может быть получена непосредственно из входного сигнала 102 с помощью независимого фильтра нижних частот, соединенного с генератором патчей 110.

В случае постоянных временных интервалов может быть вычислена взаимная корреляция между амплитудно-частотными характеристиками окон исходной высокочастотной полосы (исходного аудио сигнала) и полученной высокочастотной полосы (созданного сигнала с полосой высоких частот). Таким образом может быть определена задержка (частота смещения) для максимальной корреляции. Эта задержка означает корректирующий коэффициент в терминах исходного одностороннего преобразования частотного диапазона, т.е. одностороннее преобразование частотного диапазона может быть дополнительно скорректировано с помощью задержки для того, чтобы довести взаимную корреляцию до максимума. Иными словами, определяется частота смещения, также называемая задержкой, соответствующая параметру сравнения, который, в свою очередь, отвечает заранее заданному критерию. Таким образом, параметр сравнения соответствует взаимной корреляции, а задачей заранее заданного критерия является нахождение максимальной корреляции.

Дополнительно определяется отношение между абсолютными значениями амплитудно-частотных характеристик. Так вычисляется коэффициент, на который уменьшается или увеличивается полученный высокочастотный сигнал. Иными словами, может быть определен параметр плотности мощности, который обозначает коэффициент мощности, плотностей мощности, абсолютных значений амплитудно-частотных характеристик или других величин, соотносимых с соотношением плотности мощности между полосой высоких частот созданного сигнала 112 и соответствующей полосы частот исходного входного аудио сигнала 102. Процедура проводится компаратором плотности мощности, который может быть частью блока извлечения параметров 430, как показано в данном примере, или независимым блоком. Для определения параметра плотности мощности может быть использован сигнал с полосой высоких частот 112, который был создан путем сдвига полосы низких частот входного аудио сигнала 102 на постоянную частоту или сигнал с полосой высоких частот 112, соответствующий определенному параметру сравнения, или другой созданный сигнал с полосой высоких частот 112. Соответствующая полоса частот в этом случае обозначает полосу частот с одинаковым частотным диапазоном. Например, если полоса высоких частот созданного сигнал включает частоты от 4 кГц до 8 кГц, то соответствующая полоса частот входного аудио сигнала также имеет диапазон от 4 кГц до 8 кГц.

Полученные коэффициенты корректировки (частота смещения, параметр плотности мощности), соответствующие задержке и абсолютному значению амплитуды, могут быть интерполированы во времени. Иными словами, возможна интерполяция параметра, полученного для одного окна сигнала (для временного фрейма), на каждый временной период сигнала.

Эта модуляция (контроль) сигнала (параметрического сигнала) или его параметрическая репрезентация может быть сохранена или передана в декодер. Иными словами, параметрический сигнал 432 может быть объединен с полосой низких частот входного аудио сигнала 102, обработанного основным кодером 410, для того, чтобы получить выходной сигнал 132, который может быть сохранен или передан в декодер.

В дополнение могут быть определены параметры для адаптации, например, уровня шума и/или тональности. Вычисления проводятся блоком извлечения параметров 430. Дополнительные параметры добавляются к параметрическому сигналу 432.

Пример, показанный на фиг.4, иллюстрирует вычисления переменных во времени модуляций на стороне кодера. Переменные во времени модуляции в этом случае относятся к сигналам с полосой высоких частот 112 с различными частотами смещения. Частота смещения, соответствующая определенному параметру сравнения, который отвечает заранее заданному критерию, может изменяться во времени.

На фиг.5 показана блок-схема декодера, увеличивающего полосу частот, 500, для получения сигнала с увеличенным частотным диапазоном 532 на основе входного аудио сигнала 502 и параметрического сигнала 504 в соответствии с одним из вариантов реализации настоящего изобретения. Параметрический сигнал 504 включает показатель частоты смещения и параметр плотности мощности. Декодер, увеличивающий полосу частот, 500 включает генератор патчей 510, блок объединения 520 и выходной интерфейс 530. Генератор патчей 510 соединен с блоком объединения 520, а блок объединения 520 соединен с выходным интерфейсом 530.

Генератор патчей 510 генерирует сигнал с полосой высоких частот 512, который имеет полосу высоких частот, созданную на основе входного аудио сигнала 502. Полоса высоких частот созданного сигнала 512 генерируется на основе частотного сдвига полосы частот входного аудио сигнала 502, при этом частотный сдвиг производится на основе частоты смещения.

Далее генератор патчей 510 увеличивает или уменьшает полосу высоких частот созданного сигнала 512 на коэффициент, равный значению параметра плотности мощности или обратный значению параметра плотности мощности.

Блок объединения 520 соединяет сигнал с полосой высоких частот