Устройство и способ для воспроизведения аудиосигнала, устройство и способ для генерирования кодированного аудиосигнала, компьютерная программа и кодированный аудиосигнал

Иллюстрации

Показать все

Изобретение относится к средствам для генерирования и воспроизведения аудиосигнала. Технический результат заключается в обеспечении возможности генерирования и воспроизведения аудиосигнала при уменьшении доступной скорости передачи данных. Устройство содержит первое воспроизводящее средство, выполненное с возможностью воспроизведения первой части аудиосигнала на основании первых данных. Средство предоставления выполняется с возможностью предоставления сигнала-заплаты во второй частотной полосе, причем сигнал-заплата является по меньшей мере частично некоррелированным относительно первой части аудиосигнала или является по меньшей мере частично декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу. Второе воспроизводящее средство выполняется с возможностью воспроизведения второй части аудиосигнала во второй частотной полосе на основании вторых данных и сигнала-заплаты. Объединяющее средство выполняется с возможностью объединения воспроизводимой первой части аудиосигнала и сигнала-заплаты перед воспроизведением второй части аудиосигнала вторым воспроизводящим средством. 6 н. и 9 з.п. ф-лы, 13 ил.

Реферат

Настоящее изобретение имеет отношение к устройству, способу и компьютерной программе для воспроизведения аудиосигнала и, в частности, к устройству, способу и компьютерной программе для воспроизведения аудиосигнала в ситуациях, в которых уменьшается доступная скорость передачи данных. Помимо этого, настоящее изобретение имеет отношение к устройству, способу и компьютерной программе для генерирования кодированного аудиосигнала и соответствующему кодированному аудиосигналу.

Перцепционно адаптивное кодирование аудиосигналов, для эффективного хранения и передачи этих сигналов с уменьшенной скоростью передачи данных, получило распространение во многих областях. Известны алгоритмы кодирования, в частности такие, как MPEG-1/2, «MP3» 3-го уровня, Усовершенствованное кодирование аудио (AAC-Advanced Audio Coding) MPEG-2/4 или Комплексное кодирование речи и аудио (USAC-Unified Speech and Audio Coding) MPEG-H. Лежащие в основе методы кодирования, особенно при достижении наименьших скоростей передачи битов, приводят к снижению качества аудио. Часто ухудшение, главным образом, вызвано ограничением полосы пропускания аудиосигнала для передачи на стороне устройства кодирования.

В такой ситуации, как известно для существующего уровня техники, чтобы подвергнуть аудиосигнал ограничению полосы частот на стороне устройства кодирования и закодировать только нижнюю полосу аудиосигнала, используется высококачественное устройство кодирования аудио. Верхняя полоса, однако, только очень грубо характеризуется набором параметров, которые выражают, например, огибающую спектра верхней полосы. Затем на стороне устройства декодирования синтезируется верхняя полоса путем вставки заплаты из декодированного сигнала нижней полосы в свободную в противном случае верхнюю полосу, и выполняя последующие управляемые настройки параметров.

Стандартные способы для расширения полосы пропускания аудиосигналов с ограниченной полосой частот используют функцию копирования низкочастотных частей сигнала (LF-low-frequency) в высокочастотный диапазон (HF-high frequency), чтобы аппроксимировать информацию, отсутствующую из-за ограничения полосы частот. В принципе, такая функция копирования технически эквивалентна спектральному сдвигу, вычисленному во временной области посредством модуляции с одной боковой полосой (SSB-single sideband), но в вычислительном отношении гораздо менее сложна. Такие способы, как, например, Репликация спектральной полосы (SBR-Spectral Band Replication), описываются в документах М. Дитц (M. Dietz), Л. Лильерид (L. Liljeryd), К. Кьерлинг (K. Kjörling) и О. Кунц (O. Kunz), "Репликация спектральной полосы, новый подход в кодировании аудио" ("Spectral Band Replication, a novel approach in audio coding"), 112-й Съезд AES, Мюнхен, май 2002 г.; С. Мелтцер (S. Meltzer), Р. Бем (R. Böhm) и Ф. Хенн (F. Henn), "Аудиокодеки с улучшенной SBR для цифрового вещания, такого, как "Всемирное Цифровое Радиовещание" (DRM)" ("SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)"), 112-й Съезд AES, Мюнхен, май 2002 г.; Т. Циглер (T. Ziegler), А. Эрет (A. Ehret), П. Экстранд (P. Ekstrand) и М. Лутцкий (M. Lutzky), "Улучшенный mp3 с SBR: Особенности и возможности нового алгоритма mp3PRO" ("Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm"), 112-й Съезд AES, Мюнхен, май 2002 г.; Международный стандарт ISO/IEC 14496-3:2001/FPDAM 1, "Расширение полосы пропускания" («Bandwidth Extension»), ISO/IEC, 2002, или "Способ и устройство расширения полосы пропускания речевых сигналов" ("Speech bandwidth extension method and apparatus"), Васу Айенгар (Vasu Iyengar) и др. Патент США Номер 5,455,888.

В этих способах не выполняется гармоническая транспозиция, а последовательные полосовые сигналы нижней полосы вводятся в последовательные каналы банка фильтров верхней полосы. Тем самым достигается грубая аппроксимация верхней полосы аудиосигнала. Затем, на следующем этапе, эта грубая аппроксимация сигнала аппроксимируется к исходному посредством пост-обработки с использованием управляющей информации, полученной из исходного сигнала. При этом, например, коэффициенты масштабирования служат для адаптации огибающей спектра, обратного фильтрования и добавления минимального уровня шума, чтобы адаптировать тональность, и дополнения синусоидальными частями сигнала, что также описано в Стандарте MPEG-4.

Как известно из методов гармонических расширений полосы пропускания, описанных в работе Ф. Нагеля (Nagel, F.); С. Диша (Disch, S.) «Способ гармонического расширения полосы пропускания для аудиокодеков» («A Harmonic Bandwidth Extension Method for Audio Codecs»), Международная конференция по акустике и обработке речи и сигналов (ICASSP - Int. Conf. on Acoustics, Speech and Signal Processing) IEEE, 2009 г.; в работе Ф. Нагеля; С. Диша; Н. Реттельбаха (Rettelbach, N.) «Способ расширения полосы пропускания под управлением фазового вокодера с новой обработкой переходных процессов для аудиокодеков» («A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs»), 126-й Съезд AES, 2009 г.; в работе Х. Жонга (Zhong, H.); Л. Виллемоеса (Villemoes, L.); П. Экстранда, и др. «Гармоническая репликация спектральной полосы на базе QMF» («QMF Based Harmonic Spectral Band Replication», 131-й Съезд Общества инженеров-акустиков (AES-Audio Engineering Society), 2011 г.; в работе Л. Виллемоеса; П. Экстранда; П. Хеделина (Hedelin, P.) «Способы для расширенной гармонической транспозиции» («Methods for enhanced harmonic transposition»), Рабочая группа IEEE по применениям обработки сигналов к аудио и акустике, (WASPAA-Workshop on Applications of Signal Processing to Audio and Acoustics), 2011 г., при синтезе верхней полосы в сигнал могут быть внесены нежелательные слышимые нечеткости. Одной причиной (из многих) упомянутых нечеткостей является спектральное отклонение заплаты и/или эффекты диссонанса в переходных зонах между нижней полосой и первой заплатой или между последовательными заплатами. Методы гармонических расширений полосы пропускания предназначены для улучшения этих двух аспектов, пусть и ценой вычислительной сложности.

Вычисления в банке фильтров и вставка заплаты в области банка фильтров, особенно при гармоническом расширении полосы пропускания, действительно могут превратиться в высокие вычислительные затраты. В WO 98/57436 описывается усовершенствованный метод вставки заплаты, который, в некоторых определенных пределах, может избежать эффектов диссонанса, вводя так называемые защитные полосы частот между разными спектральными заплатами и выполняя модифицированную вставку заплаты с повышающим копированием, чтобы уменьшить спектральное отклонение, сохраняя приемлемую вычислительную сложность.

Кроме этого, существуют дополнительные способы, например, так называемое «слепое расширение полосы пропускания», описанное в работе Э. Ларсена (E. Larsen), Р. М. Аартса (R. M. Aarts) и М. Данессиса (M. Danessis), «Эффективное высокочастотное расширение полосы пропускания музыки и речи» («Efficient high-frequency bandwidth extension of music and speech»), на 112-ом Съезде AES, Мюнхен, Германия, май 2002 г., в которых не используется информация об исходном ВЧ диапазоне. Кроме того, существует также способ так называемого «Искусственного расширения полосы пропускания», который описан в работе К. Каюхке (K. Käyhkö), «Устойчивое широкополосное улучшение для узкополосного речевого сигнала» («A Wideband Enhancement for Narrowband Speech Signal»); научно-исследовательский отчет, Хельсинкский технологический университет, Лаборатория акустики и обработки аудиосигналов, 2001 г.

В работе Дж. Макинена (J. Makinen) и др.: AMR-WB+: «Новый стандарт кодирования аудио для транслирования подвижных услуг передачи аудиоинформации 3-го поколения» («A new audio coding standard for 3rd generation mobile audio services Broadcasts»), IEEE, ICASSP ’05, описывается способ для расширения полосы пропускания, в котором операция копирования для расширения полосы пропускания с повышающим копированием последовательных полосовых сигналов в соответствии с технологией SBR заменяется на зеркальное отображение, например, путем повышающей дискретизации.

Дополнительные технологии для расширения полосы пропускания описаны в следующих документах. Р. М. Аартс, Э. Ларсен и О. Аувелтьес (O. Ouweltjes), «Комплексный подход к низко- и высокочастотному расширению полосы пропускания» («A unified approach to low- and high frequency bandwidth extension»), 115-й Съезд AES, Нью-Йорк, США, октябрь 2003 г.; Э. Ларсен и Р. М. Аартс, «Расширение полосы пропускания аудио - применение в психоакустике, обработке сигналов и конструировании громкоговорителей» («Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design»), John Wiley & Sons, Ltd., 2004 г.; Э. Ларсен, Р. М. Аартс и М. Данессис, «Эффективное высокочастотное расширение полосы пропускания музыки и речи» («Efficient high-frequency bandwidth extension of music and speech»), 112-й Съезд AES, Мюнхен, май 2002 г.; Дж. Макхоул (J. Makhoul), «Спектральный анализ речи с помощью линейного предсказания» («Spectral Analysis by Linear Prediction»), Протоколы IEEE по аудио и электроакустике, AU-21(3), июнь 1973 г.; Заявка на патент США 08/951,029; Патент США Номер 6,895,375.

Известные способы гармонического расширения полосы пропускания демонстрируют высокую сложность. С другой стороны, способы расширения полосы пропускания пониженной сложности демонстрируют потери качества. В частности, при низкой скорости передачи битов, и в сочетании с низкой пропускной способностью в НЧ диапазоне, могут возникать такие артефакты, как нечеткость и тембр, неприятные для восприятия. Причиной этого является прежде всего тот факт, что аппроксимированная ВЧ часть основывается на одной или более операциях прямого копирования или зеркального отображения НЧ части спектра.

Задачей настоящего изобретения является предоставить устройство и способ для воспроизведения аудиосигнала в улучшенной форме. Более того, задачей настоящего изобретения является предоставить устройство и способ для генерирования кодированного аудиосигнала, который может быть воспроизведен в улучшенной форме. Дополнительной задачей настоящего является предоставить соответствующую компьютерную программу и соответствующий кодированный аудиосигнал.

Эта задача успешно выполняется с помощью устройства для воспроизведения аудиосигнала по п. 1 формулы изобретения, способа для воспроизведения аудиосигнала по п. 13 формулы изобретения, устройства для генерирования кодированного аудиосигнала по п. 12 формулы изобретения, способа для генерирования кодированного аудиосигнала по п. 13 формулы изобретения, компьютерной программы по п. 14 формулы изобретения и кодированного аудиосигнала по п. 15 формулы изобретения.

Варианты осуществления настоящего изобретения обеспечивают устройство для воспроизведения аудиосигнала на основании первых данных, представляющих кодированную версию первой части аудиосигнала в первой частотной полосе, и вторых данных, представляющих вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом устройство содержит:

первое воспроизводящее средство, выполненное с возможностью воспроизведения первой части аудиосигнала на основании первых данных;

средство предоставления, выполненное с возможностью предоставления сигнала-заплаты во второй частотной полосе, причем сигнал-заплата является некоррелированным относительно первой части аудиосигнала или является декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу;

второе воспроизводящее средство, выполненное с возможностью воспроизведения второй части аудиосигнала во второй частотной полосе на основании вторых данных и сигнала-заплаты; и

объединяющее средство для объединения воспроизводимой первой части аудиосигнала и сигнала-заплаты перед воспроизведением второй части аудиосигнала вторым воспроизводящим средством или для объединения воспроизводимой первой части аудиосигнала и воспроизводимой второй части аудиосигнала.

Варианты осуществления настоящего изобретения обеспечивают способ для воспроизведения аудиосигнала на основании первых данных, представляющих кодированную версию первой части аудиосигнала в первой частотной полосе, и вторых данных, представляющих вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом способ содержит этапы, на которых:

воспроизводят аудиосигнал в первой частотной полосе на основании первых данных;

предоставляют сигнал-заплату во второй частотной полосе, причем сигнал-заплата является некоррелированным относительно первой части аудиосигнала или является декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу;

воспроизводят аудиосигнал во второй частотной полосе на основании вторых данных и сигнала-заплаты; и

объединяют воспроизводимую первую часть аудиосигнала и сигнал-заплату перед воспроизведением второй части аудиосигнала или объединяют воспроизводимую первую часть аудиосигнала и воспроизводимую вторую часть аудиосигнала.

Варианты осуществления настоящего изобретения имеют отношение к воспроизведению аудиосигнала, предусматривающему расширение полосы пропускания с использованием декоррелированных аудиосигналов частичной полосы. В отличие от уже существующих способов, большинства искажений сигналов и артефактов, которые в настоящее время типичны для расширений полосы пропускания, можно избежать при помощи декоррелированных аудиосигналов частичной полосы для расширения полосы пропускания, а не коррелированных (копированных с повышением или зеркально отображенных) аудиосигналов частичной полосы. Это достигается путем предоставления аудиосигнала, который формирует основу для воспроизведения высокочастотной части аудиосигнала, некоррелированного или декоррелированного относительно первой части (НЧ части) аудиосигнала. Варианты осуществления настоящего изобретения основаны на утверждении, что корреляция между низкочастотной частью и высокочастотной частью не должна поддерживаться при воспроизведении второй части сигнала из аудиосигнала. Наоборот, авторы изобретения приходят к выводу, что артефактов, таких, как нечеткость и тембр, неприятных для восприятия, можно избежать, используя декоррелированный или полностью некоррелированный сигнал-заплату.

Варианты осуществления настоящего изобретения обеспечивают устройство для генерирования кодированного аудиосигнала, причем кодированный аудиосигнал содержит первые данные, представляющие кодированную версию первой части аудиосигнала в первой частотной полосе, и вторые данные, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом устройство содержит:

средство добавления декорреляционной информации, выполненное с возможностью добавления к кодированному аудиосигналу информации о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала.

Варианты осуществления настоящего изобретения обеспечивают способ для генерирования кодированного аудиосигнала, причем кодированный аудиосигнал содержит первые данные, представляющие кодированную версию первой части аудиосигнала в первой частотной полосе, и вторые данные, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса, при этом способ содержит этап, на котором:

добавляют к кодированному аудиосигналу информацию о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала.

Варианты осуществления настоящего изобретения обеспечивают кодированный аудиосигнал, который содержит:

первые данные, представляющие кодированную версию первой части аудиосигнала в первой частотной полосе;

вторые данные, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе, причем вторая частотная полоса содержит частоты более высокие, чем первая частотная полоса; и

информацию о степени декорреляции, которая должна быть использована между первой частью аудиосигнала и сигналом-заплатой, на основании которой воспроизводится вторая часть аудиосигнала при воспроизведении аудиосигнала из кодированного аудиосигнала.

Итак, варианты осуществления настоящего изобретения позволяют генерировать кодированный аудиосигнал таким образом, чтобы позволить декодировать кодированный аудиосигнал надлежащим образом, используя надлежащую степень декорреляции. Надлежащая степень декорреляции может быть определена на стороне устройства кодирования на основании характеристик первой части и/или второй части аудиосигнала.

В дальнейшем варианты осуществления настоящего изобретения разъясняются более подробно со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1a демонстрирует структурную схему варианта осуществления устройства для воспроизведения аудиосигнала;

Фиг. 1b демонстрирует структурную схему другого варианта осуществления устройства для воспроизведения аудиосигнала;

Фиг. 2 демонстрирует структурную схему дополнительного варианта осуществления устройства для воспроизведения аудиосигнала;

Фиг. 3 демонстрирует структурную схему варианта осуществления устройства для генерирования кодированного аудиосигнала;

Фиг. 4a демонстрирует схематичную иллюстрацию стороны устройства кодирования с учетом вариантов осуществления настоящего изобретения;

Фиг. 4b демонстрирует схематичную иллюстрацию стороны устройства декодирования с учетом вариантов осуществления настоящего изобретения;

Фиг. 5a и 5b демонстрируют диаграммы, иллюстрирующие преимущества вариантов осуществления настоящего изобретения;

Фиг. 6 демонстрирует структурную схему устройства для воспроизведения аудиосигнала, от которого отталкивается настоящее изобретение; и

Фиг. 7a-7d демонстрируют диаграммы сигналов, полезные при разъяснении работы устройства, продемонстрированного на Фиг. 6.

Перед подробным разъяснением вариантов осуществления настоящего изобретения, считаем целесообразным коротко обсудить теоретические соображения, лежащие в основе изобретения.

Как указывалось выше, расширения полосы пропускания, основанные на операциях копирования (или операциях зеркального отображения), например, как SBR (SBR = Репликация спектральной полосы (Spectral Band Replication)), копируют большие части НЧ спектра непосредственно в ВЧ диапазон.

Пример устройства с SBR описывается со ссылкой на Фиг. 6 и 7. Огибающая аудиосигнала 2 продемонстрирована на Фиг. 7a. Аудиосигнал 2 содержит низкочастотную часть (или низкочастотную полосу) 4 и высокочастотную часть (или высокочастотную полосу) 6. Как правило, при перцепционном кодировании аудиосигналов, низкочастотная часть 4 кодируется посредством высококачественного устройства кодирования аудио, такого, как устройство кодирования с PCM (PCM = импульсно- кодовая модуляция (pulse code modulation)), тогда как верхняя полоса только очень грубо характеризуется вспомогательной информацией. Данные, представляющие кодированную низкочастотную часть, и данные, представляющие вспомогательную информацию, передаются с использованием соответствующего основного кодека. Фиг. 6 демонстрирует сигнал 8 основной полосы от основного кодека, который представляет низкочастотную часть 4, показанную на Фиг. 7b. Этот сигнал 8 поступает на модуль модуляции с одной боковой полосой/повышающего копирования, где сигнал 8 смещается в частотный диапазон высокочастотной части 6. Этот смещенный сигнал показан как сигнал 10 на Фиг. 7c. Смещенный сигнал 10 и сигнал 8 поступают на модуль 12 вставки заплат, где оба сигнала объединяются (суммируются) для получения спектра, показанного на Фиг. 7c. Часть 8 сигнала может быть смещена в p различных диапазонов верхних частот, где p ≥ 1. Таким образом объединение одного или нескольких (p) смещенных сигналов и сигнала 8 может иметь место в модуле 12 вставки заплат.

Выходной сигнал модуля 12 вставки заплат поступает на модуль 14 пост-обработки, который также принимает вспомогательную информацию 16, представляющую аудиосигнал в высокочастотной части 6. Таким образом, высокочастотная часть 10’ аудиосигнала 6 воспроизводится на основании вспомогательной информации 16 и аудиосигнала низкочастотной части 4. Получающийся аудиосигнал показан на Фиг. 7d. Модуль 14 пост-обработки выводит полнополосный выходной сигнал с охватом частотных диапазонов низкочастотной части 4 и высокочастотной части 6.

Соответственно, расширения полосы пропускания на основании операций копирования (или операций зеркального отображения), такие как, например, SBR, копируют большие части низкочастотного спектра непосредственно в высокочастотный диапазон. Это может быть достигнуто в результате применения модуляции с одной боковой полосой представления во временной области аудиосигнала или прямого процесса копирования (копирования с повышением) в спектральном представлении аудиосигнала. Этот этап обработки обычно называют "вставка заплаты".

Вообще, может быть множество заплат, копируемых в различные высокочастотные полосы. Соответствующие частотные полосы могут перекрываться или нет. Каждая из соответствующих ВЧ заплат, таким образом, полностью коррелирует с низкочастотным диапазоном, из которого она была извлечена. Авторы настоящего изобретения пришли к выводу, что тем самым модуляции временной огибающей могут происходить в результате наложения обоих сигналов с частотой, которая зависит от спектрального расстояния между НЧ полосой и спектральным положением соответственной ВЧ заплаты.

С системно-теоретической точки зрения, это явление следует рассматривать как сопряженное с работой гребенчатого фильтра с конечной импульсной характеристикой (КИХ), содержащего задержку n отсчетов при Fs в качестве частоты дискретизации. Этот фильтр имеет амплитудно-частотную характеристику с шириной гребенки (спектральное расстояние между двумя максимумами амплитудно-частотной характеристики) 1/n*Fs. Таким образом, системно-теоретическая двойственность имеет следующие прямые соответствия:

временная задержка <-> перенос частоты

амплитудно-частотная характеристика <-> временная огибающая.

Авторы настоящего изобретения пришли к выводу, что временные модуляции в результате этого слышимы с помехами и могут проявляться в автокорреляционной функции величины формы волны в виде периодически повторяющихся боковых максимумов. Такие периодически повторяющиеся боковые максимумы в автокорреляционной последовательности огибающей шумового сигнала для SBR с повышающим копированием показаны на Фиг. 5a. Фиг. 5a демонстрирует автокорреляционную функцию амплитудной огибающей белого шума, причем полоса пропускания расширяется тремя заплатами прямого повышающего копирования, которые полностью коррелируют между собой и с НЧ полосой.

Только когда НЧ и ВЧ сигнал демонстрирует одинаковую амплитуду, достигается максимальная глубина модуляции. На практике, следовательно, эффект модуляции часто немного ниже, потому что, как правило, ВЧ диапазон заметно тише (менее громкий), чем НЧ диапазон. Шумоподобные сигналы или квазистационарные сигналы с выраженной структурой обертонов должны считаться особенно важными по отношению к артефактам модуляции.

В случае наличия нескольких заплат (p на Фиг. 6), которые полностью коррелируют между собой, вышеупомянутая двойственность тоже справедлива, конечно. Оказывается, что временная модуляция амплитудной огибающей сопряжена с амплитудно-частотной характеристикой соответствующего КИХ-фильтра.

Итак, в соответствии с вариантами осуществления настоящего изобретения, заплата или заплаты декоррелируются друг от друга и от НЧ полосы. В вариантах осуществления настоящего изобретения используются одно или несколько декорреляционных средств, чтобы декоррелировать сигнал, полученный из низкочастотных составляющих сигнала, соответственно, перед тем, как он будет вставлен в диапазон(ы) верхних частот и, в зависимости от ситуации, подвергнут пост-обработке.

Варианты осуществления настоящего изобретения избегают указанных проблем, которые возникают вследствие операции копирования или операции зеркального отображения, благодаря использованию взаимно декоррелированных заплат. В вариантах осуществления настоящего изобретения, соответственные ВЧ заплаты декоррелируются от НЧ полосы по отдельности с помощью декорреляционных средств, например, посредством фазовых фильтров или другими известными способами декорреляции, или сразу синтезируются заплаты в декоррелированной по своей природе форме.

В вариантах осуществления настоящего изобретения степень декорреляции может жестко определяться или регулироваться на стороне устройства декодирования, или она может передаваться в качестве параметра от устройства кодирования на устройство декодирования. Кроме того, может декоррелироваться вся заплата, или только определенные части заплаты. Части заплаты, подлежащие декорреляции, также могут передаваться в качестве параметра от устройства кодирования на устройство декодирования как часть соответствующей информации, добавляемой к кодированному аудиосигналу.

Подход настоящего изобретения выгоден по сравнению с традиционными подходами для расширения полосы пропускания, поскольку искажения и окрашивания звука в результате создания помех или паразитных модуляций огибающей, как они имеются в современных способах, основанных на модуляции с одной боковой полосой/повышающем копировании НЧ полосы, безусловно предотвращаются при подходе настоящего изобретения. Это достигается при помощи ВЧ заплат, которые являются декоррелированными версиями НЧ части сигнала или которые полностью некоррелированы по отношению к НЧ части сигнала.

Далее описывается сценарий, в котором могут быть реализованы варианты осуществления настоящего изобретения, со ссылкой на Фиг. 4a и 4b.

Сторона устройства кодирования продемонстрирована на Фиг. 4a, а сторона устройства декодирования продемонстрирована на Фиг. 4b. Аудиосигнал подается в комбинированный фильтр нижних/ верхних частот на вход 700. Комбинированный фильтр нижних/верхних частот, с одной стороны, включает в себя фильтр нижних частот (LP-lowpass), для генерирования отфильтрованной по нижним частотам версии аудиосигнала, представленной через 703 на Фиг. 7a. Этот отфильтрованный по нижним частотам аудиосигнал кодируется устройством 704 кодирования аудио. Устройство кодирования аудио представляет собой, например, устройство кодирования MP3 (MPEG-1/2 3-го уровня) или устройство кодирования AAC, описанные в стандарте MPEG-2/4. Альтернативные устройства кодирования аудио, обеспечивающие прозрачное или предпочтительно перцепционно прозрачное представление аудиосигнала 703 с ограниченной полосой частот, могут использоваться в устройстве 704 кодирования, чтобы генерировать полностью закодированный или перцепционно закодированный и перцепционно прозрачно закодированный аудиосигнал 705, соответственно. Верхняя полоса аудиосигнала выводится на выход 706 частью фильтрования верхних частот фильтра 702, обозначенной "HP". Прошедшая через фильтр верхних частот часть аудиосигнала, т.е. верхняя полоса или ВЧ полоса, также обозначаемая как ВЧ часть, поставляется на средство 707 вычисления параметров, которое выполнено с возможностью вычисления различных параметров (представляющих вспомогательную информацию, представляющую высокочастотную часть аудиосигнала). Этими параметрами являются, например, огибающая спектра верхней полосы 706 в относительно низком разрешении, к примеру, за счет представления коэффициента масштабирования для каждой группы частот на перцепционно адаптированной шкале (критические полосы), например, для каждой барк-полосы на шкале барков. Еще одним параметром, который может быть вычислен средством 707 вычисления параметров, является минимальный уровень шума в верхней полосе, чья энергия на полосе может быть связана с энергией огибающей в этой полосе. Дополнительными параметрами, которые могут быть вычислены средством 707 вычисления параметров, включают в себя меру тональности для каждой частичной полосы верхней полосы, которая указывает, как спектральная энергия распределяется в полосе, т.е. распределяется ли спектральная энергия в полосе относительно равномерно, причем в таком случае в этой полосе имеется атональный сигнал, или концентрируется ли энергия в полосе относительно сильно в определенном месте, причем в таком случае скорее тональный сигнал имеется для этой полосы. Дополнительные параметры содержат в себе явную кодировку пиков, относительно сильно выступающих в верхней полосе по высоте и частоте, как модель расширения полосы пропускания, при реконструкции без такой явной кодировки заметных синусоидальных участков в верхней полосе будет лишь восстановление один в один самым элементарным образом, или вообще не будет.

В любом случае, средство 707 вычисления параметров выполняется с возможностью генерирования параметров 708 только для верхней полосы, которая может быть подвергнута аналогичным этапам по снижению энтропии, поскольку они могут также выполняться в устройстве 704 кодирования аудио для квантованных спектральных значений, как, например дифференциальное кодирование, предсказание или кодирование по алгоритму Хаффмана, и т.д. Затем представление 708 параметров и аудиосигнал 705 поставляются на средство 709 форматирования потока данных, которое выполняется с возможностью предоставления на выходной стороне потока 710 данных, который обычно представляет собой битовый поток в определенном формате, как это, например, стандартизировано в Стандарте MPEG4.

Сторона декодера, которая была бы подходящей для настоящего изобретения, продемонстрирована на Фиг. 7b. Поток 710 данных вводится в средство 711 интерпретации потока данных, которое выполнено с возможностью отделения части 708 параметров от части 705 аудиосигнала. Часть 708 параметров декодируется декодером 712 параметров для получения декодированных параметров 713. Параллельно с этим, часть 705 аудиосигнала декодируется декодером 714 аудио для получения аудиосигнала 777, который представлен через 8 на Фиг. 6, например.

В зависимости от реализации, аудиосигнал 777 может быть выведен через первый выход 715. Тогда на выходе 715 может быть получен аудиосигнал с небольшой полосой пропускания и, следовательно, также и с низким качеством. Для повышения качества, однако, может быть выполнено расширение 720 полосы пропускания, используя подход настоящего изобретения, как описано ниже со ссылкой на Фиг. 1a, 1b и 2, чтобы получить аудиосигнал 112 на стороне выхода с расширенной или высокой полосой пропускания, соответственно, и с высоким качеством.

Один вариант осуществления устройства согласно настоящему изобретению для воспроизведения аудиосигнала и, тем самым, расширения его полосы пропускания, продемонстрирован на Фиг. 1a. Устройство содержит первое воспроизводящее средство 100, средство 102 предоставления, объединяющее средство 104 и второе воспроизводящее средство 106. В некоторых случаях может быть предусмотрен обнаружитель 108 перехода. Первое воспроизводящее средство 100 принимает на свой вход первые данные 120, представляющие кодированную версию первой части аудиоданных в первой частотной полосе. Например, первые данные 120 могут соответствовать части 705 аудиосигнала, показанной на Фиг. 4b. Первое воспроизводящее средство 100 воспроизводит аудиосигнал в первой частотной полосе на основании первых данных 120. Например, первое воспроизводящее средство 100 может быть образовано декодером 714 аудио, показанным на Фиг. 4b. Первое воспроизводящее средство 100 выводит аудиосигнал в первой частотной полосе, который может соответствовать аудиосигналу 777, показанному на Фиг. 4b. Аудиосигнал 777 поступает на средство 102 предоставления, которое предоставляет сигнал-заплату 122 во второй частотной полосе. Сигнал-заплата 122 является, по меньшей мере, частично некоррелированным относительно первой части аудиосигнала 777 или является, по меньшей мере, частично декоррелированной версией первой части аудиосигнала, которая была смещена во вторую частотную полосу. Аудиосигнал 777 и сигнал-заплата 122 объединяются, например суммируются, в объединяющем средстве 104. Объединенный сигнал 124 выводится и поступает на второе воспроизводящее средство 106. Второе воспроизводящее средство 106 принимает объединенный сигнал 124 и вторые данные 126, представляющие вспомогательную информацию о второй части аудиосигнала во второй частотной полосе. Например, вторые данные 126 могут соответствовать декодированным параметрам 713, описанным выше со ссылкой на Фиг. 4b. Второе воспроизводящее средство 106 воспроизводит аудиосигнал во второй частотной полосе на основании сигнала-заплатки (в составе объединенного сигнала 124) и на основании вторых данных 126.

В вариантах осуществления настоящего изобретения первая частотная полоса может соответствовать частотному диапазону, соотнесенному с первой частью аудиосигнала, показанного на Фиг. 7a, а вторая частотная полоса может соответствовать частотному диапазону, соотнесенному со второй частью аудиосигнала, показанного на Фиг. 7a.

В соответствии с вариантом осуществления, показанным на Фиг. 1a, второе воспроизводящее средство 106 выводит воспроизводимый аудиосигнал 128 с высокой полосой пропускания.

В альтернативном варианте осуществления, показанном на Фиг. 1b, выход средства 102 предоставления соединяется со вторым воспроизводящим средством 106, а выход второго воспроизводящего средства 106 соединяется с объединяющим средством 104. Таким образом, в соответствии с вариантом осуществления, показанным на Фиг. 1b, аудиосигнал 130 во второй частотной полосе воспроизводится из сигнала-заплаты, предоставленного средством 102 предоставления, до объединения сигнала-заплаты с первой частью 777 аудиосигнала. И вновь, второе воспроизводящее средство воспроизводит аудиосигнал 130 во второй частотной полосе на основании вторых данных 126 и сигнала-заплаты 122. В соответствии с вариантом осуществления, показанным на Фиг. 1b, объединяющее средство 104 выводит воспроизводимый аудиосигнал 128.

В вариантах осуществления настоящего изобретения средство предоставления содержит модуль смещения и декорреляционное средство, которые выполнены с возможностью генерирования сигнала-заплаты в виде декоррелированной версии первой части аудиосигнала, смещенной во вторую частотную полосу. В вариантах осуществления настоящего изобретения средство предоставления выполняется с возможностью предоставления синтезированного сигнала-заплаты, который является некоррелированным относительно первой части аудиосигнала. В вариантах осуществления настоящего изобретения средство предоставления выполнено с возможностью предоставления множества сигналов-заплат для множества верхних частотных полос. В таких вариантах осуществления второе воспроизводящее средство и второе объединяющее средство выполняются с возможностью воспроизведения множества вторых частей сигнала и объединения множества частей сигнала в воспроизводимый аудиосигнал.

Один из вариантов осуществления устройства для воспроизведения аудиосигнала с использованием расширения полосы пропускания, которое использует декоррелированные аудиосигналы частичной полосы, показан на Фиг. 2. Устройство принимает сигнал основной полосы от основного кодека, который может быть сигналом 777, показанным на Фиг. 4b. Сигнал 777 поступает на модуль 200 смещения. Модуль 200 смещения выполняется с возможностью смещения сигнала 777 из низкочастотного диапазона в высокочастотный диапазон, например, из частотного диапазона, соотнесенного с низкочастотной частью 4 на Фиг. 7a, в частотный диапазон, соотнесенный с высокочастотной частью 6 на Фиг. 7a.

Модуль 200 смещения может быть выполнен с возможностью простого повышающего копирования части 777 сигнала в высокочастотный диапазон в частотной области. В качестве альтернативы, модуль 200 смещения может быть реализован в виде модуля модуляции с одной боковой полосой, выполненного с возможностью и