Гармоническое расширение полосы аудиосигналов

Иллюстрации

Показать все

Изобретение относится к средствам для гармонического расширения полосы аудиосигналов. Технический результат заключается в повышении качества синтезированной части верхней полосы выходного сигнала. Разделяют, в устройстве, входной аудиосигнал на, по меньшей мере, сигнал нижней полосы и сигнал верхней полосы. Сигнал нижней полосы соответствует диапазону нижней полосы частот, и сигнал верхней полосы соответствует диапазону верхней полосы частот. Выбирают функцию нелинейной обработки из множества функций нелинейной обработки. Генерируют первый расширенный сигнал на основании сигнала нижней полосы и функции нелинейной обработки. Генерируют по меньшей мере один регулировочный параметр на основании первого расширенного сигнала, сигнала верхней полосы или их обоих. 6 н. и 44 з.п. ф-лы, 6 ил.

Реферат

I. Притязание на приоритет

[0001] По настоящей заявке испрашивается приоритет предварительной заявки на патент США № 61/939,585, поданной 13 февраля 2014 г., и обычной заявки на патент США № 14/617,524, поданной 9 февраля 2015 г., которые обе озаглавлены ʺHarmonic bandwidth extension of audio signalsʺ, содержание которых включено в настоящее описание изобретения посредством ссылки в полном объеме.

II. Область техники, к которой относится изобретение

[0002] Настоящее изобретение, в целом, относится к гармоническому расширению полосы аудиосигналов.

III. Уровень техники

[0003] Развитие технологии привело к появлению более компактных и более мощных вычислительных устройств. Например, в настоящее время известны различные портативные персональные вычислительные устройства, в том числе, беспроводные вычислительные устройства, например, портативные беспроводные телефоны, карманные персональные компьютеры (PDA), и пейджинговые устройства, которые малы, легки и легко переносятся пользователями. В частности, портативные беспроводные телефоны, например, сотовые телефоны и телефоны на основе интернет-протокола (IP), могут осуществлять связь посредством голоса и пакетов данных по беспроводным сетям. Дополнительно, многие такие беспроводные телефоны включают в себя другие типы устройств, которые встроены в них. Например, беспроводной телефон также может включать в себя цифровой фотоаппарат, цифровую видеокамеру, цифровое устройство записи и проигрыватель аудиофайлов.

[0004] В традиционных телефонных системах (например, коммутируемой телефонной сети общего пользования (PSTN)), полоса сигнала ограничивается диапазоном частот от 300 герц (Гц) до 3,4 килогерц (кГц). В широкополосных (WB) применениях, например, сотовой телефонии и передаче голоса по интернет-протоколу (VoIP), полоса сигнала может охватывать диапазон частот от 50 Гц до 7 кГц. Методы сверхширокополосного (SWB) кодирования поддерживают полосу, которая проходит до около 16 кГц. Расширение полосы сигнала от узкополосной телефонии на 3,4 кГц до SWB телефонии на 16 кГц может повышать качество реконструкции, разборчивость и естественность звучания сигнала.

[0005] Методы SWB кодирования обычно предусматривают кодирование и передачу более низкочастотной части сигнала (например, от 50 Гц до 7 кГц, также именуемой частью ʺнижней полосыʺ). Например, нижнюю полосу можно представить с использованием параметров фильтра и/или сигнала нижней полосы возбуждения. Для повышения эффективности кодирования, более высокочастотная часть сигнала (например, от 7 кГц до 16 кГц, также именуемая частью ʺверхней полосыʺ) может не полностью кодироваться и передаваться. Приемник может использовать моделирование сигнала для генерации синтезированного сигнала верхней полосы. В некоторых реализациях, данные, связанные с верхней полосой, может поступать на приемник для помощи в синтезе верхней полосе. Такие данные могут именоваться ʺпобочной информациейʺ, и могут включать в себя информацию коэффициента усиления, линейные спектральные частоты (LSF, также именуемые линейные спектральные пары (LSP)) и т.д. Побочную информацию можно генерировать, сравнивая сигнал верхней полосы и синтезированный сигнал верхней полосы, выведенный из сигнала нижней полосы. Например, синтезированный сигнал верхней полосы может базироваться на сигнале нижней полосы и нелинейной функции. Одна и та же нелинейная функция может использоваться для генерации синтезированного сигнала верхней полосы для сигналов нижней полосы, имеющих различные характеристики. Применение одной и той же нелинейной функции для сигналов, имеющих различные характеристики, может приводить к генерации синтезированного сигнала верхней полосы низкого качества в некоторых ситуациях (например, речи в отличие от музыки). В результате, синтезированный сигнал верхней полосы может слабо коррелировать с сигналом верхней полосы.

IV. Сущность изобретения

[0006] Раскрыты системы и способы для гармонического расширения полосы аудиосигналов. Кодер может использовать часть нижней полосы аудиосигнала для генерации информации (например, регулировочные параметры), используемой для реконструкции части верхней полосы аудиосигнала на декодере. Например, кодер может расширять часть нижней полосы аудиосигнала на основании характеристик части нижней полосы. Расширенная часть нижней полосы может иметь более широкую полосу, чем часть нижней полосы. Кодер может определять регулировочные параметры на основании расширенной части нижней полосы и части верхней полосы.

[0007] Кодер может использовать выбранную функцию нелинейной обработки для генерации расширенной части нижней полосы. Функцию нелинейной обработки можно выбирать из множества функций нелинейной обработки на основании характеристик части нижней полосы аудиосигнала. Аудиосигнал может соответствовать конкретному кадру или пакету аудио. Если часть нижней полосы указывает, что аудиосигнал является сильно периодическим (например, имеет сильные гармонические компоненты и/или соответствует речи), кодер сигнала может выбирать нелинейную функцию более высокого порядка. Если часть нижней полосы указывает, что аудиосигнал сильно зашумлен (например, соответствует музыке), кодер сигнала может выбирать нелинейную функцию более низкого порядка. Кодер может определять регулировочные параметры на основании сравнения части верхней полосы и расширенной части нижней полосы.

[0008] Декодер может принимать данные нижней полосы и регулировочные параметры от кодера. Декодер может генерировать синтезированный сигнал нижней полосы на основании данных нижней полосы. Декодер может генерировать синтезированную расширенную часть нижней полосы на основании синтезированного сигнала нижней полосы и выбранной функции нелинейной обработки. Декодер может генерировать синтезированный сигнал верхней полосы на основании синтезированной расширенной части нижней полосы и регулировочных параметров. Выходной сигнал можно генерировать путем объединения синтезированного сигнала нижней полосы и синтезированного сигнала верхней полосы на декодере.

[0009] В конкретном варианте осуществления, способ включает в себя разделение, в устройстве, входного аудиосигнала на, по меньшей мере, сигнал нижней полосы и сигнал верхней полосы. Сигнал нижней полосы соответствует диапазону нижней полосы частот, и сигнал верхней полосы соответствует диапазону верхней полосы частот. Способ также включает в себя выбор функции нелинейной обработки из множества функций нелинейной обработки. Способ дополнительно включает в себя генерацию первого расширенного сигнала на основании сигнала нижней полосы и функции нелинейной обработки. Способ также включает в себя генерацию по меньшей мере одного регулировочного параметра на основании первого расширенного сигнала, сигнала верхней полосы или их обоих.

[0010] В другом конкретном варианте осуществления, способ включает в себя прием, в устройстве, данных нижней полосы, соответствующих, по меньшей мере, сигналу нижней полосы входного аудиосигнала. Способ также включает в себя декодирование данных нижней полосы для генерации синтезированного аудиосигнала нижней полосы. Способ дополнительно включает в себя выбор функции нелинейной обработки из множества функций нелинейной обработки. Способ также включает в себя генерацию синтезированного аудиосигнала верхней полосы на основании синтезированного аудиосигнала нижней полосы и функции нелинейной обработки.

[0011] В другом конкретном варианте осуществления, устройство включает в себя память и процессор. Процессор выполнен с возможностью разделять входной аудиосигнал на, по меньшей мере, сигнал нижней полосы и сигнал верхней полосы. Сигнал нижней полосы соответствует диапазону нижней полосы частот, и сигнал верхней полосы соответствует диапазону верхней полосы частот. Процессор также выполнен с возможностью выбора функцию нелинейной обработки из множества функций нелинейной обработки. Процессор дополнительно выполнен с возможностью генерации первого расширенного сигнала на основании сигнала нижней полосы и функции нелинейной обработки. Процессор также выполнен с возможностью генерации по меньшей мере одного регулировочного параметра на основании первого расширенного сигнала, сигнала верхней полосы или их обоих.

[0012] В другом конкретном варианте осуществления, устройство включает в себя память и процессор. Процессор выполнен с возможностью принимать данные нижней полосы, соответствующие, по меньшей мере, сигналу нижней полосы входного аудиосигнала. Процессор также выполнен с возможностью декодировать данные нижней полосы для генерации синтезированного аудиосигнала нижней полосы. Процессор дополнительно выполнен с возможностью выбора функцию нелинейной обработки из множества функций нелинейной обработки. Процессор также выполнен с возможностью генерации синтезированного аудиосигнала верхней полосы на основании синтезированного аудиосигнала нижней полосы и функции нелинейной обработки.

[0013] В другом конкретном варианте осуществления, на компьютерно-читаемом запоминающем устройстве хранятся инструкции, которые, при выполнении процессором, предписывают процессору осуществлять операции, включающие в себя разделение входного аудиосигнала на, по меньшей мере, сигнал нижней полосы и сигнал верхней полосы. Сигнал нижней полосы соответствует диапазону нижней полосы частот, и сигнал верхней полосы соответствует диапазону верхней полосы частот. Операции также включают в себя выбор функции нелинейной обработки из множества функций нелинейной обработки. Операции дополнительно включают в себя генерацию первого расширенного сигнала на основании сигнала нижней полосы и функции нелинейной обработки. Операции также включают в себя генерацию по меньшей мере одного регулировочного параметра на основании первого расширенного сигнала, сигнала верхней полосы или их обоих.

[0014] В другом конкретном варианте осуществления, на компьютерно-читаемом запоминающем устройстве хранятся инструкции, которые, при выполнении процессором, предписывают процессору осуществлять операции, включающие в себя прием данных нижней полосы, соответствующих, по меньшей мере, сигналу нижней полосы входного аудиосигнала. Операции также включают в себя декодирование данных нижней полосы для генерации синтезированного аудиосигнала нижней полосы. Операции дополнительно включают в себя выбор функции нелинейной обработки из множества функций нелинейной обработки. Операции также включают в себя генерацию синтезированного аудиосигнала верхней полосы на основании синтезированного аудиосигнала нижней полосы и функции нелинейной обработки.

[0015] Конкретные преимущества, обеспеченные по меньшей мере одним из раскрытых вариантов осуществления, могут включать в себя повышение качества синтезированной части верхней полосы выходного сигнала. Качество выходного сигнала можно повысить путем генерации синтезированной части верхней полосы с использованием нелинейной функции, выбранной из нескольких доступных функций нелинейной обработки на основании звуковых характеристик части нижней полосы. Выбранная нелинейная функция может повышать корреляцию между частью верхней полосы входного сигнала на кодере и синтезированной частью верхней полосы выходного сигнала на декодере, как в речевых, так и неречевых (например, музыкальных) ситуациях. Другие аспекты, преимущества и признаки настоящего изобретения явствуют из обзора заявки, включающего в себя следующие разделы: краткое описание чертежей, подробное описание и формулу изобретения.

V. Краткое описание чертежей

[0016] Фиг. 1 - схема для иллюстрации конкретного варианта осуществления системы кодера, предназначенной для осуществления гармонического расширения полосы аудиосигналов;

[0017] фиг. 2 - схема другого конкретного варианта осуществления системы декодера, предназначенной для осуществления гармонического расширения полосы аудиосигналов;

[0018] фиг. 3 - схема другого конкретного варианта осуществления системы, предназначенной для осуществления гармонического расширения полосы аудиосигналов;

[0019] фиг. 4 - блок-схема операций для иллюстрации конкретного варианта осуществления способа осуществления гармонического расширения полосы аудиосигналов;

[0020] фиг. 5 - блок-схема операций для иллюстрации другого конкретного варианта осуществления способа осуществления гармонического расширения полосы аудиосигналов; и

[0021] фиг. 6 - блок-схема беспроводного устройства, предназначенного для осуществления операций обработки сигнала в соответствии с системами и способами, представленными на фиг. 1-5.

VI. Подробное описание

[0022] На фиг. 1 показана схема конкретного варианта осуществления системы кодера, предназначенной для осуществления гармонического расширения полосы аудиосигналов, которая в целом обозначена 100. В конкретном варианте осуществления, система 100 кодера может быть встроена в систему или устройство кодирования (или декодирования) (например, в беспроводной телефон или кодер/декодер (кодек)). В других вариантах осуществления, система 100 кодера может быть встроена в телевизионную приставку, музыкальный проигрыватель, видеопроигрыватель, увеселительное устройство, навигационное устройство, устройство связи, карманный персональный компьютер (PDA), устройство обработки данных фиксированного местоположения или компьютер.

[0023] Следует отметить, что в нижеследующем описании, различные функции, осуществляемые системой 100 кодера, показанной на фиг. 1 представлены как осуществляемые некоторыми компонентами или модулями. Это разделение компонентов и модулей служит только для иллюстрации и не подлежит рассмотрению в качестве ограничения. В альтернативном варианте осуществления, функция, осуществляемая конкретным компонентом или модулем, может делиться среди нескольких компонентов или модулей. Кроме того, в альтернативном варианте осуществления, два или более компонентов или модулей, показанных на фиг. 1 может быть встроено в единый компонент или модуль. Каждый компонент или модуль, представленный на фиг. 1, может быть реализован с использованием оборудования (например, устройства вентильной матрицы, программируемой пользователем (FPGA), специализированной интегральной схемы (ASIC), цифрового сигнального процессора (DSP), контроллера и т.д.), программного обеспечения (например, инструкций, исполняемых процессором) или любой их комбинации.

[0024] Система 100 кодера включает в себя набор 110 анализирующих фильтров, подключенный к кодеру 108 нижней полосы, блок 106 оценивания гармоничности, генератор 112 сигнала и блок 190 оценивания параметров. Генератор 112 сигнала подключен к фильтру 114 и смесителю 116. Генератор 112 сигнала может включать в себя блок 180 выбора функции.

[0025] В ходе эксплуатации, набор 110 анализирующих фильтров может принимать входной аудиосигнал 102. Например, входной аудиосигнал 102 может обеспечиваться микрофоном или другим устройством ввода. Входной аудиосигнал 102 может включать в себя речь, шум, музыку или их комбинацию. Входной аудиосигнал 102 может представлять собой сверхширокополосный (SWB) сигнал, который включает в себя данные в диапазоне частот от приблизительно 50 герц (Гц) до приблизительно 16 килогерц (кГц). Набор 110 анализирующих фильтров может разделять входной аудиосигнал 102 на несколько частей на основании частоты. Например, набор 110 анализирующих фильтров может разделять входной аудиосигнал 102, по меньшей мере, на сигнал 122 нижней полосы и сигнал 124 верхней полосы. В конкретном варианте осуществления, набор 110 анализирующих фильтров может включать в себя комплект наборов анализирующих фильтров. Комплект наборов анализирующих фильтров может разделять входной аудиосигнал 102, по меньшей мере, на сигнал 122 нижней полосы и сигнал 124 верхней полосы. В конкретном варианте осуществления, набор 110 анализирующих фильтров может генерировать более двух выходных сигналов.

[0026] В примере, показанном на фиг. 1, сигнал 122 нижней полосы и сигнал 124 верхней полосы занимают неперекрывающиеся полосы частот. Например, сигнал 122 нижней полосы и сигнал 124 верхней полосы могут занимать неперекрывающиеся полосы частот 50 Гц - 7 кГц и 7 кГц - 16 кГц, соответственно. В альтернативном варианте осуществления, сигнал 122 нижней полосы и сигнал 124 верхней полосы могут занимать неперекрывающиеся полосы частот 50 Гц - 8 кГц и 8 кГц - 16 кГц, соответственно. В еще одном альтернативном варианте осуществления, сигнал 122 нижней полосы и сигнал 124 верхней полосы перекрываются (например, 50 Гц - 8 кГц и 7 кГц - 16 кГц, соответственно), благодаря чему, фильтр низких частот и фильтр высоких частот набора 110 анализирующих фильтров могут иметь плавный спад, что позволяет упростить конструкцию и снизить стоимость фильтра низких частот и фильтра высоких частот. Перекрывание сигнала 122 нижней полосы и сигнала 124 верхней полосы также может обеспечивать плавное смешивание сигналов нижней полосы и верхней полосы в приемнике, что может давать меньше слышимых артефактов.

[0027] Следует отметить, что хотя пример, приведенный на фиг. 1, иллюстрирует обработку SWB сигнала, он служит только для иллюстрации и не подлежит рассмотрению в качестве ограничения. В альтернативном варианте осуществления, входной аудиосигнал 102 может представлять собой широкополосный (WB) сигнал, имеющий диапазон частот от приблизительно 50 Гц до приблизительно 8 кГц. В таком варианте осуществления, сигнал 122 нижней полосы может соответствовать диапазону частот от приблизительно 50 Гц до приблизительно 6,4 кГц, и сигнал 124 верхней полосы может соответствовать диапазону частот от приблизительно 6,4 кГц до приблизительно 8 кГц.

[0028] Набор 110 анализирующих фильтров может выдавать сигнал 122 нижней полосы на кодер 108 нижней полосы и может выдавать сигнал 124 верхней полосы на блок 190 оценивания параметров. Блок 190 оценивания параметров может быть выполнен с возможностью сравнения первого расширенного сигнала 182 и сигнала 124 верхней полосы для генерации одного или более регулировочных параметров 178, как описано здесь. Система 100 кодера может генерировать первый расширенный сигнал 182 на основании сигнала 122 нижней полосы и выбранной функции нелинейной обработки, как описано здесь. Смеситель 116 может быть выполнен с возможностью генерации первого расширенного сигнала 182 путем модуляции второго расширенного сигнала 172 с использованием шумового сигнала 176. Фильтр 114 может быть выполнен с возможностью генерации второго расширенного сигнала 172 путем фильтрации третьего расширенного сигнала 174 от генератора 112 сигнала.

[0029] Кодер 108 нижней полосы может принимать сигнал 122 нижней полосы от набора 110 анализирующих фильтров и может генерировать параметры 168 нижней полосы. Параметры 168 нижней полосы могут указывать характеристики сигнала 122 нижней полосы. Параметры 168 нижней полосы могут включать в себя значения, связанные с наклоном спектра, коэффициентом усиления основного тона, отставанием, речевым режимом или их комбинацией, сигнала 122 нижней полосы.

[0030] Наклон спектра может относиться к форме спектральной огибающей в полосе пропускания и может быть представлен квантованным первым коэффициентом отражения. Для вокализованных звуков, спектральная энергия может снижаться с увеличением частоты, из-за чего, первый коэффициент отражения отрицателен и может достигать -1. Невокализованные звуки могут либо иметь плоский спектр, в связи с чем, первый коэффициент отражения близок к нулю, либо иметь более высокую энергию на высоких частотах, в связи с чем, первый коэффициент отражения положителен и может достигать +1.

[0031] Речевой режим (также именуемый режимом вокализации) может указывать, представляет ли кадр аудио, связанный с сигналом 122 нижней полосы, вокализованный или невокализованный звук. Параметр речевого режима может иметь двоичное значение на основании одной или более мер периодичности (например, переходов через нуль, нормализованных автокорреляционных функций (NACF), коэффициента усиления основного тона и т.д.) и/или голосовой активности для кадра аудио, например, соотношения между такой меры и порогового значения. В других реализациях, параметр речевого режима может иметь одно или более других состояний для указания режимов, например, молчания или фонового шума, или перехода между молчанием и вокализованной речью. Кодер 108 нижней полосы может выдавать параметры 168 нижней полосы на генератор 112 сигнала.

[0032] В конкретном варианте осуществления, генератор 112 сигнала может генерировать сигнал 122 нижней полосы на основании параметров 168 нижней полосы. Например, генератор 112 сигнала может включать в себя локальный декодер (или имитатор декодера). Локальный декодер может имитировать поведение декодера на принимающем устройстве. Например, локальный декодер может быть выполнен с возможностью декодировать параметры 168 нижней полосы для генерации сигнала 122 нижней полосы. В альтернативном варианте осуществления, генератор 112 сигнала может принимать сигнал 122 нижней полосы от набора 110 анализирующих фильтров.

[0033] Блок 180 выбора функции может выбирать функцию нелинейной обработки из множества доступных функций 118 нелинейной обработки. Множество доступных функций 118 нелинейной обработки может включать в себя функцию абсолютного значения, функцию двухполупериодного выпрямления, функция однополупериодного выпрямления, квадратичную функцию, кубичную функцию, функцию четвертой степени, функцию отсечки или их комбинацию.

[0034] Блок 180 выбора функции может выбирать функцию нелинейной обработки на основании характеристики сигнала 122 нижней полосы. Для иллюстрации, блок 180 выбора функции может определять значению характеристики на основании параметров 168 нижней полосы или сигнала 122 нижней полосы. Коэффициент шума может указывать периодичность кадра аудио, соответствующего сигналу 122 нижней полосы. Например, коэффициент шума может соответствовать коэффициенту усиления основного тона, речевому режиму, наклону спектра, NACF, переходам через нуль или их комбинации, связанной с сигналом 122 нижней полосы. Если коэффициент шума удовлетворяет первому порогу шума, блок 180 выбора функции может выбирать первую функцию нелинейной обработки. Например, если коэффициент шума указывает, что сигнал 122 нижней полосы является сильно периодическим (например, соответствует речи), блок 180 выбора функции может выбирать степенную функцию высокого порядка (например, функцию четвертой степени). Если коэффициент шума удовлетворяет второму порогу шума, блок 180 выбора функции может выбирать вторую функцию нелинейной обработки. Например, если коэффициент шума указывает, что сигнал 122 нижней полосы не очень периодичен или шумоподобен (например, соответствует музыке), блок 180 выбора функции может выбирать степенную функцию низкого порядка (например, квадратичную функцию).

[0035] В конкретном варианте осуществления, блок 180 выбора функции может выбирать функцию нелинейной обработки из множества доступных функций 118 нелинейной обработки на кадре аудио на основе кадра аудио. Дополнительно, разные функции нелинейной обработки можно выбирать для последовательных кадров входного аудиосигнала 102. Таким образом, блок 180 выбора функции может выбирать первую функцию нелинейной обработки из множества функций нелинейной обработки в ответ на определение, что параметр, связанный с первым кадром аудио, удовлетворяет первому условию, и может выбирать вторую функцию нелинейной обработки из множества функций нелинейной обработки в ответ на определение, что параметр, связанный со вторым кадром аудио, удовлетворяет второму условию. В качестве иллюстративного примера, когда входной аудиосигнал 102 соответствует речи при выполнении телефонного вызова, можно применять другую функцию нелинейной обработки, чем когда входной аудиосигнал 102 соответствует музыке при удержании при выполнении телефонного вызова. В конкретном варианте осуществления, параметр, связанный с кадром, представляет собой один из режима кодирования, выбранного для кодирования сигнала нижней полосы, периодичности кадра, величины непериодического шума в кадре и наклона спектра, соответствующего кадру.

[0036] Генератор 112 сигнала может гармонически расширять спектр сигнала 122 нижней полосы для включения диапазона более высоких частот (например, диапазона частот, соответствующего сигналу 124 верхней полосы). Например, генератор 112 сигнала может повышать частоту дискретизации сигнала 122 нижней полосы. Частоту дискретизации сигнала 122 нижней полосы можно повышать для снижения наложение спектров после применения выбранной функции нелинейной обработки. В конкретном варианте осуществления, генератор 112 сигнала может повышать частоту дискретизации сигнала 122 нижней полосы с конкретным коэффициентом (например, 8). В конкретном варианте осуществления, операция повышения частоты дискретизации может включать в себя вставку нулей в сигнал 122 нижней полосы. Генератор 112 сигнала может генерировать третий расширенный сигнал 174 путем применения выбранной функции нелинейной обработки к сигналу с повышенной частотой дискретизации.

[0037] Фильтр 114 может принимать третий расширенный сигнал 174 от генератора 112 сигнала. Фильтр 114 может генерировать второй расширенный сигнал 172 путем фильтрации третьего расширенного сигнала 174. Например, фильтр 114 может понижать частоту дискретизации третьего расширенного сигнала 174 чтобы диапазон частот (например, 7 кГц - 16 кГц) второго расширенного сигнала 172 соответствовал диапазону частот, связанному с сигналами 124 верхней полосы. Для иллюстрации, фильтр 114 может применять операцию полосовой (например, высокоточной) фильтрации к третьему расширенному сигналу 174 для генерации второго расширенного сигнала 172. В конкретном варианте осуществления, фильтр 114 может применять линейное преобразование (например, дискретное косинусное преобразование (DCT)) к третьему расширенному сигналу 174 и может выбирать коэффициенты преобразования, соответствующие диапазону высоких частот (например, 7 кГц - 16 кГц). Фильтр 114 может выдавать второй расширенный сигнал 172 на смеситель 116.

[0038] Смеситель 116 может объединять второй расширенный сигнал 172 и шумовой сигнал 176. Смеситель 116 может принимать шумовой сигнал 176 от генератора шума (не показан). Генератор шума может быть выполнен с возможностью генерации белого псевдослучайного шумового сигнала с единичной дисперсией. В конкретном варианте осуществления, шумовой сигнал 176 может не быть белым и может иметь плотность мощности, которая изменяется с частотой. В конкретном варианте осуществления, генератор шума может быть выполнен с возможностью вывода шумового сигнала 176 в качестве детерминированной функции, которая может дублироваться на декодере принимающего устройства. Например, генератор шума может быть выполнен с возможностью генерации шумового сигнала 176 в качестве детерминированной функции параметров 168 нижней полосы.

[0039] Смеситель 116 может объединять первую долю шумового сигнала 176 и вторую долю второго расширенного сигнала 172. Например, смеситель 116 может генерировать первый расширенный сигнал 182, имеющий примерно такое же отношение энергии гармоник к энергии шума, как у сигнала 124 верхней полосы. Смеситель 116 может определять первую долю и вторую долю на основании коэффициента 170 гармоничности. Например, первая доля может быть выше, чем вторая доля, если коэффициент 170 гармоничности указывает, что сигнал 124 верхней полосы связан с невокализованным звуком (например, музыкой или шумом). В порядке другого примера, вторая доля может быть выше, чем первая доля, если коэффициент 170 гармоничности указывает, что сигнал 124 верхней полосы связан с вокализованной речью. В конкретном варианте осуществления, смеситель 116 может определять первую долю (или вторую долю) из коэффициента 170 гармоничности и может выводить вторую долю (или первую долю) согласно уравнению, например,

(первая доля)2+( вторая доля)2=1, (уравнение 1).

[0040] Альтернативно, смеситель 116 может выбирать, на основании коэффициента 170 гармоничности, соответствующая пара долей из множества пар долей, где пары заранее вычисляются для удовлетворения отношения при постоянной энергии, например, уравнения (1). Значения первой доли могут составлять от 0,1 до 0,7 и значения второй доли могут составлять от 0,7 до 1,0.

[0041] Блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании оценки характеристики (например, периодичности) входного аудиосигнала 102. В конкретном варианте осуществления, блок 106 оценивания гармоничности может генерировать коэффициент 170 гармоничности на основании по меньшей мере одного из сигнала 124 верхней полосы и параметров 168 нижней полосы. Например, блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании характеристик (например, периодичности) сигнала 122 нижней полосы, указанных параметрами 168 нижней полосы. Для иллюстрации, блок 106 оценивания гармоничности может присваивать значение коэффициенту 170 гармоничности, который пропорционален коэффициенту усиления основного тона. В порядке другого примера, блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании речевого режима. Для иллюстрации, коэффициент 170 гармоничности может иметь первое значение в соответствии с речевым режимом, указывающим вокализованный аудиосигнал (например, речь), и может иметь второе значение в соответствии с речевым режимом, указывающим невокализованный аудиосигнал (например, музыку).

[0042] В порядке другого примера, блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании характеристик (например, периодичности) сигнала 124 верхней полосы. Для иллюстрации, блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании максимального значения коэффициента автокорреляции сигнала 124 верхней полосы, где автокорреляция осуществляется в диапазоне поиска, который включает в себя задержку одного отставания основного тона и не включает в себя задержку нуля выборок. В конкретном варианте осуществления, блок 106 оценивания гармоничности может генерировать параметры фильтрации верхней полосы, соответствующие сигналу 124 верхней полосы и может определять характеристики сигнала 124 верхней полосы на основании параметров фильтрации верхней полосы.

[0043] В конкретном варианте осуществления, блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании другого указателя периодичности (например, коэффициента усиления основного тона) и порогового значения. Например, блок 106 оценивания гармоничности может осуществлять операцию автокорреляции на сигнале 124 верхней полосы, если коэффициент усиления основного тона, указанный параметрами 168 нижней полосы, удовлетворяет первому пороговому значению (например, больше или равен 0,5). В порядке другого примера, блок 106 оценивания гармоничности может осуществлять операцию автокорреляции, если речевой режим указывает конкретное состояние (например, вокализованную речь). Коэффициент 170 гармоничности может иметь значение, принятое по умолчанию, если коэффициент усиления основного тона не удовлетворяет первому пороговому значению и/или если речевой режим указывает другие состояния.

[0044] Блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании характеристик, отличных от периодичности или помимо нее. Например, значение коэффициента гармоничности может различаться для речевых сигналов, имеющих большое отставание основного тона, и речевых сигналов, имеющих малое отставание основного тона. В конкретном варианте осуществления, блок 106 оценивания гармоничности может определять коэффициент 170 гармоничности на основании меры энергии сигнала 124 верхней полосы на частотах, кратных основной частоте относительно меры энергии сигнала 124 верхней полосы на других частотных компонентов.

[0045] Блок 106 оценивания гармоничности может выдавать коэффициент 170 гармоничности на смеситель 116. Смеситель 116 может генерировать первый расширенный сигнал 182 на основании коэффициента 170 гармоничности, как описано здесь. Смеситель 116 может выдавать первый расширенный сигнал 182 на блок 190 оценивания параметров.

[0046] Блок 190 оценивания параметров может генерировать регулировочные параметры 178 на основании по меньшей мере одного из сигнала 124 верхней полосы и первого расширенного сигнала 182. Например, блок 190 оценивания параметров может генерировать регулировочные параметры 178 на основании соотношения между сигналом 124 верхней полосы и первым расширенным сигналом 182, например, разность или отношение энергий двух сигналов. В конкретном варианте осуществления, регулировочные параметры 178 могут соответствовать одному или более параметрам регулировки коэффициента усиления, указывающим разность или отношение энергий двух сигналов. В альтернативном варианте осуществления, регулировочные параметры 178 могут соответствовать квантованному индексу параметров регулировки коэффициента усиления. В конкретном варианте осуществления, регулировочные параметры 178 могут включать в себя параметры верхней полосы, указывающие характеристики сигнала 124 верхней полосы. В конкретном варианте осуществления, блок 190 оценивания параметров может генерировать регулировочные параметры 178 на основании сигнала 124 верхней полосы и не на основании первого расширенного сигнала 182.

[0047] Блок 190 оценивания параметров может выдавать регулировочные параметры 178, и кодер 108 нижней полосы может выдавать параметры 168 нижней полосы на мультиплексор (MUX). MUX может мультиплексировать регулировочные параметры 178 и параметры 168 нижней полосы для генерации выходного битового потока. Выходной битовый поток может представлять кодированный аудиосигнал, соответствующий входному аудиосигналу 102. Например, MUX может быть выполнен с возможностью вставки регулировочных параметров 178 в кодированную версию входного аудиосигнала 102 для обеспечения регулировки коэффициента усиления при выполнении воспроизведения входного аудиосигнала 102. Выходной битовый поток может передаваться (например, по проводному, беспроводному или оптическому каналу) передатчиком и/или сохраняться. На принимающем устройстве, обратные операции могут осуществляться демультиплексором (DEMUX), декодером нижней полосы, декодером верхней полосы и набором фильтров для генерации аудиосигнала (например, реконструированной версии входного аудиосигнала 102, который поступает на громкоговоритель или другое устройство вывода), как описано со ссылкой на фиг. 2. В конкретном варианте осуществления, блок 106 оценивания гармоничности может выдавать коэффициент 170 гармоничности на MUX, и MUX может включать в себя коэффициент 170 гармоничности в выходном битовом потоке.

[0048] Система 100 кодера генерирует синтезированный сигнал верхней полосы (например, первый расширенный сигнал 182), на кодере, с использованием функции нелинейной обработки, выбранной на основании характеристик сигнала 122 нижней полосы. Использование выбранной функции нелинейной обработки может повышать корреляцию между синтезированным сигналом верхней полосы и сигналом 124 верхней полосы в вокализованном и невокализованном случаях.

[0049] На фиг. 2 показан конкретный вариант осуществления системы декодера, предназначенной для осуществления гармонического расширения полосы аудиосигналов, которая, в целом, обозначена 200. Система 100 кодера и система 200 декодера могут быть включены в единое устройство или в раздельные устройства.

[0050] В конкретном варианте осуществления, система 200 декодера может быть встроена в систему или устройство кодирования (или декодирования) (например, в беспроводной телефон или кодер/декодер (кодек)). В других вариантах осуществления, система 200 декодера может быть встроена в телевизионную приставку, музыкальный проигрыватель, видеопроигрыватель, увеселительное устройство, навигационное устройство, устройство связи, карманный персональный компьютер (PDA), устройство обработки данных фиксированного местоположения или компьютер.

[0051] Следует отметить, что в нижеследующем описании, различные функции, осуществляемые системой 200 декоде