Системы и способы выполнения шумовой модуляции и регулировки усиления

Иллюстрации

Показать все

Изобретение относится к средствам для выполнения шумовой модуляции и регулировки усиления. Технический результат заключается в повышении качества сигнала за счет компенсации зашумления и искажения вследствие ошибок квантования. Принимают первое значение коэффициента смешения. Первое значение соответствует первой части аудиосигнала, принимаемого в аудиокодере. Принимают второе значение коэффициента смешения. Второе значение соответствует второй части аудиосигнала. Формируют третье значение коэффициента смешения, по меньшей мере, частично на основе первого значения и второго значения и смешение сигнала возбуждения с модулированным шумом на основе третьего значения. Определяют первый набор спектральных значений частоты, соответствующих аудиосигналу, и определяют второй набор спектральных значений частоты, который аппроксимирует первый набор спектральных значений частоты. Значение усиления, соответствующее, по меньшей мере, части аудиосигнала, регулируется на основе разности между первым набором и вторым набором. 4 н. и 45 з.п. ф-лы, 7 ил.

Реферат

ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИ

[0001] Настоящая заявка испрашивает приоритет находящейся в общей собственности предварительной заявки на патент (США) № 61/762810, поданной 8 февраля 2013 года, и непредварительной заявки на патент (США) № 14/012749, поданной 28 августа 2013 года, содержимое которых полностью содержится в данном документе по ссылке в явном виде.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0002] Настоящее раскрытие сущности, в общем, относится к обработке сигналов.

ОПИСАНИЕ ПРЕДШЕСТВУЮЩЕГО УРОВНЯ ТЕХНИКИ

[0003] Технологические усовершенствования привели к более компактным и обладающим большой вычислительной мощностью вычислительным устройствам. Например, сегодня существует множество портативных персональных вычислительных устройств, в том числе беспроводные вычислительные устройства, такие как портативные беспроводные телефоны, персональные цифровые устройства (PDA) и устройства для поисковых вызовов, которые являются небольшими, легкими и удобно носятся пользователями. Более конкретно, портативные беспроводные телефоны, такие как сотовые телефоны и телефоны по Интернет-протоколу (IP), могут передавать речевые пакеты и пакеты данных по беспроводным сетям. Дополнительно, многие такие беспроводные телефоны включают в себя другие типы устройств, которые содержатся в них. Например, беспроводной телефон также может включать в себя цифровой фотоаппарат, цифровую видеокамеру, цифровое записывающее устройство и проигрыватель аудиофайлов.

[0004] В традиционных телефонных системах (например, в коммутируемых телефонных сетях общего пользования (PSTN)), полоса пропускания сигнала ограничена частотным диапазоном от 300 герц (Гц) до 3,4 килогерц (кГц). В широкополосных (WB) вариантах применения, таких как сотовая телефония и протокол "речь-по-IP" (VoIP), полоса пропускания сигнала может охватывать частотный диапазон от 50 Гц до 7 кГц. Технологии сверхширокополосного (SWB) кодирования поддерживают полосу пропускания, которая расширяется приблизительно до 16 кГц. Расширение полосы пропускания сигнала от узкополосной телефонии в 3,4 кГц до SWB-телефонии в 16 кГц позволяет повышать качество восстановления сигналов, разборчивость и естественность.

[0005] Технологии SWB-кодирования типично заключают в себе кодирование и передачу части нижних частот сигнала (например, от 50 Гц до 7 кГц, также называемой "полосой низких частот"). Например, полоса низких частот может быть представлена с использованием параметров фильтрации и/или сигнала возбуждения в полосе низких частот. Тем не менее, для того чтобы повышать эффективность кодирования, часть верхних частот сигнала (например, от 7 кГц до 16 кГц, также называемая "полосой высоких частот") может не полностью кодироваться и передаваться. Вместо этого приемное устройство может использовать моделирование прохождения сигналов для того, чтобы прогнозировать полосу высоких частот. В некоторых реализациях данные, ассоциированные с полосой высоких частот, могут предоставляться в приемное устройство для того, чтобы помогать в прогнозировании. Такие данные могут упоминаться в качестве "вспомогательной информации" и могут включать в себя информацию усиления, частоты спектральных линий (LSF, также называемые "парами спектральных линий (LSP)") и т.д. Прогнозирование в полосе высоких частот с использованием модели прохождения сигналов может быть приемлемо точным, когда сигнал полосы низких частот достаточно коррелирован с сигналом полосы высоких частот. Тем не менее, при наличии шума, корреляция между полосой низких частот и полосой высоких частот может быть слабой, и модель прохождения сигналов более не может иметь возможность точно представлять полосу высоких частот. Это может приводить к артефактам (например, искаженной речи) в приемном устройстве.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0006] Раскрыты системы и способы выполнения шумовой модуляции и регулировки усиления. Например, кодирование полосы высоких частот может заключать в себе формирование сигнала возбуждения в полосе высоких частот на основе сигнала возбуждения в полосе низких частот, сформированного с использованием анализа полосы низких частот (например, анализа на основе линейного прогнозирования (LP) полосы низких частот). Сигнал возбуждения в полосе высоких частот может формироваться посредством смешения преобразованного сигнала возбуждения в полосе низких частот с модулированным шумом (например, белым шумом). Соотношение, с которым смешиваются преобразованный сигнал возбуждения в полосе низких частот и модулированный шум, может оказывать влияние на качество восстановления сигналов. При наличии шума, который снижает корреляцию между полосой низких частот и полосой высоких частот, преобразованный сигнал возбуждения в полосе низких частот может быть недостаточным для синтеза полосы высоких частот. Например, синтезированный сигнал возбуждения в полосе высоких частот может вводить слышимые артефакты. В соответствии с описанными технологиями шумовая модуляция и/или регулировка усиления может выполняться для того, чтобы снижать такие артефакты. Выполнение шумовой модуляции может включать в себя адаптивное сглаживание отношения возбуждения в полосе низких частот к модулированному шуму, используемому для синтеза полосы высоких частот. Выполнение регулировки усиления может включать в себя определение параметра(ов) усиления, которые следует включать во вспомогательную информацию полосы высоких частот на основе искажения при квантовании.

[0007] В конкретном варианте осуществления способ включает в себя прием первого значения коэффициента смешения. Первое значение соответствует первой части аудиосигнала, принимаемого в аудиокодере. Способ включает в себя прием второго значения коэффициента смешения. Второе значение соответствует второй части аудиосигнала. Способ включает в себя формирование третьего значения коэффициента смешения, по меньшей мере, частично на основе первого значения и второго значения. Способ также включает в себя смешение сигнала возбуждения с модулированным шумом на основе третьего значения коэффициента смешения.

[0008] В другом конкретном варианте осуществления способ включает в себя определение первого набора спектральных значений частоты, соответствующих аудиосигналу, и определение второго набора спектральных значений частоты, который аппроксимирует первый набор спектральных значений частоты. Способ также включает в себя регулирование значения усиления, соответствующего, по меньшей мере, части аудиосигнала, на основе разности между первым набором и вторым набором.

[0009] В другом конкретном варианте осуществления устройство включает в себя фильтр, выполненный с возможностью формировать третье значение коэффициента смешения, по меньшей мере, частично на основе первого значения коэффициента смешения и второго значения коэффициента смешения. Первое значение соответствует первой части аудиосигнала, а второе значение соответствует второй части аудиосигнала. Устройство также включает в себя микшер, выполненный с возможностью принимать третье значение и формировать сигнал возбуждения в полосе высоких частот, соответствующий части полосы высоких частот аудиосигнала, посредством формирования модулированного шума и комбинирования модулированного шума и преобразованной версии сигнала возбуждения в полосе низких частот. Сигнал возбуждения в полосе низких частот соответствует части полосы низких частот аудиосигнала. Микшер выполнен с возможностью комбинировать модулированный шум и преобразованную версию сигнала возбуждения в полосе низких частот на основе третьего значения.

[0010] В другом конкретном варианте осуществления устройство включает в себя аналитический фильтр, выполненный с возможностью определять первый набор спектральных значений частоты, соответствующих аудиосигналу. Устройство включает в себя квантователь, выполненный с возможностью формировать второй набор спектральных значений частоты, который аппроксимирует первый набор спектральных значений частоты. Устройство также включает в себя схему усиления, выполненную с возможностью регулировать значение усиления, соответствующее, по меньшей мере, части аудиосигнала, на основе разности между первым набором и вторым набором.

[0011] В другом конкретном варианте осуществления устройство включает в себя средство для формирования третьего значения коэффициента смешения, по меньшей мере, частично на основе первого значения коэффициента смешения и второго значения коэффициента смешения. Первое значение соответствует первой части аудиосигнала, принимаемого в аудиокодере, а второе значение соответствует второй части аудиосигнала. Устройство включает в себя средство для формирования сигнала возбуждения в полосе высоких частот, соответствующего части полосы высоких частот аудиосигнала, посредством комбинирования модулированного шума и преобразованной версии сигнала возбуждения в полосе низких частот. Сигнал возбуждения в полосе низких частот соответствует части полосы низких частот аудиосигнала. Средство для формирования выполнено с возможностью комбинировать модулированный шум и преобразованную версию сигнала возбуждения в полосе низких частот на основе третьего значения.

[0012] В другом конкретном варианте осуществления устройство включает в себя средство для определения первого набора спектральных значений частоты, соответствующих аудиосигналу. Устройство также включает в себя средство для формирования второго набора спектральных значений частоты, который аппроксимирует первый набор спектральных значений частоты. Устройство также включает в себя средство для регулирования значения усиления, соответствующего, по меньшей мере, части аудиосигнала, на основе разности между первым набором и вторым набором.

[0013] В другом конкретном варианте осуществления невременный машиночитаемый носитель включает в себя инструкции, которые при выполнении посредством компьютера инструктируют компьютеру принимать первое значение коэффициента смешения. Первое значение соответствует первой части аудиосигнала, принимаемого в аудиокодере. Инструкции также исполняются, чтобы инструктировать компьютеру принимать второе значение коэффициента смешения. Второе значение соответствует второй части аудиосигнала. Инструкции также исполняются, чтобы инструктировать компьютеру формировать третье значение коэффициента смешения, по меньшей мере, частично на основе первого значения и второго значения. Инструкции также исполняются, чтобы инструктировать компьютеру смешивать сигнал возбуждения с модулированным шумом на основе третьего значения коэффициента смешения.

[0014] В другом конкретном варианте осуществления невременный машиночитаемый носитель включает в себя инструкции, которые при выполнении посредством компьютера, инструктируют компьютеру определять первый набор спектральных значений частоты, соответствующих аудиосигналу. Инструкции также исполняются, чтобы определять второй набор спектральных значений частоты, который аппроксимирует первый набор спектральных значений частоты. Инструкции также исполняются, чтобы регулировать значение усиления, соответствующее, по меньшей мере, части аудиосигнала, на основе разности между первым набором и вторым набором.

[0015] Конкретные преимущества, предоставленные посредством, по меньшей мере, одного из раскрытых вариантов осуществления, включают в себя способность выполнять шумовую модуляцию и/или регулировку усиления, чтобы компенсировать зашумленные условия. Например, шумовая модуляция может противодействовать большим флуктуациям в параметре смешения, используемом во время синтеза полосы высоких частот. В качестве другого примера регулировка усиления может компенсировать спектральное искажение вследствие ошибки квантования. Другие аспекты, преимущества и признаки настоящего изобретения должны становиться очевидными из прочтения всей заявки, включающей в себя следующие разделы: "Краткое описание чертежей", "Подробное описание изобретения" и "Формула изобретения".

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0016] Фиг. 1 является схемой, которая иллюстрирует конкретный вариант осуществления системы, которая выполнена с возможностью осуществлять шумовую модуляцию и регулировку усиления;

[0017] Фиг. 2 является схемой, которая иллюстрирует конкретный вариант осуществления компонентов системы по фиг. 1;

[0018] Фиг. 3 является графиком, который иллюстрирует конкретный вариант осуществления преобразования между коэффициентом усиления и спектральным искажением;

[0019] Фиг. 4 является схемой, которая иллюстрирует конкретный вариант осуществления формирователя возбуждения в полосе высоких частот по фиг. 1;

[0020] Фиг. 5 является блок-схемой последовательности операций способа, которая иллюстрирует конкретный вариант осуществления способа выполнения шумовой модуляции;

[0021] Фиг. 6 является блок-схемой последовательности операций способа, которая иллюстрирует конкретный вариант осуществления способа выполнения регулировки усиления; и

[0022] Фиг. 7 является блок-схемой беспроводного устройства, выполненного с возможностью осуществлять операции обработки сигналов в соответствии с системами и способами фиг. 1-6.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0023] Ссылаясь на фиг. 1, показан конкретный вариант осуществления системы, которая выполнена с возможностью осуществлять шумовую модуляцию и регулировку усиления и в общем обозначается 100. В конкретном варианте осуществления система 100 может быть интегрирована в систему или устройство кодирования (например, в беспроводном телефоне или в кодере/декодере (кодеке)).

[0024] Следует отметить, что в нижеприведенном описании различные функции, выполняемые посредством системы 100 по фиг. 1, описываются как выполняемые посредством определенных компонентов или модулей. Тем не менее, это разделение компонентов и модулей служит только для иллюстрации. В альтернативном варианте осуществления функция, выполняемая посредством конкретного компонента или модуля, вместо этого может быть разделена между несколькими компонентами или модулями. Кроме того, в альтернативном варианте осуществления два или более компонентов или модулей по фиг. 1 могут быть интегрированы в один компонент или модуль. Каждый компонент или модуль, проиллюстрированный на фиг. 1, может реализовываться с использованием аппаратных средств (например, устройства на основе программируемой пользователем вентильной матрицы (FPGA), специализированной интегральной схемы (ASIC), процессора цифровых сигналов (DSP), контроллера и т.д.), программного обеспечения (например, инструкций, выполняемых посредством процессора) или любой комбинации вышеозначенного.

[0025] Система 100 включает в себя гребенку 110 аналитических фильтров, которая выполнена с возможностью принимать входной аудиосигнал 102. Например, входной аудиосигнал 102 может предоставляться посредством микрофона или другого устройства ввода. В конкретном варианте осуществления входной аудиосигнал 102 может включать в себя речь. Входной аудиосигнал может представлять собой сверхширокополосный (SWB) сигнал, который включает в себя данные в частотном диапазоне приблизительно от 50 герц (Гц) до 16 килогерц (кГц). Гребенка 110 аналитических фильтров может фильтровать входной аудиосигнал 102 в нескольких частях на основе частоты. Например, гребенка 110 аналитических фильтров может формировать сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот. Сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут иметь равные или неравные полосы пропускания и могут быть перекрывающимися или неперекрывающимися. В альтернативном варианте осуществления гребенка 110 аналитических фильтров может формировать более двух выводов.

[0026] В примере по фиг. 1 сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот занимают неперекрывающиеся полосы частот. Например, сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут занимать неперекрывающиеся полосы частот в 50 Гц – 7 кГц и 7 кГц – 16 кГц. В альтернативном варианте осуществления сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут занимать неперекрывающиеся полосы частот в 50 Гц – 8 кГц и 8 кГц – 16 кГц. В еще одном другом альтернативном варианте осуществления сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот перекрываются (например, 50 Гц – 8 кГц и 7 кГц – 16 кГц), что может обеспечивать возможность фильтру нижних частот и фильтру верхних частот гребенки 110 аналитических фильтров иметь плавный спад, что позволяет упрощать проектное решение и сокращать затраты фильтра нижних частот и фильтра верхних частот. Перекрытие сигнала 122 полосы низких частот и сигнала 124 полосы высоких частот также позволяет обеспечивать плавное смешивание сигналов полосы низких частот и полосы высоких частот в приемном устройстве, что может приводить к меньшим слышимым артефактам.

[0027] Следует отметить, что хотя пример по фиг. 1 иллюстрирует обработку SWB-сигнала, это служит только для иллюстрации. В альтернативном варианте осуществления входной аудиосигнал 102 может представлять собой широкополосный (WB) сигнал, имеющий частотный диапазон приблизительно от 50 Гц до 8 кГц. В таком варианте осуществления сигнал 122 полосы низких частот может соответствовать частотному диапазону приблизительно от 50 Гц до 6,4 кГц и сигнал 124 полосы высоких частот может соответствовать частотному диапазону приблизительно от 6,4 кГц до 8 кГц. Также следует отметить, что различные системы и способы в данном документе описываются как обнаруживающие шум полосы высоких частот и выполняющие различные операции в ответ на шум полосы высоких частот. Тем не менее, это служит только для примера. Технологии, проиллюстрированные со ссылкой на фиг. 1-7, также могут выполняться в контексте шума полосы низких частот.

[0028] Система 100 может включать в себя модуль 130 анализа полосы низких частот, выполненный с возможностью принимать сигнал 122 полосы низких частот. В конкретном варианте осуществления модуль 130 анализа полосы низких частот может представлять вариант осуществления кодера на основе линейного прогнозирования с возбуждением по коду (CELP). Модуль 130 анализа полосы низких частот может включать в себя модуль 132 анализа и кодирования на основе линейного прогнозирования (LP), модуль 134 преобразования коэффициентов линейного прогнозирования (LPC) в пары спектральных линий (LSP) и квантователь 136. LSP также могут упоминаться в качестве частот спектральных линий (LSF), и эти два термина могут использоваться взаимозаменяемо в данном документе. Модуль 132 LP-анализа и кодирования может кодировать спектральную огибающую сигнала 122 полосы низких частот в качестве набора LPC. LPC могут формироваться для каждого кадра аудио (например, 20 миллисекунд (мс) аудио, соответствующего 320 выборкам на частоте дискретизации 16 кГц), каждого субкадра аудио (например, 5 мс аудио) или любой комбинации вышеозначенного. Число LPC, сформированных для каждого кадра или субкадра, может определяться посредством "порядка" выполняемого LP-анализа. В конкретном варианте осуществления модуль 132 LP-анализа и кодирования может формировать набор из одиннадцати LPC, соответствующих LP-анализу десятого порядка.

[0029] Модуль 134 преобразования LPC в LSP может преобразовывать набор LPC, сформированных посредством модуля 132 LP-анализа и кодирования, в соответствующий набор LSP (например, с использованием преобразования "один-к-одному"). Альтернативно, набор LPC может преобразовываться "один-к-одному" в соответствующий набор ParCor-коэффициентов, значений логарифмического отношения площадей, пар спектральных иммитансов (ISP) или частот спектральных иммитансов (ISF). Преобразование между набором LPC и набором LSP может быть обратимым без ошибки.

[0030] Квантователь 136 может квантовать набор LSP, сформированных посредством модуля 134 преобразования. Например, квантователь 136 может включать в себя или соединяться с несколькими таблицами кодирования, которые включают в себя несколько записей (например, векторов). Чтобы квантовать набор LSP, квантователь 136 может идентифицировать записи таблиц кодирования, которые являются "ближайшими" (например, на основе показателя искажения, такого как наименьшие квадраты или среднеквадратическая ошибка) к набору LSP. Квантователь 136 может выводить значение индекса или последовательность значений индекса, соответствующих местоположению идентифицированных записей в таблице кодирования. Вывод квантователя 136 в силу этого может представлять параметры фильтрации полосы низких частот, которые включены в поток 142 битов полосы низких частот.

[0031] Модуль 130 анализа полосы низких частот также может формировать сигнал 144 возбуждения в полосе низких частот. Например, сигнал 144 возбуждения в полосе низких частот может представлять собой кодированный сигнал, который формируется посредством квантования остаточного LP-сигнала, который формируется во время LP-процесса, выполняемого посредством модуля 130 анализа полосы низких частот. Остаточный LP-сигнал может представлять ошибку прогнозирования.

[0032] Система 100 дополнительно может включать в себя модуль 150 анализа полосы высоких частот, выполненный с возможностью принимать сигнал 124 полосы высоких частот из гребенки 110 аналитических фильтров и сигнал 144 возбуждения в полосе низких частот из модуля 130 анализа полосы низких частот. Модуль 150 анализа полосы высоких частот может формировать вспомогательную информацию 172 полосы высоких частот на основе сигнала 124 полосы высоких частот и сигнала 144 возбуждения в полосе низких частот. Например, вспомогательная информация 172 полосы высоких частот может включать в себя LSP полосы высоких частот и/или информацию усиления (например, на основе, по меньшей мере, отношения энергии полосы высоких частот к энергии полосы низких частот), как подробнее описано в данном документе.

[0033] Модуль 150 анализа полосы высоких частот может включать в себя формирователь 160 возбуждения в полосе высоких частот. Формирователь 160 возбуждения в полосе высоких частот может формировать сигнал 161 возбуждения в полосе высоких частот посредством расширения спектра сигнала 144 возбуждения в полосе низких частот до частотного диапазона полосы высоких частот (например, 7 кГц – 16 кГц). В качестве иллюстрации, формирователь 160 возбуждения в полосе высоких частот может применять преобразование к сигналу возбуждения в полосе низких частот (например, нелинейное преобразование, такое как операция в абсолютных значениях или в квадрате) и может смешивать преобразованный сигнал возбуждения в полосе низких частот с шумовым сигналом (например, белым шумом, модулированным согласно огибающей, соответствующей сигналу 144 возбуждения в полосе низких частот, который имитирует медленно варьирующиеся временные характеристики сигнала 122 полосы низких частот), с тем чтобы формировать сигнал 161 возбуждения в полосе высоких частот. Например, смешение может выполняться согласно следующему уравнению:

Возбуждение в полосе высоких частот=(α*преобразованное возбуждение в полосе низких частот)+((1-α)*модулированный шум)

[0034] Соотношение, с которым смешиваются преобразованный сигнал возбуждения в полосе низких частот и модулированный шум, может оказывать влияние на качество восстановления в полосе высоких частот в приемном устройстве. Для вокализованных речевых сигналов смешение может сдвигаться к преобразованному возбуждению в полосе низких частот (например, коэффициент α смешения может находиться в диапазоне 0,5-1,0). Для невокализованных сигналов смешение может сдвигаться к модулированному шуму (например, коэффициент α смешения может находиться в диапазоне 0,0-0,5). Иллюстративный вариант осуществления формирователя 160 возбуждения в полосе высоких частот подробнее описывается относительно фиг. 4.

[0035] Сигнал 161 возбуждения в полосе высоких частот может использоваться для того, чтобы определять один или более параметров усиления полосы высоких частот, которые включены во вспомогательную информацию 172 полосы высоких частот. Как проиллюстрировано, модуль 150 анализа полосы высоких частот также может включать в себя модуль 152 LP-анализа и кодирования, модуль 154 преобразования LPC в LSP и квантователь 156. Каждый из модуля 152 LP-анализа и кодирования, модуля 154 преобразования и квантователя 156 может функционировать так, как описано выше в отношении соответствующих компонентов модуля 130 анализа полосы низких частот, но при сравнительно уменьшенном разрешении (например, с использованием меньшего числа битов для каждого коэффициента, LSP и т.д.). Модуль 152 LP-анализа и кодирования может формировать набор LPC, которые преобразованы в LSP посредством модуля 154 преобразования и квантованы посредством квантователя 156 на основе таблицы 163 кодирования. Например, модуль 152 LP-анализа и кодирования, модуль 154 преобразования и квантователь 156 могут использовать сигнал 124 полосы высоких частот, чтобы определять информацию фильтрации полосы высоких частот (например, LSP полосы высоких частот), которая включена во вспомогательную информацию 172 полосы высоких частот. В конкретном варианте осуществления вспомогательная информация 172 полосы высоких частот может включать в себя LSP полосы высоких частот, а также параметры усиления полосы высоких частот. При наличии определенных типов шума параметры усиления полосы высоких частот могут формироваться как результат регулировки усиления, выполняемой посредством модуля 162 регулировки усиления, как подробнее описано в данном документе.

[0036] Поток 142 битов полосы низких частот и вспомогательная информация 172 полосы высоких частот могут мультиплексироваться посредством мультиплексора (мультиплексора) 180, с тем чтобы формировать выходной поток 192 битов. Выходной поток 192 битов может представлять кодированный аудиосигнал, соответствующий входному аудиосигналу 102. Например, выходной поток 192 битов может передаваться (например, по проводному, беспроводному или оптическому каналу) и/или сохраняться. В приемном устройстве обратные операции могут выполняться посредством демультиплексора (демультиплексора), декодера полосы низких частот, декодера полосы высоких частот и гребенки фильтров, с тем чтобы формировать аудиосигнал (например, восстановленную версию входного аудиосигнала 102, который предоставляется в динамик или другое устройство вывода). Число битов, используемых для того, чтобы представлять поток 142 битов полосы низких частот, может быть более существенно большим числа битов, используемых для того, чтобы представлять вспомогательную информацию 172 полосы высоких частот. Таким образом, большая часть битов в выходном потоке 192 битов может представлять данные полосы низких частот. Вспомогательная информация 172 полосы высоких частот может использоваться в приемном устройстве для того, чтобы повторно формировать сигнал возбуждения в полосе высоких частот из данных полосы низких частот в соответствии с моделью прохождения сигналов. Например, модель прохождения сигналов может представлять ожидаемый набор взаимосвязей или корреляций между данными полосы низких частот (например, сигналом 122 полосы низких частот) и данными полосы высоких частот (например, сигналом 124 полосы высоких частот). Таким образом, различные модели прохождения сигналов могут использоваться для различных видов аудиоданных (например, речи, музыки и т.д.), и конкретная модель прохождения сигналов, которая используется, может быть согласована посредством передающего устройства и приемного устройства (или задана посредством отраслевого стандарта) до передачи кодированных аудиоданных. С использованием модели прохождения сигналов модуль 150 анализа полосы высоких частот в передающем устройстве может иметь возможность формировать вспомогательную информацию 172 полосы высоких частот, так что соответствующий модуль анализа полосы высоких частот в приемном устройстве имеет возможность использовать модель прохождения сигналов для того, чтобы восстанавливать сигнал 124 полосы высоких частот из выходного потока 192 битов.

[0037] Преобразованное возбуждение в полосе низких частот может быть недостаточным для использования при синтезе полосы высоких частот вследствие недостаточной корреляции между зашумленным сигналом 124 полосы высоких частот и зашумленным сигналом 122 полосы низких частот. Например, когда входной аудиосигнал 102 включает в себя речь, сигнал 124 полосы высоких частот может обрабатываться в кадрах по 20 миллисекунд (мс) и LSF и параметры усиления могут оцениваться и квантоваться на покадровой основе. Четыре параметра наклона временного усиления могут оцениваться на посубкадровой основе (например, каждые 5 мс) и могут передаваться вместе с параметрами общего усиления и LSF. Таким образом, возбуждение в полосе высоких частот может оцениваться (например, формироваться) для каждого субкадра. Типично, параметр α смешения может определяться на основе параметров интонирования полосы низких частот. Тем не менее, при наличии шума определение параметра α смешения таким способом может приводить к широким флуктуациям в расчете на субкадр. Например, вследствие шума параметр α смешения для четырех последовательных субкадров может составлять 0,9, 0,25, 0,8 и 0,15, приводя к раздражающим или модуляционным артефактам. Кроме того, может присутствовать большая величина искажения при квантовании.

[0038] Модуль 152 LP-анализа и кодирования может формировать набор LPC, которые преобразованы в LSP посредством модуля 154 преобразования и квантованы посредством квантователя 156 на основе таблицы 163 кодирования. При наличии шума искажение при квантовании в LSP полосы высоких частот может быть большим.

[0039] Например, квантователь 156 может быть выполнен с возможностью квантовать набор спектральных значений частоты, таких как LSP, предоставленные посредством модуля преобразования 154. В других вариантах осуществления квантователь 156 может принимать и квантовать наборы одного или более других типов спектральных значений частоты, помимо или вместо LSF или LSP. Например, квантователь 156 может принимать и квантовать набор коэффициентов линейного прогнозирования (LPC), сформированных посредством модуля 152 LP-анализа и кодирования. Другие примеры включают в себя наборы ParCor-коэффициентов, значений логарифмического отношения площадей и частот спектральных иммитансов (ISF), которые могут приниматься и квантоваться в квантователе 156. Квантователь 156 может включать в себя векторный квантователь, который кодирует входной вектор (например, набор спектральных значений частоты в векторном формате) в качестве индекса для соответствующей записи в таблице или таблице кодирования, такой как таблица 163 кодирования. В качестве другого примера, квантователь 156 может быть выполнен с возможностью определять один или более параметров, из которых входной вектор может формироваться динамически в декодере, к примеру, в варианте осуществления с разреженными таблицами кодирования вместо извлечения из устройства хранения данных. В качестве иллюстрации, примеры с разреженными таблицами кодирования могут применяться в таки схемах кодирования, как CELP, и в таких кодеках, как EVRC (усовершенствованный кодек с переменной скоростью) по стандарту 3GPP2 (Партнерского проекта третьего поколения 2). В другом варианте осуществления модуль 150 анализа полосы высоких частот может включать в себя квантователь 156 и может быть выполнен с возможностью использовать определенное векторов таблиц кодирования для того, чтобы формировать синтезированные сигналы (например, согласно набору параметров фильтрации) и выбирать одни из векторов таблиц кодирования, ассоциированных с синтезированным сигналом, который лучше всего совпадает с сигналом 124 полосы высоких частот, к примеру, в перцепционно взвешенном домене.

[0040] Выпадающие значения квантования полосы высоких частот могут оказывать негативное влияние на синтез полосы высоких частот и оценку временного усиления. Например, переоценка временных параметров и параметров усиления может приводить к артефактам. Чтобы уменьшать такие артефакты, модуль 150 анализа полосы высоких частот может включать в себя модуль 162 регулировки усиления.

[0041] Модуль 162 регулировки усиления может оценивать спектральное искажение между первым набором спектральных значений (например, неквантованных LSF, сформированных посредством модуля 154 преобразования) и вторым набором спектральных значений (например, квантованных LSF, сформированных посредством квантователя 156). Модуль 162 регулировки усиления может оценивать коэффициент усиления на основе преобразования коэффициента усиления в спектральное искажение. Фиг. 3 иллюстрирует пример графика 300, который преобразует коэффициент усиления в спектральное искажение. На фиг. 3, "SD1" и "SD2" представляют 8%-ное и 2%-ное выпадающие значения соответственно, которые могут вычисляться из функции распределения вероятностей. Например, в ходе обучения таблицы 163 кодирования, может обрабатываться большой объем речевых данных (например, 10 часов речевых данных). Во время обработки может формироваться распределение вероятностей спектрального искажения и могут определяться SD1 и SD2.

[0042] SD1 и SD2 могут использоваться для того, чтобы определять значения коэффициента усиления. В примерном преобразовании 300 по фиг. 3, когда спектральное искажение определяется как меньшее SD1 (например, как меньшее искажение, чем 8%-ное выпадающее значение), регулировка усиления не выполняется (например, коэффициент усиления задается равным 1). Когда спектральное искажение определяется как большее (например, как большее искажение, чем 2%-ное выпадающее значение), ослабление может выполняться посредством задавания коэффициента усиления равным значению G2, которое меньше 1, к примеру, G2=0,5. Когда спектральное искажение находится в диапазоне от SD1 до SD2, линейная взаимосвязь может использоваться для того, чтобы определять коэффициент усиления. Например, линия, имеющая наклон (G2-1)/(SD2-SD1) и перехват K, может использоваться для того, чтобы преобразовывать SD значения спектрального искажения в коэффициент усиления согласно GainFactor=наклон*SD+перехват=SD*(G2-1)/(SD2-SD1)+K.

[0043] В примерном варианте осуществления модуль 162 регулировки усиления может определять коэффициент усиления (например, чтобы регулировать кадр усиления, который должен быть включен во вспомогательную информацию 172 полосы высоких частот) в соответствии со следующим псевдокодом.

/*Инициализация показателя спектрального искажения между исходной неквантованной LSF, т.е. lsp_shb_orig, и квантованными LSF, т.е. lsp_shb*/

sd_uq_q=0;

LPC_ORDER=10;/*Инициализация LPC-порядка*/

for(i=0; i<LPC_ORDER; i++)

{

/*Оценка спектрального искажения между неквантованными и квантованными LSF*/

sd_uq_q+=(lsp_shb[i]

lsp_shb_orig[i])*(lsp_shb[i]

lsp_shb_orig[i]);

}

/*Оценка коэффициента усиления с использованием преобразования по фиг. 3*/

GainFactor=sd_uq_q*(G2-1)/(SD2-SD1)+K;

/*Коэффициент усиления ограничен между G2 и 1,0*/

GainFactor=min (max(GainFactor, G2), 1,0);

/*Регулирование кадрового усиления*/

GainFrame=GainFrame*GainFactor;

[0044] Как проиллюстрировано в вышеуказанном псевдокоде, посредством использования преобразования по фиг. 3 модуль 162 регулировки усиления может ограничивать артефакты вследствие спектрального искажения (например, выпадающие LSF-значения) при определении коэффициента усиления.

[0045] В вышеуказанном псевдокоде спектральное искажение определяется в качестве суммы квадратов ошибок вследствие квантования. Ошибки вследствие квантования идентифицированы в качестве разности, для каждого спектрального значения частоты набора спектральных значений частоты, между квантованной версией спектрального значения частоты и неквантованной версией спектрального значения частоты. Каждая ошибка (например, каждая разность между квантованными и неквантованными значениями) возводится в квадрат, и спектральное искажение оценивается как сумма квадратических ошибок. В других вариантах осуществления оценки спектрального искажения могут определяться согласно одной или более других технологий. Например, спектральное искажение может определяться согласно технологии на основе среднеквадратических ошибок (MSE). В качестве другого примера, спектральное искажение может определять