Системы и способы выполнения регулировки усиления
Иллюстрации
Показать всеИзобретение относится к средствам для регулировки усиления. Технический результат заключается в повышении точности восстановления сигнала в приемном устройстве и уменьшении слышимых артефактов. Способ обработки сигнала включает в себя определение минимального разнесения между парами спектральных линий (LSP) для пар LSP полосы высоких частот кадра принятого аудиосигнала. На основе минимального разнесения между LSP определяют, что часть полосы высоких частот принятого аудиосигнала включает в себя компонент, соответствующий условию формирования артефактов. Причем принятый аудиосигнал определяют как включающий в себя упомянутый компонент по меньшей мере частично в ответ на то, что минимальное разнесение между LSP удовлетворяет пороговому значению. В ответ на определение того, что часть полосы высоких частот принятого аудиосигнала включает в себя упомянутый компонент, регулируют параметр усиления полосы высоких частот, соответствующий части полосы высоких частот принятого аудиосигнала. Формируют выходной поток битов, причем выходной поток битов формируют на основе отрегулированного параметра усиления полосы высоких частот. 5 н. и 32 з.п. ф-лы, 6 ил.
Реферат
Перекрестные ссылки на родственные заявки
[0001] Настоящая заявка испрашивает приоритет по находящейся в общей собственности предварительной заявке на патент США № 61/762,803, поданной 8 февраля 2013 года, и непредварительной заявке на патент США № 13/959,090, поданной 5 августа 2013 года, содержимое которых полностью содержится в данном документе по ссылке в явном виде.
Область техники, к которой относится изобретение
[0002] Настоящее раскрытие сущности, в общем, относится к обработке сигналов.
Описание предшествующего уровня техники
[0003] Технологические усовершенствования привели к более компактным и обладающим большой вычислительной мощностью вычислительным устройствам. Например, сегодня существует множество портативных персональных вычислительных устройств, в том числе беспроводные вычислительные устройства, такие как портативные беспроводные телефоны, персональные цифровые устройства (PDA) и устройства для поисковых вызовов, которые являются небольшими, легкими и удобно носятся пользователями. Более конкретно, портативные беспроводные телефоны, такие как сотовые телефоны и телефоны по Интернет-протоколу (IP), могут передавать речевые пакеты и пакеты данных по беспроводным сетям. Дополнительно, многие такие беспроводные телефоны включают в себя другие типы устройств, которые содержатся в них. Например, беспроводной телефон также может включать в себя цифровой фотоаппарат, цифровую видеокамеру, цифровое записывающее устройство и проигрыватель аудиофайлов.
[0004] В традиционных телефонных системах (например, в коммутируемых телефонных сетях общего пользования (PSTN)), полоса пропускания сигнала ограничена частотным диапазоном от 300 герц (Гц) до 3,4 килогерц (кГц). В широкополосных (WB) вариантах применения, таких как сотовая телефония и протокол "речь-по-IP" (VoIP), полоса пропускания сигнала может охватывать частотный диапазон от 50 Гц до 7 кГц. Технологии сверхширокополосного (SWB) кодирования поддерживают полосу пропускания, которая расширяется приблизительно до 16 кГц. Расширение полосы пропускания сигнала от узкополосной телефонии в 3,4 кГц до SWB-телефонии в 16 кГц позволяет повышать качество восстановления сигналов, разборчивость и естественность.
[0005] Технологии SWB-кодирования типично заключают в себе кодирование и передачу части нижних частот сигнала (например, от 50 Гц до 7 кГц, также называемой "полосой низких частот"). Например, полоса низких частот может быть представлена с использованием параметров фильтрации и/или сигнала возбуждения в полосе низких частот. Тем не менее, для того чтобы повышать эффективность кодирования, часть верхних частот сигнала (например, от 7 кГц до 16 кГц, также называемая "полосой высоких частот") может не полностью кодироваться и передаваться. Вместо этого, приемное устройство может использовать моделирование прохождения сигналов для того, чтобы прогнозировать полосу высоких частот. В некоторых реализациях, данные, ассоциированные с полосой высоких частот, могут предоставляться в приемное устройство для того, чтобы помогать в прогнозировании. Такие данные могут упоминаться в качестве "вспомогательной информации" и могут включать в себя информацию усиления, частоты спектральных линий (LSF, также называемые "парами спектральных линий (LSP)") и т.д. Прогнозирование в полосе высоких частот с использованием модели прохождения сигналов может быть приемлемо точным, когда сигнал полосы низких частот достаточно коррелирован с сигналом полосы высоких частот. Тем не менее, при наличии шума, корреляция между полосой низких частот и полосой высоких частот может быть слабой, и модель прохождения сигналов более не может иметь возможность точно представлять полосу высоких частот. Это может приводить к артефактам (например, искаженной речи) в приемном устройстве.
Сущность изобретения
[0006] Раскрыты системы и способы выполнения регулировки усиления. Описанные технологии включают в себя определение того, включает или нет аудиосигнал, который должен кодироваться для передачи, в себя компонент (например, шум), который может приводить к слышимым артефактам после восстановления аудиосигнала. Например, модель прохождения сигналов может интерпретировать шум в качестве речевых данных, что может приводить к использованию ошибочной информации усиления для того, чтобы представлять аудиосигнал. В соответствии с описанными технологиями, при наличии зашумленных условий, ослабление усиления и/или сглаживание усиления могут выполняться для того, чтобы регулировать параметры усиления, используемые для того, чтобы представлять сигнал, который должен передаваться. Такие регулирования могут приводить к более точному восстановлению сигнала в приемном устройстве, за счет этого уменьшая слышимые артефакты.
[0007] В конкретном варианте осуществления, способ включает в себя определение, на основе разнесения между парами спектральных линий (LSP), соответствующего аудиосигналу, того, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов. Способ также включает в себя, в ответ на определение того, что аудиосигнал включает в себя упомянутый компонент, регулирование параметра усиления, соответствующего аудиосигналу.
[0008] В другом конкретном варианте осуществления, способ включает в себя сравнение разнесения между парами спектральных линий (LSP), ассоциированного с кадром аудиосигнала, по меньшей мере, с одним пороговым значением. Способ также включает в себя регулирование параметра усиления при кодировании речи, соответствующего аудиосигналу (например, параметра усиления кодека для цифрового усиления, используемого в системе кодирования речи), по меньшей мере частично, на основе результата сравнения.
[0009] В другом конкретном варианте осуществления, устройство включает в себя схему обнаружения шума, выполненную с возможностью определять, на основе разнесения между парами спектральных линий (LSP), соответствующего аудиосигналу, то, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов. Устройство также включает в себя схему ослабления и сглаживания усиления, чувствительную к схеме обнаружения шума и выполненную с возможностью, в ответ на определение того, что аудиосигнал включает в себя упомянутый компонент, регулировать параметр усиления, соответствующий аудиосигналу.
[0010] В другом конкретном варианте осуществления, устройство включает в себя средство для определения, на основе разнесения между парами спектральных линий (LSP), соответствующего аудиосигналу, того, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов. Устройство также включает в себя средство для регулирования параметра усиления, соответствующего аудиосигналу, в ответ на определение того, что аудиосигнал включает в себя упомянутый компонент.
[0011] В другом конкретном варианте осуществления, некратковременный машиночитаемый носитель включает в себя инструкции, которые, при выполнении посредством компьютера, инструктируют компьютеру определять, на основе разнесения между парами спектральных линий (LSP), соответствующего аудиосигналу, то, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов. Инструкции также выполняются для того, чтобы инструктировать компьютеру регулировать параметр усиления, соответствующий аудиосигналу, в ответ на определение того, что аудиосигнал включает в себя упомянутый компонент.
[0012] Конкретные преимущества, предоставленные посредством, по меньшей мере, одного из раскрытых вариантов осуществления, включают в себя способность обнаруживать вызывающие артефакты компоненты (например, шум) и избирательно выполнять регулировку усиления (например, ослабление усиления и/или сглаживание усиления) в ответ на обнаружение таких вызывающих артефакты компонентов, что может приводить к более точному восстановлению сигналов в приемном устройстве и меньшим слышимым артефактам. Другие аспекты, преимущества и признаки настоящего изобретения должны становиться понятными из прочтения всей заявки, включающей в себя следующие разделы: "Краткое описание чертежей", "Подробное описание изобретения" и "Формула изобретения".
Краткое описание чертежей
[0013] Фиг. 1 является схемой, которая иллюстрирует конкретный вариант осуществления системы, которая выполнена с возможностью осуществлять регулировку усиления;
[0014] Фиг. 2 является схемой, которая иллюстрирует примеры вызывающего артефакты компонента, соответствующего восстановленного сигнала, который включает в себя артефакты, и соответствующего восстановленного сигнала, который не включает в себя артефакты;
[0015] Фиг. 3 является блок-схемой последовательности операций способа, которая иллюстрирует конкретный вариант осуществления способа выполнения регулировки усиления;
[0016] Фиг. 4 является блок-схемой последовательности операций способа, которая иллюстрирует другой конкретный вариант осуществления способа выполнения регулировки усиления;
[0017] Фиг. 5 является блок-схемой последовательности операций способа, которая иллюстрирует другой конкретный вариант осуществления способа выполнения регулировки усиления; и
[0018] Фиг. 6 является блок-схемой беспроводного устройства, выполненного с возможностью осуществлять операции обработки сигналов в соответствии с системами и способами фиг. 1-5.
Подробное описание изобретения
[0019] Ссылаясь на фиг. 1, показан конкретный вариант осуществления системы, которая выполнена с возможностью осуществлять регулировку усиления и, в общем, обозначается 100. В конкретном варианте осуществления, система 100 может быть интегрирована в систему или устройство кодирования (например, в беспроводном телефоне или в кодере/декодере (кодеке)).
[0020] Следует отметить, что в нижеприведенном описании, различные функции, выполняемые посредством системы 100 по фиг. 1, описываются как выполняемые посредством определенных компонентов или модулей. Тем не менее, это разделение компонентов и модулей служит только для иллюстрации. В альтернативном варианте осуществления, функция, выполняемая посредством конкретного компонента или модуля, вместо этого может быть разделена между несколькими компонентов или модулей. Кроме того, в альтернативном варианте осуществления, два или более компонентов или модулей по фиг. 1 могут быть интегрированы в один компонент или модуль. Каждый компонент или модуль, проиллюстрированный на фиг. 1, может реализовываться с использованием аппаратных средств (например, устройства на основе программируемой пользователем вентильной матрицы (FPGA), специализированной интегральной схемы (ASIC), процессора цифровых сигналов (DSP), контроллера и т.д.), программного обеспечения (например, инструкций, выполняемых посредством процессора) или любой комбинации вышеозначенного.
[0021] Система 100 включает в себя гребенку 110 аналитических фильтров, которая выполнена с возможностью принимать входной аудиосигнал 102. Например, входной аудиосигнал 102 может предоставляться посредством микрофона или другого устройства ввода. В конкретном варианте осуществления, входной аудиосигнал 102 может включать в себя речь. Входной аудиосигнал может представлять собой сверхширокополосный (SWB) сигнал, который включает в себя данные в частотном диапазоне приблизительно от 50 герц (Гц) до 16 килогерц (кГц). Гребенка 110 аналитических фильтров может фильтровать входной аудиосигнал 102 в нескольких частях на основе частоты. Например, гребенка 110 аналитических фильтров может формировать сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот. Сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут иметь равные или неравные полосы пропускания и могут быть перекрывающимися или неперекрывающимися. В альтернативном варианте осуществления, гребенка 110 аналитических фильтров может формировать более двух выводов.
[0022] В примере по фиг. 1, сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот занимают неперекрывающиеся полосы частот. Например, сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут занимать неперекрывающиеся полосы частот в 50 Гц - 7 кГц и 7 кГц - 16 кГц. В альтернативном варианте осуществления, сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут занимать неперекрывающиеся полосы частот в 50 Гц - 8 кГц и 8 кГц - 16 кГц. В еще одном другом альтернативном варианте осуществления, сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут перекрываться (например, 50 Гц - 8 кГц и 7 кГц - 16 кГц), что может обеспечивать возможность фильтру нижних частот и фильтру верхних частот гребенки 110 аналитических фильтров иметь плавный спад, что позволяет упрощать проектное решение и сокращать затраты фильтра нижних частот и фильтра верхних частот. Перекрытие сигнала 122 полосы низких частот и сигнала 124 полосы высоких частот также позволяет обеспечивать плавное смешивание сигналов полосы низких частот и полосы высоких частот в приемном устройстве, что может приводить к меньшим слышимым артефактам.
[0023] Следует отметить, что хотя пример по фиг. 1 иллюстрирует обработку SWB-сигнала, это служит только для иллюстрации. В альтернативном варианте осуществления, входной аудиосигнал 102 может представлять собой широкополосный (WB) сигнал, имеющий частотный диапазон приблизительно от 50 Гц до 8 кГц. В таком варианте осуществления, сигнал 122 полосы низких частот может соответствовать частотному диапазону приблизительно от 50 Гц до 6,4 кГц, и сигнал 124 полосы высоких частот может соответствовать частотному диапазону приблизительно от 6,4 кГц до 8 кГц. Также следует отметить, что различные системы и способы в данном документе описываются как обнаруживающие шум полосы высоких частот и выполняющие различные операции в ответ на шум полосы высоких частот. Тем не менее, это служит только для примера. Технологии, проиллюстрированные со ссылкой на фиг. 1-6, также могут выполняться в контексте шума полосы низких частот.
[0024] Система 100 может включать в себя модуль 130 анализа полосы низких частот, выполненный с возможностью принимать сигнал 122 полосы низких частот. В конкретном варианте осуществления, модуль 130 анализа полосы низких частот может представлять вариант осуществления кодера на основе линейного прогнозирования с возбуждением по коду (CELP). Модуль 130 анализа полосы низких частот может включать в себя модуль 132 анализа и кодирования на основе линейного прогнозирования (LP), модуль 134 преобразования коэффициентов линейного прогнозирования (LPC) в пары спектральных линий (LSP) и квантователь 136. LSP также могут упоминаться в качестве частот спектральных линий (LSF), и эти два термина могут использоваться взаимозаменяемо в данном документе. Модуль 132 LP-анализа и кодирования может кодировать спектральную огибающую сигнала 122 полосы низких частот в качестве набора LPC. LPC могут формироваться для каждого кадра аудио (например, 20 миллисекунд (мс) аудио, соответствующего 320 выборкам на частоте дискретизации 16 кГц), каждого субкадра аудио (например, 5 мс аудио) или любой комбинации вышеозначенного. Число LPC, сформированных для каждого кадра или субкадра, может определяться посредством "порядка" выполняемого LP-анализа. В конкретном варианте осуществления, модуль 132 LP-анализа и кодирования может формировать набор из одиннадцати LPC, соответствующих LP-анализу десятого порядка.
[0025] Модуль 134 преобразования LPC в LSP может преобразовывать набор LPC, сформированных посредством модуля 132 LP-анализа и кодирования, в соответствующий набор LSP (например, с использованием преобразования "один-к-одному"). Альтернативно, набор LPC может преобразовываться "один-к-одному" в соответствующий набор ParCor-коэффициентов, значений логарифмического отношения площадей, пар спектральных иммитансов (ISP) или частот спектральных иммитансов (ISF). Преобразование между набором LPC и набором LSP может быть обратимым без ошибки.
[0026] Квантователь 136 может квантовать набор LSP, сформированных посредством модуля 134 преобразования. Например, квантователь 136 может включать в себя или соединяться с несколькими таблицами кодирования, которые включают в себя несколько записей (например, векторов). Чтобы квантовать набор LSP, квантователь 136 может идентифицировать записи таблиц кодирования, которые являются "ближайшими" (например, на основе показателя искажения, такого как наименьшие квадраты или среднеквадратическая ошибка) к набору LSP. Квантователь 136 может выводить значение индекса или последовательность значений индекса, соответствующих местоположению идентифицированных записей в таблицах кодирования. Вывод квантователя 136 в силу этого может представлять параметры фильтрации полосы низких частот, которые включены в поток 142 битов полосы низких частот.
[0027] Модуль 130 анализа полосы низких частот также может формировать сигнал 144 возбуждения в полосе низких частот. Например, сигнал 144 возбуждения в полосе низких частот может представлять собой кодированный сигнал, который формируется посредством квантования остаточного LP-сигнала, который формируется во время LP-процесса, выполняемого посредством модуля 130 анализа полосы низких частот. Остаточный LP-сигнал может представлять ошибку прогнозирования.
[0028] Система 100 дополнительно может включать в себя модуль 150 анализа полосы высоких частот, выполненный с возможностью принимать сигнал 124 полосы высоких частот из гребенки 110 аналитических фильтров и сигнал 144 возбуждения в полосе низких частот из модуля 130 анализа полосы низких частот. Модуль 150 анализа полосы высоких частот может формировать вспомогательную информацию 172 полосы высоких частот на основе сигнала 124 полосы высоких частот и сигнала 144 возбуждения в полосе низких частот. Например, вспомогательная информация 172 полосы высоких частот может включать в себя LSP полосы высоких частот и/или информацию усиления (например, на основе, по меньшей мере, отношения энергии полосы высоких частот к энергии полосы низких частот), как подробнее описано в данном документе.
[0029] Модуль 150 анализа полосы высоких частот может включать в себя формирователь 160 возбуждения в полосе высоких частот. Формирователь 160 возбуждения в полосе высоких частот может формировать сигнал возбуждения в полосе высоких частот посредством расширения спектра сигнала 144 возбуждения в полосе низких частот до частотного диапазона полосы высоких частот (например, 7 кГц - 16 кГц). В качестве иллюстрации, формирователь 160 возбуждения в полосе высоких частот может применять преобразование к сигналу возбуждения в полосе низких частот (например, нелинейное преобразование, такое как операция в абсолютных значениях или в квадрате) и может смешивать преобразованный сигнал возбуждения в полосе низких частот с шумовым сигналом (например, белым шумом, модулированным согласно огибающей, соответствующей сигналу 144 возбуждения в полосе низких частот) для того, чтобы формировать сигнал возбуждения в полосе высоких частот. Сигнал возбуждения в полосе высоких частот может использоваться для того, чтобы определять один или более параметров усиления полосы высоких частот, которые включены во вспомогательную информацию 172 полосы высоких частот.
[0030] Модуль 150 анализа полосы высоких частот также может включать в себя модуль 152 LP-анализа и кодирования, модуль 154 преобразования LPC в LSP и квантователь 156. Каждый из модуля 152 LP-анализа и кодирования, модуля 154 преобразования и квантователя 156 может функционировать так, как описано выше в отношении соответствующих компонентов модуля 130 анализа полосы низких частот, но при сравнительно уменьшенном разрешении (например, с использованием меньшего числа битов для каждого коэффициента, LSP и т.д.). В другом примерном варианте осуществления, LSP-квантователь 156 полосы высоких частот может использовать скалярное квантование, при котором поднабор LSP-коэффициентов квантуется по отдельности с использованием предварительно заданного числа битов. Например, модуль 152 LP-анализа и кодирования, модуль 154 преобразования и квантователь 156 могут использовать сигнал 124 полосы высоких частот для того, чтобы определять информацию фильтрации полосы высоких частот (например, LSP полосы высоких частот), которая включена во вспомогательную информацию 172 полосы высоких частот. В конкретном варианте осуществления, вспомогательная информация 172 полосы высоких частот может включать в себя LSP полосы высоких частот, а также параметры усиления полосы высоких частот. При наличии определенных типов шума параметры усиления полосы высоких частот могут формироваться как результат ослабления усиления и/или сглаживания усиления, выполняемого посредством модуля 162 ослабления и сглаживания усиления, как подробнее описано в данном документе.
[0031] Поток 142 битов полосы низких частот и вспомогательная информация 172 полосы высоких частот могут мультиплексироваться посредством мультиплексора (мультиплексора) 180, чтобы формировать выходной поток 192 битов. Выходной поток 192 битов может представлять кодированный аудиосигнал, соответствующий входному аудиосигналу 102. Например, выходной поток 192 битов может передаваться (например, по проводному, беспроводному или оптическому каналу) и/или сохраняться. В приемном устройстве, обратные операции могут выполняться посредством демультиплексора (демультиплексора), декодера полосы низких частот, декодера полосы высоких частот и гребенки фильтров, чтобы формировать аудиосигнал (например, восстановленную версию входного аудиосигнала 102, который предоставляется в динамик или другое устройство вывода). Число битов, используемых для того, чтобы представлять поток 142 битов полосы низких частот, может быть более существенно большим числа битов, используемых для того, чтобы представлять вспомогательную информацию 172 полосы высоких частот. Таким образом, большая часть битов в выходном потоке 192 битов представляют данные полосы низких частот. Вспомогательная информация 172 полосы высоких частот может использоваться в приемном устройстве для того, чтобы повторно формировать сигнал полосы высоких частот из данных полосы низких частот в соответствии с моделью прохождения сигналов. Например, модель прохождения сигналов может представлять ожидаемый набор взаимосвязей или корреляций между данными полосы низких частот (например, сигналом 122 полосы низких частот) и данными полосы высоких частот (например, сигналом 124 полосы высоких частот). Таким образом, различные модели прохождения сигналов могут использоваться для различных видов аудиоданных (например, речи, музыки и т.д.), и конкретная модель прохождения сигналов, которая используется, может быть согласована посредством передающего устройства и приемного устройства (или задана посредством отраслевого стандарта) до передачи кодированных аудиоданных. С использованием модели прохождения сигналов модуль 150 анализа полосы высоких частот в передающем устройстве может иметь возможность формировать вспомогательную информацию 172 полосы высоких частот, так что соответствующий модуль анализа полосы высоких частот в приемном устройстве имеет возможность использовать модель прохождения сигналов для того, чтобы восстанавливать сигнал 124 полосы высоких частот из выходного потока 192 битов.
[0032] Тем не менее, при наличии фонового шума синтез полосы высоких частот в приемном устройстве может приводить к заметным артефактам, поскольку недостаточная корреляция между полосой низких частот и полосой высоких частот может заставлять базовую модель прохождения сигналов работать субоптимально в отношении надежного восстановления сигналов. Например, модель прохождения сигналов может некорректно интерпретировать компоненты шума в полосе высоких частот в качестве речи и в силу этого может вызывать формирование параметров усиления, которые пытаются реплицировать шум неточно в приемном устройстве, приводя к заметным артефактам. Примеры таких условий формирования артефактов включают в себя, но не только, высокочастотные шумы, такие как автомобильные гудки и скрипящие тормоза. В качестве иллюстрации, первая спектрограмма 210 на фиг. 2 иллюстрирует аудиосигнал, имеющий два компонента, соответствующие условиям формирования артефактов, проиллюстрированным в качестве шума полосы высоких частот, имеющего относительно большую энергию сигналов. Вторая спектрограмма 220 иллюстрирует результирующие артефакты в восстановленном сигнале вследствие переоценки параметров усиления полосы высоких частот.
[0033] Чтобы уменьшать такие артефакты, модуль 150 анализа полосы высоких частот может выполнять управление усилением полосы высоких частот. Например, модуль 150 анализа полосы высоких частот может включать в себя модуль 158 обнаружения вызывающих артефакты компонентов, который выполнен с возможностью обнаруживать компоненты сигнала (например, условия формирования артефактов, показанные на первой спектрограмме 210 по фиг. 2), которые с большой вероятностью приводят к слышимым артефактам при воспроизведении. При наличии таких компонентов модуль 150 анализа полосы высоких частот может вызывать формирование кодированного сигнала, который, по меньшей мере частично, уменьшает слышимый эффект таких артефактов. Например, модуль 162 ослабления и сглаживания усиления может выполнять ослабление усиления и/или сглаживание усиления, чтобы модифицировать информацию усиления или параметры, включенные во вспомогательную информацию 172 полосы высоких частот.
[0034] Ослабление усиления может включать в себя уменьшение моделируемого значения усиления через применение экспоненциальной или линейной операции в качестве иллюстративных примеров. Сглаживание усиления может включать в себя вычисление взвешенной суммы моделируемых усилений текущего кадра/субкадра и одного или более предыдущих кадров/субкадров. Модифицированная информация усиления может приводить к восстановленному сигналу согласно третьей спектрограмме 230 по фиг. 2, который является свободным (или имеет пониженный уровень) от артефактов, показанных на второй спектрограмме 220 по фиг. 2.
[0035] Один или более тестов могут выполняться для того, чтобы оценивать то, включает или нет аудиосигнал в себя условие формирования артефактов. Например, первый тест может включать в себя сравнение минимального разнесения между LSP, которое обнаруживается в наборе LSP (например, LSP для конкретного кадра аудиосигнала), с первым пороговым значением. Небольшое разнесение между LSP соответствует относительно сильному сигналу в относительно узком частотном диапазоне. В конкретном варианте осуществления, когда определяется то, что сигнал 124 полосы высоких частот приводит к кадру, имеющему минимальное разнесение между LSP, которое меньше первого порогового значения, определяется то, что условие формирования артефактов присутствует в аудиосигнале, и ослабление усиления может активироваться для кадра.
[0036] В качестве другого примера, второй тест может включать в себя сравнение среднего минимального разнесения между LSP для нескольких последовательных кадров со вторым пороговым значением. Например, когда конкретный кадр аудиосигнала имеет минимальное LSP-разнесение, которое превышает первое пороговое значение, но меньше второго порогового значения, по-прежнему может определяться то, что условие формирования артефактов присутствует, если среднее минимальное разнесение между LSP для нескольких кадров (например, взвешенное среднее минимального разнесения между LSP для четырех последних кадров, включающих в себя конкретный кадр) меньше третьего порогового значения. Как результат, ослабление усиления может активироваться для конкретного кадра.
[0037] В качестве другого примера, третий тест может включать в себя определение того, находится или нет конкретный кадр после кадра с ослабленным усилением аудиосигнала. Если конкретный кадр находится после кадра с ослабленным усилением, ослабление усиления может активироваться для конкретного кадра на основе минимального разнесения между LSP конкретного кадра, меньшего второго порогового значения.
[0038] Три теста описываются в качестве иллюстрации. Ослабление усиления для кадра может активироваться в ответ на удовлетворение любого одного или более тестов (или комбинаций тестов) либо в ответ на удовлетворение одного или более других тестов или условий. Например, конкретный вариант осуществления может включать в себя определение того, активировать или нет ослабление усиления на основе одного теста, к примеру, первого теста, описанного выше, без применения второго теста или третьего теста. Альтернативные варианты осуществления могут включать в себя определение того, активировать или нет ослабление усиления на основе второго теста без применения первого теста или третьего теста, либо на основе третьего теста без применения первого теста или второго теста. В качестве другого примера, конкретный вариант осуществления может включать в себя определение того, активировать или нет ослабление усиления на основе двух тестов, к примеру, первого теста и второго теста без применения третьего теста. Альтернативные варианты осуществления могут включать в себя определение того, активировать или нет ослабление усиления на основе первого теста и третьего теста без применения второго теста, либо на основе второго теста и третьего теста без применения первого теста.
[0039] Когда ослабление усиления активировано для конкретного кадра, сглаживание усиления также может активироваться для конкретного кадра. Например, сглаживание усиления может выполняться посредством определения среднего (например, взвешенного среднего) значения усиления для конкретного кадра и значения усиления для предшествующего кадра аудиосигнала. Определенное среднее может использоваться в качестве значения усиления для конкретного кадра, уменьшая величину изменения значений усиления между последовательными кадрами аудиосигнала.
[0040] Сглаживание усиления может активироваться для конкретного кадра в ответ на определение того, что LSP-значения для конкретного кадра отклоняются от оценки "медленной" вариации LSP-значений менее чем на четвертое пороговое значение и отклоняются от оценки "быстрой" вариации LSP-значений менее чем на пятое пороговое значение. Величина отклонения от оценки медленной вариации может упоминаться в качестве низкой скорости LSP-вариации. Величина отклонения от оценки быстрой вариации может упоминаться в качестве высокой скорости LSP-вариации и может соответствовать большей скорости адаптации, чем низкая скорость LSP-вариации.
[0041] Низкая скорость LSP-вариации может быть основана на отклонении от взвешенного среднего LSP-значений для нескольких последовательных кадров, которое присваивает LSP-значениям одного или более предыдущих кадров большие весовые коэффициенты, чем LSP-значениям текущего кадра. Низкая скорость LSP-вариации, имеющая относительно большое значение, указывает то, что LSP-значения изменяются на скорости, которая не служит признаком условия формирования артефактов. Тем не менее, низкая скорость LSP-вариации, имеющая относительно небольшое значение (например, меньшее четвертого порогового значения), соответствует медленному перемещению LSP для нескольких кадров, которое может служить признаком действующего условия формирования артефактов.
[0042] Высокая скорость LSP-вариации может быть основана на отклонении от взвешенного среднего LSP-значений для нескольких последовательных кадров, которое присваивает LSP-значениям для текущего кадра более большие весовые коэффициенты, чем взвешенному среднему для низкой скорости LSP-вариации. Высокая скорость LSP-вариации, имеющая относительно большое значение, может указывать то, что LSP-значения изменяются на скорости, которая не служит признаком условия формирования артефактов, и высокая скорость LSP-вариации, имеющая относительно небольшое значение (например, меньшее пятого порогового значение), может соответствовать относительно небольшому изменению LSP для нескольких кадров, которое может служить признаком условия формирования артефактов.
[0043] Хотя низкая скорость LSP-вариации может использоваться для того, чтобы указывать, когда условие формирования мультикадровых артефактов начато, низкая скорость LSP-вариации может вызывать задержку в обнаружении, когда условие формирования мультикадровых артефактов завершено. Аналогично, хотя высокая скорость LSP-вариации может быть менее надежной, чем низкая скорость LSP-вариации, чтобы обнаруживать то, когда условие формирования мультикадровых артефактов начато, высокая скорость LSP-вариации может использоваться для того, чтобы более точно обнаруживать то, когда условие формирования мультикадровых артефактов завершено. Событие формирования мультикадровых артефактов может определяться как выполняемое в то время, когда низкая скорость LSP-вариации меньше четвертого порогового значения, и высокая скорость LSP-вариации меньше пятого порогового значения. В результате сглаживание усиления может активироваться, чтобы предотвращать внезапные или ложные увеличения значений кадрового усиления, в то время как событие формирования артефактов выполняется.
[0044] В конкретном варианте осуществления, модуль 158 обнаружения вызывающих артефакты компонентов может определять четыре параметра из аудиосигнала для того, чтобы определять то, включает или нет аудиосигнал в себя компонент, который должен приводить к слышимым артефактам: минимальное разнесение между LSP, низкая скорость LSP-вариации, высокая скорость LSP-вариации и среднее минимальное разнесение между LSP. Например, LP-процесс десятого порядка может формировать набор из одиннадцати LPC, которые преобразованы в десять LSP. Модуль 158 обнаружения вызывающих артефакты компонентов может определять, для конкретного кадра аудио, минимальное (например, наименьшее) разнесение между любыми двумя из десяти LSP. Типично, резкие и внезапные шумы, такие как автомобильные гудки и скрипящие тормоза, приводят к близкорасположенным LSP (например, "сильный" компонент шума в 13 кГц на первой спектрограмме 210 может быть близко окружен посредством LSP в 12,95 кГц и 13,05 кГц). Модуль 158 обнаружения вызывающих артефакты компонентов также может определять низкую скорость LSP-вариации и высокую скорость вариации так, как показано в нижеприведенном псевдокоде в стиле С++, который может выполняться или реализовываться посредством модуля 158 обнаружения вызывающих артефакты компонентов.
{/*Оценка разнесения между LSP, т.е. LSP-расстояния между i-ым коэффициентом и (i-1)-ым LSP-коэффициентом, как указано ниже*/
/*Оценка ошибки в LSP от текущего кадра до предыдущих кадров*/
/*Обновление скоростей LSP-вариации (низкие/высокие интерполяционные LSP для следующего кадра)*/
[0045] Модуль 158 обнаружения вызывающих артефакты компонентов дополнительно может определять средневзвешенное минимальное разнесение между LSP в соответствии со следующим псевдокодом. Следующий псевдокод также включает в себя сброс разнесения между LSP в ответ на изменение режима. Такие изменения режима могут возникать в устройствах, которые поддерживают несколько режимов кодирования для музыки и/или речи. Например, устройство может использовать режим алгебраического CELP (ACELP) для речи и режим кодирования аудио, т.е. общее кодирование сигналов (GSC) для сигналов музыкального типа. Альтернативно, в определенных низкоскоростных сценариях, устройство может определять на основе параметров признаков (например, тональности, ухода основного тона, интонирования и т.д.) то, что может использоваться режим ACELP/GSC/модифицированного дискретного косинусного преобразования (MDCT).
/*Сброс LSP-разнесения во время изменений режима, т.е. когда режим кодирования последнего кадра отличается от режима кодирования текущего кадра*/
/*Вычисление средневзвешенного LSP-разнесения для текущего кадра и трех предыдущих кадров*/