Системы и способы выполнения фильтрации для определения усиления
Иллюстрации
Показать всеИзобретение относится к области обработки сигналов. Технический результат заключается в повышении точности обнаружения и фильтрации шумов аудиосигнала. В способе обработки сигнала определяют минимальное разнесение между парами спектральных линий (LSP) для пар LSP полосы высоких частот в кадре аудиосигнала, на основании минимального разнесения между LSP определяют компонент, соответствующий условию формирования артефактов, и если аудиосигнал включает в себя упомянутый компонент, фильтруют часть полосы высоких частот аудиосигнала для того, чтобы формировать фильтрованный выходной сигнал полосы высоких частот, определяют информацию усиления на основе отношения первой энергии, выводят вспомогательную информацию полосы высоких частот на основе по меньшей мере одного из части полосы высоких частот аудиосигнала, причем вспомогательная информация полосы высоких частот указывает информацию усиления кадра, пары LSP полосы высоких частот и информацию временного усиления, соответствующую оценкам усиления субкадра, основанную на фильтрованном выходном сигнале полосы высоких частот. 5 н. и 35 з.п. ф-лы, 8 ил.
Реферат
ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИ
[0001] Настоящая заявка испрашивает приоритет по находящейся в общей собственности предварительной заявке на патент (США) № 61/762807, поданной 8 февраля 2013 года, и непредварительной заявки на патент (США) № 13/959188, поданной 5 августа 2013 года, содержимое которых полностью содержится в данном документе по ссылке в явном виде.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0002] Настоящее раскрытие сущности, в общем, относится к обработке сигналов.
ОПИСАНИЕ ПРЕДШЕСТВУЮЩЕГО УРОВНЯ ТЕХНИКИ
[0003] Технологические усовершенствования привели к более компактным и обладающим большой вычислительной мощностью вычислительным устройствам. Например, сегодня существует множество портативных персональных вычислительных устройств, в том числе беспроводные вычислительные устройства, такие как портативные беспроводные телефоны, персональные цифровые устройства (PDA) и устройства для поисковых вызовов, которые являются небольшими, легкими и удобно носятся пользователями. Более конкретно, портативные беспроводные телефоны, такие как сотовые телефоны и телефоны по Интернет-протоколу (IP), могут передавать речевые пакеты и пакеты данных по беспроводным сетям. Дополнительно, многие такие беспроводные телефоны включают в себя другие типы устройств, которые содержатся в них. Например, беспроводной телефон также может включать в себя цифровой фотоаппарат, цифровую видеокамеру, цифровое записывающее устройство и проигрыватель аудиофайлов.
[0004] В традиционных телефонных системах (например, в коммутируемых телефонных сетях общего пользования (PSTN)) полоса пропускания сигнала ограничена частотным диапазоном от 300 герц (Гц) до 3,4 килогерц (кГц). В широкополосных (WB) вариантах применения, таких как сотовая телефония и протокол "речь-по-IP" (VoIP), полоса пропускания сигнала может охватывать частотный диапазон от 50 Гц до 7 кГц. Технологии сверхширокополосного (SWB) кодирования поддерживают полосу пропускания, которая расширяется приблизительно до 16 кГц. Расширение полосы пропускания сигнала от узкополосной телефонии в 3,4 кГц до SWB-телефонии в 16 кГц позволяет повышать качество восстановления сигналов, разборчивость и естественность.
[0005] Технологии SWB-кодирования типично заключают в себе кодирование и передачу части нижних частот сигнала (например, от 50 Гц до 7 кГц, также называемой "полосой низких частот"). Например, полоса низких частот может быть представлена с использованием параметров фильтрации и/или сигнала возбуждения полосы низких частот. Тем не менее, для того чтобы повышать эффективность кодирования, часть верхних частот сигнала (например, от 7 кГц до 16 кГц, также называемая "полосой высоких частот") может не полностью кодироваться и передаваться. Вместо этого приемное устройство может использовать моделирование прохождения сигналов для того, чтобы предсказывать полосу высоких частот. В некоторых реализациях данные, ассоциированные с полосой высоких частот, могут предоставляться в приемное устройство для того, чтобы помогать в предсказании. Такие данные могут упоминаться в качестве "вспомогательной информации" и могут включать в себя информацию усиления, частоты спектральных линий (LSF, также называемые "парами спектральных линий (LSP)") и т.д. Предсказание полосы высоких частот с использованием модели прохождения сигналов может быть приемлемо точным, когда сигнал полосы низких частот достаточно коррелирован с сигналом полосы высоких частот. Тем не менее, при наличии шума корреляция между полосой низких частот и полосой высоких частот может быть слабой, и модель прохождения сигналов более не может иметь возможность точно представлять полосу высоких частот. Это может приводить к артефактам (например, искаженной речи) в приемном устройстве.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0006] Раскрыты системы и способы выполнения условной фильтрации аудиосигнала для определения усиления в системе кодирования аудио. Описанные технологии включают в себя определение того, включает или нет аудиосигнал, который должен кодироваться для передачи, в себя компонент (например, шум), который может приводить к слышимым артефактам после восстановления аудиосигнала. Например, базовая модель прохождения сигналов может интерпретировать шум в качестве речевых данных, что может приводить к ошибочному восстановлению аудиосигнала. В соответствии с описанными технологиями при наличии вызывающих артефакты компонентов условная фильтрация может выполняться для части полосы высоких частот аудиосигнал, и фильтрованный выходной сигнал полосы высоких частот может использоваться для того, чтобы формировать информацию усиления для части полосы высоких частот. Информация усиления на основе фильтрованного выходного сигнала полосы высоких частот может приводить к уменьшенным слышимым артефактам после восстановления аудиосигнала в приемном устройстве.
[0007] В конкретном варианте осуществления способ включает в себя определение на основе спектральной информации, соответствующей аудиосигналу, который включает в себя часть полосы низких частот и часть полосы высоких частот, того, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов. Способ также включает в себя фильтрацию части полосы высоких частот аудиосигнала для того, чтобы формировать фильтрованный выходной сигнал полосы высоких частот. Способ дополнительно включает в себя формирование кодированного сигнала. Формирование кодированного сигнала включает в себя определение информации усиления на основе отношения первой энергии, соответствующей фильтрованному выходному сигналу полосы высоких частот, ко второй энергии, соответствующей части полосы низких частот, для того чтобы уменьшать слышимый эффект условия формирования артефактов.
[0008] В конкретном варианте осуществления способ включает в себя сравнение разнесения между парами спектральных линий (LSP), ассоциированного с кадром аудиосигнала, по меньшей мере, с одним пороговым значением. Способ также включает в себя условную фильтрацию части полосы высоких частот аудиосигнала для того, чтобы формировать фильтрованный выходной сигнал полосы высоких частот, по меньшей мере частично, на основе сравнения. Способ включает в себя определение информации усиления на основе отношения первой энергии, соответствующей фильтрованному выходному сигналу полосы высоких частот, ко второй энергии, соответствующей части полосы низких частот, аудиосигнала.
[0009] В другом конкретном варианте осуществления устройство включает в себя схему обнаружения шума, выполненную с возможностью определять на основе спектральной информации, соответствующей аудиосигналу, который включает в себя часть полосы низких частот и часть полосы высоких частот, то, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов. Устройство включает в себя схему фильтрации, чувствительную к схеме обнаружения шума и выполненную с возможностью фильтровать часть полосы высоких частот аудиосигнала для того, чтобы формировать фильтрованный выходной сигнал полосы высоких частот. Устройство также включает в себя схему определения усиления, выполненную с возможностью определять информацию усиления на основе отношения первой энергии, соответствующей фильтрованному выходному сигналу полосы высоких частот, ко второй энергии, соответствующей части полосы низких частот, для того чтобы уменьшать слышимый эффект условия формирования артефактов.
[0010] В другом конкретном варианте осуществления устройство включает в себя средство для определения на основе спектральной информации, соответствующей аудиосигналу, который включает в себя часть полосы низких частот и часть полосы высоких частот, того, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов. Устройство также включает в себя средство для фильтрации части полосы высоких частот аудиосигнала для того, чтобы формировать фильтрованный выходной сигнал полосы высоких частот. Устройство включает в себя средство для формирования кодированного сигнала. Средство для формирования кодированного сигнала включает в себя средство для определения информации усиления на основе отношения первой энергии, соответствующей фильтрованному выходному сигналу полосы высоких частот, ко второй энергии, соответствующей части полосы низких частот, для того чтобы уменьшать слышимый эффект условия формирования артефактов.
[0011] В другом конкретном варианте осуществления некратковременный машиночитаемый носитель включает в себя инструкции, которые, при выполнении посредством компьютера, предписывают компьютеру определять на основе спектральной информации, соответствующей аудиосигналу, который включает в себя часть полосы низких частот и часть полосы высоких частот, то, что аудиосигнал включает в себя компонент, соответствующий условию формирования артефактов, фильтровать часть полосы высоких частот аудиосигнала для того, чтобы формировать фильтрованный выходной сигнал полосы высоких частот, и формировать кодированный сигнал. Формирование кодированного сигнала включает в себя определение информации усиления на основе отношения первой энергии, соответствующей фильтрованному выходному сигналу полосы высоких частот, ко второй энергии, соответствующей части полосы низких частот, для того чтобы уменьшать слышимый эффект условия формирования артефактов.
[0012] Конкретные преимущества, предоставленные посредством, по меньшей мере, одного из раскрытых вариантов осуществления, включают в себя способность обнаруживать вызывающие артефакты компоненты (например, шум) и избирательно выполнять фильтрацию в ответ на обнаружение таких вызывающих артефакты компонентов, чтобы влиять на информацию усиления, что может приводить к более точному восстановлению сигналов в приемном устройстве и меньшим слышимым артефактам. Другие аспекты, преимущества и признаки настоящего изобретения должны становиться понятными из прочтения всей заявки, включающей в себя следующие разделы: "Краткое описание чертежей", "Подробное описание изобретения" и "Формула изобретения".
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0013] Фиг. 1 является схемой, которая иллюстрирует конкретный вариант осуществления системы, которая выполнена с возможностью осуществлять фильтрацию;
[0014] Фиг. 2 является схемой, которая иллюстрирует примеры вызывающего артефакты компонента, соответствующего восстановленного сигнала, который включает в себя артефакты, и соответствующего восстановленного сигнала, который не включает в себя артефакты;
[0015] Фиг. 3 является графиком, который иллюстрирует конкретный вариант осуществления преобразования между адаптивным весовым коэффициентом и разнесением пар спектральных линий (LSP);
[0016] Фиг. 4 является схемой, которая иллюстрирует другой конкретный вариант осуществления системы, которая выполнена с возможностью осуществлять фильтрацию;
[0017] Фиг. 5 является блок-схемой последовательности операций способа, которая иллюстрирует конкретный вариант осуществления способа выполнения фильтрации;
[0018] Фиг. 6 является блок-схемой последовательности операций способа, которая иллюстрирует другой конкретный вариант осуществления способа выполнения фильтрации;
[0019] Фиг. 7 является блок-схемой последовательности операций способа, которая иллюстрирует другой конкретный вариант осуществления способа выполнения фильтрации; и
[0020] Фиг. 8 является блок-схемой беспроводного устройства, выполненного с возможностью осуществлять операции обработки сигналов в соответствии с системами и способами фиг. 1-7.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0021] Ссылаясь на фиг. 1, показан конкретный вариант осуществления системы, которая выполнена с возможностью осуществлять фильтрацию и, в общем, обозначается 100. В конкретном варианте осуществления система 100 может быть интегрирована в систему или устройство кодирования (например, в беспроводном телефоне или в кодере/декодере (кодеке)).
[0022] Следует отметить, что в нижеприведенном описании, различные функции, выполняемые посредством системы 100 по фиг. 1, описываются как выполняемые посредством определенных компонентов или модулей. Тем не менее, это разделение компонентов и модулей служит только для иллюстрации. В альтернативном варианте осуществления функция, выполняемая посредством конкретного компонента или модуля, вместо этого может быть разделена между несколькими компонентов или модулей. Кроме того, в альтернативном варианте осуществления два или более компонентов или модулей по фиг. 1 могут быть интегрированы в один компонент или модуль. Каждый компонент или модуль, проиллюстрированный на фиг. 1, может реализовываться с использованием аппаратных средств (например, устройства на основе программируемой пользователем вентильной матрицы (FPGA), специализированной интегральной схемы (ASIC), процессора цифровых сигналов (DSP), контроллера и т.д.), программного обеспечения (например, инструкций, выполняемых посредством процессора) или любой комбинации вышеозначенного.
[0023] Система 100 включает в себя гребенку 110 фильтров анализа, которая выполнена с возможностью принимать входной аудиосигнал 102. Например, входной аудиосигнал 102 может предоставляться посредством микрофона или другого устройства ввода. В конкретном варианте осуществления входной аудиосигнал 102 может включать в себя речь. Входной аудиосигнал может представлять собой сверхширокополосный (SWB) сигнал, который включает в себя данные в частотном диапазоне приблизительно от 50 герц (Гц) до 16 килогерц (кГц). Гребенка 110 фильтров анализа может фильтровать входной аудиосигнал 102 в нескольких частях на основе частоты. Например, гребенка 110 фильтров анализа может формировать сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот. Сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут иметь равные или неравные полосы пропускания и могут быть перекрывающимися или неперекрывающимися. В альтернативном варианте осуществления гребенка 110 фильтров анализа может формировать более двух выходных сигналов.
[0024] Сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут занимать неперекрывающиеся полосы частот. Например, сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут занимать неперекрывающиеся полосы частот в 50 Гц – 7 кГц и 7 кГц – 16 кГц. В альтернативном варианте осуществления сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут занимать неперекрывающиеся полосы частот в 50 Гц – 8 кГц и 8 кГц – 16 кГц. В еще одном другом альтернативном варианте осуществления сигнал 122 полосы низких частот и сигнал 124 полосы высоких частот могут перекрываться (например, 50 Гц – 8 кГц и 7 кГц – 16 кГц), что может обеспечивать возможность фильтру нижних частот и фильтру верхних частот гребенки 110 фильтров анализа иметь плавный спад, что позволяет упрощать проектное решение и сокращать затраты фильтра нижних частот и фильтра верхних частот. Перекрытие сигнала 122 полосы низких частот и сигнала 124 полосы высоких частот также позволяет обеспечивать плавное смешивание сигналов полосы низких частот и полосы высоких частот в приемном устройстве, что может приводить к меньшим слышимым артефактам.
[0025] Следует отметить, что хотя пример по фиг. 1 иллюстрирует обработку SWB-сигнала, это служит только для иллюстрации. В альтернативном варианте осуществления входной аудиосигнал 102 может представлять собой широкополосный (WB) сигнал, имеющий частотный диапазон приблизительно от 50 Гц до 8 кГц. В таком варианте осуществления сигнал 122 полосы низких частот может соответствовать частотному диапазону приблизительно от 50 Гц до 6,4 кГц, и сигнал 124 полосы высоких частот может соответствовать частотному диапазону приблизительно от 6,4 кГц до 8 кГц. Также следует отметить, что различные системы и способы в данном документе описываются как обнаруживающие шум полосы высоких частот и выполняющие различные операции в ответ на шум полосы высоких частот. Тем не менее, это служит только для примера. Технологии, проиллюстрированные со ссылкой на фиг. 1-7, также могут выполняться в контексте шума полосы низких частот.
[0026] Система 100 может включать в себя модуль 130 анализа полосы низких частот, выполненный с возможностью принимать сигнал 122 полосы низких частот. В конкретном варианте осуществления модуль 130 анализа полосы низких частот может представлять вариант осуществления кодера на основе линейного предсказания с возбуждением по коду (CELP). Модуль 130 анализа полосы низких частот может включать в себя модуль 132 анализа и кодирования на основе линейного предсказания (LP), модуль 134 преобразования коэффициентов линейного предсказания (LPC) в пары спектральных линий (LSP) и квантователь 136. LSP также могут упоминаться в качестве частот спектральных линий (LSF), и эти два термина могут использоваться взаимозаменяемо в данном документе. Модуль 132 LP-анализа и кодирования может кодировать спектральную огибающую сигнала 122 полосы низких частот в качестве набора LPC. LPC могут формироваться для каждого кадра аудио (например, 20 миллисекунд (мс) аудио, соответствующего 320 выборкам на частоте дискретизации 16 кГц), каждого субкадра аудио (например, 5 мс аудио) или любой комбинации вышеозначенного. Число LPC, сформированных для каждого кадра или субкадра, может определяться посредством "порядка" выполняемого LP-анализа. В конкретном варианте осуществления модуль 132 LP-анализа и кодирования может формировать набор из одиннадцати LPC, соответствующих LP-анализу десятого порядка.
[0027] Модуль 134 преобразования LPC в LSP может преобразовывать набор LPC, сформированных посредством модуля 132 LP-анализа и кодирования, в соответствующий набор LSP (например, с использованием преобразования "один-к-одному"). Альтернативно, набор LPC может преобразовываться "один-к-одному" в соответствующий набор ParCor-коэффициентов, значений логарифмического отношения площадей, пар спектральных иммитансов (ISP) или частот спектральных иммитансов (ISF). Преобразование между набором LPC и набором LSP может быть обратимым без ошибки.
[0028] Квантователь 136 может квантовать набор LSP, сформированных посредством модуля 134 преобразования. Например, квантователь 136 может включать в себя или соединяться с несколькими таблицами кодирования, которые включают в себя несколько записей (например, векторов). Чтобы квантовать набор LSP, квантователь 136 может идентифицировать записи таблиц кодирования, которые являются "ближайшими" (например, на основе показателя искажения, такого как наименьшие квадраты среднеквадратической ошибки) к набору LSP. Квантователь 136 может выводить значение индекса или последовательность значений индекса, соответствующих местоположению идентифицированных записей в таблицах кодирования. Выходной сигнал квантователя 136 в силу этого может представлять параметры фильтрации полосы низких частот, которые включены в поток 142 битов полосы низких частот.
[0029] Модуль 130 анализа полосы низких частот также может формировать сигнал 144 возбуждения полосы низких частот. Например, сигнал 144 возбуждения полосы низких частот может представлять собой кодированный сигнал, который формируется посредством квантования остаточного LP-сигнала, который формируется во время LP-процесса, выполняемого посредством модуля 130 анализа полосы низких частот. Остаточный LP-сигнал может представлять ошибку предсказания.
[0030] Система 100 дополнительно может включать в себя модуль 150 анализа полосы высоких частот, выполненный с возможностью принимать сигнал 124 полосы высоких частот из гребенки 110 фильтров анализа и сигнал 144 возбуждения полосы низких частот из модуля 130 анализа полосы низких частот. Модуль 150 анализа полосы высоких частот может формировать вспомогательную информацию 172 полосы высоких частот на основе одного или более из сигнала 124 полосы высоких частот, сигнала 144 возбуждения полосы низких частот или фильтрованного выходного сигнала 168 полосы высоких частот, к примеру, как подробнее описано относительно фиг. 4. Например, вспомогательная информация 172 полосы высоких частот может включать в себя LSP полосы высоких частот и/или информацию усиления (например, на основе, по меньшей мере, отношения энергии полосы высоких частот к энергии полосы низких частот), как подробнее описано в данном документе.
[0031] Модуль 150 анализа полосы высоких частот может включать в себя формирователь 160 возбуждения полосы высоких частот. Формирователь 160 возбуждения полосы высоких частот может формировать сигнал возбуждения полосы высоких частот посредством расширения спектра сигнала 144 возбуждения полосы низких частот до частотного диапазона полосы высоких частот (например, 7 кГц – 16 кГц). В качестве иллюстрации формирователь 160 возбуждения полосы высоких частот может применять преобразование к сигналу возбуждения полосы низких частот (например, нелинейное преобразование, такое как операция в абсолютных значениях или в квадрате) и может смешивать преобразованный сигнал возбуждения полосы низких частот с шумовым сигналом (например, белым шумом, модулированным согласно огибающей, соответствующей сигналу 144 возбуждения полосы низких частот) для того, чтобы формировать сигнал возбуждения полосы высоких частот. Сигнал возбуждения полосы высоких частот может использоваться посредством модуля 162 определения усиления полосы высоких частот для того, чтобы определять один или более параметров усиления полосы высоких частот, которые включены во вспомогательную информацию 172 полосы высоких частот.
[0032] Модуль 150 анализа полосы высоких частот также может включать в себя модуль 152 LP-анализа и кодирования, модуль 154 преобразования LPC в LSP и квантователь 156. Каждый из модуля 152 LP-анализа и кодирования, модуля 154 преобразования и квантователя 156 может функционировать так, как описано выше в отношении соответствующих компонентов модуля 130 анализа полосы низких частот, но при сравнительно уменьшенном разрешении (например, с использованием меньшего числа битов для каждого коэффициента, LSP и т.д.). В другом примерном варианте осуществления LSP-квантователь 156 полосы высоких частот может использовать скалярное квантование, при котором поднабор LSP-коэффициентов квантуется по отдельности с использованием предварительно заданного числа битов. Например, модуль 152 LP-анализа и кодирования, модуль 154 преобразования и квантователь 156 могут использовать сигнал 124 полосы высоких частот для того, чтобы определять информацию фильтрации полосы высоких частот (например, LSP полосы высоких частот), которая включена во вспомогательную информацию 172 полосы высоких частот. В конкретном варианте осуществления вспомогательная информация 172 полосы высоких частот может включать в себя LSP полосы высоких частот, а также параметры усиления полосы высоких частот.
[0033] Поток 142 битов полосы низких частот и вспомогательная информация 172 полосы высоких частот могут мультиплексироваться посредством мультиплексора (мультиплексора) 180, чтобы формировать выходной поток 192 битов. Выходной поток 192 битов может представлять кодированный аудиосигнал, соответствующий входному аудиосигналу 102. Например, выходной поток 192 битов может передаваться (например, по проводному, беспроводному или оптическому каналу) и/или сохраняться. В приемном устройстве, обратные операции могут выполняться посредством демультиплексора (демультиплексора), декодера полосы низких частот, декодера полосы высоких частот и гребенки фильтров, чтобы формировать аудиосигнал (например, восстановленную версию входного аудиосигнала 102, который предоставляется в динамик или другое устройство вывода). Число битов, используемых для того, чтобы представлять поток 142 битов полосы низких частот, может быть более существенно большим числа битов, используемых для того, чтобы представлять вспомогательную информацию 172 полосы высоких частот. Таким образом, большая часть битов в выходном потоке 192 битов представляют данные полосы низких частот. Вспомогательная информация 172 полосы высоких частот может использоваться в приемном устройстве для того, чтобы повторно формировать сигнал возбуждения полосы высоких частот из данных полосы низких частот в соответствии с моделью прохождения сигналов. Например, модель прохождения сигналов может представлять ожидаемый набор взаимосвязей или корреляций между данными полосы низких частот (например, сигналом 122 полосы низких частот) и данными полосы высоких частот (например, сигналом 124 полосы высоких частот). Таким образом, различные модели прохождения сигналов могут использоваться для различных видов аудиоданных (например, речи, музыки и т.д.), и конкретная модель прохождения сигналов, которая используется, может быть согласована посредством передающего устройства и приемного устройства (или задана посредством отраслевого стандарта) до передачи кодированных аудиоданных. С использованием модели прохождения сигналов модуль 150 анализа полосы высоких частот в передающем устройстве может иметь возможность формировать вспомогательную информацию 172 полосы высоких частот, так что соответствующий модуль анализа полосы высоких частот в приемном устройстве имеет возможность использовать модель прохождения сигналов для того, чтобы восстанавливать сигнал 124 полосы высоких частот из выходного потока 192 битов.
[0034] Тем не менее, при наличии шума синтез полосы высоких частот в приемном устройстве может приводить к заметным артефактам, поскольку недостаточная корреляция между полосой низких частот и полосой высоких частот может заставлять базовую модель прохождения сигналов работать субоптимально в отношении надежного восстановления сигналов. Например, модель прохождения сигналов может некорректно интерпретировать компоненты шума в полосе высоких частот в качестве речи и в силу этого может вызывать формирование параметров усиления, которые пытаются реплицировать шум в приемном устройстве, приводя к заметным артефактам. Примеры таких условий формирования артефактов включают в себя, но не только, высокочастотные шумы, такие как автомобильные гудки и скрипящие тормоза. В качестве иллюстрации первая спектрограмма 210 на фиг. 2 иллюстрирует аудиосигнал, имеющий компоненты, соответствующие условиям формирования артефактов, проиллюстрированным в качестве шума полосы высоких частот, имеющего относительно большую энергию сигналов. Вторая спектрограмма 220 иллюстрирует результирующие артефакты в восстановленном сигнале вследствие переоценки параметров усиления.
[0035] Чтобы уменьшать такие артефакты, модуль 150 анализа полосы высоких частот может выполнять условную фильтрацию полосы высоких частот. Например, модуль 150 анализа полосы высоких частот может включать в себя модуль 158 обнаружения вызывающих артефакты компонентов, который выполнен с возможностью обнаруживать вызывающие артефакты компоненты, например, вызывающий артефакты компонент, показанный на первой спектрограмме 210 по фиг. 2, которые с большой вероятностью приводят к слышимым артефактам при воспроизведении. При наличии таких компонентов модуль 166 фильтрации может выполнять фильтрацию сигнала 124 полосы высоких частот для того, чтобы ослаблять компоненты формирования артефактов. Фильтрация сигнала 124 полосы высоких частот может приводить к восстановленному сигналу согласно третьей спектрограмме 230 по фиг. 2, который является свободным (или имеет пониженный уровень) от артефактов, показанных на второй спектрограмме 220 по фиг. 2.
[0036] Один или более тестов могут выполняться для того, чтобы оценивать то, включает или нет аудиосигнал в себя условие формирования артефактов. Например, первый тест может включать в себя сравнение минимального разнесения между LSP, которое обнаруживается в наборе LSP (например, LSP для конкретного кадра аудиосигнала), с первым пороговым значением. Небольшое разнесение между LSP соответствует относительно сильному сигналу в относительно узком частотном диапазоне. В конкретном варианте осуществления когда определяется то, что сигнал 124 полосы высоких частот приводит к кадру, имеющему минимальное разнесение между LSP, которое меньше первого порогового значения, определяется то, что условие формирования артефактов присутствует в аудиосигнале, и фильтрация может разрешаться для кадра.
[0037] В качестве другого примера второй тест может включать в себя сравнение среднего минимального разнесения между LSP для нескольких последовательных кадров со вторым пороговым значением. Например, когда конкретный кадр аудиосигнала имеет минимальное LSP-разнесение, которое превышает первое пороговое значение, но меньше второго порогового значения, по-прежнему может определяться то, что условие формирования артефактов присутствует, если среднее минимальное разнесение между LSP для нескольких кадров (например, взвешенное среднее минимального разнесения между LSP для четырех последних кадров, включающих в себя конкретный кадр) меньше третьего порогового значения. Как результат, фильтрация может разрешаться для конкретного кадра.
[0038] В качестве другого примера третий тест может включать в себя определение того, находится или нет конкретный кадр после фильтрованного кадра аудиосигнала. Если конкретный кадр находится после фильтрованного кадра, фильтрация может разрешаться для конкретного кадра на основе минимального разнесения между LSP конкретного кадра, меньшего второго порогового значения.
[0039] Три теста описываются в качестве иллюстрации. Фильтрация для кадра может разрешаться в ответ на удовлетворение любого одного или более тестов (или комбинаций тестов) либо в ответ на удовлетворение одного или более других тестов или условий. Например, конкретный вариант осуществления может включать в себя определение того, разрешать или нет фильтрацию на основе одного теста, к примеру, первого теста, описанного выше, без применения второго теста или третьего теста. Альтернативные варианты осуществления могут включать в себя определение того, разрешать или нет фильтрацию на основе второго теста без применения первого теста или третьего теста, либо на основе третьего теста без применения первого теста или второго теста. В качестве другого примера конкретный вариант осуществления может включать в себя определение того, разрешать или нет фильтрацию на основе двух тестов, к примеру, первого теста и второго теста без применения третьего теста. Альтернативные варианты осуществления могут включать в себя определение того, разрешать или нет фильтрацию на основе первого теста и третьего теста без применения второго теста, либо на основе второго теста и третьего теста без применения первого теста.
[0040] В конкретном варианте осуществления модуль 158 обнаружения вызывающих артефакты компонентов может определять параметры из аудиосигнала для того, чтобы определять то, включает или нет аудиосигнал в себя компонент, который должен приводить к слышимым артефактам. Примеры таких параметров включают в себя минимальное разнесение между LSP и среднее минимальное разнесение между LSP. Например, LP-процесс десятого порядка может формировать набор из одиннадцати LPC, которые преобразованы в десять LSP. Модуль 158 обнаружения вызывающих артефакты компонентов может определять, для конкретного кадра аудио, минимальное (например, наименьшее) разнесение между любыми двумя из десяти LSP. Типично, резкие и внезапные шумы, такие как автомобильные гудки и скрипящие тормоза, приводят к близкорасположенным LSP (например, "сильный" компонент шума в 13 кГц на первой спектрограмме 210 может быть близко окружен посредством LSP в 12,95 кГц и 13,05 кГц). Модуль 158 обнаружения вызывающих артефакты компонентов может определять минимальное разнесение между LSP и среднее минимальное разнесение между LSP так, как показано в нижеприведенном псевдокоде в стиле С++, который может выполняться или реализовываться посредством модуля 158 обнаружения вызывающих артефакты компонентов.
lsp_spacing=0,5; //минимальное LSP-разнесение по умолчанию
LPC_ORDER=10; //порядок выполнения кодирования с линейным предсказанием
for(i=0; i<LPC_ORDER; i++)
{/*Оценка разнесения между LSP, т.е. LSP-расстояния между i-м коэффициентом и (i-1)-м LSP-коэффициентом, как указано ниже*/
lsp_spacing=min (lsp_spacing, (i==0? lsp_shb[0]
: (lsp_shb[i]
lsp_shb[i-1])));
}
[0041] Модуль 158 обнаружения вызывающих артефакты компонентов дополнительно может определять средневзвешенное минимальное разнесение между LSP в соответствии со следующим псевдокодом. Следующий псевдокод также включает в себя сброс разнесения между LSP в ответ на изменение режима. Такие изменения режима могут возникать в устройствах, которые поддерживают несколько режимов кодирования для музыки и/или речи. Например, устройство может использовать режим алгебраического CELP (ACELP) для речи и режим кодирования аудио, т.е. общее кодирование сигналов (GSC) для сигналов музыкального типа. Альтернативно, в определенных низкоскоростных сценариях, устройство может определять на основе параметров признаков (например, тональности, ухода основного тона, интонирования и т.д.) то, что может использоваться режим ACELP/GSC/модифицированного дискретного косинусного преобразования (MDCT).
/*Сброс LSP-разнесения во время изменений режима, т.е. когда режим кодирования последнего кадра отличается от режима кодирования текущего кадра*/
THR1=0,008;
if(last_mode!=current_mode andand lsp_spacing<THR1)
{
lsp_shb_spacing[0]
=lsp_spacing;
lsp_shb_spacing[1]
=lsp_spacing;
lsp_shb_spacing[2]
=lsp_spacing;
prevPreFilter=TRUE;
}
/*Вычисление средневзвешенного LSP-разнесения для текущего кадра и трех предыдущих кадров*/
WGHT1=0,1; WGHT2=0,2; WGHT3=0,3; WGHT4=0,4;
Average_lsp_shb_spacing=WGHT1*lsp_shb_spacing[0
+
WGHT2*lsp_shb_spacing[1]
+
WGHT3*lsp_shb_spacing[2]
+
WGHT4*lsp_spacing;
/*Обновление буфера разнесения предыдущих lsp*/
lsp_shb_spacing[0]
=lsp_shb_spacing[1];
lsp_shb_spacing[1]
=lsp_shb_spacing[2];
lsp_shb_spacing[2]
=lsp_spacing;
[0042] После определения минимального разнесения между LSP и среднего минимального разнесения между LSP модуль 158 обнаружения вызывающих артефакты компонентов может сравнивать определенные значения с одним или более пороговых значений в соответствии со следующим псевдокодом, чтобы определять то, существует или нет вызывающий артефакты шум в кадре аудио. Когда вызывающий артефакты шум существует, модуль 158 обнаружения вызывающих артефакты компонентов может предписывать модулю 166 фильтрации выполнять фильтрацию сигнала 124 полосы высоких частот.
THR1=0,008; THR2=0,0032, THR3=0,005;
PreFilter=FALSE;
/*Проверка нижеприведенных условий и разрешение параметров фильтрации
Если LSP-разнесение является очень небольшим, то имеется высокая достоверность того, что вызывающий артефакты шум существует.*/
if(lsp_spacing<=THR2 ||
(lsp_spacing<THR1 andand (Average_lsp_shb_spacing<THR3 ||
prevPreFilter==TRUE)))
{
PreFilter=TRUE;
}
/*Обновление флага ослабления усиления предыдущего кадра, который должен использоваться в следующем кадре*/
prevPreFilter=PreFilter;
[0043] В конкретном варианте осуществления модуль 166 условной фильтрации может избирательно выполнять фильтрацию, когда вызывающий артефакты шум обнаруживается. Модуль 166 фильтрации может фильтровать сигнал 124 полосы высоких частот до определения одного или более параметров усиления вспомогательной информации 172 полосы высоких частот. Например, фильтрация может включать в себя фильтрацию с конечной импульсной характеристикой (FIR). В конкретном варианте осуществления фильтрация может выполняться с использованием адаптивных LPC 164 полосы высоких частот из модуля 152 LP-анализа и кодирования и может формировать фильтрованный выходной сигнал 168 полосы высоких частот. Фильтрованный выходной сигнал 168 полосы высоких частот может использоваться для того, чтобы формировать, по меньшей мере, часть вспомогательной информации 172 полосы высоких частот.
[0044] В конкретном варианте осуществления фильтрация может выполняться в соответствии с уравнением фильтрации:
[0045] где ai являются LPC полосы высоких частот, L является LPC-порядком (например, 10), и (гамма) является весовым параметром. В конкретном варианте осуществления весовой параметр может и