2648570 - Оценка формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона

Оценка формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона

Иллюстрации

Показать все

Изобретение относится к области обработки сигналов. Технический результат изобретения заключается в обеспечении возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала. Способ включает в себя определение в устройстве кодирования речи первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Способ также включает в себя определение вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании части верхнего диапазона звукового сигнала. Способ также включает в себя вставку первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала. 4 н. и 26 з.п. ф-лы, 7 ил.

Реферат

ЗАЯВЛЕНИЕ ОБ УСТАНОВЛЕНИИ ПРИОРИТЕТА

По настоящей заявке испрашивается приоритет предварительной заявки на патент США № 61/889434, озаглавленной «GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS», зарегистрированной 10 октября 2013 и обычной заявки на патент США № 14/508486, озаглавленной «GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS», зарегистрированной 7 октября 2014, содержание которых включено посредством ссылки во всей их полноте.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее раскрытие в широком смысле относится к обработке сигналов.

ОПИСАНИЕ УРОВНЯ ТЕХНИКИ

Успехи в технологии позволили получить меньшие по размеру и более мощные вычислительные устройства. Например, в настоящий момент существует множество портативных вычислительных устройств, включая беспроводные вычислительные устройства, такие как мобильные беспроводные телефоны, карманные персональные компьютеры (КПК) и радиоприемники персонального вызова, которые являются небольшими по размеру, легкими и могут легко переноситься пользователями. Более конкретно, портативные беспроводные телефоны, такие как сотовые телефоны и телефоны, работающие по Интернет-протоколу (IP), могут передавать голос и пакеты данных по беспроводным сетям. Кроме того, многие такие беспроводные телефоны содержат устройства других типов, которые встроены в них. Например, беспроводной телефон может также содержать цифровую фотокамеру, цифровую видеокамеру, цифровое записывающее устройство и проигрыватель аудиофайлов.

В традиционных телефонных системах (например, коммутируемых телефонных сетях общего пользования (PSTN)) ширина спектра сигнала ограничена частотным диапазоном от 300 герц (Гц) до 3,4 килогерц (кГц). В широкополосных (WB) приложениях, таких как сотовая телефония и передача речи по протоколу IP (VoIP), ширина спектра сигнала может перекрывать частотный диапазон от 50 Гц до 7 кГц. В сверхширокополосных методиках кодирования (SWB) поддерживается ширина спектра, которая простирается приблизительно до 16 кГц. Расширение ширины спектра сигнала от узкополосной телефонии в 3,4 кГц до телефонии SWB в 16 кГц может улучшить качество восстановления сигнала, повысить разборчивость и естественность.

Методики кодирования SWB обычно включают в себя кодирование низкочастотной части сигнала (например, от 50 Гц до 7 кГц, также называемой "нижним диапазоном"). Например, нижний диапазон может быть представлен с применением параметров фильтрации и/или сигнала возбуждения нижнего диапазона. Однако, в целях повышения эффективности кодирования высокочастотная часть сигнала (например, от 7 кГц до 16 кГц, также называемая "верхним диапазоном"), может кодироваться и передаваться не полностью. Вместо этого в приемнике может применяться моделирование сигнала для предсказания верхнего диапазона. В некоторых реализациях данные, относящиеся к верхнему диапазону, могут быть предоставлены приемнику для помощи в предсказании. Такие данные могут называться «дополнительной информацией» и могут включать в себя информацию коэффициенте передачи, линейные спектральные частоты (LSF, также называемые линейными спектральными парами (LSP)), и т.д. Свойства сигнала нижнего диапазона могут использоваться для генерации дополнительной информации; однако, энергетические несоответствия между нижним диапазоном и верхним диапазоном могут привести к тому, что дополнительная информация будет неточно характеризовать верхний диапазон.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Раскрыты системы и способы для выполнения двухэтапной оценки формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона. Устройство кодирования речи может использовать часть нижнего диапазона (например, гармонически расширенное возбуждение нижнего диапазона) звукового сигнала для генерации информации (например, дополнительной информации), используемой для восстановления высокочастотной части звукового сигнала в декодирующем устройстве. Первый блок оценки формы коэффициента передачи может определять изменения энергии в остаточном сигнале верхнего диапазона, которые не присутствуют в возбуждении гармонически расширенного нижнего диапазона. Например, блок оценки формы коэффициента передачи может оценивать временные изменения или отклонения (например, энергетические уровни) в верхнем диапазоне, которые являются сдвинутыми или отсутствуют в остаточном сигнале верхнего диапазона относительно гармонически расширенного сигнала возбуждения нижнего диапазона. Первый блок настройки формы коэффициента передачи (на основании первых параметров формы коэффициента передачи) может настроить изменение во времени гармонически расширенного возбуждения нижнего диапазона таким образом, чтобы оно близко соответствовало временной огибающей остаточного сигнала верхнего диапазона. Синтезированный сигнал верхнего диапазона может генерироваться на основании настроенного/измененного гармонически расширенного возбуждения нижнего диапазона, и второй блок оценки формы коэффициента передачи может определять изменения энергии между синтезированным сигналом верхнего диапазона и высокочастотной частью звукового сигнала на втором этапе. Синтезированный сигнал верхнего диапазона может быть настроен таким образом, чтобы смоделировать высокочастотную часть звукового сигнала на основании данных (например, вторых параметров формы коэффициента передачи) второго блока оценки формы коэффициента передачи. Первые параметры формы коэффициента передачи и вторые параметры формы коэффициента передачи могут быть переданы декодирующему устройству вместе с другой дополнительной информацией в целях восстановления высокочастотной части звукового сигнала.

В конкретном аспекте способ включает в себя определение, в устройстве кодирования речи, первых параметров формы на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. В еще одном конкретном аспекте первые параметры формы коэффициента передачи определяют на основании временного изменения в остаточном сигнале верхнего диапазона, ассоциированном с высокочастотной частью звукового сигнала. Способ также включает в себя определение вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Способ также включает в себя вставку первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте устройство содержит первый блок оценки формы коэффициента передачи, сконфигурированный для определения первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Устройство также содержит второй блок оценки формы коэффициента передачи, сконфигурированный для определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Устройство также содержит мультиплексор, сконфигурированный для вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте постоянный машиночитаемый носитель информации содержит инструкции, которые, при их исполнении процессором, вызывают выполнение процессором определения первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Инструкции также могут быть исполнены для вызывания выполнения процессором определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Инструкции также могут быть исполнены для вызывания выполнения процессором вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте устройство содержит средство для определения первых параметров формы коэффициента передачи на основании гармонически расширенного сигнала и/или на основании остаточного сигнала верхнего диапазона, ассоциированного с высокочастотной частью звукового сигнала. Устройство также содержит средство для определения вторых параметров формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и на основании высокочастотной части звукового сигнала. Устройство также содержит средство для вставки первых параметров формы коэффициента передачи и вторых параметров формы коэффициента передачи в закодированную версию звукового сигнала в целях обеспечения возможности настройки коэффициента передачи во время воспроизведения звукового сигнала из закодированной версии звукового сигнала.

В еще одном конкретном аспекте способ включает в себя прием, в устройстве декодирования речи, закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на первом гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Способ также включает в себя воспроизведение звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

В еще одном конкретном аспекте устройство декодирования речи сконфигурировано для приема закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Устройство декодирования речи также сконфигурировано для воспроизведения звукового сигнала из закодированного звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

В еще одном конкретном аспекте устройство содержит средство для приема закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на первом гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Устройство также содержит средство для воспроизведения звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

В еще одном конкретном аспекте постоянный машиночитаемый носитель информации содержит инструкции, которые, при их исполнении процессором, вызывают выполнение процессором приема закодированного звукового сигнала от устройства кодирования речи. Закодированный звуковой сигнал включает в себя первые параметры формы коэффициента передачи, основанные на первом гармонически расширенном сигнале, сгенерированном в устройстве кодирования речи, и/или основанные на остаточном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи. Закодированный звуковой сигнал также включает в себя вторые параметры формы коэффициента передачи, основанные на первом синтезированном сигнале верхнего диапазона, сгенерированном в устройстве кодирования речи, и основанные на верхнем диапазоне звукового сигнала. Инструкции также могут быть исполнены для вызывания выполнения процессором воспроизведения звукового сигнала из кодируемого звукового сигнала на основании первых параметров формы коэффициента передачи и на основании вторых параметров формы коэффициента передачи.

Конкретные преимущества, предоставляемые по меньшей мере одним из раскрытых вариантов осуществления, включают в себя улучшение энергетической корреляции между гармонически расширенным возбуждением нижнего диапазона звукового сигнала и остатком верхнего диапазона звукового сигнала. Например, гармонически расширенное возбуждение нижнего диапазона может быть скорректировано на основании параметров формы коэффициента передачи в целях более точного соответствия временным характеристикам остаточного сигнала верхнего диапазона. Другие аспекты, преимущества и характеристики настоящего раскрытия станут очевидными после анализа всей заявки, включая следующие разделы: краткое описание чертежей, подробное описание и формула изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг. 1 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для определения параметров формы коэффициента передачи на двух этапах в целях восстановления верхнего диапазона;

Фиг. 2 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для определения параметров формы коэффициента передачи на первом этапе на основании гармонически расширенного сигнала и/или остаточного сигнала верхнего диапазона;

Фиг. 3 представляет собой временную диаграмму для иллюстрации параметров формы коэффициента передачи на основании различий между гармонически расширенным сигналом и остаточным сигналом верхнего диапазона;

Фиг. 4 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для определения вторых параметров формы коэффициента передачи на втором этапе на основании синтезированного сигнала верхнего диапазона и высокочастотной части входного звукового сигнала;

Фиг. 5 представляет собой диаграмму для иллюстрации конкретного варианта осуществления системы, который пригоден для воспроизведения звукового сигнала с использованием параметров формы коэффициента передачи;

Фиг. 6 представляет собой блок-схему для иллюстрации конкретных вариантов осуществления способов для использования оценок коэффициента передачи для восстановления верхнего диапазона; и

Фиг. 7 представляет собой блок-схему беспроводного устройства, пригодного для выполнения операций обработки сигналов в соответствии с системами и способами с фиг. 1-6.

ПОДРОБНОЕ ОПИСАНИЕ

Обратимся к фиг. 1; показан и в общих чертах определен конкретный вариант осуществления системы 100, который способен определять параметры формы коэффициента передачи на двух этапах в целях восстановления верхнего диапазона. В конкретном варианте осуществления система 100 может быть интегрирована в систему или устройство кодирования (например, в беспроводной телефон, кодирующее устройство/декодирующее устройство (CODEC) или цифровой сигнальный процессор (DSP)). В других конкретных вариантах осуществления система 100 может быть интегрирована в телевизионную приставку, музыкальный проигрыватель, видеоплеер, развлекательный модуль, навигационный прибор, коммуникационное устройство, КПК, блок данных фиксированного местоположения или компьютер.

Следует отметить, что в приведенном ниже описании различные функции, выполняемые системой 100 с фиг. 1 описаны как выполняемые определенными узлами или модулями. Однако, такое деление узлов и модулей приведено только в целях иллюстрации. В альтернативном варианте осуществления функция, выполняемая конкретным узлом или модулем, может вместо этого быть разделена между множеством узлов или модулей. Кроме того, в альтернативном варианте осуществления, два или более узлов или модулей с фиг. 1 могут быть интегрированы в единственный узел или модуль. Каждый узел или модуль, проиллюстрированный на фиг. 1, может быть реализован с применением аппаратного обеспечения (например, устройства на программируемой в условиях эксплуатации матрице логических элементов (FPGA), специализированная интегральная схема (ASIC), DSP, контроллер, и т.д.), программного обеспечения (например, инструкций, исполнимых процессором), или произвольной комбинации указанного.

Система 100 содержит набор 110 фильтров для частотного разложения сигнала, который сконфигурирован для приема входного звукового сигнала 102. Например, входной звуковой сигнал 102 может быть получен посредством микрофона или другого устройства ввода. В конкретном варианте осуществления входной звуковой сигнал 102 может содержать речь. Входной звуковой сигнал 102 может представлять собой сигнал SWB, который содержит данные в частотном диапазоне от приблизительно 50 Гц до приблизительно 16 кГц. Набор 110 фильтров для частотного разложения сигнала может фильтровать входной звуковой сигнал 102 на множество частей на основании частоты. Например, набор 110 фильтров для частотного разложения сигнала может генерировать сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона. Сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона могут иметь равную или неравную полосу частот, и могут перекрываться или не перекрываться друг с другом. В альтернативном варианте осуществления набор 110 фильтров для частотного разложения сигнала может генерировать более двух выходных сигналов.

В примере на фиг. 1 сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона занимают неперекрывающиеся полосы частот. Например, сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона могут занимать неперекрывающиеся полосы частот 50 Гц-7 кГц и 7 кГц–16 кГц, соответственно. В альтернативном варианте осуществления сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона могут занимать неперекрывающиеся полосы частот 50 Гц-8 кГц и 8 кГц-16 кГц, соответственно. В другом альтернативном варианте осуществления сигнал 122 нижнего диапазона и сигнал 124 верхнего диапазона перекрываются (например, 50 Гц-8 кГц и 7 кГц–16 кГц, соответственно), что может обеспечить для фильтра нижних частот и фильтра высоких частот набора 110 фильтров для частотного разложения сигнала возможность иметь гладкий спад, что может упростить конструкцию и снизить стоимость фильтра нижних частот и фильтра высоких частот. Перекрытие сигнала 122 нижнего диапазона 122 и сигнала 124 верхнего диапазона может также обеспечивать возможность плавного смешивания сигналов нижнего диапазона и сигнала верхнего диапазона в приемнике, что может уменьшить количество звуковых артефактов.

Следует отметить, что хотя пример с фиг. 1 иллюстрирует обработку сигнала SWB, это является только иллюстрацией. В альтернативном варианте осуществления входной звуковой сигнал 102 может быть сигналом WB, имеющим частотный диапазон от приблизительно 50 Гц до приблизительно 8 кГц. В таком варианте осуществления сигнал 122 нижнего диапазона, может, например, соответствовать частотному диапазону от приблизительно 50 Гц до приблизительно 6,4 кГц, и сигнал 124 верхнего диапазона может соответствовать частотному диапазону от приблизительно 6,4 кГц до приблизительно 8 кГц.

Система 100 может содержать модуль 130 анализа нижнего диапазона, сконфигурированный для приема сигнала 122 нижнего диапазона. В конкретном варианте осуществления модуль 130 анализа нижнего диапазона может представлять собой вариант осуществления устройства кодирования на основе линейного предсказания с кодовым возбуждением (CELP). Модуль 130 анализа нижнего диапазона может содержать модуль анализа и кодирования линейного предсказания (LP) 132, модуль 134 преобразования коэффициентов линейного предсказания (LPC) в LSP и импульсный модулятор 136. LSP могут также называться LSF, и два термина (LSP и LSF) могут быть использованы взаимозаменяемо в настоящем описании. Модуль 132 анализа и кодирования LP может кодировать огибающую спектра сигнала 122 нижнего диапазона как множество LPC. LPC могут генерироваться для каждого кадра аудио (например, 20 миллисекунд (мс) аудио, что соответствует 320 дискретным значениям при частоте дискретизации 16 кГц), каждого подкадра аудио (например, 5 мс аудио), или произвольной комбинации указанного. Число LPC, генерируемых для каждого кадра или подкадра, может быть определено "порядком" выполняемого анализа LP. В конкретном варианте осуществления модуль 132 анализа и кодирования LP может генерировать множество из одиннадцати LPC, соответствующих анализу LP десятого порядка.

Модуль 134 преобразования LPC в LSP может преобразовывать множество LPC, сгенерированных посредством модуля 132 анализа и кодирования LP 132, в соответствующее множество LSP (например, с применением взаимно однозначного преобразования). Альтернативно, множество LPC может быть взаимно однозначно преобразовано в соответствующее множество коэффициентов частичной автокорреляции, значений отношения логарифмов площадей, спектральные пары иммитансов (ISP), или спектральные частоты иммитансов (ISF). Преобразование между набором LPC и набором LSP может являться безошибочно обратимым.

Импульсный модулятор 136 может квантовать набор LSP, сгенерированных модулем 134 преобразования. Например, импульсный модулятор 136 может содержать или может быть соединен с множеством кодовых книг, которые содержат множество записей (например, векторов). Для того, чтобы квантовать множество LSP, импульсный модулятор 136 может идентифицировать записи кодовых книг, которые являются «наиболее близкими» (например, на основании меры искажения, такой как наименьшие квадраты или среднеквадратичная ошибка) к множеству LSP. Импульсный модулятор 136 может выдавать значение индекса или ряд значений индексов, соответствующих положению идентифицированных записей в кодовой книге. Выход импульсного модулятора 136 может, таким образом, представлять собой параметры фильтра нижнего диапазона, которые включены в поток 142 битов нижнего диапазона.

Модуль 130 анализа нижнего диапазона может также генерировать сигнал 144 возбуждения нижнего диапазона. Например, сигнал 144 возбуждения нижнего диапазона может представлять собой закодированный сигнал, который генерируется посредством квантования остаточного сигнала LP, который генерируется во время процесса LP, выполняемого модулем 130 анализа нижнего диапазона. Остаточный сигнал LP может представлять ошибку предсказания.

Система 100 может также содержать модуль 150 анализа верхнего диапазона, сконфигурированный для приема сигнала 124 верхнего диапазона от набора 110 фильтров для частотного разложения сигнала и сигнала 144 возбуждения нижнего диапазона от модуля 130 анализа нижнего диапазона. Модуль 150 анализа верхнего диапазона может генерировать дополнительную информацию верхнего диапазона 172 на основании сигнала 124 верхнего диапазона и сигнала 144 возбуждения нижнего диапазона. Например, дополнительная информация 172 верхнего диапазона может включать в себя LSP верхнего диапазона и/или информацию о коэффициенте передачи (например, на основании, по меньшей мере, отношения энергии верхнего диапазона к энергии нижнего диапазона) в соответствии с подробнее описанным в настоящем описании. В конкретном варианте осуществления информация о коэффициенте передачи может включать в себя параметры формы коэффициента передачи, основанные на гармонически расширенном сигнале и/или остаточном сигнале верхнего диапазона. Гармонически расширенный сигнал может быть не подходящим для применения в синтезе верхнего диапазона вследствие недостаточной корреляции между сигналом 124 верхнего диапазона и сигналом 122 нижнего диапазона. Например, подкадры сигнала 124 верхнего диапазона могут содержать флуктуации в энергетических уровнях, которые не имитируются должным образом в смоделированном сигнале 161 возбуждения верхнего диапазона.

Модуль 150 анализа верхнего диапазона может содержать первый блок 190 оценки формы коэффициента передачи. Первый блок 190 оценки формы коэффициента передачи может определять первые параметры формы коэффициента передачи на основании первого сигнала, ассоциированного с сигналом 122 нижнего диапазона, и/или на основании высокочастотного остатка сигнала 124 верхнего диапазона. Как описано в настоящем описании, первый сигнал может представлять собой преобразованное (например, нелинейно или гармонически расширенное) возбуждение нижнего диапазона сигнала 122 нижнего диапазона. Дополнительная информация 172 верхнего диапазона может включать в себя первые параметры формы коэффициента передачи. Модуль 150 анализа верхнего диапазона может также содержать первый блок 192 настройки формы коэффициента передачи, сконфигурированный для настройки гармонически расширенного возбуждения нижнего диапазона на основании первых параметров формы коэффициента передачи. Например, первый блок 192 настройки формы коэффициента передачи может масштабировать конкретные подкадры гармонически расширенного возбуждения нижнего диапазона в целях аппроксимации энергетических уровней соответствующих подкадров остатка сигнала 124 верхнего диапазона.

Модуль 150 анализа верхнего диапазона может также содержать генератор 160 возбуждения верхнего диапазона. Генератор 160 возбуждения верхнего диапазона может генерировать сигнал 161 возбуждения верхнего диапазона посредством расширения спектра сигнала 144 возбуждения нижнего диапазона в частотный диапазон верхнего диапазона (например, 7 кГц-16 кГц). В качестве иллюстрации, генератор 160 возбуждения верхнего диапазона может смешивать скорректированное гармонически расширенное возбуждение нижнего диапазона с шумовым сигналом (например, белым шумом, модулированным в соответствии с огибающей, соответствующей сигналу 144 возбуждению нижнего диапазона, которое имитирует медленно изменяющиеся временные характеристики сигнала 122 нижнего диапазона) для генерации сигнала 161 возбуждения верхнего диапазона. Например, смешивание может быть выполнено согласно следующему уравнению:

Возбуждение верхнего диапазона=(α*скорректированное гармонически расширенное возбуждение нижнего диапазона)+((1-α)*модулированный шум)

Отношение, в котором смешаны скорректированное гармонически расширенное возбуждение нижнего диапазона и модулированный шум, может повлиять на качество восстановления верхнего диапазона в приемнике. Для речевых голосовых сигналов смешивание может отклоняться в направлении скорректированного гармонически расширенного возбуждения нижнего диапазона (например, коэффициент смешивания α может находиться в диапазоне от 0,5 до 1,0). Для неголосовых сигналов смешивание может отклоняться в направлении модулированного шума (например, коэффициент смешивания α может находиться в диапазоне от 0,0 до 0,5).

Как проиллюстрировано, модуль 150 анализа верхнего диапазона может также содержать модуль 152 анализа и кодирования LP, модуль 154 преобразования LPC в LSP и импульсный модулятор 156. Каждый модуль 152 анализа и кодирования LP, модуль преобразования 154, и импульсный модулятор 156 может функционировать в соответствии с описанным выше в отношении соответствующих узлов модуля 130 анализа нижнего диапазона, но в сравнительно пониженном разрешении (например, с использованием меньшего числа битов для каждого коэффициента, LSP и т.д.). Модуль 152 анализа и кодирования LP может генерировать множество LPC, которые преобразуются в LSP модулем 154 преобразования и квантуются импульсным модулятором 156 на основании кодовой книги 163. Например, модуль 152 анализа и кодирования LP, модуль преобразования 154 и импульсный модулятор 156 могут использовать сигнал 124 верхнего диапазона, который включен в дополнительную информацию 172 верхнего диапазона, для определения информации фильтра верхнего диапазона (например, LSP верхнего диапазона).

Импульсный модулятор 156 может быть сконфигурирован для квантования множества значений спектральных частот, таких как LSP, предоставленных модулем 154 преобразования. В других вариантах осуществления импульсный модулятор 156 может принимать и квантовать множества одного или более других типов значений спектральных частот в дополнение, или вместо, LSF или LSP. Например, импульсный модулятор 156 может принимать и квантовать множество LPC, сгенерированных модулем 152 анализа и кодирования LP. Другие примеры включают множества коэффициентов частичной автокорреляции, значений отношений логарифмов площадей и ISF, которые могут быть приняты и проквантованы в импульсном модуляторе 156. Импульсный модулятор 156 может содержать векторный импульсный модулятор, который кодирует входной вектор (например, множество значений спектральной частоты в векторном формате) в качестве индекса соответствующей записи в таблице или кодовой книге, такой как кодовая книга 163. В качестве другого примера, импульсный модулятор 156 может быть сконфигурирован для определения одного или более параметров, по которым входной вектор может генерироваться динамически в декодирующем устройстве, например, в варианте осуществления разреженной кодовой книги, а не извлекаться из хранилища. В качестве иллюстрации, примеры разреженной кодовой книги могут быть применены в таких схемах кодирования, как CELP и кодеках, соответствующих промышленным стандартам, таким как 3GPP2 (партнерство третьего поколения 2) EVRC (улучшенный кодек с переменной скоростью). В другом варианте осуществления модуль 150 анализа верхнего диапазона может содержать импульсный модулятор 156 и может быть сконфигурирован для использования ряда векторов кодовой книги для генерации синтезированных сигналов (например, согласно множеству параметров фильтрации) и выбора одного из векторов кодовой книги, ассоциированных с синтезированным сигналом, который наилучшим образом соответствует сигналу 124 верхнего диапазона, например, в области, взвешенной восприятием.

В конкретном варианте осуществления дополнительная информация 172 верхнего диапазона может включать в себя LSP верхнего диапазона, а также параметры коэффициента передачи верхнего диапазона. Например, сигнал 161 возбуждения верхнего диапазона может использоваться для определения дополнительных параметров формы коэффициента передачи, которые включены в дополнительную информацию 172 верхнего диапазона. Модуль 150 анализа верхнего диапазона может содержать второй блок 194 оценки формы коэффициента передачи и второй блок 196 настройки формы коэффициента передачи. Операция синтеза коэффициентов линейного предсказания может быть выполнена на сигнале 161 возбуждения верхнего диапазона для генерации синтезированного сигнала верхнего диапазона. Второй блок 194 оценки формы коэффициента передачи может определять вторые параметры формы коэффициента передачи на основании синтезированного сигнала верхнего диапазона и сигнала 124 верхнего диапазона. Дополнительная информация 172 верхнего диапазона может включать в себя вторые параметры формы коэффициента передачи. Второй блок 196 настройки формы коэффициента передачи может быть сконфигурирован для настройки синтезированного сигнала верхнего диапазона на вторые параметры формы коэффициента передачи. Например, второй блок 196 настройки формы коэффициента передачи может масштабировать конкретные подкадры синтезированного сигнала верхнего диапазона для аппроксимации энергетических уровней соответствующих подкадров сигнала 124 верхнего диапазона.

Поток 142 битов нижнего диапазона и дополнительная информация 172 верхнего диапазона могут быть мультиплексированы мультиплексором (MUX) 180 для генерации выходного потока 199 битов. Выходной поток 199 битов может представлять закодированный звуковой сигнал, соответствующий входному звуковому сигналу 102. Например, выходной поток 199 битов может быть передан (например, по проводному, беспроводному или оптическому каналу) и/или сохранен. Таким образом, мультиплексор 180 может вставлять первые параметры формы коэффициента передачи, определенные первым блоком 190 оценки формы коэффициента передачи, и вторые параметры формы коэффициента передачи, определенные вторым блоком 194 оценки формы коэффициента передачи, в выходной поток 199 битов для обеспечения возможности настройки коэффициента передачи возбуждения верхнего диапазона во время воспроизведения входного звукового сигнала 102. В приемнике обратные операции могут быть выполнены демультиплексором (DEMUX), декодирующим устройством нижнего диапазона, декодирующим устройством верхнего диапазона и множеством фильтров для генерации звукового сигнала (например, восстановленной версии входного звукового сигнала 102, который выдается на динамик или другое устройство вывода). Число битов, используемое для представления потока 142 битов нижнего диапазона, может быть существенно больше, чем число битов, используемое для представления дополнительной информации 172 верхнего диапазона. Таким образом, большинство битов в выходном потоке 199 битов может представлять данные нижнего диапазона. Дополнительная информация 172 верхнего диапазона может использоваться в приемнике для восстановления сигнала возбуждения верхнего диапазона по данным нижнего диапазона в соответствии с моделью сигнала. Например, модель сигнала может представлять ожидаемое множество зависимостей или корреляций между данными нижнего диапазона (например, сигналом 122 нижнего диапазона) и данными верхнего диапазона (например, сигналом 124 верхнего диапазона). Таким образом, различные модели сигналов могут использоваться для различных типов аудиоданных (например, речь, музыка, и т.д.), и конкретная используемая модель сигнала может быть согласована передатчиком и приемником (или определена промышленным стандартом) до начала передачи закодированных аудиоданных. С использованием модели сигнала модуль 150 анализа верхнего диапазона в передатчике имеет возможность генерации дополнительной информации 172 верхнего диапазона таким образом, чтобы соответствующий модуль анализа верхнего диапазона в приемнике был в состоянии использовать модель сигнала для восстановления сигнала 124 верхнего диапазона из выходного потока 199 битов.

Система 100 может улучшить покадровую энергетическую корреляцию (например, улучшить изменение с течением времени) между гармонически расширенным возбуждением нижнего диапазона звукового сигнала 102 и высокочастотным остатком входного звукового сигнала 102. Например, во время первого этапа оценки коэффициента передачи, первый блок 190 оценки формы коэффициента передачи и первый блок 192 настройки формы коэффициента передачи могут скорректировать гармонически расширенное возбуждение нижнего диапазона на основании первых параметров формы коэффициента передачи. Гармонически расш

Оценка формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона

Патент 2648570