Системы, способы и устройство для генерирования возбуждения в диапазоне высоких частот
Иллюстрации
Показать всеИзобретение относится к обработке широкополосных речевых сигналов. В одном варианте выполнения способ генерирования сигнала возбуждения в диапазоне высоких частот содержит этапы, на которых гармонически расширяют спектр сигнала, который основан на сигнале возбуждения в диапазоне низких частот; рассчитывают огибающую во временной области сигнала, который основан на сигнале возбуждения в диапазоне низких частот; и модулируют сигнал шума в соответствии с огибающей во временной области. Способ также включает в себя этап, на котором комбинируют (А) гармонически расширенный сигнал на основе результата гармонического расширения и (В) модулированный сигнал шума на основе результата модулирования. В таком способе сигнал возбуждения в диапазоне высоких частот основан на результате комбинирования. Технический результат - обеспечение расширения узкополосного речевого кодера для поддержания передачи и/или сохранения широкополосных речевых сигналов при увеличении пропускной способности. 5 н. и 37 з.п. ф-лы, 32 ил.
Реферат
Область техники, к которой относится изобретение
Настоящее изобретение относится к обработке сигналов.
Уровень техники
Речевая связь по коммутируемой телефонной сети общего пользования (КТСО, PSTN) традиционно ограничена полосой пропускания в диапазоне частот 300-3400 кГц. Новые сети для речевой связи, такие как сотовая телефонная связь и передача голоса по IP (ПИ, протокол Интернет, VoIP), могут не иметь такие же ограничения по полосе пропускания, и может быть предпочтительным передавать и принимать по таким сетям речевые сообщения, которые занимают более широкий диапазон частот. Например, может быть желательным поддерживать диапазон звуковых частот, который продолжается от 50 Гц и/или вплоть до 7 или 8 кГц. Также может быть желательным поддерживать другие приложения, такие как высококачественная передача звука или организация аудио/видео конференции, речевое содержание которых может занимать диапазон, выходящий за пределы традиционных ограничений PSTN.
Расширение диапазона, поддерживаемого речевым кодером, в область более высоких частот позволяет улучшить разборчивость речи. Например, информация, с помощью которой различаются фрикативные звуки, такие как "s" и "f", в значительной степени располагается в области высоких частот. Расширение в область диапазона высоких частот также может улучшить другие качества речи, такие как эффект присутствия. Например, даже звонкий гласный звук может иметь спектральную энергию, далеко выходящую за пределы, установленные в PSTN.
Один из подходов широкополосного кодирования речи включает в себя масштабирование узкополосной технологии кодирования речи (например, выполненной с возможностью кодирования диапазона от 0 до 4 кГц) так, чтобы она охватывала широкополосный спектр. Например, речевой сигнал может быть дискретизирован с более высокой частотой так, чтобы он включал компоненты высоких частот, и технология узкополосного кодирования может быть реконфигурирована для использования большего количества коэффициентов фильтра для представления такого широкополосного сигнала. Однако технологии узкополосного кодирования, такие как CELP (ЛПКТ, линейное прогнозирование с кодированием по таблице кодирования), являются интенсивными с точки зрения объемов расчетов, и широкополосный кодер CELP может расходовать слишком большое количество циклов обработки, что делает его непрактичным для использования во многих мобильных и других встраиваемых приложениях. Кодирование всего спектра широкополосного сигнала до требуемого качества при использовании такой методики также может привести к неприемлемо большому увеличению полосы пропускания. Кроме того, потребовалось бы выполнять транскодирование такого кодированного сигнала для передачи и/или декодирования даже его узкополосной части в системе, которая поддерживает только узкополосное кодирование.
Другой подход широкополосного кодирования речи включает в себя экстраполяцию огибающей спектра диапазона высоких частот по кодированной огибающей узкополосного спектра. Хотя такой подход может быть воплощен без какого-либо увеличения полосы пропускания и без необходимости транскодирования, грубая огибающая спектра или структура форманты на участке диапазона высоких частот речевого сигнала обычно не может быть точно предсказана по спектральной огибающей узкополосного участка.
Может быть предпочтительным воплотить широкополосное кодирование речи таким образом, чтобы, по меньшей мере, узкополосный участок кодированного сигнала можно было пересылать через узкополосный канал (такой как канал PSTN) без транскодирования или другой существенной модификации. Эффективность расширения для широкополосного кодирования также может быть желательной, например, для исключения существенного уменьшения количества пользователей, которые могут обслуживаться в приложениях, таких как беспроводная сотовая телефонная связь и широковещательная передача данных по кабельным и беспроводным каналам.
Сущность изобретения
В одном варианте выполнения способ генерирования сигнала возбуждения в диапазоне высоких частот содержит этапы, на которых гармонически расширяют спектр сигнала, который основан на сигнале возбуждения в диапазоне низких частот; рассчитывают огибающую во временной области сигнала, который основан на сигнале возбуждения в диапазоне низких частот; и модулируют сигнал шума в соответствии с огибающей во временной области.
Этот способ также содержит этап, на котором комбинируют (A) гармонически расширенный сигнал на основе результата гармонического расширения и (B) модулированный сигнал шума на основе результата модулирования. В этом способе сигнал возбуждения в диапазоне высоких частот основан на результате такого комбинирования.
В другом варианте выполнения устройство содержит расширитель спектра, выполненный с возможностью гармонического расширения спектра сигнала, который основан на сигнале возбуждения в диапазоне низких частот; калькулятор огибающей, выполненный с возможностью расчета огибающей во временной области сигнала, который основан на сигнале возбуждения в диапазоне низких частот; первый блок комбинирования, выполненный с возможностью модуляции сигнала шума в соответствии с огибающей во временной области; и второй блок комбинирования, выполненный с возможностью расчета суммы (A) гармонически расширенного сигнала на основе результата гармонического расширения и (B) модулированного сигнала шума на основе результата модуляции. Сигнал возбуждения в диапазоне высоких частот основан на результате этой суммы.
В другом варианте выполнения устройство содержит средство гармонического расширения спектра сигнала, который основан на сигнале возбуждения в диапазоне низких частот; средство расчета огибающей во временной области сигнала, который основан на сигнале возбуждения в диапазоне низких частот; средство модуляции сигнала шума в соответствии с огибающей во временной области; и средство комбинирования (A) гармонически расширенного сигнала на основе результата упомянутого гармонического расширения и (B) модулированного сигнала шума на основе результата упомянутой модуляции. В этом устройстве сигнал возбуждения в диапазоне высоких частот основан на результате упомянутого комбинирования.
В другом варианте выполнения способ генерирования сигнала возбуждения в диапазоне высоких частот содержит этапы, на которых рассчитывают гармонически расширенный сигнал путем применения нелинейной функции к сигналу возбуждения в диапазоне низких частот, полученному из части речевого сигнала низкой частоты; и смешивают гармонически расширенный сигнал с модулированным сигналом шума для генерирования сигнала возбуждения в диапазоне высоких частот.
Краткое описание чертежей
На фиг.1a показана блок-схема широкополосного речевого кодера A100 в соответствии с вариантом выполнения.
На фиг.1b показана блок-схема варианта выполнения A102 широкополосного речевого кодера A100.
На фиг.2a показана блок-схема широкополосного речевого декодера B100 в соответствии с вариантом выполнения.
На фиг.2b показана блок-схема варианта выполнения B102 широкополосного речевого кодера B100.
На фиг.3a показана блок-схема варианта выполнения А112 набора A110 фильтров.
На фиг.3b показана блок-схема варианта выполнения B122 набора B120 фильтров.
На фиг.4a показан охват полосы пропускания диапазонов низких и высоких частот одного примера набора А110 фильтров.
На фиг.4b показан охват полосы пропускания диапазонов низких и высоких частот другого примера набора А110 фильтров.
На фиг.4c показана блок-схема варианта A114 выполнения набора A112 фильтров.
На фиг.4d показана блок-схема варианта B124 выполнения набора B122 фильтров.
На фиг.5a показан пример графика зависимости частоты от логарифма амплитуды для речевого сигнала.
На фиг.5b показана блок-схема основной системы линейного кодирования с прогнозированием.
На фиг.6 показана блок-схема варианта A122 выполнения узкополосного кодера A120.
На фиг.7 показана блок-схема варианта B112 выполнения узкополосного декодера B110.
На фиг.8a показан пример графика зависимости частоты от логарифма амплитуды остаточного речевого сигнала.
На фиг.8b показан пример графика зависимости времени от логарифма амплитуды для остаточного речевого сигнала.
На фиг.9 показана блок-схема основной линейной системы кодирования с прогнозированием, которая также выполняет долговременное прогнозирование.
На фиг.10 показана блок-схема варианта A202 выполнения кодера A200 диапазона высоких частот.
На фиг.11 показана блок-схема варианта A302 выполнения генератора A300 возбуждения в диапазоне высоких частот.
На фиг.12 показана блок-схема варианта A402 выполнения расширителя A400 спектра.
На фиг.12a показаны графики спектров сигнала в различных точках в одном примере операции расширения спектра.
На фиг.12b показаны графики спектров сигнала в различных точках в другом примере операции расширения спектра.
На фиг.13 показана блок-схема варианта A304 выполнения генератора A302 возбуждения в диапазоне высоких частот.
На фиг.14 показана блок-схема варианта A306 выполнения генератора A302 возбуждения в диапазоне высоких частот.
На фиг.15 показана блок-схема последовательности операций задачи T100 расчета огибающей.
На фиг.16 показана блок-схема варианта 492 выполнения блока 490 комбинирования.
На фиг.17 иллюстрируется подход к расчету меры периодичности сигнала S30 диапазона высоких частот.
На фиг.18 показана блок-схема варианта A312 выполнения генератора A302 возбуждения в диапазоне высоких частот.
На фиг.19 показана блок-схема варианта A314 выполнения генератора A302 возбуждения в диапазоне высоких частот.
На фиг.20 показана блок-схема варианта A316 выполнения генератора A302 возбуждения в диапазоне высоких частот.
На фиг.21 показана блок-схема последовательности операций задачи T200 расчета коэффициента усиления.
На фиг.22 показана блок-схема последовательности операций варианта T210 выполнения задачи T200 расчета коэффициента усиления.
На фиг.23a показана схема функции окна.
На фиг.23b показано применение функции окна, как показано на фиг.23a, для подфреймов (подкадров) речевого сигнала.
На фиг.24 показана блок-схема варианта B202 выполнения декодера B200 диапазона высоких частот.
На фиг.25 показана блок-схема варианта AD10 выполнения широкополосного речевого кодера A100.
На фиг.26a показана схема варианта D122 выполнения линии D120 задержки.
На фиг.26b показана схема варианта D124 выполнения линии D120 задержки.
На фиг.27 показана схема варианта D130 выполнения линии D120 задержки.
На фиг.28 показана блок-схема варианта AD12 выполнения широкополосного речевого кодера AD10.
На фиг.29 показана блок-схема последовательности операций способа обработки MD100 сигналов в соответствии с вариантом выполнения.
На фиг.30 показана блок-схема последовательности операций способа M100 в соответствии с вариантом выполнения.
На фиг.31a показана блок-схема последовательности операций способа M200 в соответствии с вариантом выполнения.
На фиг.31b показана блок-схема последовательности операций варианта M210 выполнения способа M200.
На фиг.32 показана блок-схема последовательности операций способа M300 в соответствии с вариантом выполнения.
На фигурах и в приложенном описании одинаковыми ссылочными позициями обозначены одинаковые или аналогичные элементы или сигналы.
Подробное описание изобретения
Описанные здесь варианты выполнения включают в себя системы, способы и устройство, которые могут быть выполнены с возможностью расширения узкополосного речевого кодера для поддержки передачи данных и/или сохранения широкополосных речевых сигналов с увеличением полосы пропускания не больше, чем приблизительно на 800-1000 бит/с (бит в секунду). Потенциальные преимущества таких вариантов выполнения включают в себя внедренное кодирование для поддержки совместимости с узкополосными системами, относительно простое распределение и перераспределение битов между каналами узкополосного кодирования и кодирования в диапазоне высоких частот, исключение интенсивных при расчетах операций широкополосного синтеза и поддержание низкой частоты дискретизации для сигналов, обрабатываемых с использованием интенсивных при расчетах процедур кодирования формы сигнала.
Если только явно не будет ограничено его контекстом, термин "расчет" используется здесь для обозначения любого из его обычных значений, таких как расчет, генерирование и выбор из списка значений. В случае, когда термин "расчет" используется в настоящем описании и в формуле изобретения, он не исключает другие элементы или операции. Термин "A основано на B" используется для обозначения любого из его обычных значений, включая случаи (i) "A равно B", и (ii) "A основано, по меньшей мере, на B". Термин "протокол Интернет" включает в себя версию 4, как описано в IETF (ЦГИИ, Целевая группа инженерной поддержки Интернет, Internet Engineering Task Force) RFC (ЗНК, Запрос на комментарий) 791 и последующие версии, такие как версия 6.
На фиг.1a показана блок-схема широкополосного речевого кодера A100 в соответствии с вариантом выполнения. Набор А110 фильтров выполнен с возможностью фильтрации широкополосного речевого сигнала S10 для получения узкополосного сигнала S20 и сигнала S30 диапазона высоких частот. Узкополосный кодер A120 выполнен с возможностью кодирования узкополосного сигнала S20 для получения параметров S40 узкополосного (УП, NB) фильтра и узкополосного остаточного сигнала S50. Как более подробно описано ниже, узкополосный кодер A120 типично выполнен с возможностью формирования параметров S40 узкополосного фильтра и кодированного узкополосного сигнала S50 возбуждения в качестве показателей таблицы кодирования или в другой квантованной форме. Кодер A200 диапазона высоких частот выполнен с возможностью кодирования сигнала S30 диапазона высоких частот в соответствии с информацией, содержащейся в кодированном узкополосном сигнале S50 возбуждения, для формирования параметров S60 кодирования диапазона высоких частот. Как более подробно описано ниже, кодер A200 диапазона высоких частот обычно выполнен с возможностью формирования параметров S60 кодирования диапазона высоких частот в качестве показателей таблицы кодирования или в другой квантованной форме. Один конкретный пример широкополосного речевого кодера A100 выполнен с возможностью кодирования широкополосного речевого сигнала S10 со скоростью следования данных приблизительно 8,55 кбит/с (килобит в секунду), при этом приблизительно 7,55 кбит/с используются для параметров S40 узкополосного фильтра и кодированного узкополосного сигнала S50 возбуждения и приблизительно 1 кбит/с используется для параметров S60 кодирования диапазона высоких частот.
Может быть желательным комбинировать кодированные узкополосный канал и широкополосный сигналы в один поток битов. Например, может быть желательным мультиплексировать кодированные сигналы вместе для их передачи (например, по кабельным, оптическим или беспроводным каналам передачи данных) или для хранения в качестве кодированного широкополосного речевого сигнала. На фиг.1b показана блок-схема варианта A102 выполнения широкополосного речевого кодера A100, который включает в себя мультиплексор A130, выполненный с возможностью комбинирования параметров S40 узкополосного фильтра, кодированного узкополосного сигнала S50 возбуждения и параметров S60 фильтра диапазона высоких частот в мультиплексированный сигнал S70.
Устройство, включающее в себя кодер A102, также может включать в себя схему, выполненную с возможностью передачи мультиплексированного сигнала S70 в канал передачи данных, такой как кабельный, оптический или беспроводный канал. Такое устройство также может быть выполнено с возможностью выполнения одной или больше операций кодирования канала по сигналу, такой как кодирование для коррекции ошибки (например, сверточное кодирование, совместимое по скорости) и/или кодирование с детектированием ошибок (например, кодирование с циклической избыточностью), и/или один или больше уровней кодирования сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Может быть желательным выполнить мультиплексор A130 таким образом, чтобы он внедрял кодированный узкополосный сигнал (включая параметры S40 узкополосного фильтра и кодированный узкополосный сигнал S50 возбуждения) в виде отделяемого подпотока мультиплексированного сигнала S70 таким образом, чтобы кодированный узкополосный сигнал можно было восстанавливать и декодировать независимо от другой части мультиплексированного сигнала S70, такой как сигнал диапазона низких частот и/или сигнал диапазона высоких частот. Например, мультиплексированный сигнал S70 может быть скомпонован таким образом, чтобы кодированный узкополосный сигнал можно восстанавливать путем отделения параметров S60 фильтра диапазона высоких частот. Одно потенциальное преимущество такого свойства состоит в том, что устраняется необходимость транскодирования кодированного широкополосного сигнала перед его подачей в систему, которая поддерживает декодирование узкополосного сигнала, но не поддерживает декодирование части диапазона высоких частот.
На фиг.2a показана блок-схема широкополосного речевого декодера B100 в соответствии с вариантом выполнения. Узкополосный декодер B110 выполнен с возможностью декодирования параметров S40 узкополосного фильтра и кодированного узкополосного сигнала S50 возбуждения для формирования узкополосного сигнала S90. Декодер B200 диапазона высоких частот выполнен с возможностью декодирования параметров S60 кодирования диапазона высоких частот в соответствии с узкополосным сигналом S80 возбуждения на основе кодированного узкополосного сигнала S50 возбуждения для формирования сигнала S100 диапазона высоких частот. В этом примере узкополосный декодер B110 выполнен с возможностью передачи узкополосного сигнала S80 возбуждения в декодер B200 диапазона высоких частот. Набор B120 фильтров выполнен с возможностью комбинирования узкополосного сигнала S90 и сигнала S100 диапазона высоких частот для формирования широкополосного речевого сигнала S110.
На фиг.2b показана блок-схема варианта B102 выполнения широкополосного речевого декодера B100, который включает в себя демультиплексор B130, выполненный с возможностью формирования кодированных сигналов S40, S50 и S60 из мультиплексированного сигнала S70. Устройство, включающее в себя декодер B102, может включать в себя схему, выполненную с возможностью приема мультиплексированного сигнала S70 из канала передачи данных, такого как кабельный, оптический или беспроводный канал. Такое устройство также может быть выполнено с возможностью выполнения одной или больше операций декодирования канала по сигналу, таких как декодирование с коррекцией ошибки (например, сверточное декодирование, совместимое по скорости) и/или декодирование с детектированием ошибки (например, декодирование с циклической избыточностью), и/или один или больше уровней декодирования сетевого протокола (например, Ethernet, TCP/IP, cdma2000).
Набор A110 фильтров выполнен с возможностью фильтрации входного сигнала в соответствии со схемой разделенных полос для получения низкочастотной подполосы и высокочастотной подполосы. В зависимости от конструктивных критериев для конкретного варианта применения выходные подполосы могут иметь равную или неравную ширину полосы пропускания и могут перекрываться или не перекрываться. Также возможна конфигурация набора A110 фильтров, которая формирует больше чем две подполосы. Например, такой набор фильтров может быть выполнен с возможностью формирования одного или больше сигналов диапазона низких частот, которые включают в себя компоненты в диапазоне частот ниже узкополосного сигнала S20 (например, в диапазоне 50-300 Гц). Также возможно выполнить такой набор фильтров с возможностью формирования одного или больше дополнительных сигналов диапазона высоких частот, которые включают в себя компоненты в диапазоне частот выше сигнала S30 диапазона высоких частот (такого как диапазон 14-20, 16-20 или 16-32 кГц). В таком случае широкополосный речевой кодер A100 может быть выполнен с возможностью кодирования такого сигнала или сигналов по отдельности, и мультиплексор A130 может быть выполнен с возможностью включения дополнительного кодированного сигнала или сигналов в мультиплексированный сигнал S70 (например, в виде отдельной его части).
На фиг.3a показана блок-схема варианта выполнения A112 набора A110 фильтров, который выполнен с возможностью формирования сигналов двух подполос, имеющих уменьшенную частоту дискретизации. Набор A110 фильтров выполнен с возможностью приема широкополосного речевого сигнала S10, имеющего часть высокой частоты (или диапазон высоких частот) и часть низкой частоты (или диапазон низких частот). Набор A112 фильтров включает в себя путь обработки диапазона низких частот, выполненный с возможностью приема широкополосного речевого сигнала S10 и формирующий узкополосной речевой сигнал S20, и путь обработки диапазона высоких частот, выполненный с возможностью приема широкополосного речевого сигнала S10 и формирования речевого сигнала S30 диапазона высоких частот. Фильтр 110 низких частот фильтрует широкополосный речевой сигнал S10, пропуская выбранную подполосу низких частот, и фильтр 130 высоких частот фильтрует широкополосный речевой сигнал S10, пропуская выбранную подполосу высоких частот. Поскольку сигналы в обеих подполосах имеют более узкую полосу пропускания, чем широкополосный речевой сигнал S10, частота их дискретизации может быть в некоторой степени уменьшена без потери информации. Дискретизатор 120 с понижением частоты понижает частоту дискретизации низкочастотного сигнала в соответствии с требуемым коэффициентом децимации (например, путем удаления выборок сигнала и/или замены выборок средними значениями), и дискретизатор 140 с понижением частоты аналогично уменьшает частоту дискретизации высокочастотного сигнала в соответствии с другим требуемым коэффициентом децимации.
На фиг.3b показана блок-схема соответствующего варианта B122 выполнения набора B120 фильтров. Дискретизатор 150 с повышением частоты увеличивает частоту дискретизации узкополосного сигнала S90 (например, путем заполнения нулями и/или дубликатами выборок), и фильтр 160 низких частот фильтрует сигнал после повышения частоты дискретизации, пропуская только часть диапазона низких частот (например, для предотвращения ступенчатости). Аналогично - дискретизатор 170 с повышением частоты увеличивает частоту дискретизации сигнала S100 диапазона высоких частот, и фильтр 180 верхних частот фильтрует сигнал после повышения частоты дискретизации, пропуская только часть диапазона высоких частот. Два сигнала полосы пропускания затем суммируют для формирования широкополосного речевого сигнала S110. В некоторых вариантах выполнения декодера B100 набор B120 фильтров выполнен с возможностью формирования взвешенной суммы двух сигналов полосы пропускания в соответствии с одним или больше весовыми значениями, принятыми и/или рассчитанными декодером B200 диапазона высоких частот. Также может быть рассмотрена конфигурация набора B120 фильтров, который комбинирует сигналы более чем в двух полосах пропускания.
Каждый из фильтров 110, 130, 160, 180 может быть воплощен как фильтр с конечной импульсной характеристикой (КИХ, FIR) или как фильтр с бесконечной импульсной характеристикой (ITR). Частотные характеристики фильтров 110 и 130 кодера могут иметь области перехода между полосой задержания и полосой пропускания симметричной формы или несимметричной формы. Аналогично - частотные характеристики фильтров 160 и 180 декодирования могут иметь симметричную или несимметричную форму областей перехода между полосой задержания и полосой пропускания. Может быть предпочтительным, но не строго обязательным, чтобы фильтр 110 низкой частоты имел такую же характеристику, как и фильтр 160 низкой частоты, и фильтр 130 высокой частоты имел такую же характеристику, что и фильтр 180 высокой частоты. В одном примере два пары 110, 130 и 160, 180 фильтров представляют собой наборы квадратурных зеркальных фильтров (КЗФ, QMF), при этом пара 110, 130 фильтров имеет такие же коэффициенты, что и пара 160, 180 фильтров.
В типичном примере фильтр 110 низкой частоты имеет полосу пропускания, которая включает в себя ограниченный диапазон PSTN, равный 300-3400 Гц (например, диапазон от 0 до 4 кГц). На фиг.4a и 4b показаны относительные полосы пропускания широкополосного речевого сигнала S10, узкополосного сигнала S20 и сигнала S30 диапазона высоких частот в двух разных примерах воплощения. В обоих из этих конкретных примерах широкополосный речевой сигнал S10 имеет частоту дискретизации 16 кГц (представляет частотные компоненты в пределах диапазона от 0 до 8 кГц), и узкополосный сигнал S20 имеет частоту дискретизации 8 кГц (представляет частотные компоненты в пределах диапазона от 0 до 4 кГц).
В примере, показанном на фиг.4a, отсутствует существенное перекрытие между двумя поддиапазонами. Сигнал S30 диапазона высоких частот, как показано в этом примере, может быть получен с использованием фильтра 130 высокой частоты с полосой пропускания 4-8 кГц. В таком случае может быть желательно уменьшить частоту дискретизации до 8 кГц путем дискретизации с понижением частоты фильтрованного сигнала с коэффициентом два. Такая операция, которая, как можно ожидать, значительно снизит сложность расчетов при выполнении дополнительных операций по обработке сигнала, переместит энергию полосы пропускания в диапазон от 0 до 4 кГц без потери информации.
В альтернативном примере по фиг.4b поддиапазоны высоких и низких частот имеют заметное перекрытие так, что область от 3,5 до 4 кГц определяется сигналами в обоих поддиапазонах. Сигнал S30 диапазона высоких частот, как в этом примере, может быть получен с использованием фильтра 130 высокой частоты с полосой пропускания 3,5-7 кГц. В таком случае может быть желательно уменьшить частоту дискретизации до 7 кГц путем дискретизации с понижением частоты отфильтрованного сигнала с коэффициентом 16/7. Такая операция, которая, как можно ожидать, значительно уменьшит сложность расчетов дальнейших операций по обработке сигнала, переместит энергию полосы пропускания в диапазон от 0 до 3,5 кГц без потери информации.
В типичной телефонной трубке, используемой для телефонной связи, один или больше преобразователей (то есть микрофон и наушник или громкоговоритель) имеет характеристику с заметными потерями в частотном диапазоне 7-8 кГц. В примере, показанном на фиг.4b, часть широкополосного речевого сигнала S10 в диапазоне от 7 до 8 кГц не включена в кодированный сигнал. Другие конкретные примеры фильтра 130 высокой частоты имеют полосы пропускания 3,5-7,5 кГц и 3,5-8 кГц.
В некоторых вариантах выполнения, в которых обеспечивается перекрытие между поддиапазонами, как в примере, показанном на фиг.4b, возможно использовать фильтры низкой частоты и/или высокой частоты, имеющие гладкий спад в области перекрытия. Такие фильтры обычно проще разработать, они требуют расчетов меньшей сложности и/или вводят меньшую задержку, чем фильтры с более резкой или "прямоугольной" характеристикой. Фильтры, имеющие переходные области с резкими границами, проявляют тенденцию более высоких боковых лепестков (которые могут привести к ступенчатости), чем фильтры аналогичного порядка, которые имеют гладкий спад. Фильтры, имеющие острые переходные области, также могут иметь длительные импульсные характеристики, в результате чего могут возникать паразитные сигналы в виде затухающих колебаний. Для вариантов выполнения набора фильтров, имеющих один или больше фильтров IIR (БИХ, бесконечная импульсная характеристика), которые обеспечивают гладкий спад в области перекрытия, возможно использовать фильтр или фильтры, полюса которых расположены на большем расстоянии от единичной окружности, что может быть важным для обеспечения стабильного воплощения с фиксированной точкой.
Перекрытие поддиапазонов обеспечивает плавное смешение сигналов диапазона низких частот и диапазона высоких частот, что может привести к меньшему уровню слышимых паразитных звуков, снижению ступенчатости и/или менее заметному переходу с одного диапазона на другой. Кроме того, эффективность кодирования узкополосного кодера A120 (например, кодера формы колебаний) может понижаться при увеличении частоты. Например, качество кодирования узкополосного кодера может быть уменьшено при малых скоростях следования битов, в частности, в присутствии фонового шума. В таких случаях благодаря обеспечению перекрытия поддиапазонов можно повысить качество воспроизводимых частотных компонентов в области перекрытия.
Кроме того, перекрытие поддиапазонов обеспечивает возможность плавного смешения сигналов диапазона низких частот и диапазона высоких частот, что позволяет получить меньшее количество слышимых паразитных звуков, уменьшить ступенчатость и/или обеспечить менее заметный переход с одного диапазона в другой. Особенно предпочтительным для воплощения может быть такое свойство, в котором узкополосный кодер A120 и кодер A200 диапазона высоких частот работают в соответствии с разными методиками кодирования. Например, разные методики кодирования позволяют получать сигналы, которые звучат в значительной степени по-разному. Кодер, который кодирует спектральную огибающую в форме показателей таблицы кодирования, может формировать сигнал, имеющий другой звук, чем кодер, который кодирует вместо этого амплитудный спектр. Кодер во временной области (например, импульсно-кодовая модуляция или кодер PCM (ИКМ, импульсно-кодовая модуляция)) может формировать сигнал, имеющий другой звук, чем кодер, работающий в частотной области. Кодер, который кодирует сигнал с представлением спектральной огибающей и соответствующий остаточный сигнал, может формировать сигнал, имеющий звук, отличающийся от звука кодера, который кодирует сигнал только с представлением спектральной огибающей. Кодер, который кодирует сигнал как представление его формы колебаний, может формировать выходной сигнал, имеющий звук, отличающийся от звука синусоидального кодера. В таких случаях использование фильтров, имеющих резкие переходные области, которые определяют неперекрывающиеся поддиапазоны, может привести к резкому и заметному для восприятия переходу между поддиапазонами в синтезируемом широкополосном сигнале.
Хотя наборы фильтров QMF, имеющие взаимодополняющие перекрывающиеся частотные характеристики, часто используют в технологиях подполос, такие фильтры не пригодны для, по меньшей мере, некоторых из описанных здесь вариантов воплощения широкополосного кодирования. Набор фильтров QMF в кодере выполнен с возможностью получения значительной ступенчатости, которую устраняют в соответствующем наборе фильтров QMF в декодере. Такая компоновка может не соответствовать приложению, в котором в сигнале возникает значительный уровень искажений между наборами фильтров, и эти искажения могут снизить эффективность свойства устранения ступенчатости. Например, описанные здесь приложения включают в себя варианты воплощения кодирования, выполненные с возможностью работы с очень малыми скоростями следования битов. Вследствие очень малой скорости следования битов декодированный сигнал, вероятно, может поступать со значительными искажениями по сравнению с исходным сигналом, в результате чего использование наборов фильтров QMF может привести к недостаточной компенсации ступенчатости.
Кроме того, кодер может быть выполнен с возможностью формирования синтезированного сигнала, который по восприятию аналогичен исходному сигналу, но который фактически существенно отличается от исходного сигнала. Например, кодер, который получает возбуждение диапазона высоких частот из остаточного узкополосного сигнала, как описано здесь, может формировать такой сигнал, и при этом фактический остаточный сигнал диапазона высоких частот может полностью отсутствовать в декодированном сигнале. При использовании наборов фильтров QMF в таких приложениях может возникнуть существенный уровень искажений в результате нескомпенсированной ступенчатости. Приложения, в которых используют наборы фильтров QMF, обычно имеют более высокие скорости следования битов (например, превышающие 12 кбит/с для AMR (открытый промышленный стандарт для плат расширения) и 64 кбит/с для G.722).
Уровень искажений, связанных со ступенчатостью QMF, может быть уменьшен, если искажения будут влиять на узкий поддиапазон, поскольку влияние ступенчатости будет ограничено полосой пропускания, равной ширине этого поддиапазона. Однако в описанных здесь примерах, в которых каждый поддиапазон включает в себя приблизительно половину полосы пропускания широкого диапазона, искажения, вызванные нескомпенсированной ступенчатостью, могут влиять на существенную часть сигналов. Качество сигнала также может быть затронуто в зависимости от местоположения частотного диапазона, в котором возникает нескомпенсированная ступенчатость. Например, искажения, возникшие рядом с центром широкополосного речевого сигнала (например, между 3 и 4 кГц), могут быть намного более нежелательными, чем искажения, которые возникают рядом с краем сигнала (например, на частотах выше 6 кГц).
Хотя характеристики фильтров набора фильтров QMF строго соответствуют друг другу, низкочастотный и высокочастотный пути наборов A110 и B120 фильтров могут быть выполнены с совершенно не связанными спектрами в частях за пределами области перекрытия двух поддиапазонов. Мы определяем перекрытие двух поддиапазонов как расстояние от точки, в которой частотная характеристика фильтра диапазона высоких частот падает до уровня -20 дБ, до точки, в которой частотная характеристика фильтра диапазона низких частот падает до уровня -20 дБ. В разных примерах набора A110 и/или B120 фильтров такое перекрытие располагается в диапазоне от приблизительно 200 Гц до приблизительно до 1 кГц. Диапазон от приблизительно 400 до приблизительно 600 Гц может представлять желательный компромисс между эффективностью кодирования и воспринимаемой непрерывностью сигнала. В одном конкретном примере, как упомянуто выше, перекрытие располагается приблизительно на частоте 500 Гц.
Может быть желательным воплотить набор А112 и/или B122 фильтров так, чтобы они выполняли операции, представленные на фиг.4a и 4b в нескольких каскадах. Например, на фиг.4c показана блок-схема варианта воплощения А114 из набора A112 фильтров, который выполняет функциональный эквивалент операций фильтрации высокой частоты и дискретизации с понижением частоты, с использованием последовательности операций интерполяции, повторной дискретизации, децимации и других операций. Такие варианты воплощения могут быть легко осуществимы и/или могут позволить повторно использовать функциональные логические блоки и/или блоки кода. Например, один и тот же функциональный блок можно использовать для выполнения операций децимации до 14 кГц и децимации до 7 кГц, как показано на фиг.4c. Спектрально обратимые операции могут быть воплощены путем умножения сигнала на функцию e jnπ или последовательность (-1)n, значения которых чередуются между +1 и -1. Операции формирования спектра могут быть воплощены с помощью фильтра низкой частоты, который выполнен с возможностью придания сигналу такой формы, чтобы получить требуемую общую характеристику фильтра.
Следует отметить, что вследствие спектральной обратимости операции спектр сигнала S30 диапазона высоких частот реверсируют. Последующие операции в кодере и соответствующем декодере должны быть соответствующим образом сконфигурированы. Например, генератор A300 возбуждения в диапазоне высоких частот, как описано здесь, может быть выполнен с возможностью формирования сигнала S120 возбуждения в диапазоне высоких частот, который также имеет спектрально обратную форму.
На фиг.4d показана блок-схема варианта B124 воплощения набора B122 фильтров, который выполняет функциональный эквивалент операций дискретизации с повышением частоты и фильтрации верхних частот, с использованием последовательности операций интерполяции, повторной дискрет