Способ и устройство для оценки энергии полосы высоких частот в системе расширения полосы частот

Иллюстрации

Показать все

Изобретение относится к воспроизведению аудио контента, в частности к способам расширения полосы частот. Техническим результатом является возможность генерирования речи расширенной ширины полосы частот с минимальным числом искажений. Указанный результат достигается тем, что принимают (101) входной цифровой аудио сигнал, содержащий узкополосный сигнал. Входной цифровой аудио сигнал обрабатывают (102), чтобы сгенерировать обработанный цифровой аудио сигнал. Оценивают (103) уровень энергии полосы высоких частот, соответствующий входному цифровому аудио сигналу, на основании оцененной энергии полосы частот перехода обработанного цифрового аудио сигнала в предварительно определенном верхнем диапазоне частот узкополосной ширины полосы частот. Генерируют (104) цифровой аудио сигнал полосы высоких частот на основании уровня энергии полосы высоких частот и оцененного спектра полосы высоких частот, соответствующего уровню энергии полосы высоких частот. 2 н. и 8 з.п. ф-лы, 6 ил.

Реферат

Родственная заявка

Эта заявка родственна с совместно рассматривающейся заявкой на патент США № 11/946978, и зарегистрированной 29 ноября 2007 г., принадлежащей тому же заявителю, которая полностью включена в настоящее описание в качестве ссылки.

Область техники, к которой относится изобретение

Это изобретение, в целом, относится к воспроизведению аудио контента и, более конкретно, к способам расширения полосы частот.

Уровень техники

Аудио воспроизведение содержания аудио контента из цифрового представления требует известной степени усилий. В некоторых настройках приложений цифровое представление содержит полную соответствующую ширину полосы частот, которая относится к первоначальной аудио выборке. В таком случае аудио воспроизведение может содержать очень точный и естественно звучащий выходной сигнал. Однако такой подход требует значительных затрат ресурсов, чтобы приспособить соответствующее количество данных. Во многих настройках приложений, таких как, например, настройки беспроводной связи, такое количество информации не может быть всегда адекватно поддержано.

Чтобы уладить такое ограничение, так называемые, способы узкополосной речи могут служить для того, чтобы ограничивать количество информации, в свою очередь, с помощью ограничения представления меньшей, чем полная соответствующая ширина полосы частот, которая относится к выборке первоначального аудио сигнала. В этом отношении в качестве только одного примера, несмотря на то, что естественная речь включает в себя существенные компоненты до 8 кГц (или выше), узкополосное представление может предоставлять только информацию, относительно, например, диапазона 300-3400 Гц. Результирующий контент, когда воспроизведен аудиально, обычно является достаточно разборчивым, чтобы поддерживать функциональные потребности речевой связи. Однако, к сожалению, обработка узкополосной речи также имеет тенденцию выдавать речь, которая звучит приглушенной, и даже может иметь уменьшенную разборчивость по сравнению с речью полной полосы частот.

Чтоб удовлетворить этому требованию, иногда используют способы расширения ширины полосы частот. Можно искусственно генерировать недостающую информацию в более высоких и/или более низких полосах частот на основании имеющейся узкополосной информации, а также другой информации, чтобы выбирать информацию, которая может быть добавлена к узкополосному контенту, чтобы, таким образом, синтезировать сигнал псевдо широкой (или полной) полосы частот. С использованием таких способов, например, можно преобразовывать узкополосную речь в диапазоне 300-3400 Гц в широкополосную речь, например, в диапазоне 100-8000 Гц. С этой целью критическая часть информации, которая требуется, является спектральной огибающей в полосе высоких частот (3400-8000 Гц). Если широкополосная спектральная огибающая оценена, тогда спектральная огибающая полосы высоких частот может быть легко извлечена из нее. Можно представить себе спектральную огибающую полосы высоких частот как состоящую из формы и усиления (или эквивалентно, энергии).

Например, при одном подходе форму спектральной огибающей полосы высоких частот оценивают с помощью оценки широкополосной спектральной огибающей из узкополосной спектральной огибающей посредством отображения кодовой книги. Затем оценивают энергию полосы высоких частот с помощью регулирования энергии в узкополосной секции широкополосной спектральной огибающей с возможностью соответствия энергии узкополосной спектральной огибающей. В этом подходе форма спектральной огибающей полосы высоких частот определяет энергию полосы высоких частот, а любые ошибки в оценке формы будут также соответствующим образом влиять на оценки энергии полосы высоких частот.

В другом подходе форму спектральной огибающей полосы высоких частот и энергию полосы высоких частот оценивают отдельно, и спектральную огибающую полосы высоких частот, которую, в конце концов, используют, регулируют, чтобы соответствовать оцененной энергии полосы высоких частот. При одном связанном подходе оцененную энергию полосы высоких частот используют, помимо других параметров, чтобы определять форму спектральной огибающей полосы высоких частот. Однако результирующая спектральная огибающая полосы высоких частот не обязательно гарантирует наличие соответствующей энергии полосы высоких частот. Следовательно, требуется дополнительный этап, чтобы регулировать энергию спектральной огибающей полосы высоких частот в оцененное значение. Если не предприняты специальные меры, этот подход будет давать в результате разрывность в широкополосной спектральной огибающей на границе между узкой полосой частот и полосой высоких частот. Хотя существующие подходы к расширению ширины полосы частот и, в частности, к оценке огибающей полосы высоких частот являются приемлемо успешными, они не обязательно дают результирующую речь подходящего качества, по меньшей мере, в некоторых настройках приложений.

Для того чтобы генерировать речь расширенной ширины полосы частот приемлемого качества, число искажений в такой речи должно быть минимизировано. Известно, что переоценка энергии полосы высоких частот дает в результате раздражающие искажения. Неправильная оценка формы спектральной огибающей полосы высоких частот также может иметь результатом искажения, но эти искажения обычно являются более мягкими, и их легко маскируют с помощью узкополосной речи.

Краткое описание чертежей

Вышеупомянутые потребности, по меньшей мере, частично удовлетворяют посредством предоставления способа и устройства для оценки энергии полосы высоких частот в системе расширения ширины полосы частот, описанной в следующем подробном описании. Сопровождающие чертежи, на которых одинаковые ссылочные номера относятся к идентичным элементам или элементам с одинаковой функциональностью во всех отдельных видах, и, которые вместе с подробным описанием ниже включены в спецификацию и являются частью спецификации, служат, чтобы дополнительно проиллюстрировать различные варианты осуществления и, чтобы объяснить различные принципы и преимущества, все в соответствии с настоящим изобретением.

Фиг.1 содержит блок-схему последовательности операций, как сконфигурированную в соответствии с различными вариантами осуществления изобретения.

Фиг.2 содержит график, как сконфигурировано в соответствии с различными вариантами осуществления изобретения.

Фиг.3 содержит блок-схему, как сконфигурировано в соответствии с различными вариантами осуществления изобретения.

Фиг.4 содержит блок-схему, как сконфигурировано в соответствии с различными вариантами осуществления изобретения.

Фиг.5 содержит блок-схему, как сконфигурировано в соответствии с различными вариантами осуществления изобретения.

Фиг.6 содержит график, как сконфигурировано в соответствии с различными вариантами осуществления изобретения.

Специалисты в области техники поймут, что элементы на чертежах проиллюстрированы для простоты и пояснения и не обязательно начерчены в масштабе. Например, размеры и/или относительное расположение некоторых из элементов на фигурах могут быть преувеличены относительно других элементов, чтобы помочь улучшить понимание различных вариантов осуществления настоящего изобретения. Также общеизвестные, но вполне понятные элементы, которые являются полезными или необходимыми в коммерчески реализуемом варианте осуществления, часто не изображены, для того чтобы способствовать менее затруднительному виду этих различных вариантов осуществления настоящего изобретения. Дополнительно будет понятно, что определенные действия и/или этапы могут быть описаны или изображены в конкретной последовательности или вхождении, тогда как специалисты в данной области техники поймут, что такая определенность относительно последовательности в действительности не требуется. Также будет понятно, что термины и выражения, использованные в настоящей заявке, имеют обычное техническое значение, как согласованное с такими терминами и выражениями специалистами в данной области техники, как приведено выше, за исключением, когда разные конкретные значения не приведены иначе в настоящей заявке.

Подробное описание изобретения

Идеи, обсужденные в настоящей заявке, адресованы рентабельным способу и системе для искусственного расширения ширины полосы частот. В соответствии с такими идеями принимают узкополосный цифровой аудио сигнал. Узкополосный цифровой аудио сигнал может быть сигналом, например, принятым мобильной станцией в сотовой сети, и узкополосный цифровой аудио сигнал может включать в себя речь в диапазоне частот 300-3400 Гц. Способы искусственного расширения ширины полосы частот осуществляют, чтобы расширять спектр цифрового аудио сигнала с возможностью включения в него частот полосы низких частот, таких как 100-300 Гц и частот полосы высоких частот, таких как 3400-8000 Гц. При использовании искусственного расширения ширины полосы частот, чтобы расширить спектр с возможностью включения в него частот полосы низких частот и полосы высоких частот, создают более естественно звучащий цифровой аудио сигнал, который является более приятным пользователю мобильной станции, осуществляющей способ.

В способах искусственного расширения ширины полосы частот недостающую информацию в более высоких (3400-8000 Гц) и более низких (100-300 Гц) полосах частот искусственно генерируют на основании имеющейся узкополосной информации, а также априорной информации, полученной и запомненной из речевой базы данных, и добавленной в узкополосный сигнал, чтобы синтезировать псевдо широкополосный сигнал. Такое решение является достаточно привлекательным, поскольку оно требует минимальных изменений в существующую систему передачи. Например, не требуется дополнительная скорость передачи битов. Искусственное расширение ширины полосы частот может быть включено в элемент постобработки на принимающем конце и, следовательно, не зависит от технологии кодирования речи, использованной в системе связи, или характера самой системы, например, аналоговой, цифровой, наземной или сотовой. Например, способы искусственного расширения ширины полосы частот могут быть осуществлены мобильной станцией, принимающей узкополосный цифровой аудио сигнал, и результирующий широкополосный сигнал используют, чтобы генерировать аудио сигнал, воспроизводимый пользователю мобильной станции.

При определении информации полосы высоких частот сначала оценивают энергию в полосе высоких частот. Подмножество узкополосного сигнала используют, чтобы оценить энергию полосы высоких частот. Подмножество узкополосного сигнала, которое является ближайшим к частотам полосы высоких частот, обычно имеет наивысшую корреляцию с сигналом полосы высоких частот. Таким образом, только подмножество узкой полосы частот, в противоположность всей узкой полосе частот, используют, чтобы оценить энергию полосы высоких частот. Подмножество, которое используют, упомянуто как “полоса частот перехода”, и оно может включать в себя частоты, такие как 2500-3400 Гц. Более конкретно, полоса частот перехода определена в настоящей заявке, как полоса частот, которая содержится в узкой полосе частот, находится близко к полосе высоких частот, т.е. она служит в качестве перехода в полосу высоких частот. Этот подход находится в противоположности системам расширения ширины полосы частот предшествующего уровня техники, которые оценивают энергию полосы высоких частот на основе энергии во всей узкой полосе частот, обычно как отношение.

Для того чтобы оценить энергию полосы высоких частот, сначала оценивают энергию полосы частот перехода с помощью идей, обсужденных ниже относительно фиг.4 и фиг.5. Например, энергия полосы частот перехода у полосы частот перехода может быть вычислена сначала с помощью дискретизации с повышением частоты входного узкополосного сигнала, вычисления частотного спектра дискретизированного с повышением частоты узкополосного сигнала, а затем суммирования энергий спектральных компонентов в полосе частот перехода. Оцененную энергию полосы частот перехода затем вставляют в полиномиальное уравнение как независимую переменную, чтобы оценить энергию полосы высоких частот. Коэффициенты или веса разных степеней независимой переменной в полиномиальном уравнении, включая переменную нулевой степени, то есть постоянный член выбирают, чтоб минимизировать среднюю квадратичную ошибку между истинными и оцененными значениями энергии полосы высоких частот в течение большого числа кадров из тренировочной речевой базы данных. Точность оценки может быть дополнительно увеличена с помощью приведения к заданным условиям оценки относительно параметров, полученных из узкополосного сигнала, а также параметров, полученных из сигнала полосы частот перехода, как обсуждено более подробно ниже. После того как энергия полосы высоких частот оценена, оценивают спектр полосы высоких частот на основании оценки энергии полосы высоких частот.

При использовании таким способом полосы частот перехода предоставлен надежный способ расширения ширины полосы частот, который создает соответствующий аудио сигнал более высокого качества, чем было бы возможно, если бы использовали энергию во всей узкой полосе частот, чтобы оценивать энергию полосы высоких частот. Кроме того, этот способ мог бы быть использован без чрезмерного вредного влияния на существующие системы связи, поскольку способы расширения ширины полосы частот применяют к узкополосному сигналу, принятому системой связи, т.е. существующие системы связи могут быть использованы, чтобы посылать узкополосные сигналы.

Фиг.1 иллюстрирует процесс 100 для генерации цифрового аудио сигнала расширенной полосы частот в соответствии с различными вариантами осуществления изобретения. Сначала в операции 101 принимают узкополосный цифровой аудио сигнал. При обычной настройке приложения это будет содержать предоставление множества кадров такого контента. Эти идеи будут без труда приспосабливать обработку каждого такого кадра согласно описанным этапам. Например, при одном подходе каждый такой кадр может соответствовать 10-40 миллисекундам первоначального аудио контента.

Например, это может содержать предоставление цифрового аудио сигнала, который содержит синтезированный голосовой контент такой, который имеет место, например, при использовании этих идей совместно с принятым закодированным с помощью вокодера речевым контентом в портативном беспроводном устройстве связи. Однако также существуют другие возможности, как будет вполне понятно специалистам в данной области техники. Например, цифровой аудио сигнал мог бы вместо этого содержать первоначальный речевой сигнал или повторно дискретизированную версию либо первоначального речевого сигнала, либо синтезированного речевого контента.

Кратко ссылаясь на фиг.2, будет понятно, что этот цифровой аудио сигнал относится к некоторому первоначальному аудио сигналу 201, который имеет ширину 202 полосы частот первоначального соответствующего сигнала. Эта ширина 202 полосы частот первоначального соответствующего сигнала обычно будет больше, чем ширина полосы частот вышеупомянутого сигнала, которая соответствует цифровому аудио сигналу. Например, это может случаться, когда цифровой аудио сигнал представляет только часть 203 первоначального аудио сигнала 201, причем другие части оставлены вне полосы частот. В изображенном иллюстративном примере это включает в себя часть 204 полосы низких частот и часть 205 полосы высоких частот. Специалисты в данной области техники поймут, что этот пример служит только иллюстративной цели, и что не представленная часть может только содержать только часть полосы низких частот или часть полосы высоких частот. Эти идеи также были бы применимы для использования в прикладной установке, в которой не представленная часть разделяет полосу средних частот на две или более представленные части (не изображены).

Таким образом, без труда будет понятно, что не представленная часть (части) первоначального аудио сигнала 201 содержит контент, который эти настоящие идеи могут корректно искать, чтобы заменить или иначе представить некоторым корректным и допустимым способом. Также будет понятно, что ширина полосы частот этого сигнала занимает только часть ширины полосы частот по Найквисту, определенной с помощью соответственной частоты дискретизации. Это, в свою очередь, будет понятно, чтобы дополнительно предоставить область частот, в которой осуществлять желаемое расширение ширины полосы частот.

Опять, ссылаясь на фиг.1, входной цифровой аудио сигнал обрабатывают, чтобы сгенерировать обработанный цифровой аудио сигнал в операции 102. При одном подходе обработка в операции 102 является операцией дискретизации с повышением частоты. При другом подходе она может быть простой системой с единичным коэффициентом усиления, для которой выходной сигнал равняется входному сигналу. В операции 103 оценивают уровень энергии полосы высоких частот, соответствующий входному цифровому аудио сигналу, на основании полосы частот перехода обработанного цифрового аудио сигнала в предварительно определенном верхнем диапазоне частот узкополосной ширины полосы частот.

При использовании компонентов полосы частот перехода в качестве базиса для оценки получают более точную оценку, чем обычно было бы возможно, если все узкополосные компоненты были бы совместно использованы, чтобы оценить значение энергии компонентов полосы высоких частот. При одном подходе значение энергии полосы высоких частот используют, чтобы осуществлять доступ к справочной таблице, которая содержит множество соответствующих потенциальных форм спектральных огибающих полосы высоких частот, чтобы определять спектральную огибающую полосы высоких частот, т.е. соответствующую форму спектральной огибающей полосы высоких частот на правильном уровне энергии.

Затем этот процесс 100 будет по выбору подстраивать объединение 104 цифрового аудио сигнала с контентом полосы высоких частот, соответствующим оцененному значению энергии и спектру компонентов полосы высоких частот, чтобы предоставить расширенную версию узкополосного цифрового аудио сигнала, воспроизведение которого осуществляют. Несмотря на то, что процесс, изображенный на фиг.1, иллюстрирует только сложение оцененных компонентов полосы высоких частот, следует понимать, что компоненты полосы низких частот также могут быть оценены и объединены с узкополосным цифровым аудио сигналом, чтобы генерировать широкополосный сигнал с расширенной шириной полосы частот.

Результирующий аудио сигнал с расширенной шириной полосы частот (полученный с помощью объединения входного цифрового аудио сигнала с искусственно сгенерированным контентом полосы частот вне сигнала) имеет улучшенное качество аудио сигнала в отличие от первоначального узкополосного цифрового аудио сигнала, когда воспроизведен в аудио форме. При одном подходе это может содержать объединение двух элементов, которые являются взаимно исключающими относительно их спектрального контента. В таком случае такое объединение, например, может принимать вид простой конкатенации или иначе соединения двух (или более) сегментов вместе. При другом подходе, если требуется, контент ширины полосы у полосы высоких частот и/или полосы низких частот может иметь часть, которая находится в соответствующей ширине полосы частот сигнала цифрового аудио сигнала. Такое перекрытие может быть полезным, по меньшей мере, в некоторых настройках приложений, чтобы сглаживать и/или размывать переход от одной части к другой при объединении перекрывающейся части контента ширины полосы частот полосы высоких частот и/или полосы низких частот с соответствующей частью в полосе частот цифрового аудио сигнала.

Специалисты в данной области техники поймут, что описанные выше процессы являются без труда запускаемыми с использованием любой из большого разнообразия имеющихся и/или без труда конфигурируемых платформ, включая частично или полностью программируемые платформы, которые известны в данной области техники, или специализированные платформы, которые могут требоваться для некоторых приложений. Теперь, ссылаясь на фиг.3, будет предоставлен подход к такой платформе.

В этом иллюстративном примере в устройстве 300 процессор 301 выбора функционально соединяется со входом 320, который сконфигурирован и выполнен с возможностью приема цифрового аудио сигнала, имеющего соответствующую ширину полосы частот сигнала. Когда устройство 300 содержит беспроводное устройство двусторонней связи, такой цифровой аудио сигнал может быть предоставлен с помощью соответствующего приемника 303, как известно в данной области техники. В таком случае, например, цифровой аудио сигнал может содержать синтезированное голосовой контент, сформированный как функция принятого закодированного с помощью вокодера контента речи.

Процессор 301, в свою очередь, может быть сконфигурирован и выполнен (например, с помощью соответствующего программирования, когда процессор 301 содержит частично или полностью программируемую платформу, как известно в данной области техники) с возможностью выполнения одного или более из этапов или других выполняемых функций, приведенных в настоящей заявке. Это может содержать, например, оценку значения энергии полосы высоких частот из энергии полосы частот перехода, а затем использование значения энергии полосы высоких частот и множества форм индексирования энергии, чтобы определить спектральную огибающую полосы высоких частот.

Как описано выше, при одном подходе вышеупомянутое значение энергии полосы высоких частот может служить для того, чтобы способствовать доступу к справочной таблице, которая содержит множество соответствующих потенциальных форм спектральных огибающих. Чтобы поддерживать такой подход, это устройство также может содержать, если требуется, одну или более справочных таблиц 304, которые функционально соединены с процессором 301. Сконфигурированный таким образом, процессор 301 может без труда осуществлять доступ к справочной таблице 304, когда уместно.

Специалисты в данной области распознают и поймут, что такое устройство 300 может быть составлено из множества физически различных элементов, как предложено с помощью иллюстрации, изображенной на фиг.3. Однако также можно рассматривать эту иллюстрацию, как содержащую логический вид, в этом случае один или более из этих элементов может быть разрешен и реализован с помощью совместно использованной платформы. Также будет понятно, что такая совместно используемая платформа может содержать полностью или, по меньшей мере, частично программируемую платформу, которые известны в данной области техники.

Следует понимать, что обработка, обсужденная выше, может быть выполнена мобильной станцией на беспроводной связи с базовой станцией. Например, базовая станция может передавать узкополосный цифровой аудио сигнал с помощью традиционного средства в мобильную станцию. Если он принят, процессор (процессоры) в мобильной станции выполняют необходимые операции, чтобы генерировать версию с расширенной шириной полосы частот цифрового аудио сигнала, которые является более чистым и более приятен по звучанию пользователю мобильной станции.

Теперь, ссылаясь на фиг.4, входную узкополосную речь , дискретизированную на 8 кГц, сначала дискретизируют с повышение частоты в 2 раза с использованием соответствующего устройства 401 дискретизации с повышением частоты, чтобы получить дискретизированную с повышением частоты узкополосную речь , дискретизированную на 16 кГц. Это может содержать выполнение интерполяции 1:2 (например, с помощью вставки выборки нулевого значения между каждой парой выборок первоначальной речи), за которой следует фильтрация с помощью фильтра нижних частот, например фильтра нижних частот (LPF), имеющего полосу пропускания между 0 и 3400 Гц.

Из также вычисляют узкополосные параметры линейного предсказания (LP), , где P - порядок модели, с использованием устройства 402 анализа LP, которое использует широко известные способы LP. (Конечно, существуют другие возможности, например, параметры LP могут быть вычислены из прореженной версии 2:1 ). Эти параметры LP моделируют спектральную огибающую узкополосной входной речи как

.

В уравнении, приведенном выше, угловую частоту в радианах/выборка задают с помощью где - частота сигнала в Гц, а - частота дискретизации в Гц. Для частоты дискретизации , равной 8 кГц, подходящий порядок P модели, например, равен 10.

Затем параметры LP интерполируют на 2 с использованием модуля 403 интерполирования, чтобы получить С использованием дискретизированную с повышением частот узкополосную речь инверсно фильтруют с использованием фильтра 404 анализа, чтобы получить остаточный сигнал (который также дискретизируют на 16 кГц). При одном подходе эта операция инверсной фильтрации (или анализа) может быть описана с помощью уравнения

,

где n - индекс дискретизации.

В типичной настройке приложения инверсная фильтрация чтобы получить может быть выполнена на покадровой основе, где кадр определяют как последовательность из N последовательных выборок в течение длительности, равной Т секундам. Для многих приложений речевого сигнала достаточный выбор для Т приблизительно равен 20 ms с соответствующими значениями для N приблизительно равными 160 при частоте дискретизации 8 кГц и приблизительно 320 при частоте дискретизации 16 кГц. Последовательные кадры могут перекрывать друг друга, например, до 50% или приблизительно 50%, в этом случае вторая половина выборок в текущем кадре и первая половина выборок в следующем кадре являются одинаковыми, и новый кадр обрабатывают каждые Т/2 секунд. Например, для выбора Т как 20 ms и перекрытия 50% параметр LP вычисляют из 160 последовательных выборок каждые 10 ms и используют в инверсном фильтре средние 160 выборок соответствующего кадра из 320 выборок, чтобы выдать 160 выборок .

Также можно вычислить параметры LP порядка 2Р для операции инверсной фильтрации непосредственно из дискретизированной с повышением частот узкополосной речи. Однако этот подход может увеличить сложность как вычисления параметров LP, так и операции инверсной фильтрации без обязательного увеличения эффективности, по меньшей мере, при рабочих условиях.

Остаточный сигнал LP затем выпрямляют по полному периоду с использованием двухполупериодного выпрямителя 405 и фильтрации верхних частот результата (например, с использованием фильтра 406 верхних частот (HPF) с полосой пропускания между 3400 и 8000 Гц), чтобы получить выпрямленный остаточный сигнал полосы высоких частот. Параллельно выходной сигнал источника 407 псевдослучайного шума также фильтруют 408 по верхним частотам, чтобы получить сигнал шума полосы высоких частот. В качестве альтернативы отфильтрованная на верхних частотах шумовая последовательность может быть предварительно запомнена в буфере (таком как, например, кольцевой буфер) и к ней может быть осуществлен доступ, когда требуется сгенерировать . Использование такого буфера исключает вычисления, связанные с фильтрацией верхних частот выборок псевдослучайного шума в реальном времени. Эти два сигнала, а именно: и затем микшируют в микшере 409 в соответствии с уровнем голоса , предоставленным модулем 410 оценки и управления (ЕСМ) (этот модуль будет описан более подробно ниже). В этом иллюстративном примере уровень голоса изменяется от 0 до 1, причем 0 указывает уровень отсутствия голоса, а 1 указывает уровень максимального голоса. Микшер 409, по существу, формирует взвешенную сумму двух входных сигналов на своем выходе после гарантирования того, что два входных сигнала отрегулированы, чтобы иметь одинаковый уровень энергии. Выходной сигнал микшера задают с помощью

.

Специалисты в данной области техники поймут, что возможны другие правила микширования. Также можно сначала микшировать два сигнала, а именно: выпрямленный по полному периоду остаточный сигнал LP и сигнал псевдослучайного шума, а затем отфильтровать на верхних частотах микшированный сигнал. В этом случае два фильтра 406 и 408 верхних частот заменяют одним фильтром верхних частот на выходе микшера 409.

Остаточный сигнал затем предварительно обрабатывают с использованием препроцессора 411 возбуждения полосы высоких частот (НВ), чтобы сформировать сигнал возбуждения полосы высоких частот. Этап предварительной обработки может содержать: (i) масштабирование выходного сигнала микшера с возможностью соответствия уровню энергии полосы высоких частот и (ii) необязательное изменение формы выходного сигнала микшера с возможностью соответствия спектральной огибающей полосы высоких частот. Как так и предоставляют в препроцессор 411 возбуждения НВ с помощью ЕСМ 410. При использовании этого подхода может быть полезным во многих прикладных установках гарантировать, что такое изменение формы не влияет на спектр фазы выходного сигнала микшера, то есть изменение формы предпочтительно может быть выполнено с помощью фильтра с нулевой фазовой характеристикой.

Дискретизированный с повышением частоты узкополосный речевой сигнал и сигнал возбуждения полосы высоких частот складывают вместе с использованием сумматора 412, чтобы сформировать сигнал смешанной полосы частот. Этот результирующий сигнал смешанной полосы частот вводят в фильтр 413 эквалайзера, который фильтрует этот входной сигнал с использованием информации о широкополосной спектральной огибающей , предоставленной ЕСМ 410, чтобы сформировать оцененный широкополосный сигнал . Фильтр 413 эквалайзера по существу накладывает широкополосную спектральную огибающую на входной сигнал чтобы сформировать (дополнительное обсуждение в этом отношении следует ниже). Результирующий оцененный широкополосный сигнал подвергают фильтрации верхних частот, например, с использованием фильтра 414 верхних частот, имеющего полосу пропускания от 3400 до 8000 Гц, и подвергают фильтрации нижних частот, например, с использованием фильтра 415 нижних частот, имеющего полосу пропускания от 0 до 300 Гц, чтобы получить, соответственно, сигнал полосы высоких частот и сигнал полосы низких частот. Эти сигналы и дискретизированный с повышением частот узкополосный сигнал складывают вместе в другом сумматоре 416, чтобы сформировать сигнал расширенной ширины полосы частот.

Специалисты в данной области техники поймут, что имеются другие возможные конфигурации фильтра, чтобы получить сигнал расширенной ширины полосы частот. Если фильтр 413 эквалайзера точно сохраняет спектральный контент дискретизированного с повышением частот узкополосного сигнала , который является частью входного сигнала тогда оцененный широкополосный сигнал может быть непосредственно выведен как сигнал расширенной полосы частот, таким образом, исключая фильтр 414 верхних частот, фильтр 415 нижних частот и сумматор 416. В качестве альтернативы могут быть использованы два фильтра эквалайзера, один, чтобы восстановить низкочастотную часть, а другой, чтобы восстановить высокочастотную часть, и выходной сигнал первого из них может быть прибавлен к отфильтрованному на верхних частотах выходному сигналу последнего из них, чтобы получить сигнал расширенной полосы частот.

Специалисты в данной области техники узнают и поймут, что с помощью этого конкретного проиллюстрированного примера выпрямленное остаточное возбуждение полосы высоких частот и возбуждение шума полосы высоких частот микшируют вместе в соответствии с уровнем голоса. Когда уровень голоса равен 0, указывая речь без голоса, используют исключительно возбуждение шума. Подобным образом, когда уровень голоса равен 1, указывая полностью речь с голосом, используют исключительно выпрямленное остаточное возбуждение полосы высоких частот. Когда уровень голоса находится между 0 и 1, указывающим микшированную речь с голосом, два возбуждения микшируют в соответствующей части, как определено с помощью уровня голоса, и используют. Таким образом, микшированное возбуждение полосы высоких частот является подходящим для звуков с голосом, без голоса и со смешанным голосом.

Специалисты в данной области техники также поймут и осознают, что в этом иллюстративном примере фильтр эквалайзера используют для того, чтобы синтезировать . Фильтр эквалайзера рассматривает широкополосную спектральную огибающую , предоставленную ЕСМ, как идеальную огибающую и корректирует (или выравнивает) спектральную огибающую своего входного сигнала