2616557 - Устройство и способ обработки речевого/аудио сигнала

Устройство и способ обработки речевого/аудио сигнала

Иллюстрации

Показать все

Изобретение относится к средствам обработки речевого/аудио сигнала. Технический результат заключается в обеспечении комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов. Способ обработки речевого/аудио сигнала включает в себя этапы, на которых при переключении полосы пропускания речевого/аудио сигнала получают исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала; получают глобальный параметр усиления исходного высокочастотного сигнала во временной области; выполняют обработку взвешивания для отношения энергий и глобального параметра усиления во временной области и используют полученное взвешенное значение в качестве предсказанного глобального параметра усиления, причем отношение энергий представляет собой отношение между энергией архивного кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала; корректируют исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; синтезируют текущий кадр узкополосного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и выводят синтезированный сигнал. 4 н. и 19 з.п. ф-лы, 10 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится к области технологий обработки цифрового сигнала и, более конкретно, к устройству и способу обработки речевого/аудио сигнала.

Уровень техники

В области цифровой связи, передачи голосового сигнала, изображения, аудио и видео контента широко используются, например, вызов абонента по мобильному телефону, осуществление аудио/видео конференции, при трансляции телевизионной программы и мультимедийного развлекательного контента. Аудио сигнал оцифровывается и передается от одного терминала к другому терминалу с использованием сети звуковой связи. Терминал в данном документе может представлять собой мобильный телефон, цифровой телефонный терминал или звуковой терминал любого другого типа, где цифровой телефонной терминал является, например, VoIP-телефоном, ISDN телефоном, компьютером или телефонным аппаратом кабельной связи. С целью уменьшения величины использования ресурсов, которые используются для передачи или хранения речевого/аудио сигнала, речевой/аудио сигнал сжимается на конце передачи, и затем передается на приемный конец, и на приемном конце речевой/аудио сигнал восстанавливается посредством выполнения процесса разуплотнения, и воспроизводится.

При осуществлении многоскоростного кодирования речевого/аудио сигнала, вследствие наличия различных сетевых статусов, сеть отсекает битовые потоки на разных скоростях передачи, где потоки битов передаются от кодера в сеть, и в декодере усеченные битовые потоки декодируются в речевые/аудио сигналы с различной шириной полосы пропускания. В результате, выходные речевые/аудио сигналы переключаются между различными значениями полосы пропускания.

Внезапное переключение между сигналами различных полос пропускания вызывает очевидный слуховой дискомфорт в ушах пользователя. Кроме того, вследствие выполнения обновления состояний фильтров во время частотно-временного преобразования или временного-частотного преобразования, как правило, требуется использование параметра между последовательными кадрами, когда некоторый надлежащий процесс обработки не выполняется во время переключения полосы пропускания, что может вызвать сбой во время обновления этих состояний, что вызывает определенные резкие изменения энергии и ухудшение качества воспроизведения звука.

Раскрытие изобретения

Целью вариантов осуществления настоящего изобретения является предоставление устройства и способа обработки речевого/аудио сигнала для обеспечения комфортного воспроизведения звука во время переключения полосы пропускания речевых/аудио сигналов.

В соответствии с первым аспектом настоящего изобретения способ обработки речевого/аудио сигнала включает в себя:

при переключении речевого/аудио сигнала из широкополосного частотного сигнала в узкополосных частотный сигнал, получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала;

получение значения глобального параметра усиления исходного высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала;

коррекцию исходного высокочастотного сигнала использованием глобального параметра усиления во временной области для получения скорректированного высокочастотного сигнала во временной области; и

синтезирование текущего кадра узкополосного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработку синтезированного сигнала.

В первом возможном способе реализации первого аспекта, в котором, получение глобального параметра усиления исходного высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного сигнала и хронологическим кадром узкополосного сигнала содержит:

классификацию текущего кадра речевого/аудио сигнала как первый тип сигнала или второй тип сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного сигнала и хронологическим кадром узкополосного частотного сигнала;

когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничение параметра наклона спектра до величины менее чем или равной первому заранее заданному значению для получения предельного значения параметра наклона спектра;

когда текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничение параметра наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра; и

получение глобального параметра усиления исходного высокочастотного сигнала во временной области в качестве предельного значения параметра наклона спектра.

Со ссылкой на первый возможный способ реализации первого аспекта, второй возможный способ реализации, в котором, первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, то узкополосный сигнал классифицируется как щелевой сигнал, остальные как нещелевые сигналы; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

Со ссылкой на содержание первого аспекта, первого возможного способа реализации первого аспекта и второго возможного способа реализации первого аспекта, в третьем возможном способе реализации, в котором, коррекция исходного высокочастотного сигнала с помощью глобального параметра усиления во временной области для получения скорректированного высокочастотного сигнала во временной области содержит:

выполнение весовой обработки соотношения энергии и глобального параметра усиления во временной области и использование полученного взвешенного значения в качестве предсказанного глобального параметра усиления, в котором соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала; и

коррекцию исходного высокочастотного сигнала с помощью предсказанного глобального параметра усиления.

Со ссылкой на описание первого аспекта, первого возможного способа реализации первого аспекта и второго возможного способа реализации первого аспекта, четвертый возможный способ реализации дополнительно содержит:

получение параметра огибающей во временной области, соответствующего исходному высокочастотному сигналу, в котором

коррекцию исходного высокочастотного сигнала с помощью глобального параметра усиления во временной области содержит:

коррекцию исходного высокочастотного сигнала с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

В соответствии со вторым аспектом настоящего изобретения предложен способ обработки речевого/аудио сигнала, который включает в себя:

когда речевой/аудио сигнал переключает полосу пропускания, получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала;

получение значения глобального коэффициента усиления временной области исходного высокочастотного сигнала;

выполнение процедуры взвешивания соотношения энергии и глобального параметра усиления во временной области и использование полученного взвешенного значения в качестве предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;

коррекцию исходного высокочастотного сигнала посредством использования предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

синтезирование текущего кадра узкополосного сигнала во временной области и скорректированного высокочастотного сигнала во временной области и выработка синтезированного сигнала.

В первом возможном способе реализации второго аспекта, в котором переключение полосы пропускания является переключением из широкополосного частотного сигнала на узкополосный сигнал и получение глобального параметра усиления во временной области исходного высокочастотного сигнала содержит:

получение глобального параметра усиления исходного высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала.

Со ссылкой на первый возможный способ реализации первого аспекта во втором возможном способе реализации, в котором, получение глобального параметра усиления исходного высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала содержит:

классификацию текущего кадра речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и соотношения между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала;

когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничивается параметр наклона спектра до величины менее чем или равной первому заранее заданному значению для получения предельного значения параметра наклона спектра;

когда текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничивается параметр наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра; и

Со ссылкой на второй возможный способ реализации первого аспекта, в третьем возможном способе реализации, в котором, первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, то узкополосный сигнал классифицируется как щелевой, остальные как нещелевые; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

В четвертом возможном способе реализации второго аспекта, в котором переключение полосы пропускания представляет собой переключение из широкополосного частотного сигнала на узкополосный сигнал и получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала содержит:

предсказание высокочастотного сигнала возбуждения в соответствии с текущим кадром речевого/аудио сигнала;

предсказание коэффициента LPC высокочастотного сигнала; и

синтезирование высокочастотного сигнала возбуждения и коэффициента LPC высокочастотного сигнала для получения исходного высокочастотного сигнала.

В пятом возможном способе реализации согласно второму аспекту, в котором, переключение полосы пропускания представляет собой переключение из узкополосного частотного сигнала на широкополосный частотный сигнал и способ дополнительно содержит:

когда узкополосные сигналы текущего кадра речевого/аудио сигнала и предшествующий кадр речевого/аудио сигнала имеет заданную корреляцию, использование значения, полученного путем ослабления, в соответствии с размером шага, весового коэффициента alfa соотношения энергии, соответствующего предшествующему кадру речевого/аудио сигнала в качестве весового коэффициента соотношения энергии, соответствующего текущему аудио кадру, в котором затухание выполняется покадрово, пока величина alfa не будет равно 0.

В соответствии с третьим аспектом настоящего изобретения, устройство обработки речевого/аудио сигнал включает в себя:

блок предсказания, выполненный с возможностью: когда речевой/аудио сигнал переключает с широкополосного частотного сигнала в узкополосной частотный сигнал, получать исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;

блок получения параметра, выполненный с возможностью получать глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала;

корректирующий блок, выполненный с возможностью корректировать исходный высокочастотный сигнал с помощью глобального параметра усиления во временной области для получения скорректированного высокочастотного сигнала во временной области; и

синтезирующий блок, выполненный с возможностью синтезировать текущий кадр узкополосного частотного сигнала во временной области и скорректированный высокочастотный сигнал во временной области и вырабатывать синтезированный сигнал.

В первом возможном способе реализации согласно третьему аспекту, в котором блок получения параметра содержит:

блок классификации, выполненный с возможностью классифицировать текущий кадр речевого/аудио сигнала в качестве первого типа сигнала или второго типа сигнала в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляции между текущим кадром речевого/аудио сигнала и хронологическим кадром узкополосного частотного сигнала;

первый ограничивающий блок, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничение параметра наклона спектра до величины менее чем или равной первому заранее заданному значению для получения значения предельного параметра наклона спектра и использование предельного значения параметра наклона спектра в качестве глобального параметра усиления высокочастотного сигнала во временной области; и

второй ограничивающий блок, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является вторым типом сигнала, ограничение параметра наклона спектра значением в первом диапазоне для получения предельного значения параметра наклона спектра и получение параметра глобального усиления исходного высокочастотного сигнала во временной области в качестве предельного значения параметра наклона спектра.

Со ссылкой на первый возможный способ реализации согласно третьему аспекту, в соответствии со вторым возможным способом реализации, в котором, первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, узкополосный сигнал классифицируется как щелевой сигнал, остальные как нещелевые сигналы; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

Со ссылкой на любой способ третьего аспекта, первый возможный способ реализации согласно третьему аспекту и второй возможный способ реализации согласно третьему аспекту, третий возможный способ реализации дополнительно содержит:

блок весовой обработки, выполненный с возможностью выполнять весовую обработку соотношения энергии и глобального параметра усиления во временной области и использовать полученного взвешенное значение в качестве предсказанного глобального параметра усиления, в котором соотношение энергии является соотношением между энергией хронологического кадра высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала, в котором

корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

Со ссылкой на любой способ третьего аспекта, первый возможный способ реализации согласно третьему аспекту и второй возможный способ реализации согласно третьему аспекту, четвертый возможный способ реализации, в котором

блок получения параметра дополнительно выполнен с возможностью получать параметр огибающей во временной области, соответствующий исходному высокочастотному сигналу; и

корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью параметра огибающей во временной области и глобального параметра усиления во временной области.

В соответствии с четвертым аспектом настоящего изобретения, устройство обработки речевого/аудио сигнала включает в себя:

блок получения, выполненный с возможностью: когда речевой/аудио сигнал переключает полосу пропускания, получать исходный высокочастотный сигнал, соответствующий текущему кадру речевого/аудио сигнала;

блок получения параметра, выполненный с возможностью получать глобальный параметр усиления во временной области, соответствующий исходному высокочастотному сигналу;

блок взвешенной обработки, выполнен с возможностью выполнять взвешенную обработку соотношения энергии и глобального параметра усиления во временной области, и использовать полученное взвешенное значение в качестве предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией хронологического высокочастотного сигнала во временной области и энергией текущего кадра исходного высокочастотного сигнала;

корректирующий блок, выполненный с возможностью корректировать исходный высокочастотный сигнал с помощью предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области; и

В первом возможном способе реализации согласно четвертому аспекту, в котором переключение полосы пропускания представляет собой переключение из широкополосного частотного сигнала на узкополосный частотный сигнал и блок получения параметра содержит:

блок получения глобального параметра усиления, выполненный с возможностью получать глобальный параметр усиления высокочастотного сигнала во временной области в соответствии с параметром наклона спектра текущего кадра речевого/аудио сигнала и корреляцию между текущим кадром речевого/аудио сигнала и хронологическим кадром узкополосного частотного сигнала.

Со ссылкой на первый возможный способ реализации четвертого аспекта, в соответствии со вторым возможным способом реализации, в котором блок получения глобального параметра усиления содержит:

первый ограничивающий блок, выполненный с возможностью: когда текущий кадр речевого/аудио сигнала является первым типом сигнала, ограничивать параметр наклона спектра до величины менее чем или равной первому заранее заданному значению, чтобы получить предельное значение параметра наклона спектра и использовать предельное значение параметра наклона спектра в качестве глобального параметра усиления исходного высокочастотного сигнала во временной области; и

второй ограничивающий блок, выполненный с возможностью: если текущий кадр речевого/аудио сигнала является вторым типом сигнала ограничивать параметр наклона спектра значением в первом диапазоне, чтобы получить предельное значение параметра наклона спектра и получать глобальный параметр усиления исходного высокочастотного сигнала во временной области в качестве предельного значения параметра наклона спектра.

Со ссылкой на второй возможный способ реализации четвертого аспекта, третий возможный способ реализации, в котором первый тип сигнала является щелевым сигналом и второй тип сигнала является нещелевым сигналом; когда параметр tilt>5 наклона спектра и параметр cor корреляции меньше заданного значения, то узкополосный частотный сигнала классифицируется как щелевой сигнал, остальные как нещелевые сигналы; первое заданное значение равно 8; и первый заданный диапазон равен [0.5, 1].

Со ссылкой на любой способ четвертого аспекта, первый возможный способ реализации четвертого аспекта и второй возможный способ реализации четвертого аспекта, в четвертом возможном способе реализации, в котором переключение полосы пропускания переключения представляет собой переключения из широкополосного частотного сигнала в узкополосный частотный сигнал и устройство дополнительно содержит:

блок получения огибающей во временной области, выполненный с возможностью использовать серию заданных значений как параметр огибающей высокочастотного сигнала во временной области текущего кадра речевого/аудио сигнала; и

корректирующий блок выполнен с возможностью корректировать исходный высокочастотный сигнал с помощью параметра огибающей во временной области и предсказанного глобального параметра усиления для получения скорректированного высокочастотного сигнала во временной области.

Со ссылкой на любой способ четвертого аспекта, первой возможный способ реализации четвертого аспекта и второй возможный способ реализации четвертого аспекта, в пятом возможном способе реализации, в котором, получающий блок содержит:

блок получения сигнала возбуждения, выполненный с возможностью предсказывать сигнал возбуждения высокочастотного сигнала в соответствии с текущим кадром речевого/аудио сигнала;

блок получения коэффициента LPC, выполненный с возможностью предсказывать коэффициент LPC высокочастотного сигнала; и

синтезирующий блок, выполненный с возможностью синтезировать сигнал возбуждения высокочастотного сигнала и коэффициента LPC высокочастотного сигнала для получения исходного высокочастотного сигнала.

Со ссылкой на любой способ четвертого аспекта, первый возможный способ реализации четвертого аспекта и второй возможный способ реализации четвертого аспекта, в шестом возможном способе реализации, в котором переключение полосы пропускания представляет собой переключение из узкополосного частотного сигнала в широкополосный частотный сигнал и устройство дополнительно содержит:

блок установки весового коэффициента, выполненный с возможностью: когда узкополосные сигналы текущего кадра речевого/аудио сигнала и предшествующий кадр речевого/аудио сигнала имеет заданную корреляцию, использовать значение, полученное путем ослабления, в соответствии с размером шага, коэффициент взвешивания alfa соотношения энергии, соответствующий предшествующему кадру речевого/аудио сигнала в качестве весового коэффициента соотношения энергии, соответствующего текущему аудио кадру, в котором затухание выполняется покадрово до тех пор, пока величина alfa не будет равно 0.

В вариантах осуществления настоящего изобретения при переключении между широкополосным частотным диапазоном и узкополосным частотным диапазоном, высокочастотный сигнал корректируется таким образом, чтобы осуществить плавный переход высокочастотного сигнала между широкополосным частотным диапазоном и узкополосным частотным диапазоном, таким образом эффективно устраняя слуховой дискомфорт, вызванный переключением между широкополосным частотным диапазоном и узкополосным частотным диапазоном; дополнительно, поскольку алгоритм переключения полосы пропускания и алгоритм кодирования/декодирования высокочастотного сигнала до переключения находятся в одном домене сигнала, что обеспечивает не только отсутствие дополнительной задержки, но и простоту использования алгоритма, что также обеспечивает надлежащие характеристики выходного сигнала.

Краткое описание чертежей

Далее приводится краткое описание технических решений в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи, необходимые для описания вариантов осуществления или предшествующего уровня техники. Очевидно, приведенные ниже сопровождающие чертежи показывают только некоторые варианты осуществления настоящего изобретения, и специалисты в этой области техники все еще могут получить другие чертежи, используя данные прилагаемые чертежи без творческих усилий.

Фиг. 1 представляет собой схематическую блок-схему последовательности операций варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 2 представляет собой схематическую блок-схему алгоритма другого варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 3 представляет собой схематическую блок-схему алгоритма другого варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 4 представляет собой схематическую блок-схему алгоритма другого варианта осуществления способа обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 5 является структурной схемой варианта осуществления устройства обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 6 представляет собой схему варианта осуществления устройства обработки речевого/аудио сигнала в соответствии с настоящим изобретением;

Фиг. 7 является структурной схемой одного варианта осуществления блока получения параметра в соответствии с настоящим изобретением;

Фиг. 8 является структурной схемой варианта осуществления блока получения глобального параметра усиления в соответствии с настоящим изобретением;

Фиг. 9 представляет собой схематичное представление варианта осуществления получающего блока в соответствии с настоящим изобретением; и

Фиг. 10 представляет собой структурную схему другого варианта осуществления устройства обработки речевого/аудио сигнала в соответствии с настоящим изобретением.

Осуществление изобретения

Далее ясно приводится описание технических решений в вариантах осуществления настоящего изобретения со ссылкой на прилагаемые чертежи. Очевидно, что описанные варианты осуществления являются всего лишь частью от всех возможных вариантов осуществления настоящего изобретения. Все другие варианты осуществления, полученные специалистами в данной области техники на основании вариантов осуществления настоящего изобретения без творческих усилий, должны находиться в рамках объема патентной защиты настоящего изобретения.

В области цифровой обработки сигналов аудиокодеки и видеокодеки широко применяются в различных электронных устройствах, таких как мобильный телефон, устройство беспроводной связи, электронный секретарь (PDA), карманный или портативный компьютер, приемник GPS/навигатор, камера, аудио/видео плеер, видеокамера, видеомагнитофон и контрольно-измерительное устройство. Как правило, этот тип электронного устройства включает в себя аудио кодер или аудио декодер, где аудио кодер или декодер могут быть непосредственно реализованы с помощью цифровой схемы или микросхемы, например, DSP (цифровой сигнальный процессор) или быть реализованы с помощью кода программного обеспечения, который управляет процессором при выполнении обработки в соответствии с программным кодом.

В предшествующем уровне техники, в связи с тем, что полосы пропускания речевых/аудио сигналов, передаваемые в сети, разные, в процессе передачи речевых/аудио сигналов полосы частот речевых/аудио сигналов часто меняются, и присутствует такое явление, как переключение узкополосного речевого/аудио сигнала в широкополосный речевой/аудио сигнал и переключение широкополосного речевого/аудио сигнала в узкополосный речевой/аудио сигнал. Такой процесс переключения речевого/аудио сигнала между высокочастотным и низкочастотным частотными диапазонами называют переключением полосы пропускания. Переключение полосы пропускания включает в себя переключение узкополосного частотного сигнала в широкополосный частотный сигнал и переключение широкополосного частотного сигнала в узкополосный частотный сигнал. Узкополосный частотный сигнал, упомянутый в настоящем изобретении, представляет собой речевой сигнал, который имеет только низкочастотную составляющую и высокочастотная составляющая отсутствует после повышающей дискретизации и низкочастотной фильтрации, в то время, как широкополосный частотный речевой/аудио сигнал имеет как низкочастотную составляющую сигнала, так и высокочастотную составляющую сигнала. Узкополосный частотный сигнал и широкополосный частотный сигнал относительны. Например, для узкополосного сигнала широкополосный сигнал является широкополосным сигналом; и для широкополосного сигнала сверх широкополосный сигнал является широкополосным частотным сигналом. Как правило, узкополосный сигнал является речевым/аудио сигналом, частота дискретизации которого равна 8 кГц; широкополосным сигнал является речевым/аудио сигналом, частота дискретизации которого равна 16 кГц; и сверх широкополосный сигнал является речевым/аудио сигналом, частота дискретизации которого составляет 32 кГц.

Когда алгоритм кодирования/декодирования высокочастотного сигнала перед переключение выбирается между алгоритмами кодирования/декодирования в соответствии с различными типами сигналов, или когда алгоритм кодирования высокочастотного сигнала до переключения представляет собой алгоритм кодирования во временной области, чтобы обеспечить непрерывность выходных сигналов при переключении, алгоритм переключения хранится в домене сигнала для обработки, где домен сигнала является тем же самым, что и алгоритм кодирования/декодирования высокочастотного сигнала до переключения. То есть, когда используется алгоритм кодирования/декодирования высокочастотного сигнала во временной области до переключения, то используется алгоритм переключения во временной области в качестве алгоритма переключения; когда используется алгоритм кодирования/декодирования высокочастотного сигнала в частотной области до переключения, алгоритм переключения в частотной области используется в качестве алгоритма переключения. В предшествующем уровне техники, когда алгоритм расширения частотного диапазона во временной области используется до переключения, то аналогичная технология переключения во временной области не используется после переключения.

При кодировании речевого/аудио сигнала, обработка обычно выполняется с помощью кадра как блока. Входной текущий аудио кадр, который должен быть обработан, является текущим кадром речевого/звукового сигнала. Текущий кадр речевого/аудио сигнала включает в себя узкополосной частотный сигнал и высокочастотный сигнал, то есть, текущий кадр узкополосного частотного сигнала и текущий кадр высокочастотного сигнала. Любой кадр речевого/аудио сигнала перед текущим кадром высокочастотного сигнала является хронологическим кадром речевого/аудио сигнала, который также включает в себя хронологический кадр узкополосного частотного сигнала и хронологический кадр высокочастотного сигнала. Предшествующий кадр речевого/аудио сигнала текущего кадра речевого/аудио сигнала является предыдущим кадром речевого/аудио сигнала.

Как показано на фиг. 1, вариант осуществления способа обработки речевого/аудио сигнала согласно настоящему изобретению включает в себя:

S101: Когда речевой/аудио сигнал переключает полосу пропускания, получение исходного высокочастотного сигнала, соответствующего текущему кадру речевого/аудио сигнала.

Текущий кадр речевого/аудио сигнала включает в себя текущий кадр узкополосного частотного сигнала и текущий кадр высокочастотного сигнала во временной области. Переключение полосы частот включает в себя переключение с узкополосного частотного сигнала в широкополосной частотный сигнал и переключение с широкополосного частотного сигнала в узкополосный частотный сигнал. В случае переключения с узкополосного частотного сигнала в широкополосной частотный сигнал, текущий кадр речевого/аудио сигнала является текущим кадром широкополосного частотного сигнала, включающий в себя узкополосный частотный сигнал и высокочастотный сигнал, и исходный высокочастотный сигнал текущего кадра речевого/аудио сигнала является реальным сигналом и может быть получен непосредственно из текущего кадра речевого/аудио сигнала. В случае переключения из широкополосного частотного сигнала в узкополосный частотный сигнал, текущий кадр речевого/аудио сигнала является текущим кадром узкополосного частотного сигнала, где текущий кадр высокочастотного сигнала во временной области пуст, исходный высокочастотный сигнал текущего кадра речевого/аудио сигнала является предсказанным сигналом и высокочастотный сигнал, соответствующий текущему кадру узкополосного частотного сигнала, должен быть предсказан и использоваться в качестве исходного высокочастотного сигнала.

S102: Получение глобального параметра усиления во временной области, соответствующего исходному высокочастотному сигналу.

В случае переключения с узкополосного частотного сигнала на широкополосной частотный сигнал, глобальный параметр усиления высокочастотного сигнала временной области может быть получен декодированием. В случае переключения из широкополосного частотного сигнала в узкополосный частотный сигнал, глобальный параметр усиления высокочастотного сигнала во временной области может быть получен в соответствии с текущим кадром сигнала: глобальный параметр усиления высокочастотного сигнала во временной области получают в соответствии с параметром наклона спектра узкополосного частотного сигнала и корреляцией между текущим кадром узкополосного частотного сигнала и хронологическим кадром узкополосного частотного сигнала.

S103: Выполнение весовой обработки соотношения энергии и глобального параметра усиления временной области и использование полученного взвешенного значения как предсказанного глобального параметра усиления, где соотношение энергии является соотношением между энергией высокочастотного сигнала во временной области хронологического кадра речевого/аудио сигнала и энергией исходного высокочастотного сигнала текущего кадра речевого/аудио сигнала.

Хронологический кадр конечного выходного речевого/аудио сигнала используется в качестве хронологического кадра речевого/аудио сигнала, и исходный высокочастотный сигнал используется в качестве текущего кадра речевого/аудио сигнала. Коэффициент соотношения энергии Ratio=Esyn (-1) / Esyn_tmp, где Esyn (-1) представляет собой энергию выходного высокочастотного сигнала syn во временной области хронологического кадра, и Esyn_tmp представляет энергию исходного высокочастотного сигнала syn временной области, соответствующего текущего кадра.

Предсказанный глобальный параметр усиления gain=alfa*Ratio+beta*gain', где gain' является глобальным параметром усиления временной области, alfa+beta=1, и значения alfa и beta отличаются в зависимости от типов различных сигналов.

S104: корректировка исходного высокочастотного сигнала, используя предсказанный глобальный параметр усиления для получения скорректированного высокочастотного сигнала во временной области.

Корректировка относится к процессу умножения сигнала, то есть, исходный высокочас

Устройство и способ обработки речевого/аудио сигнала

Патент 2616557