Способ обнаружения звукового сигнала и устройство

Иллюстрации

Показать все

Изобретение относится к области техники обработки сигналов и предназначено для обнаружения звукового сигнала. Технический результат – обеспечение возможности точного различия активной речи и неактивной речи. Данный способ включает в себя: определение входного звукового сигнала в качестве подлежащего определению звукового сигнала; определение расширенного сегментного отношения (SSNR) сигнал-шум звукового сигнала, при этом расширенное SSNR больше опорного SSNR; и сравнение расширенного SSNR с пороговой величиной принятия решения относительно обнаружения (VAD) речевой активности для определения того, является ли звуковой сигнал активным сигналом. 4 н. и 18 з.п. ф-лы, 10 ил.

Реферат

Область техники, к которой относится изобретение

[0001] Варианты осуществления настоящего изобретения относятся к области техники обработки сигналов и, в частности, к способу обнаружения звукового сигнала и устройству.

Уровень техники

[0002] Обнаружение (VAD) речевой активности является ключевой технологией, широко используемой в таких областях техники, как передача речи и человеко-машинное взаимодействие. VAD может также упоминаться в качестве обнаружения (SAD) звуковой активности. VAD используется для обнаружения того, присутствует ли активный сигнал во входном звуковом сигнале, причем активный сигнал схож с неактивным сигналом (например, окружающий фоновый шум и приглушенная речь). Обычные активные сигналы включают в себя речь, музыку, и т.п. Принцип действия VAD заключается в том, что один или более характерных параметров, извлекаются из входного звукового сигнала, одно или более характерных значений определяются согласно упомянутому одному или более характерным параметрам, и затем упомянутое одно или более характерных значений сравнивается с одной или более пороговыми величинами.

[0003] В предшествующем уровне техники способ обнаружения активного сигнала на основе сегментного отношения (SSNR) сигнал-шум включает в себя: разделение входного звукового сигнала на множество подполосных сигналов в некоторой полосе частот, вычисление энергии звукового сигнала в каждой подполосе и сравнение энергии звукового сигнала в каждой подполосе с оцененной энергией сигнала фонового шума в каждой подполосе для получения отношения (SNR) сигнал-шум звукового сигнала в каждой подполосе; и затем определение SSNR согласно подполосному SNR каждой подполосы и сравнение SSNR с заданной пороговой величиной принятия решения относительно VAD, причем если SSNR превышает пороговую величину принятия решения относительно VAD, то звуковой сигнал является активным сигналом, или если SSNR не превышает пороговую величину принятия решения относительно VAD, то звуковой сигнал является неактивным сигналом.

[0004] Обычный способ вычисления SSNR заключается в сложении всех подполосных SNR звукового сигнала, и полученным результатом является SSNR. Например, SSNR может быть определен посредством использования формулы 1.1:

Формула 1.1

где k указывает k-ую подполосу, snr(k) указывает подполосное SNR k-ой подполосы и N указывает полное количество подполос, на которые разделен звуковой сигнал.

[0005] При использовании вышеупомянутого способа вычисления SSNR для обнаружения активной речи может происходить необнаружение активной речи.

Сущность изобретения

[0006] В вариантах осуществления настоящего изобретения предложен способ обнаружения звукового сигнала и устройство, которые могут точно различать активную речь и неактивную речь.

[0007] Согласно первому аспекту в одном варианте осуществления настоящего изобретения предложен способ обнаружения звукового сигнала, включающий в себя этапы, на которых: определяют входной звуковой сигнал в качестве подлежащего определению звукового сигнала; определяют расширенное сегментное отношение (SSNR) сигнал-шум звукового сигнала, причем расширенное SSNR больше опорного SSNR; и сравнивают расширенное SSNR с пороговой величиной принятия решения относительно обнаружения (VAD) речевой активности для определения того, является ли звуковой сигнал активным сигналом.

[0008] Со ссылкой на первый аспект, в первом возможном варианте реализации первого аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала согласно подполосному отношению (SNR) сигнал-шум звукового сигнала.

[0009] Со ссылкой на первый возможный вариант реализации первого аспекта, во втором возможном варианте реализации первого аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше первого количества.

[0010] Со ссылкой на первый возможный вариант реализации первого аспекта, в третьем возможном варианте реализации первого аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше второго количества, и количество низкочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR меньше второй заданной пороговой величины, больше третьего количества.

[0011] Со ссылкой на первый возможный вариант реализации первого аспекта, в четвертом возможном варианте реализации первого аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество подполос, которые находятся в звуковом сигнале и чьи значения подполосных SNR больше третьей заданной пороговой величины, больше четвертого количества.

[0012] Со ссылкой на первый аспект, в пятом возможном варианте реализации первого аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором определено, что звуковой сигнал является безречевым сигналом.

[0013] Со ссылкой на второй возможный вариант реализации или третий возможный вариант реализации первого аспекта, в шестом возможном варианте реализации первого аспекта, этап определения расширенного SSNR звукового сигнала включает в себя этап, на котором: определяют весовой коэффициент подполосного SNR каждой подполосы в звуковом сигнале, причем весовой коэффициент подполосного SNR высокочастотной пограничной подполосы, подполосное SNR которой больше первой заданной пороговой величины, больше весового коэффициента подполосного SNR другой подполосы; и определяют расширенное SSNR согласно подполосному SNR каждой подполосы и весовому коэффициенту подполосного SNR каждой подполосы в звуковом сигнале.

[0014] Со ссылкой на первый аспект или любой возможный вариант реализации первого возможного варианта реализации первого аспекта по пятый возможный вариант реализации первого аспекта, в седьмом возможном варианте реализации первого аспекта, этап определения расширенного SSNR звукового сигнала включает в себя этап, на котором: определяют опорное SSNR звукового сигнала; и определяют расширенное SSNR согласно опорному SSNR звукового сигнала.

[0015] Со ссылкой на седьмой возможный вариант реализации первого аспекта, в восьмом возможном варианте реализации первого аспекта, этап определения расширенного SSNR согласно опорному SSNR звукового сигнала включает в себя этап, на котором: определяют расширенное SSNR посредством использования следующей формулы: , в которой SSNR указывает опорное SSNR, SSNR' указывает расширенное SSNR, а x и y указывают параметры расширения.

[0016] Со ссылкой на седьмой возможный вариант реализации первого аспекта, в девятом возможном варианте реализации первого аспекта, этап определения расширенного SSNR согласно опорному SSNR звукового сигнала включает в себя этап, на котором: определяют расширенное SSNR посредством использования следующей формулы: , в которой SSNR указывает опорное SSNR, SSNR' указывает расширенное SSNR, и f(x) и h(y) указывают функции расширения.

[0017] Со ссылкой на первый аспект или любой из предшествующих возможных вариантов реализации первого аспекта, в десятом возможном варианте реализации первого аспекта, перед этапом сравнения расширенного SSNR с пороговой величиной принятия решения относительно VAD, способ дополнительно включает в себя этап, на котором: используют заданный алгоритм для уменьшения пороговой величины принятия решения относительно VAD с целью получения уменьшенной пороговой величины принятия решения относительно VAD; и этап сравнения расширенного SSNR с пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом, включает в себя этап, на котором: сравнивают расширенное SSNR с уменьшенной пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0018] Согласно второму аспекту в одном варианте осуществления настоящего изобретения предложен способ обнаружения звукового сигнала, включающий в себя этапы, на которых: определяют входной звуковой сигнал в качестве подлежащего определению звукового сигнала; определяют весовой коэффициент подполосного SNR каждой подполосы в звуковом сигнале, причем весовой коэффициент подполосного SNR высокочастотной пограничной подполосы, подполосное SNR которой больше первой заданной пороговой величины, больше весового коэффициента подполосного SNR другой подполосы; определяют расширенное SSNR согласно подполосному SNR каждой подполосы и весовому коэффициенту подполосного SNR каждой подполосы в звуковом сигнале, причем расширенное SSNR больше опорного SSNR; и сравнивают расширенное SSNR с пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0019] Со ссылкой на второй аспект, в первом возможном варианте реализации второго аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала согласно подполосному SNR звукового сигнала.

[0020] Со ссылкой на первый возможный вариант реализации второго аспекта, во втором возможном варианте реализации второго аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше первого количества.

[0021] Со ссылкой на первый возможный вариант реализации второго аспекта, в третьем возможном варианте реализации второго аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше второго количества, и количество низкочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR меньше второй заданной пороговой величины, больше третьего количества.

[0022] Согласно третьему аспекту в одном варианте осуществления настоящего изобретения предложен способ обнаружения звукового сигнала, включающий в себя этапы, на которых: определяют входной звуковой сигнал в качестве подлежащего определению звукового сигнала; получают опорное SSNR звукового сигнала; используют заданный алгоритм для уменьшения опорной пороговой величины принятия решения относительно VAD с целью получения уменьшенной пороговой величины принятия решения относительно VAD; и сравнивают опорное SSNR с уменьшенной пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0023] Со ссылкой на третий аспект, в первом возможном варианте реализации третьего аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала согласно подполосному SNR звукового сигнала.

[0024] Со ссылкой на первый возможный вариант реализации третьего аспекта, во втором возможном варианте реализации третьего аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше первого количества.

[0025] Со ссылкой на первый возможный вариант реализации третьего аспекта, в третьем возможном варианте реализации третьего аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше второго количества, и количество низкочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR меньше второй заданной пороговой величины, больше третьего количества.

[0026] Со ссылкой на первый возможный вариант реализации третьего аспекта, в четвертом возможном варианте реализации третьего аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором количество подполос, которые находятся в звуковом сигнале и чьи значения подполосных SNR больше третьей заданной пороговой величины, больше четвертого количества.

[0027] Со ссылкой на третий аспект, в пятом возможном варианте реализации третьего аспекта, этап определения входного звукового сигнала в качестве подлежащего определению звукового сигнала включает в себя этап, на котором: определяют звуковой сигнал в качестве подлежащего определению звукового сигнала в случае, при котором определено, что звуковой сигнал является безречевым сигналом.

[0028] Согласно четвертому аспекту в одном варианте осуществления настоящего изобретения предложено устройство, включающее в себя: первый блок определения, выполненный с возможностью определения входного звукового сигнала в качестве подлежащего определению звукового сигнала; второй блок определения, выполненный с возможностью определения расширенного SSNR звукового сигнала, причем расширенное SSNR больше опорного SSNR; и третий блок определения, выполненный с возможностью сравнения расширенного SSNR с пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0029] Со ссылкой на четвертый аспект, в первом возможном варианте реализации четвертого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала согласно подполосному отношению (SNR) сигнал-шум звукового сигнала.

[0030] Со ссылкой на первый возможный вариант реализации четвертого аспекта, во втором возможном варианте реализации четвертого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше первого количества.

[0031] Со ссылкой на первый возможный вариант реализации четвертого аспекта, в третьем возможном варианте реализации четвертого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше второго количества, и количество низкочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR меньше второй заданной пороговой величины, больше третьего количества.

[0032] Со ссылкой на первый возможный вариант реализации четвертого аспекта, в четвертом возможном варианте реализации четвертого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество подполос, которые находятся в звуковом сигнале и чьи значения подполосных SNR больше третьей заданной пороговой величины, больше четвертого количества.

[0033] Со ссылкой на четвертый аспект, в пятом возможном варианте реализации четвертого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором определено, что звуковой сигнал является безречевым сигналом.

[0034] Со ссылкой на второй возможный вариант реализации четвертого аспекта или третий возможный вариант реализации четвертого аспекта, в шестом возможном варианте реализации четвертого аспекта, второй блок определения выполнен с возможностью определения весового коэффициента подполосного SNR каждой подполосы в звуковом сигнале, причем весовой коэффициент подполосного SNR высокочастотной пограничной подполосы, подполосное SNR которой больше первой заданной пороговой величины, больше весового коэффициента подполосного SNR другой подполосы; и определения расширенного SSNR согласно подполосному SNR каждой подполосы и весовому коэффициенту подполосного SNR каждой подполосы в звуковом сигнале.

[0035] Со ссылкой на четвертый аспект или любой возможный вариант реализации первого возможного варианта реализации четвертого аспекта по пятый возможный вариант реализации четвертого аспекта, в седьмом возможном варианте реализации четвертого аспекта, второй блок определения выполнен с возможностью определения опорного SSNR звукового сигнала; и определения расширенного SSNR согласно опорному SSNR звукового сигнала.

[0036] Со ссылкой на седьмой возможный вариант реализации четвертого аспекта, в восьмом возможном варианте реализации четвертого аспекта, второй блок определения выполнен с возможностью определения расширенного SSNR посредством использования следующей формулы: , в которой SSNR указывает опорное SSNR, SSNR' указывает расширенное SSNR, а x и y указывают параметры расширения.

[0037] Со ссылкой на седьмой возможный вариант реализации четвертого аспекта, в девятом возможном варианте реализации четвертого аспекта, второй блок определения выполнен с возможностью определения расширенного SSNR посредством использования следующей формулы: , в которой SSNR указывает опорное SSNR, SSNR' указывает расширенное SSNR, и f(x) и h(y) указывают функции расширения.

[0038] Со ссылкой на четвертый аспект или любой из предшествующих возможных вариантов реализации четвертого аспекта, в десятом возможном варианте реализации четвертого аспекта, устройство дополнительно включает в себя четвертый блок определения, при этом четвертый блок определения выполнен с возможностью использования заданного алгоритма для уменьшения пороговой величины принятия решения относительно VAD с целью получения уменьшенной пороговой величины принятия решения относительно VAD; и третий блок определения выполнен с возможностью сравнения расширенного SSNR с уменьшенной пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0039] Согласно пятому аспекту в одном варианте осуществления настоящего изобретения предложено устройство, включающее в себя: первый блок определения, выполненный с возможностью определения входного звукового сигнала в качестве подлежащего определению звукового сигнала; второй блок определения, выполненный с возможностью определения весового коэффициента подполосного SNR каждой подполосы в звуковом сигнале, причем весовой коэффициент подполосного SNR высокочастотной пограничной подполосы, подполосное SNR которой больше первой заданной пороговой величины, больше весового коэффициента подполосного SNR другой подполосы, и определения расширенного SSNR согласно подполосному SNR каждой подполосы и весовому коэффициенту подполосного SNR каждой подполосы в звуковом сигнале, причем расширенное SSNR больше опорного SSNR; и третий блок определения, выполненный с возможностью сравнения расширенного SSNR с пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0040] Со ссылкой на пятый аспект, в первом возможном варианте реализации пятого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала согласно подполосному отношению (SNR) сигнал-шум звукового сигнала.

[0041] Со ссылкой на первый возможный вариант реализации пятого аспекта, во втором возможном варианте реализации пятого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше первого количества.

[0042] Со ссылкой на первый возможный вариант реализации пятого аспекта, в третьем возможном варианте реализации пятого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше второго количества, и количество низкочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR меньше второй заданной пороговой величины, больше третьего количества.

[0043] Согласно шестому аспекту в одном варианте осуществления настоящего изобретения предложено устройство, включающее в себя: первый блок определения, выполненный с возможностью определения входного звукового сигнала в качестве подлежащего определению звукового сигнала; второй блок определения, выполненный с возможностью получения опорного SSNR звукового сигнала; третий блок определения, выполненный с возможностью использования заданного алгоритма для уменьшения опорной пороговой величины принятия решения относительно VAD с целью получения уменьшенной пороговой величины принятия решения относительно VAD; и четвертый блок определения, выполненный с возможностью сравнения опорного SSNR с уменьшенной пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0044] Со ссылкой на шестой аспект, в первом возможном варианте реализации шестого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала согласно подполосному SNR звукового сигнала.

[0045] Со ссылкой на первый возможный вариант реализации шестого аспекта, во втором возможном варианте реализации шестого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше первого количества.

[0046] Со ссылкой на первый возможный вариант реализации шестого аспекта, в третьем возможном варианте реализации шестого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество высокочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR больше первой заданной пороговой величины, больше второго количества, и количество низкочастотных пограничных подполос, которые находятся в звуковом сигнале и чьи подполосные SNR меньше второй заданной пороговой величины, больше третьего количества.

[0047] Со ссылкой на первый возможный вариант реализации шестого аспекта, в четвертом возможном варианте реализации шестого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором количество подполос, которые находятся в звуковом сигнале и чьи значения подполосных SNR больше третьей заданной пороговой величины, больше четвертого количества.

[0048] Со ссылкой на шестой аспект, в пятом возможном варианте реализации шестого аспекта, первый блок определения выполнен с возможностью определения звукового сигнала в качестве подлежащего определению звукового сигнала в случае, при котором определено, что звуковой сигнал является безречевым сигналом.

[0049] Согласно способу, предложенному в упомянутых вариантах осуществления настоящего изобретения, может быть определена характерная особенность звукового сигнала, расширенное SSNR определяется соответствующим образом согласно характерной особенности звукового сигнала, и расширенное SSNR сравнивается с пороговой величиной принятия решения относительно VAD, так чтобы доля необнаружений активного сигнала могла быть уменьшена.

Краткое описание чертежей

[0050] Для описания технических решений в вариантах осуществления настоящего изобретения более ясно далее кратко описаны сопроводительные чертежи, необходимые для описания вариантов осуществления настоящего изобретения. Ясно, что на сопроводительных чертежах в последующем описании всего лишь показаны некоторые варианты осуществления настоящего изобретения, и средний специалист в уровне техники также может создать другие чертежи из этих сопроводительных чертежей без приложения творческих усилий.

[0051] На Фиг.1 показана схематичная блок-схема последовательности операций способа обнаружения звукового сигнала согласно одному варианту осуществления настоящего изобретения;

[0052] На Фиг.2 показана схематичная блок-схема последовательности операций способа обнаружения звукового сигнала согласно одному варианту осуществления настоящего изобретения;

[0053] На Фиг.3 показана схематичная блок-схема последовательности операций способа обнаружения звукового сигнала согласно одному варианту осуществления настоящего изобретения;

[0054] На Фиг.4 показана схематичная блок-схема последовательности операций способа обнаружения звукового сигнала согласно одному варианту осуществления настоящего изобретения;

[0055] На Фиг.5 показана структурная блок-схема устройства согласно одному варианту осуществления настоящего изобретения;

[0056] На Фиг.6 показана структурная блок-схема другого устройства согласно одному варианту осуществления настоящего изобретения;

[0057] На Фиг.7 показана структурная блок-схема устройства согласно одному варианту осуществления настоящего изобретения;

[0058] На Фиг.8 показана структурная блок-схема другого устройства согласно одному варианту осуществления настоящего изобретения;

[0059] На Фиг.9 показана структурная блок-схема другого устройства согласно одному варианту осуществления настоящего изобретения; и

[0060] На Фиг.10 показана структурная блок-схема другого устройства согласно одному варианту осуществления настоящего изобретения.

Осуществление изобретения

[0061] Далее ясно описаны технические решения в вариантах осуществления настоящего изобретения со ссылкой на сопроводительные чертежи в вариантах осуществления настоящего изобретения. Ясно, что описанные варианты осуществления являются всего лишь некоторыми, а не всеми, вариантами осуществления настоящего изобретения. Все другие варианты осуществления, полученные средним специалистом в уровне техники на основе приведенных вариантов осуществления настоящего изобретения без приложения творческих усилий, покрываются объемом защиты настоящего изобретения.

[0062] На Фиг.1 показана схематичная блок-схема последовательности операций способа обнаружения звукового сигнала согласно одному варианту осуществления настоящего изобретения.

[0063] 101. Определение входного звукового сигнала в качестве подлежащего определению звукового сигнала.

[0064] 102. Определение расширенного SSNR звукового сигнала, причем расширенное SSNR больше опорного SSNR.

[0065] 103. Сравнение расширенного SSNR с пороговой величиной принятия решения относительно VAD для определения того, является ли звуковой сигнал активным сигналом.

[0066] В данном варианте осуществления настоящего изобретения, когда расширенное SSNR сравнивается с пороговой величиной принятия решения относительно VAD, при этом может использоваться опорная пороговая величина принятия решения относительно VAD, или может использоваться уменьшенная пороговая величина принятия решения относительно VAD, полученная после того, как опорная пороговая величина принятия решения относительно VAD уменьшена посредством использования заданного алгоритма. Опорная пороговая величина принятия решения относительно VAD может быть пороговой величиной принятия решения относительно VAD по умолчанию, и опорная пороговая величина принятия решения относительно VAD может быть предварительно сохранена или может быть временно получена посредством вычисления, при этом опорная пороговая величина принятия решения относительно VAD может быть вычислена посредством использования существующей хорошо известной технологии. При уменьшении опорной пороговой величины принятия решения относительно VAD посредством использования заданного алгоритма заданный алгоритм может представлять собой умножение опорной пороговой величины принятия решения относительно VAD на коэффициент, который меньше 1, или может использоваться другой алгоритм. Данный вариант осуществления настоящего изобретения не накладывает каких-либо ограничений на конкретный используемый алгоритм.

[0067] При использовании обычного способа вычисления SSNR для вычисления SSNR-отношений некоторых звуковых сигналов SSNR-отношения этих звуковых сигналов могут быть ниже заданной пороговой величины принятия решения относительно VAD. Однако, фактически, эти звуковые сигналы являются активными звуковыми сигналами. Это обусловлено характерными особенностями этих звуковых сигналов. Например, в случае, при котором окружающее SNR является относительно низким, подполосное SNR высокочастотной части значительно уменьшено. Кроме того, поскольку обычно используется психоакустическая теория для выполнения разделения на подполосы, то подполосное SNR высокочастотной части вносит относительно малый вклад в SSNR. В данном случае, для некоторых сигналов, таких как безречевой сигнал, энергия которого, главным образом, сконцентрирована в относительно высокочастотной части, SSNR, полученное через вычисление посредством использования обычного способа вычисления SSNR, может быть ниже пороговой величины принятия решения относительно VAD, что обуславливает необнаружение активного сигнала. В другом примере, для некоторых звуковых сигналов, распределение энергии этих звуковых сигналов является относительно плоским по спектру, но полная энергия этих звуковых сигналов является относительно низкой. Поэтому, в случае, при котором окружающее SNR является относительно низким, SSNR, полученное через вычисление посредством использования обычного способа вычисления SSNR, может быть ниже пороговой величины принятия решения относительно VAD. В способе, изображенном на Фиг.1, используется подходящее увеличение SSNR, так что SSNR может быть больше пороговой величины принятия решения относительно VAD. Поэтому, доля необнаружений активного сигнала может быть эффективно уменьшена.

[0068] На Фиг.2 показана схематичная блок-схема последовательности операций способа обнаружения звукового сигнала согласно одному варианту осуществления настоящего изобретения.

[0069] 201. Определение подполосного SNR входного звукового сигнала.

[0070] Спектр входного звукового сигнала разделяется на N подполос, где N является положительным целым числом, больше 1. В частности, для разделения спектра звукового сигнала может использоваться психоакустическая теория. В случае, при котором для разделения спектра звукового сигнала используется психоакустическая теория, ширина подполосы ближе к низкой частоте является более узкой, а ширина подполосы ближе к высокой частоте является более широкой. Конечно, спектр звукового сигнала может также быть разделен и по-другому, например, посредством равномерного разделения спектра звукового сигнала на N подполос. Осуществляется вычисление подполосного SNR каждой подполосы входного звукового сигнала, при этом подполосное SNR является отношением энергии подполосы к энергии фонового шума в данной подполосе. Энергия фонового шума в подполосе в целом является оцененным значением, полученным посредством оценки оценщиком фонового шума. Вариант использования оценщика фонового шума для оценки энергии фонового шума, соответствующей каждой подполосе, осуществляется согласно хорошо известной технологии в данной области техники. Поэтому, в данном документе не нужно пописывать какие-либо подробности. Специалист в данной области техники может быть понятно, что подполосное SNR может быть прямым отношением энергий или может быть другой формой выражения прямого отношения энергий, такой как логарифмическое подполосное SNR. Кроме того, специалист в данной области техники дополнительно может быть понятно, что подполосное SNR может также быть подполосным SNR, полученным после выполнения над прямым подполосном SNR линейной или нелинейной обработки, или может быть другим преобразованием подполосного SNR. Прямое отношение энергий подполосного SNR изображено в следующей формуле:

Формула 1.2

в которой snr(k) указывает подполосное SNR k-ой подполосы, а E(k) и En(k) соответственно указывают энергию k-ой подполосы и энергию фонового шума в k-ой подполосе. Логарифмическое подполосное SNR может быть указано следующим образом: , где указывает логарифмическое подполосное SNR k-ой подполосы, и snr(k) указывает подполосное SNR, которым обладает k-ая подполоса и которое получено через вычисление посредством использования формулы 1.2. Специалисту в данной области техники может быть дополнительно понятно, что подполосная энергия, используемая для вычисления подполосного SNR, может быть энергией входного звукового сигнала в некоторой подполосе, или может быть энергией, полученной после вычитания энергии фонового шума в некоторой подполосе из энергии входного звукового сигнала в данной подполосе. Вычисление SNR выполняется должным образом без отступления от сущности SNR.

[0071] 202. Определение входного звукового сигнала в качестве подлежащего определению звукового сигнала.

[0072] Необязательно, в одном варианте осуществления, определение входного звукового сигнала в качестве подлежащего определению звукового сигнала может включать в себя: определение звуково