Способ обработки речевого сигнала

Иллюстрации

Показать все

Реферат

 

OllИСАНИЕ

ИЗЬБРЕТЕН ИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

Союз Советсккк

Соцкавксткческик

11естгубттмк

«»847347 (61) Дополнительное к авт. свид-ву— (22) Заявлено 09.07.79 (21) 2795178/18-!О с присоединением заявки №вЂ” (23) Приоритет— (51) М. Кл

G 10L1/00

lOCf43P CI99IIIIhlN KONNT97

СССР (53) УДК 621.391 (088.8) Опубликовано 15.07.81. Бюллетень № 26

Дата опубликования описания 25.07.81 до делам нзебретекий и еткрытий

А. П. Беликов и Н. В. Мулюкин (72) Авторы изобретения

Московский государственный педагогический институт иностранных языков им. М. Тореза (71) Заявитель (54) СПОСОБ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА

Изобретение относится к приборостроению и может быть использовано при распознавании и сегментации речевого сигнала.

Известен способ обработки речевого сигнала, основанный на условном квантовании спектра с последующим анализом многомерной функции сигнал — параметров (1) .

Однако этот способ не обеспечивает требуемой достоверности анализа речевого сигнала.

Известен также способ обработки речевого сигнала, основанный на интегральном тв преобразовании речи (2).

Однако этот способ не обеспечивает требуемой достоверности анализа речевого сигнала и сложности его реализации ввиду необходимости использования спектрального анализа речевого сигнала. IS

Цель изобретения — повышение достоверности анализа речевого сигнала.

Поставленная цель достигается за счет того, что речевой сигнал дифференцируют, квадратично детектируют, интегрируют и соотносят с квадратом среднеквадратичной амплитуды сигнала, полученного аналогичным преобразованием речевого сигнала без дифференцирования, затем это соотношение и квадрат среднеквадратичной амплитуды нелинейно преобразуют в среднеквадратичный частотный центр мгновенного спектра и среднеквадратичную амплитуду, по отношению которых определяют тангенс интегральной фазы речевого сигнала, а по результату извлечения квадратного корня из суммы их квадратов — интегральный модуль речевого сигнала.

На фиг. 1 представлена структурная схема устройства, реализующего способ; на фиг. 2 — осциллограммы речевого сигнала.

Устройство содержит два квадратичных детектора 1 и 2, дифференциатор 3, два фильтра 4 и 5 нижней частоты, два делящих устройства 6 и 7, три блока 8 — 10 извлечения квадратного корня и суммирующее устройство 11.

Квадратичный детектор 1 соединен с фильтром 4 нижней частоты, а фильтр 4 соединен с делящим устройством 6 и блоком 9 извлечения квадратного корня. Дифференциатор 3 соединен с квадратичным детектором 2, а детектор 2 соединен с фильтром

5 нижней частоты, который связан с делящим устройством 6. Делящее устройство 6 соединено с блоком 8 извлечения квадрат847347 лученных в результате обработки его описанным способом.

На фиг. 2 в верхней части дана фонетическая транскрипция фразы А, ниже которой размещены осциллограмма Б фразы

«Мама мыла Маню», наговеренной диктороммужчиной; осциллограмма В, означающая зависимость квадрата среднеквадратичного частотного центра мгновенного спектра, осциллограмма Г, означающая зависимость момента второго порядка мгновенного спектра от времени и осциллограмма Д, означающая зависимость квадрата среднеквадратичной амплитуды речевого сигнала.

Вертикальными пунктирными линиями отмечены границы звуков (фонем), традиционно выделенных визуальным способом из осциллограммы речевого сигнала.

Таким образом, предлагаемый способ позволяет благодаря выработке четырех интегральных показателей повысить достоверя ность анализа речевого сигнала. гю

Формула изобретения ного корня и с суммирующим устройством 11 которое, в свою очередь, связано с фильт ром 4 нижней частоты и блоком 10 извлече ния квадратного корня. Блоки 8 и 9 извле чения квадратного корня соединены с деля щим устройством 7.

Устройство работает следующим образом

Речевой электрический сигнал преобра зуется квадратичным детектором 1 и фильт ром 4 низкой частоты. В результате полу чаем на выходе первого канала квадрат па раметра, называемый среднеквадратичнои амплитудой. Параллельно речевой сигнал дифференцируется блоком 3, квадратичн детектируется блоком 2 и фильтруется по нижней частоте фильтром 5. С помощью аналогового устройства 6 деления вычис ляется отношение сигнала с выхода блока 5 к сигналу, получаемому с выхода блока 4 это отношение представляют как квадрат среднеквадратичного частотного центра мгно венного спектра речи. После извлечени квадратных корней с помощью блоков 8 и 9 из квадрата среднеквадратичного частотного центра мгновенного спектра речи и среднеквадратичной амплитуды речевого сигнала вычисляется их отношение с помощью блока 7, которое называют тангенсом интегральной фазы речевого сигнала. Временная зависимость тангенса интегральной фазы речевого сигнала является показателем соотнесенности (синхронности) временных зависимостей среднеквадратичного частотного центра и среднеквадратичной амплитуды спектра речи. В сумматоре 11 проводится сложение квадратов «амплитуды» и

«частоты» речевого сигнала, а с помощью нелинейного преобразователя извлекается корень квадратный из этой суммы, в результате чего формируется временная зависимость интегрального модуля речевого сигнала. Формируемые таким образом четыре интегральных параметра: среднеквадратичная амплитуда, среднеквадратичная частота центра мгновенного спектра речи, тангенс интегральной фазы речевого сигнала и интегральный модуль речевого сигнала в совокупности позволяют адекватно описывать динамику слитной речи.

На фиг. 2 показаны осциллограммы некоторых параметров речевого сигнала, поСпособ обработки речевого сигнала, основанный на интегральном преобразовании речи, отличающийся тем, что, с целью повышения достоверности анализа речевого сигнала, речевой сигнал дифференцируют, квадратично детектируют, интегрируют и соотносят с квадратом среднеквадратичной

Э0 амплитуды сигнала, получениого аналогичным преобразованием речевого сигнала без дифференцированИя, затем это соотношение и квадрат среднеквадратичной амплитуды нелинейно преобразуют в среднеквадратичный частотный центр мгновенного спекЗ тра и среднеквадратичную амплитуду, по отношению которых определяют тангенс интегральной фазы речевого сигнала, а по результату извлечения квадратного корня из суммы их квадратов — интегральный мо40

Источники информации, принятые во внимание при экспертизе

1. Авторское свидетельство СССР № 621003, кл. G 10 1. 1/00, 1978.

2. Патент США № 4078154, 4 кл. G 10 L I/00, 1978 (прототип).

847347

A u

Риг.2

Составитель Е. Дарий

Редактор А. Долинич Техред А. Бойкас Корректор С. Шомак

3а каз 5506/77 Тираж 406 Подписное

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

113035, Москва, Ж вЂ” 35, Раушская наб., д. 4/5

Филиал ППП «Патент», г. Ужгород, ул. Проектная, 4

/ l

Ь M Ь I Л Ь М A /-1 Ц