Способ распознавания речевых образов

Иллюстрации

Показать все

Реферат

 

Изобретение относится к акустике, в частности к способам распознавания речевых сигналов. Цель изобретения - уменьшение погрешности распознавания речевых об разов. Речевой акустический образ преобразуют в механическое колебание мембраны которая модулирует по пространственной фа зе оптическое когерентное излучение, срав нивают исходную пространственную фазу с модулированной и полученную фазовую разность преобразуют в интерференционную картину, интенсивность которой преобразуют в электрический сигнал а затем в импульсы тонкой структуры и импульсы периода основного тока которые являются признаками акустического ре чевого образа и которые сравнивают с эталонами 3 ил

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (51)5 G 10 1 7 /04

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ОПИСАНИЕ ИЗОБРЕТЕНИЯ Ч (Л

СО

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4859284/24 (22) 08,06.90 (46) 30.07.92. Бюл, N 28 (72) А.Т.Серэбабин и В.B.Êoðíèåíêo (56) Авторское свидетельство СССР № 432581, кл, G 10 L 9/02, 1971.

Авторское свидетельство СССР

¹ 298943, кл, G 101 7/00, 1969.

Авторское свидетельство СССР

N 621003, кл. G 10 l 7/04, 1976, (54) СПОСОБ РАСПОЗНАВАНИЯ РЕЧЕВЫХ

ОБРАЗОВ (57) Изобретение относится к акустике, в частности к способам распознавания речевых сигналов. Цель изобретения — уменьшеИзобретение относится к акустике, в частности к способам распознавания речевых сигналов.

Известны способы, по которым выделение признаков речевых сигналов осуществляется при помощи использования кодирования артикуляционных движений, Однако нормировка по частоте приводит к снижению точности выделения признаков речевых сигналов.

Известен также способ распознавания, включающий преобразование речевых образов в электрический сигнал, усиление. выделение фонем, спектральный анализ, квантование, выделение признаков фонем, сравнение их с эталонами, Недостатком этого способа является низкая точность распознавания, Наиболее близким к предлагаемому является способ распознавания речевых образов, в котором электрический сигнал стандартизируют по прод6лжительности, „„50ÄÄ 1751810 А1

2 ние погрешности распознавания речевых образов, Речевой акустический образ преобразуют в механическое колебание мембраны, которая модулирует по пространственной фазе оптическое когерентное излучение, срав- нивают исходную пространственную фазу с модулированной и полученную фаэовую разность преобразуют в интерференционную картину, интенсивность которой преобразуют в электрический сигнал, а затем в импульсы тонкой структуры и импульсы периода основного тока, которые являются признаками акустического речевого образа и которые сравнивают с эталонами, 3 ил, нормализуют по частоте и амплитуде, à по полученным сигналам формируют короткие импульсы, которые интегрируют и нормализуют, а полученную функцию сравнивают с эталонной функцией, Недостатком данного способа является большая погрешность распознавания речевого образа, так как присутствуют такие преобразования, как стандартизация, квантование и нормализация, в которых "заложена" определенная ошибка.

Цель изобретения — уменьшение погрешности распознавания речевого образа.

Поставленная цель достигается тем, что речевой акустический образ преобразовывают в механическое колебание мембраны, которая модулирует по пространственной фазе оптическое когерентное излучение. сравнивают исходную пространственную фазу с модулированной и полученную фазовую разность преобразовывают в интерферейционную картину, интенсивность

175181 0 которой преобразовывают в электрический сигнал„а затем в импульсы тонкой структуры и импульсы периода основного тона, которые являются признаками акустического речевого образа и которые сравнивают с эта лонами.

Кроме преобразования акустического речевого образа в электрический сигнал и сравнения полученных признаков с эталонами, в предлагаемом способе отсутствуют такие преобразования как стандартизация, квантование и нормализация. В предлагаемом способе признаками речевого образа являются импульсы периода основного тона и импульсы тонкой структуры, получаемые с помощью нелинейных элементов, В качестве нелинейных элементов используются голограммы, На фиг,1 показаны статистические характеристики голограмм {! — амплитудное пропускание; p — пространственная фаза); на фиг,2- временные диаграммы преобразований; на фиг.3 — функциональная, схема устройства, реализующего предлагаемый способ распознавания речевых образов.

Устройство содержит источник 1 когерентного излучения, светоделитель 2, схему

3 выделения импульсов основного тона, схему 4 выделения импульсов тонкой структуры сигнала, блок 5 сравнения, блок 6 эталЬнов, Схемы выделения импульсов основного тона 3 и импульсов тонкой структуры сигнала 4 содержат коллимирующую линзу 7, полупрозрачное зеркало 8, голограммы 9 и 10, . мембраны 11, фотоэлементы 12, усилители

13, триггеры 14 Шмитта, фильтр 15, усилитель 16, Устройство работает следующим образом, Когерентное излучение 1 через Светоделитель 2 коллимируется линзами 7 и посту. пает через полупрозрачное зеркало 8 и голограммы 9 и 10 на мембраны 11, которые модулируют исходную фазу по закону изменения звукового сигнала, Отраженное от мембран излучение с модулированной фазой поступает на голограммы 9 и 10, где сравнивается с исходной фазой, и полученПолученный электрический сигнал U l u

Uz усиливается усилителем 13, преабразовывается в импульсы триггерами 14 Шмитта, фильтруется фильтрами 15, усиливается усилителями 16 и поступает на первые входы блока 5 сравнения в виде импульсов ос10 новного 1она 0З и импульсов тонкой структуры сигнала. Up, которые представляют собой структуру звукового образа. На вторые входы блока 5 сравнения поступают импульсы эталонной структуры сигнала блока 6 эталонов, Результат сравнения формируется нэ выходе блока 5 сравнения, Предлагаемый способ позволяет существенно повысить точность распознавания, так как отсутствуют такие преобразования, 20 как квантование и нормализация, в которые

"заложена" определенная ошибка. Использование нелинейного элемента позволяет увеличить точность распознавания, так как при нелинейном преобразовании вклад спектральных составляющих с малой амплитудой в выходном сигнале уменьшается.

Наблюдается эффект фильтрации по динамическому диапазону для каждой составляющей, а не rio суммарному сигналу, Данный способ может быть использован для борьбы с помехами в системах связи, 25

Формула изобретения

Способ распознавания речевых образов, основанный на преобразовании речевого образа в электрический сигнал и сравнении его с эталоном, о т л и ч à lo шийся тем, что, с целью уменьшения погрешности распознавания, речевой акустический образ преобразуют в механическое колебание мембраны, которая модулирует по пространственной фазе оптическое когерентное излучение, сравнивают исходную пространственную. фазу с модулированной и полученную фазовую разность преобразуют в интерференционную картину, интенсивность которой преобразуют в электрический сигнал, а затем в импульсы тонкой структуры и импульсы периода основного тона, которые сравнивают с этало40

50 ная разность преобразуется в интерферен ционную картину с интенсивностью на фотоэлементах 12, 1751810

1751870

Ю

° (!

Составитель А.Серабабин

Техред М.Моргентал Корректор Н,Ревская

Редактор Е.Копча

Производственно-издательский комбинат "Патент", г. Ужгород, ул.Гагарина, 101

Заказ 2695 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., 4/5