Устройство для распознавания речевых сигналов

Иллюстрации

Показать все

Реферат

 

Изобретение относится к технике обработки речевых сигналов оптическими методами и может быть использовано при распознавании сигналов для сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке. Цель изобретения - повышение достоверности распознавания исследуемых сигналов. Введение в устройство второго источника 9 оптического излучения , второго коллиматора 10, оптического преобразователя 11 Фурье, оптической диафрагмы 12, приемника 13 оптического излучения позволяет обнаруживать моменты закрытия голосовых связок и соответствующие промежутки свободных колебаний, что необходимо для формирования синхронных С периодами свободных колебаний сонограмм речи. Введение в устройство второго оптического модулятора 4, генератора 14 временного окна позволяет организовать вычленение фрагментов речевого сигнала, соответствующих периодам свободных колебаний речевого тракта, для формирования сонограммы, синхронной периодам свободных колебаний в речевом тракте. Введение блока 15 сжатия сигналов во временной области позволяет организовать сжатие сигнала во временной области и его балансную модуляцию гармоническим сигналом с частотой, равной центральной частоте акустооптического модулятора света, который используется в качестве первого оптического модулятора 3. Массивы данных , накопленные в блоке 8 управления и обработки, обрабатываются в соответствии с алгоритмом динамического программирования в блоке 8. 1 ил. (Л С о i° ел CJ 41 ON к / $,

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР!

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4721748/24 (22) 19.07.89 (46) 30.11.91. Бюл. М 44 (71) Ленинградский электротехнический институт связи им. проф. M,А.Бонч-Бруевича (72) В.М.Агеев, З.И.Крупицкий, В.Е.Пеле-, вин, Т.H.Ñåðãååíêî и Л.С,Чудновский (53) 681.325(088.8) (56) Авторское свидетельство СССР

М 803705, кл. G 06 G 9/00, 1979.

Авторское свидетельство СССР

М 278229, кл. G 06 F 15/46, 1969. (54) УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ

РЕЧЕВЫХ СИГНАЛОВ (57) Изобретение относится к технике обработки речевых сигналов оптическими методами и может быть использовано при распознавании сигналов для сокращения . избыточности речевого потока при его вводе. в вычислительную систему, работающую в режиме обмена с оператором на естественном языке. Цель изобретения — повышение достоверности распознавания исследуемых сигналов. Введение в устройство второго источника 9 оптического излучения, второго коллиматора 10, оптического

„„5U 1695376 А1

{я)з G 10 L 7/08, 9/08, G 06 Е 3/00 преобразователя 11 Фурье, оптической диафрагмы 12, приемника 13 оптического излучения позволяет обнаруживать моменты закрытия голосовых связок и соответствующие промежутки свободных колебаний, что необходимо для формирования синхронных с периодами свободных колебаний сонограмм речи. Введение в устройство второго оптического модулятора 4, генератора 14 временного окна позволяет организовать вычленение фрагментов речевого сигнала, соответствующих периодам свободных колебаний речевого тракта, для формирования сонограммы, синхронной периодам свободных колебаний в речевом тракте.

Введение блока 15 сжатия сигналов во временной области позволяет организовать сжатие сигнала во временной области и его балансную модуляцию гармоническим сигналом с частотой, равной центральной частоте акустооптического модулятора света, который используется в качестве первого оптического модулятора 3, Массивы данных, накопленные в блоке 8 управления и обработки, обрабатываются в соответствии с алгоритмом динамического программирования в блоке 8, 1 ил.

1695376

Изобретение относится к обработке речевых сигналов оптическими методами и может быть использовано длл решения задач распознавания сигналов с целью сокращенил избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке.

Изобретение позволяет осуществлять формирование разновидности сонограмм речи — сонограммы, синхронизированной с периодами свободных колебаний речевого тракта, параллельное вычисление большого числа корреляционных интегралов сонограммы и эталонов, что обеспечивает возможность векторного кодирования речевого сигнала для его дальнейшей обработки в вычислительной системе с использованием итеративных процедур последователького приближения к решению при различных вариантах нелинейной трансформации соног-рамм, а также извлечения из непрерывного речевого сигнала такого параметра речи, как моменты смыкания голосовых связок.

Цель изобретения — повышение достоверности. распознавания исследуемых сигналов, На чертеже приведена структурная схема устройства.

Устройство содержит первый источкик

1 оптического изпученил, первый коллиматор 2, первый 3 и второй 4 оптические модуляторы, анаморфоткую оптическую систему

5, коррелятор 6, блок 7 сопряжения, блок 8 управления и обработки, выполненный, например, в виде ЭВМ, второй источник 9 оптического излучения, второй каллиматор 10, оптический преобразователь 11 Фурье, оптическую диафрагму 12, приемник 13 оптического излучения, гекератор 14 временного окна и блок 15 сжатия сигналов во временной области.

В качестве блоков 8 и 7 могут быть использованы 3ВМ СМ 1420 в стандартной конфигурации и крейт КАМАК.

Устройство работает следующим образом, Исследуемый речевой сигнал поступает на информационный вход блока 15, в котором осуществляется его сжатие во временной области и балансная модуляция гармоническим сигналом с частотой, определяемой центральной часготой полосы рабочих частот акустического модулятора света, используемого в качестве первого оптического модулятора 3, С выхода блока

15 преобразованный сигнал поступает на управляющий вход первого оптического модулятора 3, возбуждал в волноваде модулятора ультразвуковую акустическую волну, 20

55 модулированную в соответствии с законам изменения исследуемого речевого сигнала.

Световой пучок от источника 9 через коллиматор 10 поступает на соответствующий оптический информационный вход первого оптического модулятора 3, на выходе которого формируется световой пучок, пространственно промодулированный в соответствии с законом изменения исследуемого сигнала. Указанный световой пучок, проходя через преабразователь 11, формирует в частотной плоскости оптической системы преобразователя 11

Фурье световое распределение, интенсивность света в котором пропорциональна мгновенному спектру исследуемого сигнала. Оптическая диафрагма 12 осуществляет выделение из мгновенного спектра исследуемого речевого сигнала полосы частот, соответствующие полосе частот третьей форманты, и обеспечивает регистрацию приемником 13 спектральных составляющих, соответствующих третьей форманте мгновенного спектра исследуемого речевого сигнала. По результатам измерения третьей форманты исследуемого речевого сигнала приемник 13 вырабатывает сигналы, соответствующие амплитудным всплескам формантного колебания, и сигналы, указывающие на промежутки неизменности частот форманты, связанные с моментами смыкания связок. Эти сигналы через блок 7 сопряжения под управлением блока 8 передаются на генератор 14 временного окна, который вырабатывает гармонический сигнал частоты, определяемой центральной частотой полосы рабочих "IBcTGT второго оптического модулятора 4, выполненного как акустооптический модулятор света. При этом длительность указанного гармонического сигнала определяется степенью сжатия исследуемого речевого сигнала и длительностью свободных колебаний обрабатываемого фрагмента исследуемого сигнала, Указанный гармонический сигнал подается на управляющий вход второго оптического модулятора 4, Последний установлен на первой оптической оси, проходящей через первый оптический модулятор 3, причем установлен так, что анализируемый в первом оптическом канале на второй оптической оси отрезок исследуемого сигнала оказывается во втором оптическом канале на первой оптической оси, При этом исследуемый речевой сигнал во вгорам оптическом канале оказывается через определенное время, т.е. является задержанным на время обработки его электронными схе1695376

20

14 выделяются промежутки свободных ко- 30 лебаний голосового тракта и, таким обрапервым источником 1, В итоге на входе кор- 50 релятора 6 последовательно во времени формируются двумерные световые распределения, соответствующие сонограммам исследуемого речевого сигнала, синхронимами приемника 13, блоков 7 и 8 и генератора 14.

Вследствие вводимой временной задержки поступления сигнала во второй оптический канал обработки по сравнению с первым оптическим каналом {указанная временная задержка может быть обеспечена продольным смещением вдоль направления распространения ультразвуковой акустической волны в волноводе первого акустического модулятора 3 света электроакустического преобразователя второго акустического модулятора 4 света так, чтобы время распространения волны от электроакустического преобразователя первого модулятора 3 до плоскости, в которой расположен электроакустической преобразователь второго оптического модулятора 4, составляло длительность требуемой временной задержки) обеспечивается возможность управляемого выделения фрагментов исследуемого речевого сигнала из непрерывного речевого сигнала, Если в качестве управляющих сигналов используются сигналы моментов смыкания голосовых связок, получаемые в первом оптическом канале устройства, то из непрерывности речевого сигнала во втором оптическом канале устройства генератором зом, управляемый от блока 8 световой пучок от первого источника 1, проходя через первый коллиматор 2, первый оптический моду. лятор 3 и второй оптический модулятор 4, оказывается промодулированным отрезком исследуемого речевого сигнала, соответствующим промежутку свободных колебаний голосового тракта. Анаморфотная оптическая система 5 осуществляет преобразование Фурье указанного отрезка исследуемого речевого сигнала вдоль одной пространственной координаты в частотной плоскости и смещение светового распределения, соответствующего мгновенному спектру выбранного отрезка речевого сигнала по второй координате. Величина смещения определяется и управляется блоком

8, связанным через блок 7 сопряжения с зированным с периодами свободных колебаний голосового тракта, Формируемое таким образом изображение сонограммы, поступающее на вход коррелятора 6, домножается в корреляторе на различные эталонные функции — маски и

45 интегрируется. В итоге на выходе корреля-, тора 6 формируются корреляционные интегралы от сонограммы исследуемого речевого сигнала, синхронизированной по промежуткам свободных колебаний голосовых связок, и эталонов, которые далее поступают через блок 7 в блок G.В последнем осуществляется принятие решений по результатам вычисления корреляционных интегралов. .На первом шаге обработки исследуемого сигнала блок 8 осуществляет установку устройства в исходное состояние путем выдачи сигнала "Сброс".

Затем блок 8 разрешает прием исследуемого сигнала в блок 15. По завершении приема сигнала блок 15 формирует признак готовности, который программно опрашивается блоком 8.

После этого блок 8 выдает сигнал "Ввод сигнала в оптическую систему", который представляет собой кодовую комбинацию. передаваемую в блок 15. Затем осуществляется прием сигналов моментов смыкания и размыкания связок, которые поступают в блок 7, при этом на выходе генератора 14 формируется сигнал-отрезок синусоидальных колебаний с частотой, совпадающей с центральной частотой полосы рабочих частот второго акустооптического модулятора 4 света и длительностью во времени, совпадающей с длительностью периода свободных колебаний. Временная задержка, вызванная отработкой сигналов схемами соответствующих блоков, компенсируется, как указано выше, .смещением второго акусто-. оптического модулятора 4 света относительно первого акустооптического модулятора 3 света на величину, время распространения для которой соответствует времени задержки обработки сигнала.

Затем после получения сигнала о периоде свободных колебаний осуществляется формирование сигналов управления первым источником 1. Коммутация источника 1 обеспечивает проецирование формируемого в оптической системе второго оптического канала частотного среза, синхронизированного с периодами свободных колебаний речевого сигнала на определенныйй частотный срез маски-эталона, Твм самым осуществляется развертка частотного среза на маски-эталоны в многоканальном оптическом корреляторе 6. После каждого переключения первого источника 1 осуществляется считывание корреляционых интегралов под управлением блока 8 и ввод результатов в память блока 8.

По окончании обработки исследуемого сигнала, что определяется программно, блок 8 переходит к обработке массива на1695376

Составитель А. Ушаков

Редактор М. Петрова Техред М.Моргентал Корректор С. Шевкун

Заказ 4166 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва,. Ж-35, Раушская наб., 4/5

Производственно-издательский комбинат "Патент", r, Ужгород, ул.Гагарина, 101 копленных значений в соответствии с алго, ритмом динамического программирования.

Для реализации алгоритма используются вычислительные ресурсы и программное обеспечение 3BM (CM 1420) в стандартной 5 конфигурации.

Основное функциональное уравнение динамического программирования: mes(F> Q:P(k+ 1) Лt (вез(Е(ш, m Л t), Ф(а,(+ 1) Л t)- 10

Ф(в(й+ 1) h,t)} g ??0,m>I, 15 где Л t -- шаг дискретизации;

g — функция деформации временной оси в представлении сонограммы, синхронизи рованной с периодами свободных колебаний;

Р1 — оператор ограничения области за,,дания спектрограммы исследуемого сигна ла и эталона в функционале меры mes.

Оператор Р ограничивает область задания спектрограммы, до множества (O,0+0, . а вне этого множества значения спектрограммы приравниваются нулю.

Формула изобретения

Устройство для распознавания речевых сигналов, содержащее последовательно расположенные на первой оптической оси первый источник оптического. излучения, первый коллиматор, первый оптический модулятор и коррелятор, выходы которого соединены с соответствующими входами обмена блока сопряжения, входы-выходы обмена которого соединены с одноименными входами-выходами блока управления и обработки, о т л и ч а ю щ е е с я тем, что, с целью повышения достоверности распознавания исследуемых сигналов, в него введены блок сжатия сигналов во временной области, информационный и управляющий входы которого соединены с информационным входом устройства и соответствующим выходом обмена блока сопряжения соответственно, а выход — с управляющим входом первого оптического модулятора, последовательно расположенные на первой оптической оси и оптически связанные второй . оптический модулятор и анаморфотная оптическая система, информационный вход второго оптического модулятора оптически связан с выходом первого оптического модулятора, выход анаморфотной оптической системы оптически связан с информационным входом коррелятора, генератор временного окна, управляющий вход и выход которого соединены с соответствующим выходом обмена блоки сопряжения и управляющим входом второго оптического модулятора, последовательно расположенньге на второй оптической оси второй источник оптического излучения, второй коллиматор, первый оптический модулятор, оптический преобразователь. Фурье, оптическая диафрагма и приемник оптического излучения, выход которого соединен с соответствующим входом обмена блока сопряжения, соответствующий выход обмена которого соединен с управляющим входом первого источника оптического излучения.