Устройство для распознавания слоев

Иллюстрации

Показать все

Реферат

 

00 5)6094

ОПИСАНИЕ

ИЗОБРЕТЕНИЯ

Союз Советских

Социалистических

Республик

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (61) Дополнительное к авт. свид-ву (22) Заявлено 28.11.74 (21) 2079243/24 с присоединением заявки Хе (23) Приоритет

Опубликовано 30.05.76. Бюллетень J4 20

Дата опубликования описания 17.09.76 (51) М. Кл. - G 10L I/00

Государственный комитет

Совета Министров СССР по делам изобретений и открытий (53) УДК 621.391,19 (088.8) (72) Авторы изобретения (71) Заявитель

А. Н. Осокин, Н. Ф. Кучер, Г. И. Малевич и В. Ф, Степанов

Научно-исследовательский институт автоматики и электромеханики при Томском институте автоматизированных систем управления и радиоэлектроники (54) УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ СЛОВ

Изобретение относится к области автоматики и вычислительной техники и может быть использовано для ввода голосовых команд в исполняющие автоматы, вычислительные машины и для непосредственной печати устного текста.

Известны устройства для распознавания слов, содержащие микрофон, соединенный с выделителем клиппированной огибающей речевого сигнала, ларингофон, соединенный с выделителем клиппированной огибающей основного тона, и блок принятия решений, входы которого подключены соответственно к выходам блока кодирования признаков и выделителя огибающей слова.

Зти устройства используют узкий набор признаков и не учитывают последовательности признаков во времени, что приводит к потере информации о фонетической структуре слова. Вследствие этого устройства распознают либо небольшой набор слов с высокой достоверностью, либо достаточно большой набор слов с низкой достоверностью.

Цель изобретения — увеличение числа распознаваемых слов и повышение достоверности распознавания.

Зто достигается тем, что предлагаемо- устройство содержит селекторы звонких и глухих звуков, селекторы звонких и глухих смычек, выходы которых соединены с входами блока кодирования признаков, и блок коррекции огибающих, входы которого подключены к выходам выделителей клиппированных огибающих речевого сигнала и основного тона, а выходы — к входам упомянутых селекторов и выделителя огибающей слова.

На чертеже приведена блок-схема устройства.

Микрофон 1 через выделитель 2 клиппиро10 ванной огибающей речевого сигнала подключен к блоку 3 коррекции огибающих. Ларингофон 4 подключен через выделитель 5 клиппированной огибающей основного тона к второму входу блока 3 коррекции огибающих.

15 Выходы блока 3 коррекции огибающих соответственно соединены с входами селектора 6 звонких звуков, селектора 7 глухих звуков, селектора 8 звонких смычек, селектора 9 глухих смычек и выделителя 10 огибающей слова.

20 Выходы селекторов 6 — 9 соединены с входами блока 11 кодирования признаков, выходы которого, а также выход выделителя 10 огибающей слова соединены с входами блока 12 принятия решения.

25 Устройство работает следующим образом.

При произнесении слова речевой сигнал, воспринимаемый микрофоном 1, поступает на выделитель 2 клиппированной огибающей речевого сигнала, который выделяет клиппиро30 ванную (предельно-усилительную) огибаю516094 (Х,(/). Y„. (/);

> Х, (t) Y,. (t);

7 : - () 1 к ()»

s Х,. (t) Y„ (t).

Зо

00 щую речевого сигнала — g(t). Она равна нулю перед прон-rrãcåíèåì фонем п, т, к, ч, ц (глухая смычка) и фонем б, д, г (звонкая смычка). Ларингофон 4 воспринимает сигналы основного тона (колебания голосовых связок, возникающие при произнесении звонких звуков, из которых выдслитель 5 клиппированной (предельно усиленной) огибающей основного тона выделяет клиппированную огибающую основного тона — x(l). Данная огибающая равна нулю при произнесении слова на участке глухих согласных, взрывных и фрикативных фонем: с, ш, ф, х, т, к, ч, ц, При произнесении всех звонких фонем колеблются голосовые связки и клиппирования огибающая основного тона имеет фиксированное значение амплитуды.

Однако наряду со смычками перед указанными фонемами, в клиппированных огибающих наблюдаются следующие помехи: в звукосочетаниях дв, ая, вн и др. появляются ложные смычки (огибающая равна нулю) по длительности меньшие самых коротких смычек перед б, д. г, п, т, к, ч, ц; в словах, оканчивающихся на ль, мь, н, возможен короткий импульс в конце огибающей; возможен короткий импульс (огибающая равна логической

«1») в начале слова от движения речеооразующих органов; в смычках перед к, т, и иногда появляется короткий импульс; для ряда дикторов в звуке и клиппирования огибающая речевого сигнала начинается одновременно с клиппированной огибающей основного тона, хотя последняя должна начинаться позже; инерционность гортани. У некоторых дикторов смычка в клиппировонной огибающей основного тона начинается после окончания смычки в клиппированной огибающей речевого сигнала.

Для устранения этих помех сигналы с выделителей клиппированных огибающих поступают в блок 3 коррекции огибающих, который формирует корректированные клиппированные огибающие речевого сигнала У„(/) и основного тона X«(t

Корректированные клиппированные огибающие поступают далее на селекторы 6 — 9 и выделитель 10 огибающей слова. Выделитель огибающей слова формирует огибающую слова, которая равна постоянному значению во время произнесения слова, а ее начало совпадает с появлением либо корректированной клиппированной огибающей речевого сигнала, либо корректированной клиппированной огибающей основного тона в зависимости от того, какая из них появляется первой.

Селекторы звонких звуков q, глухих звуков х, звонких смычек у, глухих смычек о формируют по клиппированным огибающим сигналы, свидетельствующие о наличии в произносимом слове указанных признаков по условиям

Блок 11 кодирования признаков фиксирует временную последовательность признаков, в которой слово может быть представлено либо кодом слова, либо матрицей слова.

Решение о произнесенном слове принимается с помощью блока 12 принятия решения.

После произнесения слова (кончается огибающая слова) полученная последовательность признаков сравнивается одновременно со всеми эталонами слов. Если последовательность признаков слова и эталон совпадают, то блок принятия решения выдает сигнал, который свидетельствует о произнесении определенного слова из набора. Решение о произнесенном слове принимается после окончания произношения потому, что последовательность признаков для некоторых слов может в какой-то части совпадать.

Использование двух датчиков позволяет достичь высокую достверность распознавания, а применение блока коррекции огибающих — снизить требования к четкости произношения и уровню громкости, повысить помехоустойчивость устройства. В устройстве выделяются признаки, инвариантные к диктору, темпу произношения, набору распознаваемых слов, что позволяет быстро производить замену набора распознаваемых слов, Применение указанных признаков и блоков для их выделения позволяет получить небольшой набор эталонов, что дает возможность принимать решение о произнесенном слове по простому правилу и не требует больших аппаратурных затрат.

Формула изобретения

Устройство для распознавания слов, содержащее микрофон, соединенный с выделителем клиппированной огибающей речевого сигнала, ларингофон, соединенный с выделителем клиппированной огибающей основного тона, и блок принятия решений, входы которого подключены соответственно к выходам блока кодирования признаков и выделителя огибающей слова, отличающееся тем, что, с целью увеличения числа распознаваемых слов и повышения достоверности распознавания, оно содержит селекторы звонких и глухих звуков, селекторы звонких и глухих смычек, выходы которых соединены с входами блока кодирования признаков, и блок коррекции огибающих, входы которого подключены к выходам выделителей клиппированных огибающих речевого сигнала и основного тона, а выходы — к входам упомянутых селекторов и выделителя огибающей слова.

Редактор T. Рыбалова

Составитель И. Сидорова

Техред T. Курилко

Корректор Л. Котова

Заказ 1836i7 Изд. М 1559 Тираж 495 Подписное

ЦНИИПИ Государственного комитета Совета Министров СССР по делам изобретений и открытий

1!3035, Москва, Ж-35, Раушская наб., д. 4/5

Типография, пр. Сапунова, 2