Способ распознавания речевых команд и устройство для его осуществления

Иллюстрации

Показать все

Реферат

 

Оп ИСА НИ Е

ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

1i11650 093

Союз Советских

Социалистических

Республик (61) Дополнительное к авт. свид-ву (22) Заявлено 01.07.76 (21) 2378712/18-10 с присоединением заявки № (23) Приоритет (43) Опубликовано 28.02.79. Бюллетень ¹ 8 (45) Дата опубликования описания 28.02.79 (51) М. Кл з

G 10L 1/12

Государственный комитет (53) УДК 681.332.3 (088.8) по делам изобретений и открытий (72) Авторы изобретения

Б. В. Болотов, К. П. Майстренко и А. M. Жиляев (71) Заявитель

Украинский научно-исследовательский институт целлюлозно-бумажной промышленности (54) СПОСОБ РАСПОЗНАВАНИЯ РЕЧЕВЪ|Х КОМАНД

И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ

Изобретение относится к области акустики, в частности к способам распознавания речевых команд.

В зависимости от индивидуальных особенностей дикторов, их эмоционального состояния произносимые ими звуки речи отличаются большим разнообразием по тональности, длительности и темпу ик произношения. Для успешного решения задачи распознавания речевых образов прибегаю-, к способам нормализации этих параметtpoa.

Известны способы и устройства распознавания речевых команд, включающие нормализацию речевык образов по длительности (1).

Недостатком их является зависимость достоверности распознавания от индивидуальных особенностей дикторов.

Известны также способы распознавания речевых команд путем записи групп речевых образов, разделении ик на фонемы нормализации каждой фонемы по длительности и воспроизведении нормализованнык фонем )(2).

Устройство для осуществления этик способов содержат блок записи, регулятор скорости считывания, блок считывания.

Недостатком их является то, что они не позволяют увеличить скорость воспроизвсдения сигналов речи, нормализованных по длительности, а сам способ непригоден для создания устройств, применимых в системах распознавания речевых образов в рс5 альном масштабе времени.

Цель изобретения — повышение скорости и достоверности распознавания речевык команд.

Эта цель достигается тем, что сигналы

10 групп речевык образов преобразуют во временные функции, разделяют каждую функцию на отрезки, длина каждого из которых меньше илп равна длительности элементарного речевого образа, записывают и

15 запоминают каждую временную функцию последовательно по отрезкам и контролируют точность запоминания по координатам конца каждого отрезка, воспроизводят временную функцию каждый раз с на20 чала и до того места, до которого осуществлена запись на данный момент времени, при этом во время запоминания функцию воспроизводят по частям, содержащим 1+и заппсаннык отрезков, а в пау25 зе между функциями — полностью.

Для осуществления этого способа в устройство, содержащее блок записи, регулятор скорости считывания с аналоговыми элементами памяти и блок считывания, 30 включено устройство преобразования сиг650093 г нйла речи во временные функции, сравнивающее устройство и нуль-орган, причем выход устройства преобразования сигнала речи во временные функции подключен к входу блока записи и к одному входу сравнивающего устройства, на второй вход которого,подключен выход блока считывания. Выход сравнивающего устройства через нуль-орган подключен на второй вход блока записи, а все выходы блока записи соединены с входами блока считывания посредством регулятора скорости считывания.

На фиг. 1 изображена блок-схема устройства распознавания речевых команд; на фиг. 2 — электрическая схема устройства.

Выход устройства 1 преобразования сигналов речи во временные функции подключен к одному входу устройства 2 сравнения и к одному входу блока 3 записи. На другой вход устройства сравнения подключен выход блока 4 считывания, выход устройства сравнения подключен на второй вход блока записи посредством нуль-органа 5. Другие выходы блока записи посредством регулятора 6 скорости считывания . соединены с остальными входами блока 4 считывания.

При этом число функционально связанных входов блока считывания выходов блока записи, входов, а также выходов регулятора скорости считывания одинаково.

Регулятор скорости считывания, производит также запоминание записанных функций и состоит из матрицы однотактных аналоговых запоминающих устройств. Входы цепей запоминания и выходы цепей считывания скоммутированы на соответствующих регистрах, которые обеспечивают поочередное подключение каждой ячейки регулятора 6 на запоминание и считывание очередной координаты временной функции.

Общее число сердечников 7 записи ячеек

8 выбрано равным 100. Точность записи и считывания временных функций устройства составляет около 1 /О как по уровню, так и по длительности.

Блок 3 записи состоит из генератора 9 продвижения на транзисторах и шагового регистра 10 на триггерах, общее число триггеров выбрано равным 100. Выход каждого триггера подключен к средней точке трансформатора 11 записи, включенного между коллекторами транзисторов 12 и 13 записи, базы которых подсоединены к вторичной обмотке выходного трансформатора

14 нуль-органа 5. К средней точке этой обмотки трансформатора 14 подключены эмиттеры двух транзисторов 12 и 13 записи. Вторичная обмотка трансформатора записи нагружена обмоткой сердечника 7 записи, число трансформаторов ll записи, транзисторов 12 и 14 выбрано также равным 100, 5

З0

4

Блок 4 считывания содержит генератор 15 считывания, к выходу которого последовательно подключено десять линий 16 задержки, каждая имеет задержку 0,5 мкс на

10 отводов. Параметры выходных импульсов генератора 15 Т„=0,05 мкс; (=200 кГц.

К каждому выходу линий задержек подключен двухкаскадный усилитель считывания на транзисторах 17 и 18. В коллекторе транзистора 18 включена обмотка кольцеобразного сердечника ячейки 8, число таких сердечников также равно 100. Эти оомотки через диоды 19 соединены с резистором 20 нагрузки. Через кольцеобразные сердечники продета сквозная обмотка (один виток), подключенная к выходу генератора 15 считывания.

Нуль-орган 5 содержит усилитель 21 постоянного тока и фазовый детектор 22.

Устройство 2 сравнения собрано на транзисторах типа р — n — р, число которых равно 100. Эмиттер каждого транзистора устройства 2 подключен к первичной обмотке трансформатора фазового детектора 22 нуль-органа 5, коллектор — к средней точке трансформатора 11 записи, база — к делителю на сопротивлениях, подключенному к коллектору транзистора 18 считывания.

Устройство работает следующим образом.

Группы речевых образов поступают в устройство 1, где они интегрируются и преобр азуются во временную функцию. Сигнал временной функции запускает регистр блока 3 и начинается запись первого значения временной функции на первой ячейке. Точность записи контролируется с помощью нуль-органа 5. Как только запоминание первой ячейкой осуществлено, регистр записи подключает вторую и так далее до тех пор, пока на входе временная функция не прекратит свое существование.

Время для запоминания одной координаты на ячейку регулятора 6 отводится равным 1 мкс. Следовательно общее время записи предложенного устройства составляет 100 мс, что вполне достаточно для записи всех разновидностей функций речевых образов.

Предложенное устройство выдает независимо от продолжительности записанной функции ту же функцию, но с фиксированной продолжительностью.

Это осуществляется следующим образом.

При включении, питания непрерывно генерируют как генератор 15 считывания, так и генератор 9 продвижения. Импульсы генератора 15 поступают на вход каждой из

10 линий 16 задержки. Поскольку общее время задержки составляет 5 мкс, а частота генератора 15 — 200 кГц, то во всей гребенке линий 16 задержек циркулирует всегда только один импульс. Этот импульс последовательно пробегает все считыва650093 ющие сердечники и производит их опрос по обмоткам считывания.

С этих же обмоток ЭДС самоиндукции с помощью диода 19 собираются на общий резистор 20 нагрузки. С помощью основной обмотки считывающие сердечники ячейки

8 подготавливаются для очередного опроса.

Этот подготавливающий импульс поступает непосредственно от генератора 15. Им,пульс, прошедший всю линию 16 задержки, используется для синхронизации частоты генератора 15, что обеспечивает его высокую стабильность.

Таким образом, в зависимости от состояния сердечников считывания на сопротивлении 20 формируется соответствующая временная функция.

Процесс запоминания новой временной функции начинается с момента подачи на вход генератора 9 продвижения импульса старта шагового регистра 10, выполненного на триггерах. Этот импульс открывает левый транзистор первого триггера шагового регистра 10, закрыв правый, и тем самым обеспечивает подачу напряжения на транзисторы 12 и 13 первой ячейки записи блока 3. Если входное напряжение (точка

Б) оказывается неравным напряжению считывания, то усиленный импульс поступаст на схему 23 совпадения, с помощью которой на сопротивлении 24 возникают импульсы только в момент работы первого триггера шагового регистра 10 и только первого опрашиваемого канала. Импульс с сопротивления 24 поступает в качестве источника, питания фазового детектора 22 нуль-органа 5. На выход нульоргана 5 подаются нарастающие по амплитуде импульсы асимметричной формы, которые после усиления намагничивают запоминающий сердечник до тех пор, пока считывающее напряжение на первой ячейке 8 не сравняется с входным. Максимальное время запоминания определяется числом импульсов, подведенных к обмотке сердечника 7 записи. Оптимальный перевод одного сердечника записи из одного крайнего состояния в другое обеспечивается з а 10 и м пул ь сов.

Следовательно, весь процесс запоминания на одной ячейке оканчивается за 5 мкс, а весь цикл запоминания — за 500 мкс. С этого момента запись функции прекращается, а воспроизведение функции в точке

В по-прежнему идет с частотой 200 кГц, причем воспроизведение временной функции осуществляется и в процессе ее запоминания с начала и до того момента, когда осуществлено это запоминание.

Формула изобретения

1. Способ распознавания речевых команд путем записи групп речевых образов, разделении их на фонемы, нормализации каждой фонемы по длительности и воспроизведения нормализованных фонем, о т л и ч аю шийся тем, что, с целью повышения скорости и достоверности распознавания, cèãHà Iы групп речевых образов преобразуют во врсменные функции, разделяют каждую функцию на отрезки, длина каждого из которых меньше или равна длительностиэлементарного речевого образа, записывают и запоминают каждую временную функцию последовательно по отрезкам и контролируют точность запоминания по координатам конца каждого отрезка, воспроизводят временную функцию каждый раз с начала и до того места, до которого осуществлена запись на данный момент времени, при этом во время запоминания функцию воспроизводят по частям, содержащим 1+и записанных отрезков, а в паузе между функциямии — полностью.

2. Устройство для осуществления способа по п. 1, содержащее блок записи, регулятор скорости считывания с аналоговыми элементами памяти и блок считывания, о тличающееся тем, что в него включено устройство преобразования сигнала речи во временные функции, сравнивающее устройство и нуль-орган, причем выход устройства преобразования сигнала речи во временные функции подключен к входу блока записи и к одному входу сравнивающего устройства, на второй вход которого подключен выход блока считывания, выход сравнивающего устройства через нульорган подключен на второй вход блока записи, а все выходы блока записи соединены с входами блока считывания посредством регулятора скорости считывания.

Источники информации, принятые во внимание при экспертизе

1. Авторское свидетельство СССР № 488247, кл. G 101 1/04, 1975.

2. Патент США ¹ 3681530, кл. 179 вЂ

S А, опублик. 1972.