Устройство распознавания речи
Иллюстрации
Показать всеРеферат
ОП ИСАНИЕ
ИЗОБРЕТЕНИЯ
К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ
COIO3 COQOfCICNI
Социапнстичесиих
Респубпик (и)621004 (61) Дополнительное к авт. свид-ву (22) Заявлено 1)„0477 (2l) 2474876/18-10 с присоединением заявки 3%в (23) Приоритет— (43) Опубликовано 250878.Бюллетень,% 31 (51) М. Ки.
С 10 Ь 1/00
Государственный комитет
Совета Министров СССР по делам изобретений и открытий (53) УДК 621 ° 391 (088.8) (45) Дата опубликования описания 210778
В.A.Íîâèêîâ и Н.Е.Мрелова (72) Авторы изобретения
Особое конструкторское бюро технической кибернетики
Ленинградского политехническоГо института нм.М.И.Калинина (7l) Заявитель (54) УстРОИстВО ДлЯ РАсн03ЯАВАниЯ Речи
Изобретение относится к области вычислительной техники и автоматизированных систем управления и может быть использовано для управления голосом некоторыми объектами и ввода информации в ЭВМ.
Известно устройство для распознавания речи, содержащее микрофон, усилитель, блок подсчета числа нулевых пересечений сигнала за определенный !О интервал времени, блок подсчета числа точек с нулевой йроизводной за такой же интервал времени, блок вычисления разности между числом нулевых пересечений и числом точек с нулевой произ- 8 водной tl) .
Недостатком данного устройства является невысокая достоверность рас-. познавания сигналов вследствие того, что при подсчете числа нулевых пере20 сечений сигналов и числа точек с нулевой производной не учитывается изменение плотности распределения числа нулевых пересечений и точек с нулевой производной сигнала.
Наиболее близким по технической сущности к предлагаемому является устройство для распознавания речи,:содержащее включенные.последователько микрофон, усилитель, блок подсчета зо числа интервалов между пересечениями нуля сигнала, соответствующих эталонным диапазонам, блок принятия решений и генератор прямоугольных импульсов длительнсотью 20 мс, подключенный к1 управляющему входу блока подсчета 121 .
Недостатком известного устройства распознавания речи является низкая достоверность распознавания слов от большой группы дикторов и неинвариантность к темпу произнесения, вызванная тем, что фиксированный интервал времени, в котором производится подсчет числа интервалов с эталонной длительностью, может произвольным образом включать участки различных звуков при изменениях частоты основного тона и темпа произнесения; кроме того абсолютное значение числа интервалов, соответствующих эталонным, сильно изменяется из-эа изменения спектрального .состава речевого сигнала от дикторов к диктору.
Цель изобретения — повышение достоверности результатов распознавания речевых сигналов от большой группы дикторов и при различном темпе .произнесения.
Для достижения этой цели в устройство для распознавания речи, состоя», 621004
Формула изобретения,ЦНИИПИ Заказ 4666/47 Тираж 513 Подписное филиал ППП Патент, г. Ужгород,ул. Проектная, 4 щее из микрофона, усилителя, блока подсчета числа интервалов между пересечениями нуля сигнала, соответствующих эталонным диапазонам, блока принятия решений, введ"ны блок выделения эталонного диапазона, соответствующего максимальному числу измеренных интервалов, и блок выделения периодов основного тона, причем вход блока выделения эталонного диапазона подключен к выходу блока подсчета, а выход - к::входу блока принятия.реше-; IO ний, вход блока выделения периодов основного тона подключен к выходу усилителя, а выход — к управляющему входу блока подсчета числа интервалов.
Введение блока выделения эталонно- 15 го диапазона, соответствующего максимальному числу измеренных интервалов, и блока выделения периодов основного тбна позвЬляет получить признак„ инвариантный к .темпу произнесения, по- 20 высить достоверность распознавания слов от большой группы дикторов.
На чертеже изображена функциональная схема предлагаемого устройства.
Устройство распознавания речи сос- тоит из включенных последовательно микрофона 1, усилителя 2, блока 3 подсчета числа интервалов между пересече-t ниями нуля сигнала, соответствующих эталонным диапазонам, блока 4 выделе= ния эталонного диапазона, соответствующего максимальному числу измеренных интервалов, блока 5 принятия решений и блока 6 выделения периодов основного тона, вход которого подключен к выходу усилителя, а выход — к управляющему входу блока 3 подсчета числа интервалов. устройство работает следующим образом.
Звуковой сигнал, .преобразованный в 40 электрический микрофоном 1, усиливается усилителем 2. В- блоке производится счет числа интервалов между пересечениями нуля сигнала за период основного тона, соответствующих трем диапазонами 0,004 мсу 0,28 мсу 0,28 мсу
0,48мс. В блоке 4 определяется номер диапазона, соответствующего максимальному числу интервалов между пересечениями нуля сигнала за период основного тона. Полученный номер диапазона поступает на блок 5 принятия решений, где принимается решение о принадлежности произнесенного слова одному кз эталонных слов.
Предлагаемое устройство позволяет повысить достоверность распознавания команд от большой группы дикторов и при различном темпе произнесения.
Устройство для распознавания речевых команд может быть .использовано, для вэода команд ЭВМ, .управления голосом различными автоматизированны-, ми системами.
Устройство для распознавания речи, содержащее микрофон, усилитель, блок подсчета числа интервалов между пересечениями нуля сигнала, соответствующих эталонным диапазонам, блок принятия решений, о т л и ч:а ю:щ е ес я тем, что, с целью повышения достоверности результатов распознавания сигналов от большой группы дикторов и при различном.-темпе. произнесения, в устройство включены блок выделения эталонного диапазона и блок выделения периодов основного.тона, прКчем вход блока выделения эталонного диапазона соединен с выходом блока подсчета числа интервалов, а выход подключен к. входу. блока принятия решений, вход блока выделения периодов основного тона подключен к выходу усилителя, а выход — к управляющему входу подсчета числа интервалов.
Источники информации, принятые во внимание при экспертизе: .1. Патент Великобритании Р 1155422, кл.Q 4 К, 1968.
2. Речевое общение в автоматизированных системах, М., Наука, 1975, с. 27-28.