Способ распознавания речевого сигнала
Иллюстрации
Показать всеРеферат
ОП ИСАНИЕ
ИЗОБРЕТЕНИЯ
К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ
Союз Советских
Социалистических
Республик
Государственный коинтет
С С С P по делам нзобретеннй
e ll OTKpbltkA (23) Приоритет—
РЗ1УДК 621. 391 ° 18 (088.8) Опубликовано 23.0183. Бюллетень НоЗ
Дата опубликования описания 2mi.83 г
3 %абаков-КушйаренЫо с (1
{72) Авторы изобретения
М.Ф. Бондаренко, A.ß. Дрюченко и
Харьковский институт радиоэлектр (71) Заявитель (54) СПОСОБ РАСПОЗНАВАНИЯ РЕЧЕВОГО
СИГНАЛ
Изобретение относится к приборостроению и может быть использовано в акустике, а именно в системах распознавания речевых сигналов, например при речевом вводе информации в вычислительные машины.
Известен способ распознавания речевых сигналов, заключающийся в том, Что производят преобразование ре чевого сигнала путем квантования его по эталонным значениям напряжения, измерения времени существования и времени отсутствия напряжения на каждом уровне эталонного значения напряжения речевого сигнала, запо- минания результатов измерения и сравнения их с эталонными значениями напряжения речевого сигнала f1).
Недостатком данного способа является невысокая надежность и недостаточное быстродействие распознавания речевого сигнала.
Наиболее близким техническим ре шением к изобретению является реализованный в устройстве способ распознавания речевого сигнала путем его преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонньвчи значениями 2 .
Недостатком известного способа является невысокая надежность распоз-, навания речевого. сигнала нри наличии помех, Изменение Формы речевого сигнала, а также флуктуации амплитуды сигнала из-за наложенной на него
1 0 аддитнвной помехи оказывают,отрицательное влияние на результат распознавания. Кроме того, недостатком способа является невысокое быстродействие распознавания вследствие того, что речевой сигнал не нормируется. Это ведет к необходимости перебора большого .числа реализаций одного и того же образа с большими временными затратами.
Цель изобретения - повышение на дежности и быстродействия распознавания речевого сигнала.
Поставленная цель достигается тем, согласно способу распознавания рече вого сигнала путем его преобразова25 ния в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонньвки значениями, в котором производят нормализацию
30 входного сигнала по уровню на квази
991492
50 стационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности импульсов и выделяют стационарные блоки единицнепрерывные последовательности единиц, если их число превышает некоторое заданное число, стационарные бло-, ки нулей — .непрерывные последовательности нулей, если их число превышает некоторое заданное число, и не- t0 .стационарные блоки — произвольные последовательности бинарных элементов, а также разрывы стационарных бло. ков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и используют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука.
На фиг.1 изображено устройство 20 для осуществления предложенного способа распознавания речевого сигнала, на фиг.2 — осцилдограмма речевого сигнала и преобраэование речевого сигнала в систему признаков, пред- ъ5 ставленных в бинарной форме. устройство, осуществляющее предлагаемый способ распознавания речево го сигнала, содержит микрофон 1, микрофонный усилитель 2 динамический нормализатор уровня 3, рецептор 4, блок памяти 5, анализатор 6 и классифйкатор 7.
Микрофон 1 через микрофонный усилитель 2 соединен с динамическим нормализатором уровня 3, выход кото- 35 рого подключен к входу рецептора 4, связанного с блоком памяти 5. Выход блока памяти 5 через анализатор б соединен с классификатором 7.
Распознавание речевых сигналов 40 осуществляется следующим образом.
Речевой сигнал нормируется по уровню на квазистационарных участках.
Этим минимизируется пространство признаков описания распознаваемого 45 образа. Затем преобразуют речевой сигнал {фиг.2) с учетом психофизического эффекта сглаживания в слухе в систему признаков, представленных в бинарной форме на определенном интервале времени (выборке, например 20mS). Из структур бинарных элементов выделяют базовые блоки, т.е. стационарные блоки единиц У(11), стационарные блоки нулей й(00), нестационарные блоки Х!01), а также признак BY При этом для маркировки границ элементарного сегмента используют признак Y{11). Затем измеряют временные значения признаков
Y(11), К(00), BY и в результате анализа этих значений в зависимости от требуемой надежности распознают речевой сигнал по одному или более элементарным сегментам.
Предлагаемый способ распознавания повышает надежность и быстродействие обработки речевого сигнала.
Формула изобретения
Способ распознавания речевого сигнала путем его преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонными значениями, отличающийся тем,что, с целью повышения надежности и быстродействия распознавания, производят нормализацию входного сигнала по уров-. ню на квазистационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности и выделяют стационарные блоки единиц — непрерывные последовательности единиц-, если их число превышает некоторое заданное число, стационарные блоки нулей — непрерывные последовательности нулей, если их число превышает некоторое заданное число, и нестационарные блоки — про» извольные последовательности бинарных элементов, а также разрывы стационарных блоков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и исполь-зуют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука.
Источники информации, принятые во внимание при экспертизе
1. Авторское свидетельство СССР
9 б14461, кл. G 10 L 1/02, 1977.
2. Авторское свидетельство СССР
9 830521, кл. G 10 L 1/02, 1981.
991492
Составитель В. Суханов
Редактор В. Данко Техред A.A÷ Корректор E. Pmnco акаэ 45 7 Тираж О Подписное
ВНИИПИ Государственного комитета СССР по делам иэобретений и открытий
113035, Носква, Ж-35, Раушская наб., д. 4/5 филиал ППП Патент, r. Ужгород, ул. Проектная,