Устройство для распознавания речевых сигналов

Иллюстрации

Показать все

Реферат

 

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧННИХ

РЕСПУБЛИК (!9) (И) М59 10 Ь 1 02

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

ГОсудАРстВенный НОмитет сссР

Гю делАм изоБРетений и ОтнРытий

И ABTGPGHONIY СВИДЕТЕЛЬСТВУ (21) 3383637/18-10 (22) 08.01. 82 (46) 23.07. 83. Бюл. Р 27(72) И. Ф. Бондаренко, A. Я. Дрюченко, A.È. Кантемир и B.IO. Соколов (71) Харьковский ордена Трудового

Красного Знамени институт радиоэлектроники (53) 534.781(088.8) (56) 1 ° Авторское свидетельство СССР

Р 568963, кл. G 10 L 1/02, 1977.

2. Авторское свидетельство. СССР

9 830521, кл. G 10 Ь 1/02, 1981.

t 54) (57):УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ

РЕЧЕВЫХ СИГНАЛОВ,: содержащее блок измерителя элементарной площади. распознаваемого сигнала, генератор тактовой частоты, блок памяти, анализатор, о т л и ч а ю щ е е с я тем, что, с " целью повышения быстродействия, надежности и упрощения конструкции, в него введены динамический нормализатор уровня, рецептор, классификатор, причем первый выход динамического нормализатора уровня подсоединен - к второму- вкоду блока измерителя элементарной площади, второй выход динамического нормалиэатора уровня подключен к третьему входу рецептора, выход блока измерителя элементарной площади подключен к второму входу рецептора, выход которого подключен к второму входу блока памяти, который соединен с вторым входом анализатора, выход анализатора подключен .к второму входу классификатора, выход генератора тактовой частоты подключен Q соответственно к первым входам блока измерителя элементарной площади, рецептора, блока памяти, анализатора и классификатора. с

1030840

Изобретение относится к распозна. ванию речевых сигналов и может быть использовано при создании средств речевого ввода информации в вычислительные машины, а также при разработке других средств автоматики с рече- 5 вым управлением.

Известно устройство для распознавания речевых сигналов, содержащее нуль-органы, количество которых равно числу уровней квантования, форми- !О рователь эталонных уровней напряжения, измерители времени существования, блок памяти и блок. сравнения(1)..

Недостатком данного устройства является его конструктивная слож,ность °

Наиболее близким к изобретению по технической сущности является устройство для распознавания речевых сигналов, содержащее входную 20 шину, соединенную с одним из входов нуль-органов, другой вход которых соединен с выходом формирователя .... эталонных уровней напряжения, блок измерителя элементарной площади распознаваемого сигнала, включенный между выходами нуль-органов и входом блока памяти, подключенного к входу блока сравнения (анализатора), соединеннсго с выходной шиной (2).

Недостатком известного устройства является невысокое быстродействие, обусловленное необходимостью большого числа переборов результатов измерений реализаций каждого класса распознаваемых образов и эталонов, а также кон-35 структивная сложность, связанная с необходимостью иметь для каждого эталон.ного уровня свой нуль-орган. При этом для повышения точности преобразования

I необходимо увеличить число эталонных 40 уровней напряжения, что приводит к услОжнению схемы и к снижению надежности устройства.

Цель изобретения — повышение быстродействия, надежности и упрощения конструкции. устройства.

Поставленная цель достигается тем, что в устройство для распознавания речевых сигналов, содержащее блок измерителя элементарной площади распознаваемого сигнала, генератор,тактовой частоты, блок памяти, анализатор, введены динамический нормализатор уровня, рецептор, классификатор, причем первый выход динамического нормализатора уровня подсоединен к второму входу блока измерителя зле= ментарной площади, второй выход динамического нормализатора уровня подключен к третьему входу рецептора, выход блока измерителя элементарной 60 площади подключен к второму входу ре.цептора, вь|ход которого подключен к второму входу блока памяти, который соединен с вторым входом анализатора, выход анализатора подключен к второ- 65 г у входу классификатора, выход генератора тактовой частоты подключен соответственно к первым входам блока измерителя элементарной площади, рецептора, блока памяти, анализатора и классификатора.

На фиг. 1 представлена функциональная схема устройства; на фиг. 2 временная диаграмма процесса дискретизации речевого сигнала.

Устройство содержит входную шину 1, динамический нормализатор 2 1 уровня, блок 3 измерителя элементарной площади распознаваемого сигнала, генератор 4 тактовой частоты, рецептор 5, блок б памяти, анализа" тор 7, классификатор 8, выходную шину 9.

Устройство для распознавания речевых сигналов работает следующим образом.

По входной шине 1 речевой сигнал поступает в динамический нормализатор 2 уровня, который нормирует его по уровню на квазистационарных участках в реальном масштабе времени.

Динамический нормализатор 2 уровня имеет два идентичных канала усиления, В одном канале осуществляется измерение максимального амплитудного значе- ния сигнала на интервале одного сегмента и вырабатывает сигнал управления ослаблением речевого сигнала во втором канале на интервале следующего сегмента. Динамический нормалиэатор 2 уровня формирует по второму выходу управляющий сигнал, подаваемый в рецептор 5 на третий вход. Генератор 4 тактовой частоты осуществляет синхронизацию устройства.

Нормированный по уровню униполярный, вынесенный в положительную область, речевой сигнал подается на вход блока 3 измерителя элементарной площади распознаваемого сигнала, логические нули и единицы с выхода которого поразрядно считываются по каждому импульсу тактовой частоты в шину данных (второй вход рецептора 5) как последовательный двоичный код исходного речевого сигнала. Рецептор 5 осуществляет поразрядный логический анализ (в реальном времени) последовательного двоичного кода, поступающего с выхода блока 3 измерителя элементарной площади распознаваемого сигнала (фиг. 2, ИС вЂ” исходный сигнал, ДС вЂ” дискредитизированный сигнал, Итч — импульсы тактовой частоты, Яоэлементарная площадь), и выделяет из него инвариантные признаки, представляющие собой детерминированные структуры двоичных элементов У, Х1, NI,ÂÓ.

Каждая такая структура существует (реализуется) во времени .на опреде- . ленном интервале. Время существования указанных структур является также инвариантным признакои и измеряется

1030840

° 1

8ИИИПИ Заказ 5219/51 . Тираж 382 . Подписное

Филиал ППП "Патент", r.Óæãîðîä,óë.Ïðoåêòíàÿ, 4 шагами дискретизации (1 mar = 1 импульсу тактовой частоты). Результаты анализа засылаются в блок б памяти.

При этом для каждого конкретного признака У, Х1, 81 или Ву используется.

: свой регистр и в него записывается . число, характеризующее временной интервал (время существования } соответствующего признака в текущем сегменте. Каждый такой сегмент в акте фонации реализуется на одном периоде частоты основного тона диктора и не превышает 10 мс. При нормальном темпе речи длительность гласных звуков составляет 200-300 мс, т ° е. каждый. гласный звук представляет последователь- 15 ность, состоящую 1 не менее чем из

20-30 сегментов одного тина. B качестве отличительного признака начала нового сегмента используется область

У. Память состоит из 10 модулей, каж- 2О дый из которых содержит один полный набор регистров У, Х1, N3. BY. Всяхий раз, .когда рецептор 5.обнаруживает новую область У, он засылает результаты анализа данного сегмента в очередной модуль, накапливая тем самым информацию о признаках сигнала.,Процесс накопления завершается либо при заполнении всех модулей памяти, либо по истечении 1 0 мс анализа. При вы.полнении хотя бы одного из названных условий процесс накопления информации завершается и рецептор 5 формирует строб разрешения работы анализатора 7.

Процедура анализа осуществляется в виде ряда последовательных операций проверки между двумя импульсами тактовой частоты. Анализ заключается в измерении длительности времени существования соответствующих -признаков

У, X1, Nl, ВУ. При этом дпя У и N1 выбираются максимальные значения этик признаков по множеству сегментов, накопленных в блоке б памяти sa один такт работы рецептора 5. Для Õ1 выбирается минимальное значеяие по множеству, а для ВУ - сумма значений ВУ в каждом сегменте, содержащемся и блок 6 памяти. после завершения процедуры анализа осуществляется классификация сигналов и блоке .8 кдасоификатора, который представляет собой специализированный дешифратор. На выходе дешифратора вырабатывается код распозн ан ного . звука .

Использование предлагаемого устройства для распознавания речевых сигналов позволяет пОвысить быстродействие и надежность распознавания.