Устройство для распознавания речевых сигналов
Иллюстрации
Показать всеРеферат
СОЮЗ СОВЕТСКИХ
СОЦИАЛИСТИЧННИХ
РЕСПУБЛИК (!9) (И) М59 10 Ь 1 02
ОПИСАНИЕ ИЗОБРЕТЕНИЯ
ГОсудАРстВенный НОмитет сссР
Гю делАм изоБРетений и ОтнРытий
И ABTGPGHONIY СВИДЕТЕЛЬСТВУ (21) 3383637/18-10 (22) 08.01. 82 (46) 23.07. 83. Бюл. Р 27(72) И. Ф. Бондаренко, A. Я. Дрюченко, A.È. Кантемир и B.IO. Соколов (71) Харьковский ордена Трудового
Красного Знамени институт радиоэлектроники (53) 534.781(088.8) (56) 1 ° Авторское свидетельство СССР
Р 568963, кл. G 10 L 1/02, 1977.
2. Авторское свидетельство. СССР
9 830521, кл. G 10 Ь 1/02, 1981.
t 54) (57):УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ
РЕЧЕВЫХ СИГНАЛОВ,: содержащее блок измерителя элементарной площади. распознаваемого сигнала, генератор тактовой частоты, блок памяти, анализатор, о т л и ч а ю щ е е с я тем, что, с " целью повышения быстродействия, надежности и упрощения конструкции, в него введены динамический нормализатор уровня, рецептор, классификатор, причем первый выход динамического нормализатора уровня подсоединен - к второму- вкоду блока измерителя элементарной площади, второй выход динамического нормалиэатора уровня подключен к третьему входу рецептора, выход блока измерителя элементарной площади подключен к второму входу рецептора, выход которого подключен к второму входу блока памяти, который соединен с вторым входом анализатора, выход анализатора подключен .к второму входу классификатора, выход генератора тактовой частоты подключен Q соответственно к первым входам блока измерителя элементарной площади, рецептора, блока памяти, анализатора и классификатора. с
1030840
Изобретение относится к распозна. ванию речевых сигналов и может быть использовано при создании средств речевого ввода информации в вычислительные машины, а также при разработке других средств автоматики с рече- 5 вым управлением.
Известно устройство для распознавания речевых сигналов, содержащее нуль-органы, количество которых равно числу уровней квантования, форми- !О рователь эталонных уровней напряжения, измерители времени существования, блок памяти и блок. сравнения(1)..
Недостатком данного устройства является его конструктивная слож,ность °
Наиболее близким к изобретению по технической сущности является устройство для распознавания речевых сигналов, содержащее входную 20 шину, соединенную с одним из входов нуль-органов, другой вход которых соединен с выходом формирователя .... эталонных уровней напряжения, блок измерителя элементарной площади распознаваемого сигнала, включенный между выходами нуль-органов и входом блока памяти, подключенного к входу блока сравнения (анализатора), соединеннсго с выходной шиной (2).
Недостатком известного устройства является невысокое быстродействие, обусловленное необходимостью большого числа переборов результатов измерений реализаций каждого класса распознаваемых образов и эталонов, а также кон-35 структивная сложность, связанная с необходимостью иметь для каждого эталон.ного уровня свой нуль-орган. При этом для повышения точности преобразования
I необходимо увеличить число эталонных 40 уровней напряжения, что приводит к услОжнению схемы и к снижению надежности устройства.
Цель изобретения — повышение быстродействия, надежности и упрощения конструкции. устройства.
Поставленная цель достигается тем, что в устройство для распознавания речевых сигналов, содержащее блок измерителя элементарной площади распознаваемого сигнала, генератор,тактовой частоты, блок памяти, анализатор, введены динамический нормализатор уровня, рецептор, классификатор, причем первый выход динамического нормализатора уровня подсоединен к второму входу блока измерителя зле= ментарной площади, второй выход динамического нормализатора уровня подключен к третьему входу рецептора, выход блока измерителя элементарной 60 площади подключен к второму входу ре.цептора, вь|ход которого подключен к второму входу блока памяти, который соединен с вторым входом анализатора, выход анализатора подключен к второ- 65 г у входу классификатора, выход генератора тактовой частоты подключен соответственно к первым входам блока измерителя элементарной площади, рецептора, блока памяти, анализатора и классификатора.
На фиг. 1 представлена функциональная схема устройства; на фиг. 2 временная диаграмма процесса дискретизации речевого сигнала.
Устройство содержит входную шину 1, динамический нормализатор 2 1 уровня, блок 3 измерителя элементарной площади распознаваемого сигнала, генератор 4 тактовой частоты, рецептор 5, блок б памяти, анализа" тор 7, классификатор 8, выходную шину 9.
Устройство для распознавания речевых сигналов работает следующим образом.
По входной шине 1 речевой сигнал поступает в динамический нормализатор 2 уровня, который нормирует его по уровню на квазистационарных участках в реальном масштабе времени.
Динамический нормализатор 2 уровня имеет два идентичных канала усиления, В одном канале осуществляется измерение максимального амплитудного значе- ния сигнала на интервале одного сегмента и вырабатывает сигнал управления ослаблением речевого сигнала во втором канале на интервале следующего сегмента. Динамический нормалиэатор 2 уровня формирует по второму выходу управляющий сигнал, подаваемый в рецептор 5 на третий вход. Генератор 4 тактовой частоты осуществляет синхронизацию устройства.
Нормированный по уровню униполярный, вынесенный в положительную область, речевой сигнал подается на вход блока 3 измерителя элементарной площади распознаваемого сигнала, логические нули и единицы с выхода которого поразрядно считываются по каждому импульсу тактовой частоты в шину данных (второй вход рецептора 5) как последовательный двоичный код исходного речевого сигнала. Рецептор 5 осуществляет поразрядный логический анализ (в реальном времени) последовательного двоичного кода, поступающего с выхода блока 3 измерителя элементарной площади распознаваемого сигнала (фиг. 2, ИС вЂ” исходный сигнал, ДС вЂ” дискредитизированный сигнал, Итч — импульсы тактовой частоты, Яоэлементарная площадь), и выделяет из него инвариантные признаки, представляющие собой детерминированные структуры двоичных элементов У, Х1, NI,ÂÓ.
Каждая такая структура существует (реализуется) во времени .на опреде- . ленном интервале. Время существования указанных структур является также инвариантным признакои и измеряется
1030840
° 1
8ИИИПИ Заказ 5219/51 . Тираж 382 . Подписное
Филиал ППП "Патент", r.Óæãîðîä,óë.Ïðoåêòíàÿ, 4 шагами дискретизации (1 mar = 1 импульсу тактовой частоты). Результаты анализа засылаются в блок б памяти.
При этом для каждого конкретного признака У, Х1, 81 или Ву используется.
: свой регистр и в него записывается . число, характеризующее временной интервал (время существования } соответствующего признака в текущем сегменте. Каждый такой сегмент в акте фонации реализуется на одном периоде частоты основного тона диктора и не превышает 10 мс. При нормальном темпе речи длительность гласных звуков составляет 200-300 мс, т ° е. каждый. гласный звук представляет последователь- 15 ность, состоящую 1 не менее чем из
20-30 сегментов одного тина. B качестве отличительного признака начала нового сегмента используется область
У. Память состоит из 10 модулей, каж- 2О дый из которых содержит один полный набор регистров У, Х1, N3. BY. Всяхий раз, .когда рецептор 5.обнаруживает новую область У, он засылает результаты анализа данного сегмента в очередной модуль, накапливая тем самым информацию о признаках сигнала.,Процесс накопления завершается либо при заполнении всех модулей памяти, либо по истечении 1 0 мс анализа. При вы.полнении хотя бы одного из названных условий процесс накопления информации завершается и рецептор 5 формирует строб разрешения работы анализатора 7.
Процедура анализа осуществляется в виде ряда последовательных операций проверки между двумя импульсами тактовой частоты. Анализ заключается в измерении длительности времени существования соответствующих -признаков
У, X1, Nl, ВУ. При этом дпя У и N1 выбираются максимальные значения этик признаков по множеству сегментов, накопленных в блоке б памяти sa один такт работы рецептора 5. Для Õ1 выбирается минимальное значеяие по множеству, а для ВУ - сумма значений ВУ в каждом сегменте, содержащемся и блок 6 памяти. после завершения процедуры анализа осуществляется классификация сигналов и блоке .8 кдасоификатора, который представляет собой специализированный дешифратор. На выходе дешифратора вырабатывается код распозн ан ного . звука .
Использование предлагаемого устройства для распознавания речевых сигналов позволяет пОвысить быстродействие и надежность распознавания.