"устройство для морфологического анализа слов естественных языков и языков "деловой прозы"
Иллюстрации
Показать всеРеферат
ере, КОВ И ЯЗЫКОВ ДЕЛОВОЙ ПРОЗЫ Изобретение относится к техническим ствам информации и вычислительной техники и может быть использовано как под истема сложных систем лингвистического анализа и структурных методом расавания образов, а также для процессов, связанных с решением проблем искусствен ого интеллекта. Целью изобретения является повышение скорости процессов мороологического анализа слов реальных языков на основе логических признаков принадлежности к классам словоформ. Устройство содержит блок памяти слов, блок регистров слов, блок поиска вхождений, ключ, блок анализа характеристического вектора, блок хранения окончаний, блок хранения основ, блок элементов ИЛИ, два дешифратора, коммутатор, блок хранения признаков, блок регистровой памяти, блок формирования адреса, блок анализа морфологических признаков, блок регистров символьного вхождения, блок формирования результата классификации, блок задержки, блок элементов ИЛИ, блок управления. Новым в устройстве является то, что в нем можно реализовать скоростной анализ слов по заданному множеству формул подстановок , имеющих алфавитно и семантически различные правые и левые части, что позволяет исключить возврат на предыдущие формулы, а также быстро устанавливать отсутствие вхождения одних слов в другие обрабатываемые слова. 3 з.п. ф-лы, 14 ил. -г Ё
(21) 4771278/24 (22) 18.12.89 (46) 30.08.93. Бюл, hh 32 (71) Курский политехнический институт (72) В.М. Довгаль, О.Ф. Корольков, Ф,А, Ста ков, С.С. Шевелев и Д.Н. Тютюнов (56) авторское свидетельство СССР
М 1 87173, кл. G 06 F 15/04, 1985. вторское свидетельство СССР
М 1 55345, кл. G 06 F 15/20, 1988. (54) УСТРОЙСТВО ДЛЯ МОРФОЛОГИЧЕСК ГО АНАЛИЗА СЛОВ ЕСТЕСТВЕННЫХ
ЯЗ КОВ И ЯЗЫКОВ "ДЕЛОВОЙ ПРОЗЫ" (57) Изобретение относится к техническим сре ствам информации и вычислительной тех ики и может быть использовано как под истема сложных систем лингвистическо анализа и структурных методом распоз авания образов, а также для процессов, свя анных с решением проблем иискусст. вен ого интеллекта". Целью изобретения явля ется повышение скорости процессов мор(ологического анализа слов реальных ! языков на основе логических признаков принадлежности к классам словоформ. Устройство содержит блок памяти слов, блок регистров слов, блок поиска вхождений, ключ, блок анализа характеристического вектора, блок хранения окончаний, блок хранения основ, блок элементов ИЛИ, два дешифратора, коммутатор, блок хранения признаков, блок регистровой памяти, блок формирования адреса, блок анализа морфологических признаков, блок регистров символьного вхождения, блок формирования результата классификации, блок задержки, блок элементов ИЛИ, блок управления. Новым в устройстве является то, что в нем можно реализовать скоростной анализ слов по заданному множеству формул подстановок, имеющих алфавитно и семантически различные правые и левые части, что позволяет исключить возврат на предыдущие формулы, а также быстро устанавливать отсутствие вхождения одних слов в другие обрабатываемые слова. 3 з,п. ф-лы, 14 ил. зобретение относится к техническим
Средствам информатики и еычислителчнои техники и может быть использовано как подс стема сложных систем лингвистическог анализа и структурных методов распозн вания образов, а также для процессов, связ нных с решением проблем иискусственного интеллекта", елью изобретения является повышение корости процессов морфологического анал эа слов реальных языков, на основе логи еских признаков принадлежности к клас ам словоформ.
На фиг. 1 изображена структурная схема устройства.
На фиг. 2 представлен вариант технической реализации структуры блока поиска вхождений, На фиг. 3 представлен вариант технической реализации структуры блока анализа характеристического вектора.
На фиг. 4 представлен вариант технической реализации структуры блока хранения окончаний.
1837327
На фиг. 5 представлен вариант технической реализации структуры блока хранения основ.
На фиг. 6 представлен вариант технической реализации структуры блока хранения признаков.
На фиг, 7 представлен вариант технической реализации структуры коммутатора.
На фиг. 8 представлен вариант технической реализации структуры блока формиро- "0 вания адреса и блока регистровой памяти.
На фиг. 9 представлен вариант технической реализации структуры блока регистровой памяти.
На фиг. 10 представлен вариант техни- 15 ческой реализации структуры блока анализа морфологических признаков.
На фиг. 11 представлен вариант технической реализации структуры блока формирования результата классификации. 20
На фиг. 12 представлен вариант технической реализации структуры блока регистров символьного. вхождения.
На фиг. 13 изображена содержательная граф-схема алгоритма работы блока управления.
На фиг, 14 изображена размеченная граф-схема алгоритма работы блока управления.
Устройство для морфологического ана- 30 лиза слов естественных языков и языков
"деловой прозы" (фиг, 1) содержит блок 1 памяти слов, блок 2 регистров слов, блок 3 поиска вхождений, ключ 4, блок 5 анализа характеристического вектора, блок 6 хране- 35 ния окончаний, блок 7 хранения основ, блок йыH ьлетавонс о
0 другого окончания. Пусть это окончание будет "ательный".
На первом шаге поиска получаем пустой характеристический вектор и сразу же переходим к обнаружению вхождения йын ьле таво н с о
1 0 0 0 0 0 0 0 0 0 0 0 0 иыньлетавонс о
0 1 0 0 0 0 0 0 0 0 0 0 0
8 элементов ИЛИ, дешифратор 1-9, коммутатор 10, дешифратор 2-11, блок 12 хранения признаков, блок 13 регистровой памяти, блок 14 формирования адреса, блок 15 анализа морфологических признаков, блок 16 регистров символьного вхождения, блок 17 формирования результата классификации, блок 18 задержки, блок 19 управления.
Характеристическим вектором (10) называется двоичное слово, которое равно длине обрабатываемого слова и индицирует единицей в одном или нескольких разрядах позицию вхождения какой-либо буквы алфавита в слове, Например, слову "катамаран" при формировании вхождения буквы "а" будет характеристический вектор:
Использование характеристических векторов позволяет резко сократить время на поиск вхождений основ и окончаний в обрабатываемые слова, потому что в случае отсутствия хотя бы одного смежного вхождения буквы "обнуляет" характеристический вектор, что позволяет избежать непродуктивных затрат времени, особенно в тех случаях. когда вхождения рассматриваемой основы или окончания в обрабатываемом слове нет, Поясним это на примере..
Пусть задано слово "основательный".
Основа слова — "основ", окончание — "ательный". Пусть также из списка окончаний извлечено окончание "ук", Напоминаем, что в предлагаемом устройстве слова представляются в обратной записи. Тогда будем иметь:
1-й mar nozcKa вхождения
2-и шаг поиска вхождения
1837327
1 0 О О О О 0 0 О О О О О
О 1 О О О 0 О О О О О О 0! ! 0 1 О о О О 0 0 0 0 О О 0 — пронеж точныи хагактеристи( ческии вектоР и ы н ь л е т а в о н с о! н
3-и шаг поиска вхожления
О О 1 О О 0 0 О О 0 1 О О
0 1 0 О 0 О О О О О 1 О О
Î 0 1 Î 0 0 О 0 б Î 0 0 0 — пРоиеж точный ха1 аКтеГИстИческии вектор
Очевидно, что при просмотре для опрения вхождения всех оставшихся букв волов) окончаний и обрабатываемого в ем примере, мы будем получать харакстический вектор с единственной едией тогда, когда вхождение имеется, ий же раз, когда вхождение отсутствуарактеристический вектор обнуляется. свойство характеристических векторов, ирующихся по принципу "косой" поядной коньюнкции, когда операция выяется между I-ым и i+1-м разрядами ветствующих характеристических векв дает, при длинных основах и оконча, существенный выигрыш во времени.
В предлагаемом устройстве основы и окончания располагаются в памяти, начиная основ и окончания максимальной длины, а анализ проводится вначале по оконнчаниям, а затем осуществляется, если это еобходимо, переход к блоку хранения осн в, При это поиск выполняется только на мно естве сопряженных основ, то есть та-! дел (си на . тер ни
Вся ет, Это фор раз пол соо тор ния ких основ, которые не обнуляют характеристический вектор, полученный на списке окончаний. После формирования непустого характеристического вектора на списке
5 окончаний, извлекается признак в видедвоичного слова, Если в этом слове единственная единица, то выдается результат классификации. Если в слове — признаке несколько единиц, то просматривается список
10 основ. Признаки извлеченные по вхождению окончания и по вхождению основы в результате поразрядной коньюнкции словпризнаков дают окончательный признак.
Если в этом слове имеется единственная
15 единица, то результат классификации положительный, в противном случае — формируется требование на доопределение и производится отказ от классификации. Основы, окончания и признаки задаются лин20 гвистами.
Содержательная граф-схема алгоритма работы блока 19 управления устройства для морфологического анализа слов естествен1837327 ных языков и языков "деловой прозы" приведена на фиг. 13. Для описания работы устройства используются следующие идентификаторы;
1. УОΠ— установка исходных состояний функциональных блоков.
2. ПУСК вЂ” команда запуска устройства, 3. С3 "1" — команда для разрешения записи единичной информации в регистр 1 блока анализа.
4. АПР— линия адреса ОЗУ признаков.
5. СР— команда разрешения приема слов из блока памяти слов в блок регистров слов и выдача этого слова из блока памяти слов.
6. ПРИЕМ 1 — команда разрешения приема информации из блока памяти в блок регистровой памяти.
7. СИ 2 — сигнал синхронизации в блок регистра символьного вхождения.
8. ВЫДАЧА 1 — команда выдачи информации иэ блока регистровой памяти.
9. ПРИЕМ 2 — команда для разрешения приема информации из блока регистровой памяти в блок регистров символьного вхождения.
10. СОП вЂ” команда опроса блока регистров символьного вхождения, 11. В ЫДАЧА 2 — команда выдачи информации иэ блока регистров символьного вхождения.
12. РРП вЂ” команда определения вхождения в блоке поиска вхождения.
13. Cf1 "1" — команда определения характеристического вектора в блоке анализа характеристического вектора.
14. СЗА٠— команда "защелки" в блоке анализа характеристического вектора, подаваемая на С входы триггеров Рг1..
15. A3 — адреса записи, вырабатываемые блоком формирования адреса, 16. А — адреса выдачи, вырабатываемые блоком формирования адреса.
17. ИН "1" — команда. при которой в регистре 2.блок анализа морфологических признаков записывается единичная информация.
18. XB — информация характеристического вектора.
19. ДР— информация группы окончаний (основ), поступающая иэ коммутатора в блок регистровой памяти.
20, РД 1 — информация одного символа из блока регистровой памяти в блок регистров символьного вхождения.
21. РД 2 — информация одного символа из блока регистров символьного вхождения в блок поиска вхождения.
22. МП вЂ” информация морфологических признаков.
23, REZ — команда результата.
24, +СчАПП вЂ” команда счета следующего адреса из блока хранения признаков.
25, СНЛ вЂ” команда, определяющая ра5 боту в "косой" линии второй группы элементов И.
26, СД вЂ” информация характеристического вектора, поступающая из ключа в блок анализа характеристического вектора.
10 27. САП вЂ” команда разрешения записи морфологических признаков в регистр 2 блока анализа морфологических признаков.
28, АОК вЂ” линия адреса блока хранения окончаний.
15 29. АОС вЂ” линия адреса блока хранения основ, 30. RN — информационный выход блока анализа морфологических признаков.
31. Рг1 — регистр 1 блока анализа харак20 теристического вектора.
32, Рг2 — регистр хранения информации характеристического вектора после просмотра блока хранения окончаний.
33. КЛ вЂ” ключ.
25 34, Сх — команда разрешения хранения информации, поступающая иэ Рг1 в Рг2, . подаваемая на С входы триггеров Рг2.
35. Р — команда разрешения на выдачу информации из Рг2 в Рг1, подаваемая на
30 управляющие входы первой группы элементов И, 36, СПП вЂ” команда разрешения считывания данных из блока хранения окончаний.
37. ДОК - информационный выход бло35 ка хранения окончаний.
38. ДОС вЂ” информационный выход блока хранения основ.
39. СП — команда разрешения считывания данных из блока хранения основ.
40 40. PS — информационный выход слова блока памяти слов, 41. SP — информационный выход слова блока регистров слов.
42, Рг1 — регистр 1 блока анализа мор45 фологических признаков.
43. КОМ вЂ” коммутатор.
44, БРП вЂ” блок регистровой памяти.
45. Б РС — блок регистров символьного вхождения, 50 46. ВИКЛ вЂ” выходная информация ключа, 47. Рг2 — регистр 2 блока анализа морфологических признаков.
48, БФРК вЂ” блок формирования реэуль55 тата классификации.
49. ПРС вЂ” информационный выход блока формирования результата классификации (двоичный код — признак обрабатываемого слова при определении части речи).
1837327
10 про про
20 тро щи щи тир ний тир вхо эле гис ва.
30 вед упр — r нов ств хра зна
"СБ
"C3 нов бло ков, ход т,е. ана уст
"С фо ан это хр
"И чен
50 пр
1 и чер ин ком фо ком
50. АПΠ— команда определения конца мотра блока хранения окончаний.
1.АП С вЂ” команда on редел ения конца мотра блока хранения основ.
2. АВАР.ОСТ вЂ” аварийный останов усства.
53. СТР1 — стробирующий (разрешаю) вход дешифратора 1.
4. СТР2 — стробирующий (разрешаю) вход дешифратора 2.
55. УОК вЂ” команда разрешения коммувания выхода блока хранения окончас входом блока регистровой памяти.
56. УОС вЂ” команда разрешения коммувания выхода блока хранения основ с ов блока регистровой памяти.
57. БРС вЂ” блок регистров слов.
58. ВГЭИ вЂ” вторая группа элементов И.
59. ВИЭл.ИЛИ вЂ” выходная информация ентов ИЛИ.
60. ВИ Рг1 — выходная информация рера 1.
Работа алгоритма управления устройстСодержательная ГСА управления прина на фиг. 13 и отражает работу блока вления (фиг, 1).
По сигналам "УОО" и "Пуск" (блоки 2, 4 аф-схемы алгоритма) происходит устаа в нуль всех элементов памяти устрой., кроме блока хранения основ, блока ения окончаний, блока хранения приов и блока памяти слов, по команде
ОС:=1" (блок 3).
В блоке 5 алгоритма по команде 1":=1" происходит разрешение устаи в единицы "Д" — тригcGpoB регистра 1 а 15 анализа морфологических признапо команде (блок 5) "ИН" 1":=1" проист укаэанная загрузка этого регистра, все "Д" — триггеры регистра 1 блока 15 иза морфологических признаков будут новлены в единицу, В блоке 6 алгоритма по команде
":-0" происходит запрет на прием инации в триггеры регистра 1 блока 15 иза морфологических признаков, при данный регистр переходит в режим ения информации, По команде
1":=0" сигнал "ИН" 1"" принимает знануля (блок 6). блоке 7 алгоритма по команде "СР;-1" ходит разрешение на выдачу из блока яти слов информации и разрешения блок 18 задержки на прием этой же рмации в блок 22 регистра слов. По нде "БРС:=Р$" происходит прием инации (очередного слова) из блока 1 паслов в блок 2 регистра слов. По нде "СПП:=1" происходит просмотр блока 6 хранения окончаний (блок 7 алгоритма).
В блоке 8 алгоритма происходит проверка признака СПП. Если "СПП-1", то это означает просмотр блока 6 хранения окончаний. Если "СПП-0", то это означает просмотр блока 7 хранения основ.
В блоке 9 алгоритма происходит проверка признака СПВ. Если "СПВ-1", то это означает просмотр блока 7 хранения основ.
Если "СПВ-0", то это означает прекращение работы устройства и осуществляется переход на блок 39 алгоритма.
В блоке 10 алгоритма по команде
"АПО:-1" происходит считывание окончаний из блока 6 хранения окончаний до тех пор, пока все окончания не будут просмотрены, либо в случае нахождения требуемого окончания. По команде "АПС:-0" происходит запрет на считывание основ из блока 7 хранения основ. По команде "УОК:-1" происходит коммутация выхода блока 6 хранения окончаний на вход блока регистровой памяти. По команде "УОС:=0" происходит запрет коммутации выхода блока 7 хранения основ на вход блока 13 регистровой памяти (фиг. 7).
В блоке 11 алгоритма по команде-.
"АПО:=0" происходит запрет на считывание окончаний из блока 6 хранения окончаний, По команде "АПС:=1" происходит считыва- ние основ из блока 7 хранения основ до тех пор, пока все основы не будут просмотрены, либо в случае нахождения требуемой основы. По команде "УОК:=0" происходит запрет коммутации выхода блока 6 хранения окончаний на вход блока 13 регистровой памяти (фиг, 7).
В блоке 12 алгоритма по команде "Прием 1:=1" осуществляется формирование сигнала разрешения в блок 13 регистровой памяти (фиг. 1) для приема очередного сигнала. По команде "БРП:-ДР" (блок 12) происходит прием группы символов из блоков хранения окончаний (основ) в блок 13 регистровой памяти (фиг. 8).
В блоке 13 алгоритма по команде "Выдача 1:=1" происходит выдача очередного символа из блока 13 регистровой памяти в блок 16 регистров символьного вхождения (фиг. 1). Команда "Выдача 1:-1" формируется блоком управления.
В блоке 14 алгоритма по команде "Прием 2:=1" происходит разрешение на прием информации из блока 13 регистровой памяти в блок 16 регистров символьного вхождения, по команде "СИ2:-.1" (блок 14) происходит подача синхро-импульсов из блока t9 управления в блок 16 символьного вхождения, по команде "БРСВ:РД1" (блок
1837327
14) происходит прием в блок 16 регистров символьного вхождения информации из блока 13 регистровой памяти (фиг. 1).
В блоке 15 по команде "Выдача2:-1" происходит разрешение на выдачу информации из блока 16 регистров символьного вхождения в блок 3 поиска вхождения (фиг.
1).
В блоке 1 6 происходит проверка признака состояния блока 16 регистров символьного вхождения "COll". Если "СОП 0", то это соответствует тому, что в блоке 16 регистров символьного вхождения имеется не пустая информация(есть очередной символ). При этом выполняется проверка признака РРП (блок 17 алгоритма). Если
"СОП=1" (это означает, что в блоке 16 регистров символьного вхождения находится пустая запись, то есть конец слова-вхождения), то выполняется переход на блок 29 алгоритма.
В блоке 17 происходит проверка признака РРП. Если "РРП-0" (это означает, что символа, который находится в блоке 16 регистров символьного вхождения нет в обрабатываемом слове). Вхождение при этом не обнаруживается. При этом осуществляется переход на блок 12 алгоритма и организуется цикл на блок 12 алгоритма поиска символа вхождения до тех пор, пока не будет обнаружено совпадение буквы в блоке 16 регистров символьного вхождения и в блоке
2 регистров слов (фиг. 1), Выход из цикла организуется тогда, когда будет обнаружено вхождение, будет найдена буква в блоке
2 регистров слов, т;е, PPfl-1 (блок 17).
В блоке 18 алгоритма по команде
"РРП:-1" происходит разрешение приема характеристического вектора, поступившего из блока 3 поиска вхождения в ииоч 4 (фиг. 1). По команде "КЛ:ХВ" (блок 18) происходит загрузка характеристического вектора в ключ 4.
В блоке 19 алгоритма происходит проверка признака СП"1". Если "СП" 1"-0", то формируется "СЗАЩ:=1" (блок 24). На синхровходы триггеров регистра 1 блока 5 анализа характеристического вектора подан единичный сигнал и регистр подготовлен к приему очередного характеристического вектора и в этот регистр принимается характеристический вектор "Рг1:=BNKSI" (блок
24). При этом осуществляется переход на блок 25 алгооитма. Если "СП" 1"=1" (это означает, что загружен регистр 1 блока 5 анализа характеристического вектора) и по команде (блок 20) "СЗАЩ:=0" устанавливается режим хранения этого вектора в указанном регистра
25 "Рг1:=ВИ ЭлИЛИ" (блок 23) происходит за30
50
В блоке 21 алгоритма выходная информация регистра 1 блока 5 анализа характеристического вектора (ВИ Рг1) обрабатывается с помощью поразрядной операции "коньюнкция", с выходной информацией ключа 4 (ВИКЛ), так, что каждый I+1 разряд выходной информации ключа (ВИКЛ) коньюнктируется с l-ым разрядом выходной информации ВИ РГ1 регистра 1 блока 5, а первый разряд ключа 4 коньюнктируется с последним разрядом регистра 1 блока 5 анализа характеристического вектора, т.е. коньюнкция выполняется по "косой линии" ВГЭИ:-BNKJgBI4 Рг1. Результат операции коньюнкции поступает на вход второй группы элементов И (ВГЭИ).
В блоке 22 алгоритма происходит проверка признака СНЛ. Если "СНЛ=О", то осуществляется переход на блок 26 алгоритма, Если "СНЛ=1", то в блоке 23 алгоритма по команде "СЗАЩ:-1" происходит подача сигнала разрешения для приема информации из ключа 4 в регистр 1 блока 5 анализа характеристического вектора. По команде грузка вектора в регистр 1 блока 5 анализа характеристического вектора выходной информации элементов ИЛИ (фиг. 3).
В блоке 25 алгоритма по команде
"СЗАЩ:-0" происходит подача на синхровходы триггеров регистра 1 блока 5 анализа характеристического вектора сигнала запрета на прием информации и регистр первводится в режим хранения. При этом осуществляется переход на блок 13 алгоритма, т.е. организуется цикл поиска нужного вхождения.
В блоке 26 алгоритма происходит проверка признака "АПС". Если "АПС-О", то осуществляется переход на блок 12, Если
"АПС-1", то в блоке 27 алгоритма по команде "СЗАЩ:1" происходит подача сигнала разрешения для приема информации из регистра 2 блока 5 анализа характеристического вектора (фиг, 3). По команде "PB:-1" происходит подача на управляющие входы первой группы элементов И блока 5 анализа характеристического вектора (фиг. 3) разрешающего сигнала. По команде Рг1:-ВИ
ЭлИЛИ" происходит прием характеристического вектора выходной информации элементов ИЛИ в регистр 1 блока S анализа регистра характеристического вектора, В блоке 28 алгоритма по команде
"РВ:=0" происходит подача на управляющие входы первой группы элементов И блока 5 (фиг. 3) запрещающего сигнала, т.е, нуля. При этом регистр 2 блока 5 анализа характеристического вектора хранит инфор-. мацию характеристического вектора, пол13
1837327
14 уче ок ре зн
"С ше бл ко хо мо мо
15 ше бл ко пр ан фо ко
50
"СХ
"С бл ко фо
"Б мо ми те ан
"R но мо алг му ал ре пр но ал !
ФА пе то
"С
11 Д! ха
ro ри
Рг1
pw дл ве го хр ного при просмотре блока 6 хранения чаний.
В блоке 29 алгоритма по команде
АПП:-1" происходит считывание очеого адреса из блока 12 хранения приов (фиг. 6).
В блоке 30 алгоритма по команде
П;=1" происходит подача сигнала разреия для приема информации в регистр 2 а 15 анализа морфологических приэнаПо команде "Рг2:=МП" (блок 30) проист загрузка в регистр 2 блока 15 анализа фологических признаков очередного фологического признака, В блоке 31 алгоритма по команде
-1" происходит подача сигнала разреия для записи информации в регистр 1 а 15 анализа морфологических признаПо команде Рг1;= Рг1 В Рг2" (блок 31) исходит загрузка в регистр 1 блока 15 лиза морфологических признаков инмации, в виде результата поразрядной ьюнкции (фиг. 10).
B блоке 32 алгоритма по команде
"1":=0" происходит подача на регистр 1 ка 15 анализа морфологических признаэапрещающего сигнала для приема инмации (режим хранения), По команде
РК:=RN" (блок 32) происходит передача рием информации из блока 15 анализа фологических признаков в блок 17 форования результата классификации. Зав блоке 33 алгоритма производится лиэ признака результата REZ. Если
2;=1" (это означает, что решение найдеднозначно и слово классифицируется по фологическому признаку), то в блоке 34 ритма по команде "БРС:=ПРС" входнолову в блоке 2 регистров слов, в специно отведенные для кода признака стры записывается двоичный код, намер, соответствующей части речи входо слова. Если "REZ:=0", то в блоке 35 оритма происходит анализ признака
0". Если "АПО=О", то осуществляется еход в блок 39 алгоритма. Если "АП0=1", в блоке 36- алгоритма по команде
B:=1" происходит подача на выходы С
-триггеров регистра 2 блока 5 анализа актеристического вектора разрешающеигнала для приема информации характетического вектора. По команде "Рг2=ВИ
" происходит прием информации характетического вектора разрешающего сигнала приема информации характеристического ора. Эта информация характеристическоектора получена после просмотра блока 6 нения окончаний.
В блоке 37 алгоритма по команде
В:-0" происходит подача на С входы."D"-триггеров регистра 2 блока 5 анализа характеристического вектора нулевого сигнала. При этом регистр переходит в состояние хранения полученной информации.
В блоке 38 по команде "СПП:-0" происходит запрет на выдачу информации иэ блока 6 хранения окончаний. Результат в этом случае еще не получен, поэтому необходимо перейти к просмотру блока 7 хранения основ для дальнейшего определения классификации слова. По команде "СПЬ:-1" происходит подача разрешающего сигнала на считывание информации из блока 7 хранения основ, т.е. разрешение на просмотр блока 7.
В блоке 39 алгоритма по команде "Стоп" происходит остановка устройства и анализ обрабатываемого слова, В блоке 40 алгоритма по команде "Конец" происходит конец работы устройства, что означает возможность перехода к анализу следующего слова.
Работа устройства для морфологического анализа слов естественных языков и языков "деловой прозы" заключается в следующем.
Внешние управляющие сигналы "Пуск" и "Сброс" поступают в блок 19 управления.
Из блока 19 управления в блок 6 хранения окончаний поступает управляющий сигнал
"СПП". По этому сигналу происходит начало работы устройства, Блок 6 хранения окончаний содержит постоянное запоминающее устройство (ПЗУ), счетчик адресов, схему И, генератор импульсов, D-триггер (фиг. 4). По приходе сигнала "СПП=1" прямоугольные импульсы генератора импульсов через схему И поступают на вход счетчика, который формирует адрес считывания из ПЗУ блок 6.
Сигнал "СПП=1" является разрешающим сигналом для считывания информации из
ПЗУ блока 6 хранения окончаний. Так же этот единичный сигнал установит О-триггер блока 6 хранения окончаний в единичное состояние (фиг. 4). Итак, по приходе сигнала
"СПП-1" из блока управления происходит считывание адреса первой группы символов из ПЗУ блока 6 хранения окончаний (фиг. 4).
В ПЗУ блока 6 хранения окончаний вначале (по первому адресу) записываются окончания, которые имеют максимальное количество букв. Затем записываются окончания, имеющие меньшую длину и т.д. floследнее окончание, которое будет записано в ПЗУ окончаний будет иметь минимальную длину, т.е. содержать одну букву. При этом все окончания будут предварительно разбиты на группу символов. В одну группу символов входит одно окончание, В конце группы в ПЗУ записывается единичная ин1837327
5
40
55 формация. Этот код нужен для того, чтобы определить конец группы символов. По приходу из блока 19 управления сигналов
"УОК-1" и "УОС-0" на вход коммутатора (фиг. 7) происходит коммутация выхода блока 6 хранения окончаний с входом блока 13 регистровой памяти. Блок 10 коммутатор содержит схемы И, схему ИЛИ. На информационные входы схем И1.1...И1.8 поступает информация из блока 6 хранения окончаний. Управляющим сигналом для этих схем
И является сигнал УОК(фиг. 7). На информационные входы схем Иг,1...Иг.э поступает информация из блока 7 хранения основ. Управляющим сигналом для этих И является сигнал УОС (фиг. 7), При "YOK=1" и "УОС=О" на выходе коммутатора будет информация, полученная из блока 6 хранения окончаний
"ДР:-ДОК" (фиг, 7). При "YOK-0" и "УОС=1" на выходе коммутатора будет информация, полученная из блока 7 хранения основ
"ДР;-ДОС" (фиг. 7).
Из блока 19 управления поступили сигналы "СПП=1", "УОК-1", "УОС=О", при этом из ПЗУ блока 6 хранения окончаний считывается первое окончание (фиг, 4) и поступает на вход блока 13 регистровой памяти.
Из блока 19 управления поступает управляющий сигнал ПРИЕМ1 в блок 13 регистровой памяти (фиг. 9). Блок 13 регистровой памяти содержит дешифратор
1 записи, дешифратор 2 выдачи, регистры общего назначения, мультиплексор, инвертор. По приходу сигнала ПРИЕМ1 дешифратор 1 записи организует очередь записи группы символов одного окончания или основы, подавая разрешающий сигнал на входы регистров общего назначения. Буква, которая вошла первой, выходит первой при считывании из блока 13 регистровой памяти. Адрес памяти при постановке в очередь задается блоком формирования адреса и блоком 13 регистровой памяти (фиг. 8). В первый регистр блока 13 регистровой памяти (фиг. 9) записывается последняя буква окончания или основы, во второй предпоследняя и тд. Считывание происходит побуквенно. Как только будет считана группа символов окончания (основы) в регистры общего назначения, дешифратор 2 выдачи, по приходу иэ блока 19 управления сигнала
В ЫДАЧА1 формирует адреса считывания из регистров общего назначения. Адреса поступают на управляющие входы мультиплексора. Согласно очереди считывания содержимое регистров общего назначения поочередно считывается в блок 16 регистров символьного вхождения (фиг. 11) побуквенно. Блок 19 управления формирует сигнал "Прием 2" в блок 16 регистров символьного вхождения, Блок 16 регистров символьного вхождения состоит иэ ключей приема КП, ключей выдачи КВ и регистра хранения символа (фиг. 11). Сигнал "Прием
2" поступает на входы ключей приема и тем самым отпирает их. Блок 19 управления формирует сигнал СИ2. Это синхроимпульсы, поступающие на С-входы триггеров регистра хранения символа. Символ, считанный из блока 13 регистровой памяти, через ключи приема и по заднему фронту синхроимпульсов, записывается в регистр хранения символа (фиг, 11).
Слова, с которыми производится морфологический анализ, находятся в блоке 1 памяти слов. Блок 1 памяти слов — это запоминающее устройство, которое имеет по каждому адресу запись длиной п*8, где n— длина обрабатываемого слова. ЗУ хранит все слова обрабатываемого текста (сложные слова декомпозируются на составные и анализируются независимо), на каждую букву отводится 8 бит.
По приходу из блока 19 управления сигнала CP (сигнала разрешения) из блока 1 памяти слов в блок 2 регистров слов считывается одно слово. Сигнал СР (сигнал разрешения) является сигналом разрешения для записи в блок 2 регистров слов при считывании слова из блока 1 памяти слов, он поступает одновременно из блока 19 управления, но через блок задержки; Па приходу сигнала
CP (сигнала разрешения) слово записывается следующим образом: — последняя буква слова записывается в первый регистр блока
2 регистров слое, предпоследняя буква слова записывается во второй регистр блока 2 регистров слов и т.д. В итоге в блоке 2 регистров слов входное слово записано в обратном порядке. Пример: входное слово
"необходимый" записано "йымидохбоен".
Блок 2 регистров слов состоит из статистических восьмиразрядных регистров. Все сигналы регистров разрешения записи соединены между собой и по приходу сигнала
СР (сигнала разрешения) все регистры готовы принять информацию из блока 1 памяти слов, В каждом регистре блока 2 регистров слов содержится одна буква. В блоке 2 регистров слов в один из, регистров записывается двоичный код "ПРС" — признак принадлежности к одному из классов частей речи "обрабатываемого слова", Информация из блока 2 регистров слов поступает в блок 3 поиска вхождений (фиг. 2). По приходу из блока 19 управления сигнала ВЫДАЧА2 в блок 16 регистра символьного вхождения на управляющие входы ключей выдачи (КВ) из блока 16 регистра символьного вхождения выдается одна буква окон17
1837327 ча
Бл ра ср бу во ка ни ст пр ра ле со
10 (ф
25
55 ги ка
19 ва ты пе та во но ко ед ча со (ф не ли бл сх (ф пи
P ри
19 на по ли
Бл ск ды эл эл ст сх ка хо
1-й не ци ве тр те вх оп а ре ия (основы) в блок 3 поиска вхождений. к 3 поиска вхождения состоит из компаоров (на равенство) букв. Происходит внение восьмиразрядного (байт) словавы, считанного из блока 16 регистра симьного вхождения, со всеми буквами, ая из которых представлена также одбайтом, поступившим из блока 2 региов слов. Если вхождение найдено, т.е. изошло совпадение, то формируется хатеристический вектор, состоящий из нуи одной или более единиц, тветствующих выходам компараторов г. 2).
Если совпадение буквы из блока 16 ретра символьного вхождения и буквы блорегистра слов не произошло то из блока управления по сигналу "Прием 1" считытся следующее окончание. Процесс счиания из блока 6 хранения окончаний и 20 едачи в блок 13 регистровой памяти, а же передачи в блок 16 регистров симьного вхождения происходит аналогичописанному выше. Все выходы параторов блока 3 поиска вхождения сонены с информационными входами клю4. Также выходы компараторов динены с входами схемы дизъюнкции г. 2). Выходы схемы дизъюнкции соедиы с управляющими входами ключа 4. Ес произошло хотя бы одно совпадение в ке 3 поиска вхождений, то на выходе мы дизъюнкции появляется единица г. 2). Этот единичный сигнал РРП, постуший на управляющие входы ключа 4 зрешит" запись получившегося характетического вектора в ключ 4 (фиг. 3). Блок управления сформирует единичный сиг, разрешающий сигнал СЗАЩ, который тупит на С-входы триггеров блока 5 анаа характеристического вектора (фиг. 3). к 5 анализа регистра характеристичего вектора состоит из D-триггеров. BxoD-триггеров соединены с выходами ментов ИЛИ этого блока. Один из входов ментов ИЛИ блока 5 анализа характерического вектора соединены с выходами м коньюнкции ключа 4. Вторые входы ого из элементов ИЛИ соединены с выами второй группы элементов И так, что
ыход второй группы элементов И соедисо входом 1+1 элементов ИЛИ (нумераидет по разрядам характеристического тора слева — направо). Прямые выходы Dггерав регистра 1 блока 5 анализа харакистического вектора соединены с дами второй группы элементов И для еделения сопряженности букв в блоке 5, кже соединены с D-входами триггеров истра 2 блока 5 анализа характеристического вектора. Последняя связь необходима для хранения информации характеристического вектора, полученного после просмотра блока 6 хранения окончаний и будет применена при определении сопряженности букв при просмотре блока 7 хранения основ, Регистр 2 блока 5 анализа характеристического вектора состоит из D-триггеров.
Прямые выходы D-триггеров регистра 2 соединены с информационными входами первой группы элементов И блока 5 анализа характеристического вектора. На управляющие входы первой группы элементов И подан сигнал РВ, поступающий из блока 19 управления. Выходы первой группы элементов И блока 5 соединены с третьими входами элементов ИЛИ блока 5 анализа характеристического вектора.
После приема характеристического вектора блоком 19 управления формируется сигнал СЗАЩ, равный нулю, и блок 5 анализа характеристического вектора переходит в режим "хранения". Блоком 19 управления формируется сигнал "Выдача 1" — считывания следующей буквы из блока 13 регистровой памяти, Процесс загрузки из блока 13 регистровой памяти в блок 16 регистров символьного вхождения очередной буквы окончания или основы аналогичен и описан выше. В блоке
3 поиска вхождения вторая считанная буква окончания или основы компарируется также со всеми буквами входного слова. Если произошло совпадение в одном компараторе блока 3 поиска вхождения, то сигнал РРП принимает значение единицы. На управляющие входы ключа 4 подается разрешающий сигнал. Характеристический вектор из блока 3 поиска вхождения подается на ключ
4. Регистр 1 характеристического вектора блока 5 при этом находится в режиме хранения, т.е. хранит первый характеристический вектор. На входы второй группы элементов
И блока 5 поступает первый характеристический вектор из регистра 1 блока 5 и второй (полученный) характеристический вектор из ключа 4. Если в одной из схем второй группы элементов И блока 5 на входе была получена единица (единичный выход сигнала схемы дизъюнкции 2 блока 5 анализа характеристического вектора), Единица на выходе одной из схем второй группы элементов И индицирует о том, что первая буква группы блока 16 регистров символьного вхождения и вторая буква окончания (основы) во входном слове 1 блока 2 регистров слов расположены рядом (фиг. 3). Если блок 6 хранения окончаний будет просмотрен, но результат не будет получен (т.е, однозначное определение части речи обрабатываемого слова), 1837327
5
30
40
50 то полученный в результате просмотра блока 6 хранения окончаний характеристический вектор, который хранится в регистре 1 блока 5 анализа характеристического вектора, будет передан на хранения в регистр 2 блока 5.