Система для работы с интеллектуальной электронной книгой - элингой
Иллюстрации
Показать всеИзобретение относится к компьютерным системам, использующим модели, основанные на знаниях, а именно к системам, синтезирующим интеллектуальные решения и новые знания по запросу пользователя. Техническим результатом является обеспечение ускоренного доступа к знаниям для массового пользователя. Указанный технический результат достигается прямым моделированием по предложениям и интеграцией знаний, находящихся в исходных текстах, без дублирования знаний. Попутно решается проблемы синонимов, омонимов, диалектных слов, фразеологизмов за счет предварительного моделирования знаний экспертом-редактором. С целью защиты базы знаний и машины логического вывода от несанкционированного копирования элинги используются специальное устройство считывания, механические изменения в машиночитаемом носителе, специальные изменения в каждой версии средств кодирования базы знаний и машины логического вывода. 8 з.п. ф-лы, 7 ил., 2 табл.
Реферат
1. Область техники, к которой относится изобретение
Изобретение относится к компьютерным системам, использующим модели, основанные на знаниях, а именно к системам, синтезирующим интеллектуальные решения и новые знания по запросу пользователя.
2. Уровень техники
1 аналог
Известна компьютерная система «Изобретающая машина» для решения изобретательских задач см. Конспект научно-практической конференции «Теория и практика обучения техническому творчеству», Миасс, 23-27 мая 1988 г. ПРОЕКТ "ИЗОБРЕТАЮЩАЯ МАШИНА". Современное состояние и реальные перспективы. В.М.Цуриков, 1988 г. Последний вариант системы известен как Invention Machine Goldfire. См. информационный буклет «Invention Machine Goldfire. Data sheet/». 2009).
Используется в компьютерной системе - компьютер - машиночитаемый носитель - программное средство (ПС) - пользователь для решения интеллектуальных задач для одного направления - решения технических задач. Представляет собой гибридную экспертную систему (ЭС) с использованием моделей знаний, объединенных в базу знаний, и имеющей машину логического вывода. Имеется возможность искать подходящие документы по запросам на основе семантического анализа, как в локальных базах данных (БД), так и в сети Интернет.
«Изобретающая машина» обладает знаниями (и выдает ответы), в своей части превосходящими знания наиболее квалифицированных специалистов. В ней содержатся мощные информационные базы - технических спецэффектов из разных областей знаний, каталог методов решения задач, используются некоторые расчетные модели, в частности, функционально-стоимостного анализа. Некоторые из этих баз построены с использованием моделей знаний, в частности семантических сетей, продукционных моделей и моделей «субъект - акция - объект» (САО-модели). Также применяются визуальные и графические образы - графики, изображения, чертежи для повышения эффективности работы, подключенные к некоторым моделям знаний.
Поставляется пользователю на стандартных машиночитаемых носителях, защищенных от копирования кодами доступа. Поскольку нет массовой продажи, нет необходимости в специальных устройствах чтения машиночитаемых носителей и специальных средствах для их защиты.
Традиционно подобные системы продаются на машиночитаемых носителях, которые для эксплуатации подключаются к компьютерам через устройства считывания. При работе ядро ПС считывается в компьютер и работа выполняется в оперативной памяти компьютера с подкачкой объемов информации с машиночитаемого носителя.
Недостатки системы заключаются в следующем:
- сфера применения узкоспециальная;
- ограниченные возможности получения новых знаний;
- имеются возможности несанкционированного копирования ПС и информации непосредственно из оперативной памяти компьютера;
- при обработке больших объемов информации происходят постоянные потери времени на подкачку информации с машиночитаемого носителя;
- кроме того, «Изобретающая машина» работает только в рамках технологии ТРИЗ (теория решения изобретательских задач) для нахождения новых технических решений на собственных информационных базах - базах знаний и БД;
- не предназначена для нахождения уже известных и отработанных технологий, поскольку для этих целей нужны иные базы знаний.
2 аналог
«Электронная книга» по заявке US 2008/0076103.
Компьютерная система состоит из портативного компьютера со стандартным набором устройств, в частности, дисплея (с применением двух экранов), устройства печати, устройств для воспроизведения звука, клавиатуры, центрального процессора с оперативной памятью, устройства считывания машиночитаемых носителей, машиночитаемых носителей с ядром ПС, которое управляет работой системы, переводчиком, и системой записи текстов на машиночитаемые носители и воспроизведения для пользователя, в т.ч. с переводом. При этом также запоминаются графические и визуальные образы совместно с текстом. Также применяется звуковой вариант воспроизведения. Тексты запоминаются в БД на машиночитаемом носителе в исходном формате.
Недостатки системы заключаются в следующем:
- поскольку текстовых документов много и число их постоянно растет, в т.ч. во многих узких предметных областях, знания в них дублируются, вплоть до простого дублирования исходных текстов, а технические возможности ограничены, то подобное устройство не решает проблему в принципе, лишь помогая немного пользователю, в частности, в дороге;
- проблема анализа исходных текстов и знаний, содержащихся в них, поиск связей между ними остаются полностью за пользователем;
- не может находить решения для пользователя, из анализа имеющихся больших информационных баз;
- не имеет особых специальных возможностей для защиты информационных баз на машиночитаемом носителе.
3 аналог, который является прототипом.
К предлагаемому изобретению наиболее близка система семантического анализа и отбора документов со способностью получения знаний, «DOCUMENT SEMANTIC ANALYSIS/SELECTION WITH KNOWLEDGE CREATIVITY CAPABILITY», пат. US 2001/0014852. Система состоит из компьютера, машиночитаемого носителя знаний, устройства считывания, средства связи с локальными сетями и Интернет и машины логического вывода в виде отдельного семантического процессора. Последний включает блок подготовки текстов для моделирования, блок получения анализируемых САО-структур, блок синтеза ключевых слов/фраз для рефератов на естественном языке, блок синтеза рефератов, а также, блок базы знаний для САО-структур, блок БД исходных текстов, блок БД обобщений текстов на естественном языке, блок БД новых концептов на естественном языке, блок БД ключевых слов и фраз для рефератов.
Пользователь, используя принятые термины, вводит в систему запросы с клавиатуры компьютера. Система моделирует запросы пользователя в виде САО-структур с выделением ключевых слов и фраз, на основе которых в локальных БД и Интернет подбирает подходящие исходные тексты-кандидаты. В текстах-кандидатах также выделяются САО-структуры. Если они соответствуют САО-структурам запросов пользователя, то тексты-кандидаты запоминаются для просмотра в БД текстов на естественном языке. Тексты-кандидаты, не имеющие запрашиваемых САО-структур, удаляются. На основе наиболее частых ключевых слов, фраз и грамматических правил составляются рефераты отобранных текстов. Имеется возможность синтеза новых концептов знаний на основе синтеза подобранных САО-структур с учетом словарей синонимов компонентов САО-структур.
Недостатки последней системы заключаются в следующем:
- при каждом запросе пользователя система последовательно рассматривает весь объем доступных текстов во внешних и внутренних сетях, без исключения повторов или весьма похожих источников. Последовательный перебор всех текстов требует значительных затрат машинного времени;
- возможности системы ограничены доступными источниками, а в ряде областей знаний тексты на бумажных носителях слишком велики, засекречены или продаются по высокой цене;
- разбиение предложений исходных текстов на САО-структуры приводит к разрыву весьма сложных семантических структур, которые присутствуют внутри предложений и разделов текста. Попытка нового синтеза на их основе приведет во многих случаях к утере исходного семантического смысла;
- система удовлетворительно синтезирует рефераты, но синтез новых концептов знания достигается лишь в редких случаях;
- при получении САО-структур не решается задача выделения синонимов, фразеологизмов, метафор, профессиональных и заимствованные слов, неологизмов, диалектизмов, архаизмов, которые также имеют семантический смысл;
- отсутствует оценка уровня соответствия удаляемых текстов-кандидатов. Достаточно одного не очень удачного или нового термина, и исходный текст, содержащий необходимую информацию, будет снят с рассмотрения;
- система применяется только подготовленным экспертом-пользователем. Корректность САО-структур и достоверность рефератов, подготовленных без участия эксперта, остается неподтвержденной.
3. Раскрытие изобретения
Настоящее изобретение решает задачу предварительной систематизации знаний и данных на специальном машиночитаемом носителе, выполненном в виде интеллектуальной электронной книги-элинги. Интеллектуальная электронная книга-элинга готовится группой экспертов-редакторов в отдельной области знаний, на основе опубликованных печатных изданий, а также других достоверных источников информации. В отличие от печатных изданий и их электронных версий, интеллектуальная электронная книга-элинга читается только в компьютерной системе, способна распознавать вопросы пользователя и синтезировать достоверные ответы, которые могут не содержаться в исходных источниках. Для интеллектуальной электронной книги-элинги, располагающих такими возможностями, в тексте далее применяется термин «элинга». Изобретение также решает задачу повышения эффективности семантического анализа, повышения достоверности результатов, улучшения зашиты элинг от незаконного копирования, а также повышения скорости нахождения обоснованных решений.
Технический результат от использования изобретения заключается в создании и использовании - элинги, как доступного продукта массового спроса, содержащего систематизированные знания и способного формулировать новые знания по запросам пользователей. Централизованное создание и тиражирование элинг обеспечивает их умеренную стоимость и доступность широкому кругу пользователей.
Изобретение реализуется компьютерной системой (фиг.1), которая состоит из компьютера 1, связанного с устройством считывания элинги 2, имеющей разъем 3. Пользователь 4 имеет доступ к элинге и результатам работы с ней через технические возможности компьютера 1.
Машиночитаемый носитель 5 с элингой подключается к устройству считывания элинги через свой разъем 6 (фиг.2).
На машиночитаемом носителе 5 находятся шифратор/дешифратор 7, блок распределения заданий 8, блок машины логического вывода 9, блок базы знаний 10, блок ввода знаний 11, блок БД словарей 12 (здесь содержатся словари терминов, отношений, качественных признаков, количественных признаков, лингвистических и логических связей (все с их синонимами), вместе со словарем введенных исходных текстов), блок расчетных моделей 13, блок графических и визуальных образов 14, блока рабочей части диалога 15, блока сохраненной части диалога 16.
Физически элинга представят собой машиночитаемый носитель 5 с блоками, реализованными на базе электронных компонентов. Функционирует только в рамках компьютерной системы на базе компьютер 1 для работы с машиночитаемым носителем 5 с элингой..
Базовые режимы работы элинги 17 представлены на фиг.3. Основные два - режим ввода знаний 18 и режим рабочий 19. В состав рабочих режимов 19 входят режим вывода текстов 20, режим работы с диалогом 21 и режим логического вывода 22. В свою очередь, в режим вывода текстов 20 входят режим вывода исходных текстов 23 и режим когезии 24.
В режиме работы с диалогом 21 возможен также переход к режимам вывода исходных текстов 23 и режиму когезии 24.
Режим ввода знаний 18 резко отличается от прототипа. В прототипе он один из текущих оперативных режимов работы компьютерной системы. В настоящем изобретении ввод знаний резко отделен от оперативной работы пользователя 4. Ввод знаний в режиме ввода знаний 18 производит, как минимум, один (может быть более) подготовленный эксперт-редактор 4, который у производителя элинги заполняет блок базы знаний достаточно долго, но качественно,
А оперативная работа пользователя 4 уже происходит быстро без дополнительных потерь времени на преобразование исходных текстов, баз знаний, поиска исходных текстов во внешних БД и каких-то их отборов, как в прототипе. А именно скорость в оперативной работе и качественный результат одно из главный требований пользователя к компьютерной системе, в т.ч. при работе со знаниями.
Режим ввода знаний 18 происходит через блок ввода знаний 11 в блок базы знаний 10, блок БД словарей 12, блок расчетных моделей 13, блок графических и визуальных образов 14.
Сам ввод знаний в элингу в режиме ввода знаний 18 производится экспертом-редактором 4 следующим образом. Имеется множество специально подобранных исходных текстов определенной предметной области, они разбиваются на простые предложения преимущественно длиной 3-15 слова. Это простые предложения превращаются в специальные модели знаний - молинги, имеющие следующую структуру (табл.1)
Табл.1 | |||||
Код 1 | Код 2 | Код 3 | Код 4 | Код 5 | Код 6 |
Множество идентификаторов простых предложений | Условие применимости ядра молинги | Ядро молинги | Последовательность номеров словарей | Уровень достоверности молинг | Постусловия молинги |
Они не только ускоряют и упрощают моделирование знаний из исходных текстов, в частности, по сравнению с САО-структурами у прототипа, но и значительно упрощают получение результатов логического вывода для элинги, позволяя выдавать пользователю 4 связный осмысленный текст, весьма удобный для чтения и понимания.
Код 1 - это множество идентификаторов, с помощью которого данная молинга выделяется из всего множества молинг, хотя для некоторых молинг они могут быть и одинаковы (поскольку находятся в одном абзаце исходного текста). В качестве идентификатора выступает составной номер, включающий номер ссылки на текст в словаре исходных текстов (обозначим код 1.1), номер главы (код 1.2), номер параграфа внутри конкретной главы (код 1.3) и номер абзаца внутри конкретного параграфа (где молинга находится - код 1.4). Заголовок параграфа имеет код абзаца, равный нулю. Каждый идентификатор молинги, в целом, имеет вид - код 1.1. код 1.2. код 1.3. код 1.4.
Указываются все идентификаторы для этой молинги всех исходных текстов (или разделы внутри них), где встречались одинаковые знания.
Код 2 - это условие применимости ядра молинги. Обычно представляет собой логическое выражение. Когда оно принимает значение «истина», ядро молинги активизируется.
Код 3 - основной элемент молинги - ядро молинги. Ядро молинги вводится после обработки экспертом-редактором простых и сложных предложений (которые превращает в простые) исходных текстов. При вводе ядер молинг выявляются и вводятся в состав словаря терминов (обозначаемый 1), находящегося в блоке БД словарей 12, - все термины, их синонимы, фразеологизмы, метафоры, профессиональные слова, заимствованные слова, неологизмы, диалектизмы, архаизмы. В молинги вводятся, в основном, базовое значение терминов (определяемое экспертом-редактором). Соответственно таким же образом при вводе ядер молинг выявляются и вводятся в состав словаря отношений (обозначаемый 2), находящегося в блоке БД словарей 12, - все отношения с их синонимами. Так же при вводе ядер молинг выявляются и вводятся в состав словаря качественных признаков (обозначаемый 3), находящегося в блоке БД словарей 12, - все качественные признаки с их синонимами, в состав словаря количественных признаков (обозначаемый 4), находящегося в блоке БД словарей 12, - все количественные признаки с их синонимами, в состав словаря лингвистических и логических связей (обозначаемый 5), находящегося в блоке БД словарей 12, - все лингвистические и логические связи с их синонимами.
В коде 4 указаны последовательность номеров словарей, фиксирующих положение слов и элементов простых предложений в ядре молинги последовательностью номеров словарей терминов, отношений, качественных признаков, количественных признаков или лингвистических и логических связей.
В коде 5 указываются уровни достоверности молинг в виде факторов уверенности, впервые примененных в ЭС MYCIN.
В коде 6 описываются постусловия молинги. Они актуализируются только в том случае, если ядро молинги реализовалось, в т.ч. и ничего не делать (если код 6 равен нулю). Постусловия молинги описывают действия и процедуры, которые необходимо выполнить после реализации ядра молинги. В их числе может быть - переход к другой молинге, ввод в действие расчетных моделей, введенных в блок расчетных моделей 13, или актуализация визуальных или графических образов из блока визульных и графических образов 14.
Фиксация элементов ядра молинги последовательностью номеров словарей, фиксирующих положение слов и элементов простых предложений, означает фиксацию представления ядра молинги в виде короткой семантический сети. В результате блок базы знаний 10 содержит огромный набор коротких семантических сетей.
Далее процедура происходит в соответствии с фиг.4.
Имеются, например, исходные тексты 1, 2, …, n - блоки 25, 26, 27, которые предполагается ввести в блок БЗ 10 элинги. Ввод производится в рамках компьютерной системы, представленной на фиг.1. Тексты разбиваются на простые предложения и привязанные к ним расчетные модели и визуальные, и графические образы. Простые предложения превращаются в молинги, а тексты в модели текстов (фиг.4, блоки - 28, 29, 30), с кодированием порядка элементов в ядрах молинг с занесением соответствующих элементов в блок БД словарей 12, если они или их синонимы в словарях отсутствуют. При моделировании эксперт-редактор задает значение уровня достоверности в виде фактора уверенности со значениями в пределах от -1 (совершенно недостоверная) до +1 (полностью достоверная).
Расчетные модели (запрограммированные стандартным образом или реализуемые с использованием уже разработанных ПС, находящихся в блоке расчетных моделей 13 или в оперативной памяти компьютера 1) и визуальные, и графические образы привязываются в качестве постусловий к молингам и заносятся непосредственно соответственно в блок расчетных моделей 13 и блок визуальных и графических образов 14.
На фиг.4 показано на первом этапе в исходных текстах 1, 2, …, n (блоки 25, 26, 27) по 6 простых предложений. На втором этапе (блоки 28, 29, 30) после моделирования в модели текста 1 (блок 28) - 6 молинг, а во второй группе моделей текста 2, …, n (блоки 29, 30) уже по пять. Это связано с тем, что если предложения или их синонимические представления являются повторами и находятся в том же абзаце, то они повторно не вводятся. Также не вводятся предложения, которые с точки зрения эксперта-редактора 4 не имеют значения для ввода.
Затем молинги (с их базовыми идентификаторами, определяющие их положение в исходном тексте) вводятся в базу знаний элинги, находящейся в блоке базы знаний 10 по порядку ввода исходных текстов, определяемого экспертом-редактором 4. Если ядра молинг одинаковы или синонимичны той молинге, которая уже находится в блоке БЗ 10, то добавляется ее идентификатор во множество идентификаторов данной молинги. Подобное построение БЗ обеспечивает декларативный подход к моделям знаний. На первом этапе в исходных текстах на фиг.3 было 18 простых предложений, в блоке БЗ 10 их уже всего восемь.
Известно - знания в исходных текстах повторяются. При вводе знаний в виде моделей знаний в блок базы знаний элинги 10 делаются пометки (идентификаторы), из какого исходного текста ввод. Повторение знаний, имеющихся в базе знаний, повышает их достоверность (пометки дублированных знаний из разных источников в виде набора идентификаторов сохраняются). А то, чего нет, - вводится и увеличивает объем базы знаний. Т.е. с каждым новым исходным текстом база знаний представляет собой новую версию, монотонно возрастающую в объеме.
Т.е. база знаний элинги представляет собой постепенно увеличивающуюся «паутину» - все более расширяющуюся и сгущающуюся в местах «горбов» знаний, где они или полностью оказываются дублированными (указывается только еще один их новый идентификатор), или все более уточняют эту фокусную область знаний конкретной предметной области. Этот и есть «эффект гребня»
Такое построение базы знаний обеспечивает возможность вывода необходимого источника в виде, близком к исходному тексту, достаточно задать номер исходного текста из словаря введенных исходных текстов.
Режим логического вывода 22 реализуется машиной логического вывода 9 с участием блока базы знаний 10 и блока рабочей части диалога 11, - приведен на фиг.5.
Машина логического вывода 9 выполняет две функции:
- просмотр существующих фактов (у нас - терминов) из рабочей памяти 31 машины логического вывода 9 и молинг из блока базы знаний 10 и добавление (при возможности) в рабочую память 31 новых терминов (для вывода);
- определение порядка просмотра и применения молинг. Этот механизм управляет процессом вывода, сохраняя для пользователя информацию о полученных заключениях в блоке рабочей части диалога 15.
Логический вывод основан на правиле modus ponens, - «если известно, что истинно утверждение А и истинно правило вида «ЕСЛИ А, ТО В», тогда утверждение В также истинно». Применительно к молингам, которые представимы короткой семантической сетью в виде связанного графа (где вершинами являются термины из блока БД словарей 12), оно имеет вид, - «если имеет место определенный уровень истинности утверждения (термина) А и существует цепь в молинге, связывающая А с утверждением (термином) В, то имеет место определенный уровень истинности (достоверности) утверждения (термина) В». Этот уровень достоверности определяется уровнем достоверности (код 5) молинги.
Пример вывода показан на фиг.6. Предположим, пользователь задал запрос - найти связь между двумя разными терминами - термин 1 и термин 9. Ищется на основе прямого вывода с ограниченным перебором (с количеством промежуточных терминов не более шести). Вводится вначале исходный термин 1, ищется какая-то первая молинга с ядром молинги, где есть термин 1 (или его синоним) и термин 9 (или его синоним) одновременно. Если находится, то вводится в блок рабочей части диалога 15, где выстраиваются по мере уменьшения уровня достоверности найденных молинг. Если не находится, ищется некая (i-я) молинга с термином 1 с самым высоким уровнем достоверности и есть другие термины. Молинга срабатывает и выбираются другие термины, находящиеся в молинге для дальнейшего поиска, - это термины - термин 2 и термин 3. Вначале ищется цепочка связи с термином 9 по первому термину 2 (и его синониму), выбирается (i+k)-я молинга, в ней ищется следующий ближайший термин - термин 6. Ищется следующая молинга, имеющая термин 6 (или его синоним) и термин 9, и она находится (i+k+r)-я молинга. Результат вывода - последовательность молинг с порядковыми номерами (i), (i+k) (i+k+r) помещается блок рабочей части диалога 15.
Машина логического вывода должна функционировать даже при недостатке информации. Полученное решение может и не быть точным, однако система не должна останавливаться из-за того, что отсутствует какая-либо часть входной информации.
Машина логического вывода определяет порядок применения правил и выполняет четыре функции (см. фиг.5.).
1. Сопоставление (блок программы 32 машины логического вывода 9) - выбранная молинга сопоставляется с имеющимися терминами, выбранные поступают в конфликтное множество - блок программы 33.
2. Выбор (блок программы 34) - если в конкретной ситуации может быть применено сразу несколько молинг, то из них выбирается одна, наиболее подходящая по заданному критерию выбора молинг (блок программы 35), и происходит разрешение конфликта. Этим критерием является более высокий уровень достоверности и при равных величинах - первая по порядку.
3. Срабатывание (блок программы 36) - если молинга при сопоставлении совпала с какими-либо терминами из блока рабочей части диалога 15, то молинга срабатывает.
4. Действие (блок программы 37) - блок рабочей части диалога 15 подвергается изменению путем добавления в него сработавшей молинги и новых терминов для дальнейшего вывода. Если в правой части молинги содержится указание на какое-либо действие - постусловие, то оно выполняется.
Машина логического вывода 9 циклична. В каждом цикле просматриваются молинги, чтобы выявить те, где термины совпадают с известными на данный момент терминами из блока рабочей памяти 31 (кроме уже просмотренных). После выбора (блок программы 34) молинга срабатывает, и новый термин заносится в блок рабочей части диалога 15 для дальнейшего вывода, и цикл повторяется.
В одном цикле может сработать только одна молинга. Если несколько молинг успешно сопоставлены с терминами, то машина логического вывода 9 производит выбор по заданным критериям единственной молинги, которая срабатывает в данном цикле.
В режиме работы с диалогом 21, реализуемым блоком рабочей части диалога 15, всю необходимую информацию выдают пользователю 4 через компьютер 1. Пользователю 4 поступают по группам все последовательности логического вывода ядер молинг с номерами (i), (i+k), (i+k+r) разной длины в порядке убывания уровня достоверности (код 5) при заданном запросе для вывода на основе термин 1 - термин 9.
Уровень достоверности последовательности молинг упосл рассчитывается следующим образом.
Пусть
yi - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для начальной i-й молинги (где 1≤i≤n);
yi+k - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой промежуточной i+k-й молинги (где 1<k<n);
yi+k+r - уровень достоверности в виде фактора уверенности в пределах от -1 до 1 для некоторой конечной i+k+r-й молинги (где i+k<r<n - (i+k)). Тогда
Если какое-то из значений yi, yi+k, yi+k+r окажется ≤0, то и все значение yпосл указывается сразу равным=0 без дальнейшего расчета.
Пользователь, читая последовательность этих ядер молинг, а фактически это группы последовательностей простых предложений, семантически связанных между собой, сам решает, удовлетворяет его этот результат - текст или нет. Выбирает необходимую ему группу (или группы) и фиксирует ее (или их) в блок сохраненной части диалога (вместе с терминами запроса) 16, вместе с со всеми результатами постусловий при запуске расчетных моделей из блока расчетных моделей 13 или визуальных и графических образов из блока визуальных и графических образов 14. Если ответ его полностью не устраивает, пользователь имеет возможность или снова повторить логический вывод (режим логического вывода 22) с новыми вариантами запроса (с новыми терминами для логического вывода) или по какому-то ядру молинги запустить режим когезии 24 (локальной связанности текста относительного конкретного исходного текста (одного из используемых для конкретной молинги идентификаторов исходного текста, соответствует абзацу исходного текста) на небольшом расстоянии от исходного предложения) или когерентности (глобальной связанности текста через одинаковые термины (заголовки), относительного конкретного упомянутого и выбранного исходного текста из нескольких идентификаторов),
Режим когезии 24 обеспечивает вывод в блок рабочей части диалога 15 из блока базы знаний 10 последовательностей ядер молинг, имеющих, как минимум, один идентификатор, соответствующий заданному пользователем (через представленный ему перечню исходных текстов, их глав, параграфов из словаря введенных исходных текстов из блока БД словарей 12). Вывод ядер молинг в режиме когезии при одинаковом идентификаторе соответствует выводу абзаца исходного текста (блоки 25 или 26 или 27). Запрос пользователя о выводе всего исходного текста, соответствующего интересующему его ядра молинги (простого предложения) соответствует использованию эффекта когерентности исходного текста или режима вывода исходного текста 23. Объем может задаваться пользователем 4 - или в объеме параграфа, или в объеме главы, или в объеме всего исходного текста со всеми главами и параграфами.
Весь необходимый пользователю текст, который оказался необходим пользователю и полученный им в режиме работы с диалогом 21 в блоке рабочая часть диалога 15, может быть сохранен пользователем в блоке сохраненной части диалога 16. Причем блоки исходного текста (в виде последовательностей ядер молинг), полученные в режиме когезии 24, могут непосредственно в блоке сохраненной части диалога 16 запоминаться, а также полученные в режиме вывода исходных текстов (обеспечения когерентности) 23, только с указанием выделенных пользователем необходимых идентификаторов.
В дальнейшем при работе пользователя с блоком сохраненной части диалога 16 необходимые последовательности ядер молинг будут подгружаться в блок сохраненной части диалога 16 из блока базы знаний 10, также как и необходимые расчетные модели из блока 13 и визуальные, и графические образы - блок 14. Соответственно, все это будет выводиться по запросу пользователя в компьютер 1 для пользователя.
Режим вывода текстов 23 может задаваться пользователем через блок распределения заданий 8. Последний активизирует блок рабочей части диалога 15 и по запросу пользователя производится вывод из блока базы знаний 10 тех или иных исходных текстов в виде последовательности ядер молинг по подобранным идентификаторам, начиная с одинакового номера ссылки в словаре исходных текстов в коде 1. Все это передается в компьютер 1 для пользователя.
Подробнее программная реализация режима вывода текстов 23 и режима когезии 24 в машине логического вывода 9 рассмотрены на фиг.7.
В режиме когезии 24 пользователь при работе с результатами, выдаваемыми элингой в блок рабочей части диалога 15, может выбрать интересующее его простое предложение (ядро некоторой молинги) и для уточнения выбрать поясняющий абзац, выбрав один из идентификаторов молинги, в виде - код 1.1. код 1.2. код 1.3. код 1.4. Он поступает в машину логического вывода 9 в блок программы 38, а из него в блок программы 39, который ищет все молинги, находящиеся в блоке базы знаний 10 с заданным идентификатором. Если молинга найдена, то блоком программы 40 копия молинги отправляется в блок рабочей части диалога 15, если "нет" - проверяется блоком программы 41, все ли просмотрено. Если "нет", просмотр продолжается, если "да", то проверяют в блоке программы 42 - это был запущен режим когезии 24 или нет. Если "да", то сообщают в блок рабочей части диалога 15, что задание выполнено.
Если "нет", то - машина логического вывода 9 инициирована или блоком распределения заданий 8, или блоком рабочей части диалога 15 (в обоих случаях пользователем) в режиме вывода исходных текстов 23.
Режим вывода исходных текстов 23 задается или из блока распределения заданий 8, или блока рабочей части диалога 15. В блок программы 43 машины логического вывода 9 в виде запроса текста, который надо вывести - код 1.1.x.x.x, т.е. надо вывести весь текст, близкий к исходному тексту, который содержится в блоке БЗ 10 в форме молинг. Код 1.1 соответствует номеру исходного текста из словаря исходных текстов, который находится в блоке БД словарей 12. Возможны варианты задания в виде код 1.1. код 1.2.х.х, когда задается вывод только конкретной главы конкретного исходного текста, и код 1.1. код 1.2. код 1.3.х - когда задается вывод только конкретного параграфа конкретной главы.
Поиск молинг начинается с задания поиска главы с номером 1 в виде задания
код 1.1.х.х.х=код 1.1.1.х.х.
Задается начальный код параграфа, который ищется с номером 1 в виде код 1.1.х.код 1.3..х=код 1.1.x.1.x
в блоке программы 45.
Далее задается начальный номер абзаца с номером 0 (это - заголовок) в начальном параграфе начальной главы в блоке программы 46 в виде код 1.1.х.х.х=код 1.1.х.х.0.
И затем начинается поиск молинг для 0-го абзаца. Дальше все проходит, как и в режиме когезии 24. Если в блоке программы 42 идет выход "нет", то происходит переход к блоку программы 47, в котором определяется, все ли абзацы в параграфе просмотрены. Если выход блока программы 47 - "нет", то в блоке 48 увеличивается номер кода для поиска нового абзаца
код 1.1.х.х.код 1.4=код 1.1.х.х. (код 1.4+1).
Если в качестве выхода блока программы 47 используется "да", то идет переход к блоку программы 49. При этом проверяются, все ли номера параграфов просмотрены, если "нет", то идет присвоение нового номера параграфа в блоке программы 50 в виде
код 1.1.х.код 1.3.х=код 1.1.х.(код 1.3+1).х
и далее по циклу.
Если в блоке программы 49 был выход "да", то означает, что просмотрены все параграфы заданной главы заданного исходного текста и идет переход к блоку программы 51. Если из него выход "нет", т.е. не просмотрены все главы заданного исходного текста, то номер главы в блоке программы 52 увеличивается
код 1.1. код 1.2.х.х=код 1.1.(код 1.2+1).х.х.
Если выход из блока программы 51 "да", то это означает, что все молинги данного номера текста с кодом код 1.1. выбраны и отправлены в блок рабочей части диалога 15. При этом происходит возврат к блокам распределения заданий 8 или блоку рабочей части диалога 15 с сообщением, что задание по блоку 43 закончено.
Для снижения опасности копирования элинг и времени реакции на задаваемые вопросы (в процессе эксплуатации) используется специальное устройство считывания эллинг 2 для запуска машиночитаемых носителей 5 с элингами и специальные методы защиты машиночитаемых носителей, - как механическим путем, программным, так и организационным.
А именно:
- с целью затруднения копирования, - машиночитаемый носитель 5 имеет механические изменения, препятствующие его считыванию на иных устройствах считывания (отличных от устройств считывания 2) - разъемы 3, 6 имеют размеры, отличные от стандартных;
- все содержимое блоков на машиночитаемом носителе 5 с каждой новой версией шифруется с использованием блоков шифратор/дешифратор 7, препятствуя считыванию элинг, в т.ч. на иных устройствах считывания, отличных от устройств считывания 2;
- набор молинг в блоке базы знаний 10 каждой новой версии имеет небольшие изменения, препятствующие работе со старой машиной логического вывода 9, в частности, изменяются разделители кодов молинг и их последовательность;
- машина логического вывода 9 каждой новой версии имеет небольшие изменения, препятствующие работе с наборами молинг в старых базах знаний, в частности, в новой версии машины логического вывода 9, в блоке рабочей части диалога 15, в блоке сохраненной части диалога 16 изменены элементы работы с блоком базы знаний 10 в связи с новыми разделителями кодов молинг и их последовательностью.
Итак, основные отличия от прототипа:
- иная техническая реализация поставленных целей, в частности, совсем иная реализация машиночитаемого носителя и его роль;
- использование объединенной базы знаний текстов, причем специально отобранных, обеспечивает более качественный отбор знаний, меньший объем объединенной базы знаний (по сравнению с традиционными системами управления знаниями), что затем приводит к резкому ускорению нахождения решений даже того же уровня и возможности «свободного плавания» по предметному «морю» знаний (объединенной базе знаний), что практически невозможно у прототипа;
- использование в качестве моделей знаний молинг приводит, по сравнению с САО-структурами, к намного более точному отражению семантики знаний уже на уровне предложений, ликвидации проблем синтеза на уровне предложений и возможности применения намного более простых и более быстродействующих методов синтезов текстов, в т.ч. реального синтеза текстов, близких к исходным текстам, что фактически на базе САО-структур в удовлетворительном варианте реализовать нельзя;
- жесткое разделение на режимы ввода знаний 18 и рабочий режим 19, причем в режиме ввода знаний 18 производителем элинг возможно медленное (казалось бы, но качественное и множеством экспертов-редакторов, причем даже параллельно) заполнение объединенной базы знаний, но в рабочем режиме 19 намного более быстрое нахождение результатов по уже находящейся в элинге объединенной базы знаний (в т.ч. не надо потерь времени на каналы передачи информации по Интернету и внутри компьютерной системы);
- более качественное нахождение результатов логического вывода, поскольку ядра молинг по сравнению с САО-структурами более качественно отражают семантическую сущность используемых элементов знаний.
Более конкретно ниже.
Основными существенными признаками являются нижеследующие.
Система для работы с интеллектуальной электронной книгой - элингой - носителем знаний, состоящая из компьютера 1, устройства считывания эллинги 2 и машиночитаемого носителя 5, соединяемые через разъемы 3, 6, ПС компьютера для подключения машиночитаемого носителя 5, с машиной логическ