Система сопоставления нормативно-справочной информации
Иллюстрации
Показать всеИзобретение относится к системе сопоставления нормативно-справочной информации. Технический результат заключается в автоматизации сопоставления нормативно-справочной информации различных информационных систем. Система содержит блок ввода информации, блок индикации, блок контроля загружаемой информации, блок сопоставления данных нормативно-справочной информации, блок справочных данных, блок администрирования системы нормативно-справочной информации, блок внутреннего хранилища данных, блок взаимодействия с источниками данных, при этом блок сопоставления данных нормативно-справочной информации выполнен с возможностью автоматического определения соответствий между кодами справочников нормативно-справочной информации на основе лексико-синтаксического анализа. 1 ил.
Реферат
Система сопоставления нормативно-справочной информации
Система сопоставления нормативно-справочной информации предназначена для решения задач сопоставления справочников между программными комплексами, используемыми на предприятии.
Изобретение относится к области вычислительной техники, а именно к информационным системам интеграционных решений и сопоставления нормативно-справочной информации.
В большинстве систем сопоставления нормативно-справочной информации реализован лишь функционал по ручному сопоставлению данных с условием установки на компьютере пользователя дополнительного программного обеспечения. В рассматриваемой системе, помимо ручного сопоставления, реализован функционал по выводу рекомендаций по итогам автоматического сопоставления справочников внешних систем. Кроме этого для работы с данной системой не требуется установка дополнительного программного обеспечения, достаточно наличие стандартного браузера. Под выводом рекомендаций подразумевается автоматический подбор сопоставлений между справочниками, наиболее подходящих по значению.
В качестве прототипа выбрана «Система геоинформационной базы данных» (патент РФ на полезную модель №116663). Система, содержащая близкие по своему функциональному назначению блок ввода информации, блок индикации, блок контроля вводимой информации, блок сопоставления информации, блок справочных данных направлена на обеспечение оператора информационных систем возможностью контролировать вводимую информацию и сопоставлять ее с информацией, занесенной в базу данных ранее. Недостатком данной системы является отсутствие возможности получения и автоматического сопоставления нормативно-справочной информации из различных информационных ресурсов, представляемых базами данных и вебсервисами. Также существенным недостатком является отсутствие удаленного web-интерфейса пользователя, позволяющего работать с системой из любого места, имеющего доступ к сетям интранет или интернет, без необходимости установки дополнительного программного обеспечения.
Система сопоставления нормативно-справочной информации предназначена для решения распространенной при организации обмена данными проблемы преобразования различных кодов одних и тех же показателей, формируемых в различных информационных системах.
Технический результат изобретения - автоматизация сопоставления нормативно-справочной информации различных информационных систем пользователем без участия разработчика системы и дополнительных требований к программному обеспечению, установленному на компьютере пользователя, за исключением наличия браузера.
Задача предлагаемого изобретения состоит в том, что для решения проблемы преобразования нормативно-справочной информации (НСИ) в передаваемых данных была разработана система сопоставления НСИ, имеющая web-интерфейс и предоставляющая возможности загрузки и репликации справочных данных с различных источников информации, с наиболее распространенными интерфейсами взаимодействия. Система также направлена на определение соответствия между кодами справочников НСИ как в ручном, так и в автоматическом режиме на основе лексико-синтаксического анализа.
Поставленная задача достигается тем, что система сопоставления нормативно-справочной информации включающая блок ввода информации, блок индикации, блок контроля загружаемой информации, блок сопоставления данных нормативно-справочной информации, блок справочных данных, согласно изобретению дополнительно включает блок администрирования системы нормативно-справочной информации, блок внутреннего хранилища данных, блок взаимодействия с источниками данных, при этом блок ввода информации двусторонними связями соединен с блоком индикации, блоком сопоставления данных нормативно-справочной информации, блоком администрирования системы нормативно-справочной информации, блоком внутреннего хранилища данных, блоком взаимодействия с источниками данных, а блок справочных данных односторонней связью соединен с блоком взаимодействия с источниками данных, блок взаимодействия с источниками данных односторонней связью соединен с блоком контроля загружаемой информации, блок контроля загружаемой информации односторонней связью соединен с блоком внутреннего хранилища данных, блок внутреннего хранилища данных односторонней связью соединен с блоком администрирования системы нормативно-справочной информации, блок администрирования системы нормативно-справочной информации односторонней связью соединен с блоком сопоставления данных нормативно-справочной информации, причем блок сопоставления данных нормативно-справочной информации выполнен с возможностью автоматического определения соответствий между кодами справочников нормативно-справочной информации лексико-синтаксического анализа.
Система реализована с использованием трехзвенной архитектуры.
Хранение конфигурационных данных блоков программного комплекса реализовано на СУБД Oracle 1 lg (допустимо использование версий 9i, 10g или 12с).
В качестве сервера приложений используется IBM WebSphere Portal (допустима замена на Apache Tomcat, glassfish или любой сервер приложений, содержащий контейнер сервлетов).
Модуль визуализации реализован для выполнения в браузерах Google Chrome и Internet Explorer.
Описанная система представлена на фиг. 1 и состоит из следующих модулей:
1. Блок ввода информации,
2. Блок индикации,
3. Блок контроля загружаемой информации,
4. Блок сопоставления данных нормативно-справочной информации (НСИ),
5. Блок справочных данных,
6. Блок администрирования системы нормативно-справочной информации (С-НСИ),
7. Блок внутреннего хранилища данных,
8. Блок взаимодействия с источниками данных.
Блок ввода информации 1 системы представляет собой web-модуль, предоставляющий возможность пользователям через единый web-интерфейс производить операции по администрированию С-НСИ и проставлению соответствий через соответствующие блоки системы.
Блок индикации 2 является портальной web-платформой, на которой размещается блок ввода информации, и представляет из себя сервер приложений с функционалом авторизации и разграничения доступа к web-приложению
В Блоке контроля загружаемой информации 3 содержится бизнес-логика обработки данных, представляющей собой набор реализованных в программе алгоритмов обработки (анализа и подготовки) данных. Блок контроля загружаемой информации 3 предусматривает выгрузку данных в Блок внутреннего хранилища данных 7 следующих типов:
- с полной заменой справочников,
- с добавлением новых значений,
- с проверкой изменения справочных элементов.
При полной замене справочника данные, загруженные ранее, удаляются. При выгрузке с добавлением новых значений выполняется проверка наличия справочных элементов по идентификатору, уникальным образом определяющим справочный элемент в рамках одного справочника.
Проверка изменения справочных элементов подразумевает проверку изменения элемента по идентификатору и по наименованию справочного значения.
В Блоке сопоставления данных НСИ 4 реализовано два способа проставления соответствий:
- проставление соответствий пользователем системы нормативно-справочной информации,
- автоматическое проставление соответствий на основе лексико-синтаксического анализа.
При автоматическом проставлении соответствий пользователь задает коэффициент истинности соответствия, далее для каждого элемента одного справочника автоматически подбирается элемент другого справочника с максимальным коэффициентом соответствия, рассчитываемым на основе лексико-синтаксического анализа. Если коэффициент соответствия подобранного значения больше коэффициента истинности, то данное соответствие помечается для выгрузки в таблицу соответствий.
При сопоставлении значений справочников различных систем или программных комплексов возникают проблемы с неполным их соответствием. Это связано как с использованием сокращений, так и с профессиональными названиями. Значения словарей похожи, но не одинаковы. Пример, в системе «А» используется значение словаря «Акустико-химическое возд-е», а в системе «Б» - «Акустико-химическое возд. (АХВ)». Для разрешения этой проблемы в данной системе используется метод, учитывающий близость текстовых фрагментов, поэтому процесс поиска строк не ограничивается поиском точных слов, а наоборот, расширяется поиском похожих слов, синонимов, конкретных цифр.
В Блоке сопоставления данных НСИ 4 для автоматического сопоставления используется метод, основанный на статистике совпадения смежных пар символов в сравниваемых строках, хорошо реализуемый в реляционных СУБД. Данный метод позволил найти значения «Акустико-химическое возд-е» и «Акустико-химическое возд. (АХВ)» со степенью точности 0.93. Кроме этого включена поддержка транслитерации символов, учитывается обработка числовой информации и спецсимволов.
Блок справочных данных 5 представляет собой набор сущностей базы данных данной системы по хранению конфигурационной информации, а также набор автоматически создаваемых сущностей для загрузки и хранения нормативно-справочной информации из внешних систем.
Блок администрирования С-НСИ 6 содержит набор процедур и функций хранилища данных, позволяющих проводить подключение и настройку источников данных к системе нормативно-справочной информации, создание и настройку сопоставляемых справочников и таблиц перекодировок, необходимых для хранения соответствий справочных значений.
Блок внутреннего хранилища данных 7 представляет собой базу данных, содержащую набор репликационных таблиц, со справочными значениями из сопоставляемых систем и программных комплексов.
Блок взаимодействия с источниками данных 8 с Блоком справочных данных 5 подразумевает подключение к базам данных и web-сервисам, загрузку данных из источника и передачу в Блок контроля загружаемой информации 3.
Пользователь запускает Блок ввода информации 1. Система запрашивает из Блока администрирования системы нормативно-справочной информации 6 права доступа и, соответственно, открывает или закрывает доступ пользователю на определенные действия в системе. Права доступа запрашиваются Блоком администрирования системы нормативно-справочной информации 6 из Блока внутреннего хранилища данных 7. Далее описание работы модели зависит от доступа и действий пользователя: настройка, загрузка НСИ, сопоставление НСИ.
Настройка системы. Пользователь при наличии прав доступа подключает необходимые источники нормативно-справочной информации к данной системе, введя необходимые данные. Информация преобразуется через Блок индикации 2 и передается в Блок внутреннего хранилища данных 7.
Загрузка нормативно-справочной информации из внешних систем. Пользователь при наличии прав доступа запускает загрузку нормативно-справочной информации из Блока справочных данных 5 в систему сопоставления НСИ. При запуске система через Блок взаимодействия с источниками данных 8 получает данные, проверяет через Блок контроля загружаемой информации 3 и сохраняет в Блоке внутреннего хранилища данных 7.
Сопоставление справочников. Пользователь при наличии прав доступа через Блок сопоставления данных нормативно-справочной информации 4 производит ручное или автоматическое сопоставление. Блок сопоставления данных нормативно-справочной информации 4, в свою очередь, запрашивает исходные справочные данные из Блока внутреннего хранилища данных 7 на основе прав доступа из Блока администрирования системы нормативно-справочной информации 6. Блок администрирования позволяет разграничить доступ к операциям в системе на основе ролевой политики.
Конечным результатом работы системы является таблица перекодировок, содержащая информацию по соответствиям элементов НСИ программных комплексов и информационных систем предприятия. Проставленные сопоставления могут выгружаться как в одну физическую сущность базы данных, так и по каждой таблице перекодировок в отдельные. Соответствия проставляются исходя из обязательного условия «многие к одному» в рамках одной таблицы перекодировок. Данное условие позволяет однозначно задать и далее определить сопоставления между элементами справочников систем.
Архитектура системы сопоставления НСИ позволяет использовать данное решение не только для сопоставления справочников различных источников, но и произвольные выборки, включая возможность создания и добавления новых значений для сопоставления во внутреннем хранилище, что обеспечивает обособленную работу системы от других источников данных.
Система сопоставления нормативно-справочной информации, включающая блок ввода информации, блок индикации, блок контроля загружаемой информации, блок сопоставления данных нормативно-справочной информации, блок справочных данных, отличающаяся тем, что система дополнительно включает блок администрирования системы нормативно-справочной информации, блок внутреннего хранилища данных, блок взаимодействия с источниками данных, при этом блок ввода информации двусторонними связями соединен с блоком индикации, блоком сопоставления данных нормативно-справочной информации, блоком администрирования системы нормативно-справочной информации, блоком внутреннего хранилища данных, блоком взаимодействия с источниками данных, а блок справочных данных односторонней связью соединен с блоком взаимодействия с источниками данных, блок взаимодействия с источниками данных односторонней связью соединен с блоком контроля загружаемой информации, блок контроля загружаемой информации односторонней связью соединен с блоком внутреннего хранилища данных, блок внутреннего хранилища данных односторонней связью соединен с блоком администрирования системы нормативно-справочной информации, блок администрирования системы нормативно-справочной информации односторонней связью соединен с блоком сопоставления данных нормативно-справочной информации, причем блок сопоставления данных нормативно-справочной информации выполнен с возможностью автоматического определения соответствий между кодами справочников нормативно-справочной информации на основе лексико-синтаксического анализа.