Комплекс подготовки данных для информационно-аналитической системы

Иллюстрации

Показать все

Изобретение относится к области поиска и подготовки документов для публикации на информационном портале. Технический результат - сокращение времени отбора релевантных документов и их подготовки и размещения на портале информационно-аналитической системы. Комплекс подготовки данных для информационно-аналитической системы, содержащий связанные между собой с возможностью информационного обмена модуль авторизации, блок поисковых модулей и базу данных документов, отличается тем, что он снабжен модулем ключевых слов, состоящим из связанных между собой модуля подготовки ключевых слов и базы данных ключевых слов, и модулем экспорта документов, база данных документов выполнена с возможностью формирования списка найденных документов, списка отобранных документов, списка рабочих документов и списка документов к экспорту, причем база данных ключевых слов встроена в связь модуля авторизации с блоком поисковых модулей, а модуль экспорта документов связан с базой данных документов и выполнен с возможностью передачи документов к экспорту в информационно-аналитическую систему для дальнейшего размещения отобранных документов на портале информационно-аналитической системы, причем база данных ключевых слов снабжена подмодулем, выполненным с функцией подбора ключевых слов, которые связаны с ранее выбранными ключевыми словами. 9 ил.

Реферат

Изобретение относится к области автоматизированного поиска и может быть использовано для поиска и подготовки документов для публикации на информационном портале, к которому обращается широкий круг пользователей.

Известны различные системы информационного поиска, обеспечивающие автоматизированный поиск документов, например известные поисковые системы Яндекс, Google и т.п. Данные системы обеспечивают поиск релевантных документов по ключевым словам.

Вместе с тем в данных системах отсутствует комплекс подготовки данных, обеспечивающий возможность формирования и настройки базы специализированных ключевых слов, обработки и подготовки отобранных документов для их дальнейшей публикации.

Известен комплекс подготовки данных информационно-поисковой системы, включающей модуль авторизации, поисковые модули, подключенные к Интернету, и базу данных найденных документов (патент РФ №110847, опубл. 27.11.2011).

Недостатком известного технического решения является невозможность проведения тематических поисков по ключевым словам, выбираемым из подготовленной заранее базы ключевых слов. Кроме того, отсутствует возможность расширения области поиска за счет автоматически предлагаемых оператору ключевых слов и/или фраз из базы ключевых слов, что увеличивает время поиска релевантных документов и дальнейшей подготовки (обработки) документов к публикации на информационно-аналитическом портале.

Задачей изобретения является создание комплекса подготовки данных для информационно-аналитической системы, позволяющего осуществлять сбор и подготовку к публикации (размещению) на портале информационно-аналитической системы необходимых документов, в том числе научного характера.

Технический результат заключается в сокращении времени отбора релевантных документов, их подготовки и размещения на портале информационно-аналитической системы.

Поставленный технический результат достигается тем, что комплекс подготовки данных для информационно-аналитической системы, содержащий связанные между собой с возможностью информационного обмена модуль авторизации, блок поисковых модулей и базу данных документов, согласно изобретению снабжен модулем ключевых слов, состоящим из связанных между собой модуля подготовки ключевых слов и базы данных ключевых слов, и модулем экспорта документов, база данных документов выполнена с возможностью формирования списка найденных документов, списка отобранных документов, списка рабочих документов и списка документов к экспорту, причем база данных ключевых слов встроена в связь модуля авторизации с блоком поисковых модулей, а модуль экспорта документов связан с базой данных документов и выполнен с возможностью передачи документов к экспорту в информационно-аналитическую систему.

Совокупность признаков заявленного комплекса обеспечивает получение заявленного технического результата, поскольку:

- снабжение комплекса подготовки данных модулем ключевых слов, состоящим из связанных между собой модуля подготовки ключевых слов и базы данных ключевых слов, обеспечивает возможность формирования и настройки базы специализированных актуальных ключевых слов, что сокращает время отбора релевантных документов в процессе проведения информационного поиска;

- снабжение комплекса подготовки данных модулем экспорта документов, обеспечение связи модуля экспорта документов с базой данных документов и выполнение его с возможностью передачи документов к экспорту в информационно-аналитическую систему обеспечивает ускоренное размещение подготовленных документов на портале информационно-аналитической системы при помощи простого интерфейса путем несложных манипуляций, что способствует сокращению времени работы с документом за счет сокращения времени, необходимого для размещения документа на портале информационно-аналитической системы;

- выполнение базы данных документов с возможностью формирования списка найденных документов, списка отобранных документов, списка рабочих документов и списка документов к экспорту обеспечивает четкую последовательность работы с документами, позволяет возвращать документы, обработанные одним пользователем, на доработку другим операторам, что сокращает время подготовки документов для информационно-аналитической системы;

- встраивание базы данных ключевых слов в связь модуля авторизации с блоком поисковых модулей, кроме обеспечения четкой взаимосвязи работы элементов комплекса и возможности осуществления поиска необходимой информации одновременно в нескольких поисковых системах, сокращает время поиска и время работы с документами. Кроме того, обеспечивается получение дополнительного технического результата, а именно безопасности работы модуля ключевых слов.

Таким образом, поставленная задача полностью решена: создан комплекс подготовки данных для информационно-аналитической системы, позволяющий осуществлять сбор и подготовку к публикации (размещению) на портале информационно-аналитической системы необходимых документов с заявленным техническим результатом, заключающимся в сокращении времени отбора релевантных документов, их подготовки и размещения на портале информационно-аналитической системы.

В частном случае реализации изобретения база данных ключевых слов может быть снабжена подмодулем, выполненным с функцией подбора ключевых слов, которые связаны с ранее выбранными ключевыми словами.

Снабжение базы данных ключевых слов подмодулем, выполненным с функцией подбора ключевых слов, которые связаны с ранее выбранными ключевыми словами, также работает на достижение заявленного технического результата, т.к. «подсказывает», какие еще ключевые слова можно было бы использовать для поиска, что также способствует сокращению времени отбора релевантных документов.

Сущность изобретения поясняется далее подробным описанием примера конкретной реализации со ссылкой на иллюстрации, где на

фиг.1 показана структурная схема комплекса подготовки данных;

фиг.2 - вид окна формы для введения новых ключевых слов и списка ключевых слов модуля подготовки ключевых слов;

фиг.3 - вид окна подмодуля подбора ключевых слов из сформированной базы данных ключевых слов;

фиг.4 - вид меню выбора поисковых модулей;

фиг.5 - вид окна «Статистика поиска с использованием различных поисковых модулей»;

фиг.6 - вид окна «Список сайтов, обнаруженных с использованием различных поисковых модулей»;

фиг.7 - вид документа, помещенного в раздел «К рассмотрению»;

фиг.8 - вид окна редактируемого рабочего документа, отобранного для размещения в информационно-аналитической системе (ИАС);

фиг.9 - вид отредактированного документа, готового к экспорту в ИАС.

Рабочее место 1 эксперта-оператора, осуществляющего тематический поиск в базах данных, представленных в Интернете, подключено через модуль 2 авторизации к базе данных 3 ключевых слов (см. фиг.1). Последняя связана с модулем 4 подготовки ключевых слов, имеющим выход в Интернет, и с блоком 5 поисковых модулей, связанным с Интернетом, при этом база данных 3 ключевых слов и модуль 4 подготовки ключевых слов входят в состав модуля 6 ключевых слов. Информация из блока 5 поисковых модулей направляется в базу данных 7 документов, которая содержит список 8 (файлы) найденных документов, список 9 (файлы) отобранных документов, список 10 (файлы) рабочих документов, а также список 11 (файлы) документов к экспорту. Информация, содержащаяся в последнем, передается на модуль 12 экспорта документов, который связан с информационно-аналитической системой 13, размещенной на портале.

Модуль 2 авторизации позволяет контролировать доступ к комплексу подготовки данных. База данных 7 документов подключена к блоку 5 поисковых модулей и модулю 12 экспорта документов. Кроме того, база данных 3 ключевых слов может быть снабжена подмодулем (поз. не обозначен, см. фиг.3), выполненным с функцией подбора ключевых слов, которые связаны с ранее выбранными ключевыми словами. Для проведения поиска возможно использование поисковых модулей Яндекс, Google, Wiki.

Функционирование комплекса подготовки данных осуществляется следующим образом.

Прежде всего, следует отметить, главной целью оператора-эксперта является поиск и отбор большого количества информации, оперативного ее размещения на портале. В рамках функционирования комплекса выполняется одновременно несколько различных действий.

Первый шаг действий оператора-эксперта связан с созданием базы данных 3 ключевых слов, на основе которой осуществляется последующий поиск информации. Поскольку Интернет - постоянно меняющаяся среда, то скомпонованная однажды база данных 3 ключевых слов не является постоянной и требует корректировки (введения новых слов, удаления неактуальных, а иногда и уточнения правописания).

После того как оператор-эксперт с рабочего места 1, авторизовавшись в модуле 2, сформировал начальную версию базы данных 3, он входит в модуль 4 подготовки ключевых слов. Безопасность модуля 4 обеспечивается его защитой при помощи логина и пароля, при этом пароль задается администратором системы в конфигурационном файле. Далее начинается работа по формированию списка ключевых слов. Для этого необходимо перейти в раздел «Ключевые слова» и внести в него список слов, которые могут участвовать в поиске материала - для проведения этой операции предусмотрена форма «Новое ключевое слово» (см. фиг.2).

К данной операции оператор-эксперт обязан подойти с большой ответственностью, поскольку он должен очень четко представлять, какие ключевые слова (ключевые фразы) могут соответствовать тематике материала для информационного портала. Количество ключевых слов не ограничено (стабильность работы системы от этого не зависит).

Сформированный список ключевых слов находится в таблице «активные ключевые слова».

Поиск по всем ключевым словам в отдельных случаях может занимать довольно много времени. Для снятия этой проблемы предусмотрена возможность временного отключения или даже удаления ключевых слов, которые, по мнению оператора-эксперта, неактуальны. Однако следует иметь в виду, что ключевые слова лучше отключать, нежели удалять, так как в этом случае сохранится статистика по участию этого ключевого слова в поиске - в этом случае пользователь (оператор-эксперт) может производить поиск по усеченному списку слов, информация по которым его интересует больше всего.

Если у пользователя возникает желание расширить зону поиска, то он может подключить уже отключенные ключевые слова или использовать специальный подмодуль, который «подсказывает», какие еще ключевые слова можно было бы использовать для поиска. В раздел «Ключевые слова» добавлено специальное контекстное меню. Кроме списка ключевых слов, уже имеющихся в системе, здесь присутствует функция подбора иных ключевых слов, которые связаны с ранее выбранными. Если предложенное ключевое слово подходит, то его добавляют в список слов системы и проводят по этому слову поиск документов по обычной схеме (см. фиг.3).

Следующим шагом (после создания списка ключевых слов) является выбор поисковых модулей блока 5. Для этого в разделе «Модули» (см. фиг.4) активируют те поисковые модули, с помощью которых будет вестись поиск документов в Интернет. Если ни один модуль не активирован, то система не сможет вести поиск. При этом работа с ключевыми словами, найденными документами, экспортом документов остается доступной. Для поиска могут использоваться наиболее популярные поисковые модули Яндекс, Google, Wiki. Также возможен поиск по сервису Яндекс-блоги.

После завершения подготовительной работы (создан список ключевых слов, выбран режим работы с этим списком, подключены поисковые модули) приступают к проведению информационного поиска. Для этого в разделе «Ключевые слова» выбирают слово, для которого предполагается поиск документов. Нажатием кнопки «пуск» активизируется работа поисковых модулей блока 5. Модули осуществляют поиск материалов в Интернете с учетов выбранного ключевого слова. После окончания поиска найденные документы помещают в базу данных 7 в подраздел «список 8 найденных документов» (см. фиг.5).

Далее оператор-эксперт приступает к оценке содержания найденного материала. Найденный материал располагается в виде списка названий сайтов (см. фиг.6).

Процесс оценки информации происходит на нескольких уровнях. Самый первый уровень оценки - название. Оператор-эксперт производит осмотр списка документов и, исходя из заголовка документа, может сократить список, удалив ненужные.

Принять решение оператор-эксперт может, рассмотрев документ полностью, а не только по заголовку. Второй уровень оценки - собственно анализ содержания. Выйти на сайт-источник документа из подраздела «К рассмотрению» можно, нажав кнопку «рассмотреть». Документы в подразделе «К рассмотрению» (см. фиг.7) представлены без какой-либо обработки - в том виде, как они размещены на сайтах (это позволяет оценить сам сайт, на котором располагается найденный документ, и сделать предварительные выводы о его научной и информационной ценности). Ознакомившись с документом полностью, оператор также может удалить его или поменять статус на «к обработке». После изменения статуса документа он попадает в список 9 отобранных документов.

Документы, которые прошли предварительный отбор и получили статус «к обработке», доступны в подразделе «к обработке» списка 9 отобранных документов раздела «Документы». В этом разделе документы должны быть отредактированы и получить тот вид и содержание, с которым они будут представлены в портале ИАС 13.

Для редактирования документа нужно выбрать документ и перейти по ссылке «редактировать». Можно изменить название документа, с которым он дальше будет фигурировать в информационной системе, при этом также будет храниться и название документа, с которым он был найден.

С помощью визуального редактора оператор-эксперт готовит информационный документ. Редактируемый документ помещается в список 10 рабочих документов и сохраняется. Пример окна обработки (редактирования) документа, отобранного для размещения в ИАС 13, показан на фиг.8.

Документ можно просто сохранить и впоследствии вновь вернуться к его редактированию (таким образом можно подготовить целый список отобранных, но не отредактированных документов). По завершении окончательной редактуры документа оператор-эксперт может поменять его статус на «готовый» и этим обозначить, что документ отредактирован окончательно и может быть экспортирован через модуль 12 на портал ИАС 13. Вид отредактированного документа, готового к экспорту в ИАС, показан на фиг.9.

Проанализированный и отредактированный документ помещают в подраздел «Готовые» раздела «Документы». Если документ имеет статус «готовый», это обозначает, что он может быть экспортирован на информационный портал. Если оператор-эксперт при редактировании материала сделал какую-то ошибку или в последний момент захотел внести исправление, то он может отредактировать уже готовый к экспорту материал прямо в подразделе «Готовые». В случае необходимости можно изменить статус документа и вернуть документ в раздел «к обработке». Для этого необходимо на экране редактирования документа нажать кнопку «вернуть к обработке».

Предлагаемый комплекс обеспечивает проведение максимально полной редакторской и аналитической обработки материала, не прибегая к тиражированию различных редакторских версий.

Найденные и отредактированые документы (с учетом авторских прав и указанием источника информация) готовы к экспорту на информационный портал.

Для реализации этого действия оператор-эксперт переходит в раздел «Экспорт» главного меню. В этом разделе представлены документы, имеющие статус «готовые». Указав «галочками» те документы, которые нужно передать на портал, и нажав кнопку «экспортировать на сайт», оператор-эксперт передает документы на вход ИАС 13, размещенной на портале.

Таким образом, предлагаемый комплекс подготовки данных позволяет:

- осуществлять поиск необходимой информации для проведения исследований одновременно в нескольких поисковых системах;

- при помощи простого, адаптированного для уверенного пользователя интерфейса аккумулировать в одном месте полученный в результате поиска информационный материал;

- осуществлять обработку полученных документов, возвращать документы, обработанные одним пользователем, на доработку другим операторам;

- разрешать к экспорту на информационный портал подготовленные документы, размещать его на портале после проверки полноты найденной информации (при помощи простого интерфейса) путем несложных манипуляций.

Предлагаемый комплекс может быть использован при создании специализированных поисковых систем по гуманитарным наукам.

Комплекс подготовки данных для информационно-аналитической системы, содержащий связанные между собой с возможностью информационного обмена модуль авторизации, блок поисковых модулей и базу данных документов, отличающийся тем, что он снабжен модулем ключевых слов, состоящим из связанных между собой модуля подготовки ключевых слов и базы данных ключевых слов, и модулем экспорта документов, база данных документов выполнена с возможностью формирования списка найденных документов, списка отобранных документов, списка рабочих документов и списка документов к экспорту, причем база данных ключевых слов встроена в связь модуля авторизации с блоком поисковых модулей, а модуль экспорта документов связан с базой данных документов и выполнен с возможностью передачи документов к экспорту в информационно-аналитическую систему для дальнейшего размещения отобранных документов на портале информационно-аналитической системы, причем база данных ключевых слов снабжена подмодулем, выполненным с функцией подбора ключевых слов, которые связаны с ранее выбранными ключевыми словами.