Способ интерактивного поиска в распределенных вычислительных сетях и информационно-поисковая система для его реализации
Иллюстрации
Показать всеИзобретение относится к средствам автоматизации обучения и научных исследований и может быть использовано в интерактивных системах автоматизации научно-исследовательских работ. Техническим результатом является повышение эффективности интерактивных поисковых процессов, повышение точности, достоверности и объективности поисковых результатов. Способ интерактивного поиска в распределенных вычислительных сетях включает совмещение процессов формирования интерактивных поисковых запросов и цифровых преобразований результатов измерений соответствующих сигналов по каждому из каналов формирования поисковых запросов, при этом предварительно входные сигналы поисковых запросов разделяют на две группы, в первую группу относят независимые от времени интерактивные поисковые запросы, а во вторую - зависимые, при этом устанавливают каналы измерения соответственно независимых и зависимых сигналов поисковых запросов, осуществляют комбинаторный опрос, например перебор сочетаний, соответствующего числа каналов измерения и измерение параметров сигналов по каждому каналу формирования поисковых запросов, при этом измерение сигналов из первой группы осуществляют на основе значений разброса их нижних и верхних пределов изменения с учетом допустимой, например, абсолютной погрешности измерения на соответствующем временном интервале Ti=ti1+1-ti1 измерения для всех t∈[ti, ti1+1], i1=1,2,..., при этом длительность временного интервала Тi1 формирования интерактивных поисковых запросов корректируют на основе значений сигнала рассогласования о близости содержания документа информационному запросу или информационной потребности на предшествующем интервале Ti1-1 формирования поисковых запросов. Также заявлена система для реализации данного способа. 2 н. и 1 з.п. ф-лы, 16 ил.
Реферат
Изобретение относится к средствам автоматизации обучения и научных исследований и предназначено для использования в интерактивных системах автоматизации научно-исследовательских работ.
Известны интерактивные системы автоматизации основных процессов научных исследований на основе использования распределенных вычислительных сетей (см. например, SU 525104 А1, 15.08.1976; SU 1550528 A1, 15.03.1990; SU 1765841 A1, 30.09.1992; RU 2023295 C1, 15.11.1994; US 20010027404 A1, 04.10.2001; JP 4054685 A, 21.02.1992; RU 2199778 A1, 27.02.2003; RU 2003129127 A, 27.03.2005). В основе работы вышеперечисленных систем использован способ, включающий генерацию упорядоченных во времени интерактивные процедур, связанных с формированием поисковых запросов, обучения научно-исследовательским и учебным процессам на основе формирования поисковых запросов в заданной предметной области. При этом каждая из соответствующих интерактивных процедур ориентирована на непосредственное присутствия учителя и ученика(ов). В этой связи главный недостаток известного способа предопределен тем, что данный способ и соответствующие интерактивные системы используют сведения о текущих ситуациях лишь в ограниченном пространстве признаков поисковых запросов в заданной предметной области. При этом низкая производительность данного способа обусловлена потерей времени, затрачиваемого на формирование поисковых запросов и коррекции соответствующих плохо формализуемых ситуаций в пространстве признаков заданной предметной области. Последний недостаток обусловлен тем, что данный способ не предусматривает его использование в современных распределенных интерактивных локальных или глобальных клиент-серверных системах.
Достижению требуемого технического результата во всех приведенных аналогах, включая соответствующий способ интерактивного поиска, препятствует то, что ни один из них не может быть использован для распределенных вычислительных систем автоматизации научно-исследовательских работ.
Задачей изобретения является совершенствование интерактивных поисковых процессов при выполнении научно-исследовательских работ на основе использования распределенных вычислительных систем и сетей, а также повышение точности, достоверности и объективности их результатов на основе более широкого использования новых информационных технологий и средств автоматизации, за счет расширения функциональных возможностей существующих технических средств и повышения эффективности соответствующих интерактивных (диалоговых) систем.
Для решения поставленной задачи предложен способ интерактивного поиска в распределенных вычислительных сетях и информационно-поисковая система для его реализации.
Способ интерактивного поиска в распределенных вычислительных сетях включает совмещение процессов формирования интерактивных поисковых запросов и цифровых преобразований результатов измерений соответствующих сигналов по каждому из каналов формирования поисковых запросов, при этом предварительно входные сигналы поисковых запросов разделяют (разбивают, выделяют, группируют и т.п.) на две группы, в первую группу относят независимые от времени интерактивные поисковые запросы, а во вторую - зависимые, при этом устанавливают каналы измерения, соответственно независимых βk(t) и зависимых Uij (p)=fij[βk(t)] сигналов поисковых запросов, где t - время, i,j=1,2, fij[βk(.)] - некоторая нелинейная зависимость от βk(t), k=1, 2,..., n, затем осуществляют комбинаторный опрос, например перебор сочетаний, соответствующего числа каналов измерения и измерение параметров (амплитуды и длительности) сигналов по каждому каналу формирования поисковых запросов, при этом измерение сигналов из первой группы осуществляют на основе значений разброса их
нижних и верхних
пределов изменения с учетом допустимой, например, абсолютной погрешности измерения на соответствующем временном интервале Ti1-1 измерения для всех t∈[ti1,ti1+1], i1=1, 2,..., при этом длительность временного интервала Ti1 формирования интерактивных поисковых запросов корректируют на основе значений сигнала рассогласования о близости содержания документа информационному запросу или информационной потребности на предшествующем интервале Ti1-1 формирования поисковых запросов.
Для реализации предлагаемого способа предлагается информационно-поисковая система, в которой на каждом уровне обработки интерактивных поисковых процессов/запросов (ОИПП) содержится Sl,q, интерактивных программируемых устройств ОИПП, где Si,q, l=0,1,...,L (ПЭВМ, например, IBM PC, а также любое другое устройство, имеющее стандартный интерфейс RS-232C или ИРПС); q=1,2,..., Q1, L - число уровней ОИПП, Q1 - число интерактивных программируемых устройств ОИПП (далее для краткости - ИПУ ОИПП) на l-уровне, каждое из Sl,q ИПУ ОИПП l-уровня соединено, по крайней мере, с одним ИПУ ОИПП (l-1)-го уровня, с двумя ИПУ ОИПП l-уровня и двумя ИПУ ОИПП (l+1)-го уровня, при этом каждое ИПУ ОИПП содержит: блок системной памяти, аппаратно-программные блоки (АПБ): АПБ поиска и мониторинга, загрузки и индексации, АПБ рубрицирования, АПБ обучения системы, АПБ поиска и мониторинга документов, АПБ поиска (фильтрации) документов, АПБ мониторинга, АПБ корректировки результатов поиска, создание архивов и уточнение рубрик, АПБ видеоадаптера, АПБ интерфейса жестких дисков, АПБ интерфейса гибких дисков, АПБ интерфейса оптических дисков, АПБ интерфейса последовательного порта, АПБ процессора, АПБ сетевого интерфейса, АПБ объединены системной шиной ИПУ ОИПП.
При этом АПБ процессора ИПУ ОИПП содержит последовательно соединенные блок нормирующих устройств (НУ), коммутатор, АЦП, первое ЗУ, блок интерполирования, блок выделения экстремума, блок масштабирования, первую схему формирования дискретных приращений, вторую схему дискретных приращений, блок задания постоянных коэффициентов, блок синхронизации поисковых запросов, схему формирования адреса записи поисковых запросов, блок управления поисковыми процессами, блок преобразования, второе ЗУ, регистрирующее устройство (РУ), на выходе которого установлены маска, оптическая система и фотодатчик, выходом подключенный к входу блока формирования статистических характеристик анализируемого поискового процесса, первый выход которого соединен со вторым входом РУ, а второй выход - с входом блока формирования импульсных воздействий.
Отличительные признаки способа интерактивного поиска в распределенных вычислительных сетях и информационно-поисковой системы для его реализации позволяют повысить эффективность интерактивных поисковых процессов/запросов непосредственно в процессе выполнения научно-исследовательского работ на основе использования реальных динамических характеристик распределенных вычислительных систем и сетей, при этом предоставляется возможность повысить точность, достоверность и объективность принимаемых решений, на основе более широкого использования новых информационных технологий и средств автоматизации, за счет расширения функциональных возможностей существующих технических средств и повышения эффективности соответствующих интерактивных (диалоговых) систем и подсистем.
Предлагаемое изобретение поясняется чертежами.
На фиг.1 - структура интерактивной поисковой системы.
На фиг.2 - структура интерактивного программируемого устройства (ИПУ) обработки интерактивных поисковых процессов/запросов (ОИПП).
На фиг.3-11 - примеры реализации аппаратно программных блоков (АПБ) ИПУ ОИПП, а именно на фиг.3 - АПБ 2 поиска и мониторинга, на фиг.4 - АПБ 3 загрузки и индексации, на фиг.5 - АПБ 4 рубрицирования, на фиг.6 - АПБ 5 обучения системы, на фиг.7 - АПБ 6 поиска и мониторинга документов, на фиг.8 - АПБ 7 поиска (фильтрации) документов, на фиг.9 - АПБ 8 мониторинга, на фиг.10 - АПБ 9 корректировки результатов поиска, создание архивов и уточнение рубрик, на фиг.11 - АПБ 15 процессора.
На фиг.12 - пример реализации блока 20 формирования статистических характеристик поискового интерактивного процесса в АПБ 15 процессора ИПУ ОИПП.
На фиг.13 - пример реализации блока 21 формирования импульсных воздействий в АПБ 15 процессора ИПУ ОИПП.
На фиг.14-16 - примеры реализации Web-интерфейсов ИПУ ОИПП.
Структура информационно-поисковой системы приведена на фиг.1.
В предлагаемой структуре на каждом уровне обработки интерактивных поисковых процессов/запросов (ОИПП) содержится Sl,q интерактивных программируемых устройств ОИПП (см. фиг.1), где l=0,1,...,L (ПЭВМ, например, IBM PC, а также любое другое устройство, имеющее стандартный интерфейс RS-232C или ИРПС); q=1,2,..., Ql, L - число уровней ОИПП, Q1 - число многоканальных интерактивных программируемых устройств ОИПП (далее для краткости - ИПУ ОИПП) на l-уровне. Каждое из Sl,q ИПУ l-уровня соединено, по крайней мере, с одним ИПУ ОИПП (l-1)-го уровня, с двумя МИПУ ОИПП l-уровня и двумя МИПУ ОИПП (l+1)-го уровня. Каждое ИПУ ОИПП (см. фиг.2) содержит: блок 2.1 системной памяти, аппаратно программные блоки (АПБ) 2.2 - 2.16, соответственно, АПБ 2.2 поиска и мониторинга, АПБ 2.3 загрузки и индексации, АПБ 2.4 рубрицирования, АПБ 2.5 обучения системы, АПБ 2.6 поиска и мониторинга документов, АПБ 2.7 поиска (фильтрации) документов, АПБ 2.8 мониторинга, АПБ 2.9 корректировки результатов поиска, создание архивов и уточнение рубрик, АПБ 2.10 видеоадаптера, АПБ 2.11 интерфейса жестких дисков, АПБ 2.12 интерфейса гибких дисков, АПБ 2.13 интерфейса оптических дисков, АПБ 2.14 интерфейса последовательного порта, АПБ 2.15 процессора, АПБ 2.16 сетевого интерфейса, которые объединены системной шиной 2.17 ИПУ ОИПП.
При этом АПБ 15 процессора ИПУ ОИПП содержит (см. фиг.11) блок 1 нормирующих устройств (НУ), коммутатор - 2, АЦП - 3. первое ЗУ - 4, блок 5 интерполирования, блок 6 выделения экстремума, блок 7 масштабирования, первую схему 8 формирования дискретных приращений, вторую схему 9 дискретных приращений, блок 10 задания постоянных коэффициентов, блок 11 синхронизации поисковых запросов, схему 12 формирования адреса записи поисковых запросов, блок 13 управления поисковыми процессами, блок 14 преобразования, второе ЗУ 15, регистрирующее устройство (РУ) 16, на выходе которого установлены маска 17, оптическая система 18 и фотодатчик 19, выходом подключенный к входу блока 20 формирования статистических характеристик анализируемого поискового процесса (фиг.12), первый выход которого соединен со вторым входом РУ 16, а второй выход - с входом блока формирования импульсных воздействий 21 (фиг.13).
Способ интерактивного поиска в распределенных вычислительных сетях согласно предлагаемой ИПУ ОИПП для его реализации осуществляют следующим образом.
Значения сигналов, возникающие на системной шине 17 ИПУ ОИПП (см. фиг.2) в процессе формирования интерактивных поисковых запросов на основе работы АПБ 2 -9, поступают на входы нормирующего устройства 1 АПБ 15 (см. фиг.11) при этом эти сигналы условно разбивают на две группы. Для определенности будем полагать, что первая группа сигналов характеризует независимые по времени интерактивные процессы формирования поисковых запросов, например, первая группа сигналов представляет набор наблюдаемых интерактивных процессов формирования поисковых запросов (см. фиг.3, на которой представлен процесс взаимосвязи входных и выходных сигналов в процессе обработки поисковых запросов) пользователем или лицом, принимающим решение (ЛПР) (см. фиг.4)
Вторая группа сигналов представляет реакцию поисковой системы объекта на данный набор поисковых запросов ЛПР, т.е. вторая группа каналов измерений характеризует группу зависимых сигналов, т.е. это реакция на соответствующий набор поисковых запросов
Следовательно, в рассматриваемом примере, в первой группе будут три независимых канала измерений состояния интерактивной поисковой системы или состояний поискового процесса, а во второй - 2n (в данном случае восемь) зависимых каналов измерений состояния интерактивной поисковой системы. При этом согласно способу интерактивного поиска в распределенных вычислительных сетях (см. фиг.11) необходимо хранить соответствующие оценки верхних и нижних значений результатов поиска по каждому каналу формирования поискового запроса, т.е. ∀t>0:
X(1)=infX1(t) или X(1)→min X1(t),
Х(2)=sup X1(t) или X(2)→max X1 (t),
аналогично
Y(1)=inf Y1(t) или Y(1)→min Y1(t),
Y(2)=sup Y1(t) или Y(2)→max Y1(t),
Z(1)=inf Z1(t) или Z(1)→min Z1(t),
Z(2)=sup Z1(t) или Z(2)→max Z1(t).
На первом временном интервале осуществляется опрос следующих каналов НУ 1 (см. фиг.11): первого канала НУ 1 из первой группы независимых сигналов, на который поступает в рассматриваемом примере - Х(1); третьего канала - Y(1) и пятого - Z(1). Одновременно во второй группе каналов опрашивается первый канал, на который подается для измерения сигнал U(1). Измеренные в момент t1 значения после преобразования в блоке 3 запоминают в первом ЗУ 4. На такте t2 осуществляют опрос второго, третьего, пятого и восьмого каналов. На такте t3 осуществляется опрос первого, третьего, шестого и девятого каналов. На такте t4 осуществляют, опрос второго, третьего, шестого и десятого каналов. Для рассматриваемого примера этот процесс комбинаторного опроса каналов системной шины ИПУ ОИПП из разных групп и запоминание значений сигналов завершается за восемь тактов. Описанная последовательность операций интерактивного поиска реализована на основе фиксации верхних {Х(2), Y(2), Z(2)} и нижних {X(1), Y(1), Z(1)} границ изменения амплитуд сигналов первой группы каналов измерения состояния интерактивной поисковой системы.
При этом проекция электронного луча на экране электронно-лучевой трубки РУ 16 (см. фиг.11) передается на рабочую поверхность фотодатчика 19 через оптическую систему 18 и маску 17, выполненную так, что в трехмерном пространстве выделены области, соответствующие гипотезам о различных состояниях анализируемого поискового процесса/запроса. Оптический коэффициент пропускания маски 17 имеет одно и то же значение для точек одной гипотезы и различное для различных гипотез. Маска 17 изготовлена так, что в пространстве координат (X,Y,Z) выделены области, соответствующие поисковым гипотезам (см. фиг.6)
где f(.) - любая интегрируемая по Риману функция или параметрическая зависимость, Xi, Yj и Zk - текущие значения переменных (или параметрических зависимостей) - входных переменных - (параметров) независимых (или зависимых) координат, о различных состояниях анализируемого (контролируемого) поискового интерактивного процесса, а именно о близости содержания документа информационному запросу или информационной потребности на соответствующем интервале формирования поисковых запросов.
Оптический коэффициент пропускания маски 17 (см. фиг.11) имеет одно и то же значение для точек, принадлежащих одной и той же поисковой гипотезе Hijk(.), и различное - для различных поисковых гипотез (см. фиг.6 - АПБ построения статистических портретов). Данное свойство реализуется с помощью интенсивности "почернения", густотой штриховки или частотой точек соответствующих участков маски, при учете апертуры электронного луча и разрешающей способности фотоприемника. Это позволяет при входных величинах Xi, Yj и Zk (см. фиг.12) получать на выходе 2 блока 20 формирования статистических характеристик анализируемого поискового интерактивного процесса сигнал с амплитудой, равной гипотезе Нijk(.) и с частотой, определяемой параметрами соответствующих генераторов развертки.
При попадании электронного луча на экран электронно-лучевой трубки, в определенное положение (соответствующее координатам или данным на входах блока 20 - Xi, Yj и Zk, см. фиг.12), сигналы генератора 20.7 горизонтальной развертки, генератора 20.8 вертикальной развертки и генератора 20.6 синусоидальных колебаний превышают входные сигналы, поступающие соответственно по первой, второй и третьей входным шинам Xi, Yj и Zk, что приводит к появлению сигналов на выходах первого, второго и третьего компараторов 20.12, 20.11 и 20.13, вызывающих срабатывание элемента 20.14 совпадения. Сигнал с выхода элемента 20.14 совпадения поступает на первые управляющие входы генератора 20.7 горизонтальной развертки, генератора 20.8 вертикальной развертки и генератора 20.6 синусоидальных колебаний, обеспечивая сохранение на их выходах сигналов, соответствующих входным сигналам, поступающим соответственно по первой, второй и третьей входным шинам Xi, Yj и Zk. Кроме того, сигнал с выхода элемента 20.14 совпадения открывает ключ 20.10, с выхода которого на выходную шину 2 блока 20 подается сигнал, характеризующий значение поисковой гипотезы Hijk(.). Через интервал времени, определяемый элементом 20.9 задержки, сигнал элемента 20.14 совпадения поступает на вторые управляющие входы генератора 20.7 горизонтальной развертки, генератора 20.8 вертикальной развертки и генератора 20.6 синусоидальных колебаний, что приводит к исчезновению сигналов на их выходах. При этом исчезают сигналы на выходах первого, второго и третьего компараторов 20.12, 20.11 и 20.13 и элемента 20.14 совпадения, а цикл сканирования экрана электроннолучевой трубки РУ 16 повторяется.
Процесс формирования периода и длительности следования управляющих поисковых запросов на выходе 1 блока 21 (см. фиг.13) рассмотрим для случая, когда на его входе 1 абсолютное значение поисковой гипотезы о релевантности информационному запросу |Hijk(.)|<Δн/2, где Δн/2 - зона срабатывания первого релейного элемента 21.2 и соответствующее ей нормированное значение |e(t)|<1. Предполагаем, что нормирование текущих значений поисковой гипотизы Hijk(.) (или ошибки - e(t)) осуществляется с коэффициентом Δ=Δн/2. Пусть в исходном положении триггер 21.6 находится в единичном состоянии, тогда с блока 21.7 выборки-хранения поступает напряжение
на один из входов сумматора 21.12, на второй вход которого поступает постоянное напряжение (Е) от источника 21.11 эталонных напряжений. В результате на вход первого формирователя 21.10 импульсов подается постоянное напряжение - Uфi=Ui+Е.
Постоянная составляющая Е может быть выбрана, например, из интервала значений с нижней границей, определяемой длительностью выполнения самой продолжительной последовательности операций преобразований (обработки) в блоках 1÷16 (фиг.11) АПБ 15 процессора (фиг.2), и верхней границей, определяемой, например, как l/(Kf·Fmax), где Fmax - максимальная частота изменения значений гипотез Hijk(.), Kf - постоянный коэффициент, который согласно теореме отсчетов во временном представлении непрерывных сигналов в дискретной форме можно установить ≥2. В этой связи верхняя граница значений данного интервала может быть априорно выбрана из необходимого условия адекватности представления непрерывного сигнала своими дискретными значениями. Это позволяет обеспечить измерение и обработку значений сигналов поисковых гипотез Нijk(.) с наименьшей потерей информации. Далее в соответствии с Uфi на выходе формирователя 21.10 импульсов будет сформирован импульс длительностью Ti=Кфi·Uфi, где Кфi - коэффициент передачи формирователя 21.10 импульсов. Во время действия данного периода Т; в блоке 21.7 формируется
В конце периода Тi формирователь 21.10 импульсов устанавливает триггер 21.6 в следующее (например, нулевое) состояние. Описанные выше последовательности операций непрерывно повторяются в функциональной зависимости от изменения e(t), на основе которой определяется близость содержания документа информационному запросу или информационной потребности (релевантности или пертитивности) на соответствующем интервале формирования поисковых запросов.
В момент окончания каждого периода Ti и начала следующего Ti+1, составляющих незначительный по продолжительности промежуток времени, формируется сигнал, достаточный для отключения электронного ключа 21.15. Этим обеспечивается требуемая степень синхронизации между началом момента формирования периода управляющих воздействий при формировании поисковых запросов, или коррекции, уточнении - запросов, в формирователе 21.10 и длительности импульса в формирователе 21.16 для всех Тi, i=1,2,...,n. Формирование напряжений на входе второго формирователя 21.16 импульсов реализовано по схеме, аналогичной вышеописанной на входе формирователя 21.10 импульсов, с тем лишь отличием, что формирование длительности выходных импульсов осуществляется в соответствии со значением оценки интегрального изменения квадрата нормированного сигнала поисковых гипотез Нijk(.) и во все периоды Ti, для которых Δтр≤|e(t)|≤Δн/2, где Δтр - зона нечувствительности релейного элемента 21.4, устанавливаемая на основе критерия точности воспроизведения (распознавания, прогнозирования и т.п.) текущих значений сигнала поисковых гипотез Нijk(.) по результатам работы интерактивной поисковой системы. Формирование каждого периода Ti осуществляется на основе последовательности операций (Кфi·Е), априорных по отношению к динамике изменения значений сигнала поисковых гипотез Нijk(.), и корректируется текущими значениями интегральных оценок нормированной ее оценки, полученными на предшествующем периоде дискретизации времени или процесса формирования поисковых запросов.
Предлагаемая система предоставляет возможность информационного поиска в рамках одного или нескольких тематических направлений (см. фиг.3-10). При этом информационная потребность пользователя или ЛПР может выражаться:
- запросом, сформулированным с использованием языка запросов;
- запросом, сформулированным в свободной форме на естественном языке;
- подготовленной им подборкой документов;
- заданием области поиска и частоты сбора информации.
Длительность каждого из вышеперечисленных режимов может быть измерена или идентифицирована на основе интегральных оценок (4) или (5).
Результатом работы системы является подборка документов, удовлетворяющих информационной потребности пользователя согласно заданным формальным критериям смыслового соответствия для каждого из перечисленных выше способов ее выражения. Данная подборка может содержать либо все версии документов, полученных при сборе информации в соответствии с явными пользовательскими указаниями, либо только текущие версии документов, во всех иных случаях.
Предлагаемая система автоматически производит периодический контроль состояния ресурса и в случае обнаружения изменений информирует об этом пользователя (см. фиг.10). Возможна организация архива выбранных ресурсов, то есть последовательности локальных копий содержимого ресурса (см. фиг.9).
Предлагаемая система на основе анализа текстов позволяет отслеживать момент возникновения нового тематического направления.
Соответствующие реализации АПБ ИПУ ОИПП приведены на фиг.3-10.
Для начала работы с системой мониторинга и аналитики сетевых Интернет-ресурсов необходима первоначальная регистрация пользователей (см. фиг.14). С учетом ограниченного доступа регистрация пользователей осуществляется администратором системы.
Имя пользователя и пароль вводятся пользователем при начале сеанса с системой. При этом обеспечивается поддержка сессии пользователя, в течение которой ввод авторизирующей информации не требуется.
Для просмотра результатов интерактивного поиска или мониторинга пользователю необходимо выбрать интересующий его запрос и сформировать априорные оценки близости или задать значения гипотезы (3). После этого будет отображен список найденных ресурсов, соответствующих указанному запросу (см. фиг.16).
Список ресурсов включает в себя следующие поля:
- название ресурса;
- краткая аннотация ресурса;
- ссылка на ресурс;
- рубрика
- дата обнаружения ресурса (для запросов в режиме мониторинга).
После выполнения запроса пользователь может самостоятельно, на основании собственного представления, отнести документ к рубрике либо отметить документ как несоответствующий запросу.
Использование рубрик позволяет корректировать результаты интерактивных поисковых запросов. Например, при поиске по слову «излучение» находятся документы, относящиеся к обсуждению излучения космических тел, вопросов экологии, физики ядер, электроники. Если пользователя (или лица, принимающего решение - ЛПР1-ЛПР7, см. фиг.4-10) интересуют только вопросы, касающиеся излучения в космосе, то, указав рубрику «Астрономия» ЛПPi, может отсечь большую часть «шума». Заметим, что непосредственно слова «космос», «вселенная» в найденных документах могут не встречаться.
Настройка АПБ 3-9 ИПУ ОИПП (фиг.2) на предметную область может проходить в ручном, полуавтоматическом и автоматическом режимах (см. фиг.3-10).
Для вероятностного метода классификации на основе формирования гипотез вида (3) в случае ручной настройки ЛПР определяет статистические портреты каждой рубрики исходя из своих представлений о предметной области.
В случае полуавтоматического обучения ЛПР (см. фиг.4) корректирует работу соответствующего - АПБ ИПУ ОИПП (см. фиг.5) либо в процессе обработки результатов запроса, либо после ее окончания.
Построенные на основе этих данных статистические портреты и соответствующие оценки гипотез (3) достаточно универсальны и могут быть использованы как в вероятностном алгоритме с фиксированным порогом, так и в вероятностном алгоритме с выбором наилучшего. Кроме того, они хорошо кластеризуются гравитационным методом и позволяют строить качественные деревья рубрик.
Предлагаемая система позволяет построить качественные информационные портреты пользователя и обеспечить улучшение поиска в том числе с использованием глобального тематического индекса даже в тех случаях, когда пользователь явно не указывает интересующую его общую рубрику.
При введении поискового запроса ЛПР (см. фиг.15, 16) может указывать следующие интересующие его параметры:
- список слов для поиска;
- список интересующих пользователя общих рубрик, известных системе;
- список интересующих пользователя «персональных» рубрик, которые пользователь описал ранее;
- временные интервалы.
Каждый запрос может использоваться:
- для непосредственного поиска с разовой выдачей результатов поиска;
- для постоянного мониторинга с анализом новых тематических направлений;
- для поиска новых информационных ресурсов.
При непосредственном поиске ЛПР (см. фиг.7) сразу получает список документов в порядке релевантности запросу и полученным значениям гипотез (3).
При мониторинге запрос с определенным интервалом времени (4) исполняется на вновь поступающих документах, после чего в сохраненных результатах поиска выделяются и сохраняются в базе данных основные тематические направления. Пользователь в любой момент может просмотреть документы и темы, являющиеся результатами мониторинга каждого запроса.
Таким образом, отличительные признаки предлагаемого способа интерактивного поиска в распределенных вычислительных сетях и информационно-поисковой системы для его реализации позволяют повысить эффективность интерактивных поисковых процессов/запросов непосредственно в процессе выполнения поисковых научно-исследовательских работ на основе использования реальных динамических характеристик распределенных вычислительных систем и сетей, при этом предоставляется возможность повысить точность, достоверность и объективность принимаемых решений на основе более широкого использования новых информационных технологий и средств автоматизации, за счет расширения функциональных возможностей существующих технических средств и повышения эффективности соответствующих интерактивных (диалоговых) систем и подсистем.
1. Способ интерактивного поиска в распределенных вычислительных сетях включает совмещение процессов формирования интерактивных поисковых запросов и цифровых преобразований результатов измерений соответствующих сигналов по каждому из каналов формирования поисковых запросов, при этом предварительно входные сигналы поисковых запросов разделяют на две группы, в первую группу относят независимые от времени интерактивные поисковые запросы, а во вторую - зависимые, при этом устанавливают каналы измерения, соответственно независимых βk(t) и зависимых Uij (p)=fij[βk(t)] сигналов поисковых запросов, где t - время; i,j=1, 2; fij[βk(.)] - некоторая нелинейная зависимость от βk(t); k=1, 2, ..., n, затем осуществляют комбинаторный опрос, например перебор сочетаний, соответствующего числа каналов измерения и измерение параметров (амплитуды и длительности) сигналов по каждому каналу формирования поисковых запросов, при этом измерение сигналов из первой группы осуществляют на основе значений разброса их
нижних и верхних
пределов изменения с учетом допустимой, например, абсолютной погрешности измерения на соответствующем временном интервале Ti=ti1+1-ti1 измерения для всех t∈[ti, ti1+i], i1=1, 2, ..., при этом длительность временного интервала Тi1 формирования интерактивных поисковых запросов корректируют на основе значений сигнала рассогласования о близости содержания документа информационному запросу или информационной потребности на предшествующем интервале Ti1-1 формирования поисковых запросов.
2. Информационно-поисковая система, в которой на каждом уровне обработки интерактивных поисковых процессов/запросов (ОИПП) содержится Sl, g интерактивных программируемых устройств ОИПП, где l=0, 1, ..., L; q=1, 2, ..., Ql, L - число уровней ОИПП, Ql - число интерактивных программируемых устройств ОИПП (или ИЛУ ОИПП) на l-уровне, каждое из Sl, q ИЛУ ОИПП l-уровня соединено, по крайней мере, с одним ИЛУ ОИПП (l-1)-го уровня, с двумя ИЛУ ОИПП l-уровня и двумя ИЛУ ОИПП (l+1)-го уровня, при этом каждое ИЛУ ОИПП содержит: блок системной памяти, аппаратно программные блоки (АПБ) поиска и мониторинга, загрузки и индексации, АПБ рубрицирования, АПБ обучения системы, АПБ поиска и мониторинга документов, АПБ поиска (фильтрации) документов, АПБ мониторинга, АПБ корректировки результатов поиска, создание архивов и уточнение рубрик, АПБ видео адаптера, АПБ интерфейса жестких дисков, АПБ интерфейса гибких дисков, АПБ интерфейса оптических дисков, АПБ интерфейса последовательного порта, АПБ процессора, АПБ сетевого интерфейса, при этом АПБ объединены системной шиной ИЛУ ОИПП.
3. Информационно-поисковая система по п.2, отличающаяся тем, что АПБ процессора ИЛУ ОИПП содержит последовательно соединенные блок нормирующих устройств (НУ), коммутатор, АЦП, первое ЗУ, блок интерполирования, блок выделения экстремума, блок масштабирования, первую схему формирования дискретных приращений, вторую схему дискретных приращений, блок задания постоянных коэффициентов, блок синхронизации поисковых запросов, схему формирования адреса записи поисковых запросов, второе ЗУ, регистрирующее устройство (РУ), на выходе которого установлены маска, оптическая система и фотодатчик, выходом подключенный к входу формирования статистических характеристик анализируемого поискового процесса, первый выход которого соединен со вторым входом РУ, а второй выход с входом блока формирования импульсных воздействий.