Компьютерный поиск с помощью ассоциативных связей

Иллюстрации

Показать все

Изобретение относится к компьютерному поиску с помощью ассоциативных связей. Технический результат изобретения заключается в более высокой эффективности поиска компьютерных файлов и объектов в индексной базе данных. Указанный результат достигается за счет того, что осуществляют поиск в индексной базе данных для идентификации в качестве предварительных результатов поиска из одного или более выбранных компьютерных объектов, имеющих идентифицирующую информацию, хранящуюся в индексной базе данных. Один или более выбранных объектов, соответствующих предварительным результатам поиска, коррелируют с одним или более компьютерными объектами, которые имеют ассоциативные связи с выбранными компьютерными объектами, соответствующими предварительным результатов поиска, выдают объединенные результаты поиска, которые включают в себя предварительные результаты поиска с одним или более компьютерными объектами, которые имеют ассоциативные связи с выбранными компьютерными объектами, соответствующими предварительным результатам поиска, причем ассоциативные связи могут быть определены системой ассоциативных связей и включают в себя отношения между компьютерными файлами, основывающиеся на взаимодействиях пользователя с объектами или других взаимодействиях между объектами. Ассоциативные связи между объектами могут включать в себя степени подобия между этими объектами и их важность. 4 н. и 16 з.п. ф-лы, 11 ил., 3 табл.

Реферат

I. Область техники, к которой относится изобретение

Настоящее изобретение относится к компьютерному поиску файлов и других объектов и, в частности, к компьютерному поиску, который обеспечивает результаты поиска, которые включают в себя компьютерные объекты, имеющие ассоциативные связи с результатами поиска выделенного текста.

II. Предшествующий уровень техники

Известные компьютерные системы индексирования и поиска текста обеспечивают индексирование и поиск компьютерных файлов в соответствии с элементами поиска, выбираемыми пользователем. Компьютерные файлы могут представлять собой любой набор компьютерных файлов, например файлы, хранящиеся на конкретном компьютере или в сети, либо файлы, соответствующие доступному в сети узлу связанных файлов (например, Web-сайту).

Система индексирования и поиска текста обычно включает в себя средство индексирования, которое идентифицирует и извлекает из набора файлов один или более выбранных элементов и сохраняет или отображает эти выбранные элементы на записи в индексной базе данных. Пользователь, выполняющий поиск выбранных файлов, вводит один или более элементов поиска в форму поиска, отображаемую на компьютерном дисплее, который доступен для пользователя. Пользователь инициирует запрос поиска, в результате чего упомянутые один или более элементов поиска посылаются в средство поиска. Средство поиска выполняет поиск в индексной базе данных на предмет записей, которые включают в себя упомянутые один или более элементов поиска, и возвращает список результатов, который идентифицирует файлы, которые по меньшей мере частично удовлетворяют результатам поиска. Затем пользователь может осуществить доступ к идентифицированным файлам.

Ограничение известных систем индексирования и поиска текста состоит в том, что они ограничены поиском компьютерных файлов и объектов на основе текста. Хотя поиск на основе текста может относиться к различным полям данных, включая имена файлов или текст в файле, такой поиск не может учесть всех отношений и ассоциативных связей между компьютерными файлами и объектами.

Сущность изобретения

Настоящее изобретение обеспечивает улучшенный поиск компьютерных файлов и объектов. В одном варианте реализации поиск в индексной базе данных или другой способ поиска выполняют с целью идентификации в качестве предварительных результатов списка из одного или более выбранных компьютерных объектов, имеющих выбранную идентифицирующую информацию, хранящуюся в индексной базе данных. Кроме того, упомянутые один или более выбранных компьютерных объектов, соответствующих предварительным результатам поиска, коррелируют с одним или более компьютерных объектов, которые имеют ассоциативные связи с упомянутыми выбранными компьютерными объектами, соответствующими предварительным результатам поиска.

Затем выдают объединенные результаты поиска, которые включают в себя предварительные результаты поиска и один или более компьютерных объектов, имеющих ассоциативные связи с выбранными компьютерными объектами, соответствующими предварительным результатам поиска. Ассоциативные связи, которые можно определить посредством системы ассоциативных связей, представляют отношения между компьютерными файлами, основанные на взаимодействии пользователя с объектами или других взаимодействиях между объектами. Ассоциативные связи между объектами могут включать в себя отношения подобия между этими объектами и степень их важности.

Дополнительные задачи и преимущества настоящего изобретения будут очевидны из подробного описания его предпочтительного варианта осуществления, которое выполнено со ссылкой на прилагающиеся чертежи.

Перечень чертежей

Фиг.1 - блок-схема, иллюстрирующая соответствующую предшествующему уровню техники систему индексирования и поиска текста, которая обеспечивает индексирование и поиск компьютерных файлов.

Фиг.2 - блок-схема, иллюстрирующая систему индексирования и поиска, которая обеспечивает индексирование и поиск компьютерных файлов согласно настоящему изобретению.

Фиг.3 - многоуровневый список объединенных результатов.

Фиг.4 - одноуровневый список объединенных результатов.

Фиг.5 - последовательность операций способа индексирования и поиска, который обеспечивает индексирование и поиск компьютерных файлов согласно настоящему изобретению.

Фиг.6 - блок-схема, иллюстрирующая безындексную систему поиска.

Фиг.7 - функциональная блок-схема автоматической системы ассоциативных связей, которая автоматически определяет ассоциативные связи между действиями пользователя на компьютере, компьютерными объектами (например, файлами, контактной информацией и т.п.) и другими событиями.

Фиг.8 - детальная блок-схема одного варианта реализации системы сбора данных в системе ассоциативных связей по Фиг. 1.

Фиг.9 - детальная блок-схема одного варианта реализации системы обработки взаимосвязей.

Фиг.10 - детальная блок-схема одного варианта реализации системы пользовательского интерфейса для ассоциативных связей в системе ассоциативных связей по Фиг. 1.

Фиг.11 - блок-схема средства управления историей, соответствующего настоящему изобретению.

Подробное описание предпочтительных вариантов осуществления

Фиг.1 - блок-схема, иллюстрирующая соответствующую предшествующему уровню техники систему 100 индексирования и поиска текста, которая обеспечивает индексирование и поиск компьютерных файлов 102. Поиск компьютерных файлов 102 может быть использован для идентификации или доступа к файлам 102 в соответствии с элементами поиска, выбранными пользователем. Компьютерные файлы 102 могут быть любым набором компьютерных файлов, например, файлов, хранящихся на конкретном компьютере или в сети, либо файлов, соответствующих доступному в сети узлу связанных файлов (например, Web-сайту). В целях иллюстрации, нижеследующее описание Фиг.1 относится к файлам 102, которые соответствуют одному или более доступным в сети узлам связанных файлов (например, Web-сайтам).

Средство 104 индексирования индексирует и извлекает из файлов 102 один или более выбранных элементов и сохраняет или отображает их в записи в индексной базе 106 данных. Для каждого файла один или более выбранных элементов, идентифицированных и извлеченных средством 104 индексирования, могут включать в себя любой пункт или все пункты из следующего перечня: название, сетевой адрес, имя файла, описание файла, заданные ключевые слова, текст из файла, связи в файле и т.п., или любую другую информацию, при этом их хранят с идентификатором, который идентифицирует файл.

Пользователь, выполняющий поиск одного или более выбранных файлов, вводит один или более элементов поиска или другие критерии поиска в форму 108 поиска, которая отображается на дисплее компьютера (не показан), доступном пользователю. Пользователь инициирует поиск, в результате чего поисковый запрос с упомянутыми одним или более элементами поиска посылается в средство 110 поиска. Средство 110 поиска выполняет поиск в индексной базе 106 данных на предмет записей, которые включают в себя упомянутые один или более элементов поиска, и возвращает список 112 результатов, в котором перечислены файлы, которые по меньшей мере частично удовлетворяют критериям поиска.

В некоторых системах список 112 результатов включает в себя ранжирование по релевантности для перечисляемых файлов. Варианты ранжирования по релевантности реализуют попытки идентифицировать файлы, которые наиболее релевантны для пользователя. Ранжирование по релевантности можно реализовать посредством вычислений различными путями и в соответствии с различными алгоритмами, которые известны из уровня техники. Затем пользователь может осуществить доступ к одному или более требующихся файлов.

Фиг.2 - блок-схема, иллюстрирующая систему 200 индексирования и поиска, которая обеспечивает индексирование и поиск компьютерных файлов или объектов 202 согласно настоящему изобретению. Поиск компьютерных файлов 202 может использоваться с целью идентификации файлов 202 или доступа к ним в соответствии с критериями поиска, выбранными пользователем. Компьютерные файлы 202 могут представлять собой любой набор компьютерных файлов. Например, эти файлы могут быть сгенерированы динамически по запросу, например, программы на макроязыке (такой как программа на макроязыке, относящаяся к Web-серверу), или в результате запроса базы данных (процесса извлечения данных из базы данных для просмотра или правки), или могут храниться на конкретном компьютере или в сети, либо это могут быть файлы, соответствующие одному или более доступным в сети узлам связанных файлов (например, Web-сайтам). В целях иллюстрации, нижеследующее описание Фиг.2 относится к файлам, которые хранятся на компьютере или в сети.

Средство 204 индексирования идентифицирует и извлекает из файлов 202 один или более выбранных элементов и сохраняет или отображает их в записи в индексной базе 206 данных. Для каждого файла один или более выбранных критериев, идентифицированных и извлеченных средством 204 индексирования, могут включать в себя любой или все из пунктов следующего перечня: название, сетевой адрес, имя файла, описание файла, заданные ключевые слова, текст в файле, связи в файле и т.п., либо любую другую информацию, при этом их хранят с идентификатором, идентифицирующим данный файл.

Пользователь, выполняющий поиск одного или более выбранных файлов, вводит один или более элементов поиска или другие критерии поиска в форму 208 поиска, которая отображается на дисплее компьютера (не показан), доступном пользователю. Пользователь инициирует поиск, в результате чего поисковый запрос с упомянутыми одним или более элементами поиска или другими критериями посылается в средство 210 поиска. Средство 210 поиска выполняет поиск в индексной базе 206 данных на предмет записей, которые включают в себя упомянутые один или более элементов поиска или других критериев, и возвращает список 212 предварительных результатов, в котором перечислены файлы, которые по меньшей мере частично удовлетворяют критериям поиска. В некоторых вариантах реализации список 212 предварительных результатов может включать в себя ранжирование по релевантности для перечисляемых файлов известным из уровня техники способом. Например, начальный набор может быть сгенерирован посредством всех видов запросов типа: "найти файлы, созданные в пределах заданного временного интервала", или "найти индивидуумов, которые связывались со мной на прошлой неделе", или "найти солнечные дни за последние 4 месяца".

Файлы в списке 212 предварительных результатов коррелируют с другими компьютерными объектами (например, файлами, личной контактной информацией и т.п.), которые имеют ассоциативные связи с этими файлами. Ассоциативные связи идентифицируют и определяют посредством автоматической системы ассоциативных связей, которая автоматически определяет ассоциативные связи между действиями пользователя на компьютере, компьютерными объектами (например, файлами, контактной информацией и т.п.) и другими событиями. Ассоциативные связи, определенные системой 216 ассоциативных связей, представляют собой отношения между компьютерными файлами (обобщенно называемых объектами), которые основываются на взаимодействии пользователя с объектами или других взаимодействиях между объектами.

В соответствии с последующим описанием ассоциативные связи между объектами могут включать в себя отношения подобия между ними и степень их важности. Степень важности объектов и отношения подобия между ними можно определить на основе взаимодействия пользователя с этими объектами на компьютере. Взаимодействия пользователя на компьютере могут иметь место на обычном настольном или портативном компьютере, либо на любом другом эксплуатируемом пользователем вычислительном устройстве, таком как карманный компьютер, цифровой сотовый телефон и т.п. В целях простоты изложения эти типы устройств обобщенно называются в данном описании компьютерами. Систему 216 ассоциативных связей можно реализовать в качестве программного обеспечения, хранящегося в одном или более такого рода компьютерах и исполняемого ими.

В списке 218 объединенных результатов перечислены файлы, которые по меньшей мере частично удовлетворяют критериям поиска, а также перечислены другие компьютерные объекты (например, файлы, контактная информация и т.п.), которые имеют ассоциативные связи с файлами из списка 212 предварительных результатов. В некоторых вариантах реализации в списке 218 объединенных результатов файлы, удовлетворяющие критериям поиска, могут быть упорядочены в соответствии с ранжированием по релевантности известным из уровня техники способом. Затем пользователь может осуществить доступ к одному или более требующимся файлам.

Фиг. 3 показывает в качестве одного из вариантов реализации список 300 объединенных результатов, где файлы 302, которые идентифицированы в списке 212 предварительных результатов по Фиг. 2, формируют список 214 верхнего уровня. Для каждого из файлов 302 из списка 304 верхнего уровня в списке 308 нижнего уровня перечислены контекстно-ассоциированные объекты 306 (если таковые вообще имеются). Фиг. 4 показывает в качестве другого варианта реализации список 400 объединенных результатов, где файлы 402, которые идентифицированы в списке 212 предварительных результатов по Фиг. 2, объединены с контекстно-ассоциированными объектами 404 (если таковые вообще имеются) для формирования обобщенного одноуровневого списка. Упорядочивание файлов 402 и контекстно-ассоциированных объектов 404 может основываться на вариантах ранжирования по релевантности, известных их уровня техники.

Фиг. 5 - схема последовательности операций реализуемого на компьютере способа 500 индексирования и поиска, который обеспечивает индексирование и поиск компьютерных файлов или объектов. Поиск компьютерных файлов или объектов может использоваться с целью идентификации или доступа к файлам, соответствующим элементам поиска, выбранным пользователем, или может быть результатом других операций в системе, которая, например, отслеживает взаимодействия пользователя с компьютером и автоматически генерирует запрос, например, на предмет файлов, контактной информации и т.п., к которым доступ осуществлялся наиболее часто или наиболее редко.

Компьютерные файлы могут представлять собой любой набор компьютерных файлов. Например, эти файлы могут быть сгенерированы динамически по запросу, например, программы на макроязыке (такой как программа на макроязыке, относящаяся к Web-серверу), или в результате запроса базы данных, или могут храниться на конкретном компьютере или в сети, либо это могут быть файлы, соответствующие одному или более доступным в сети узлам связанных файлов (например, Web-сайтам). В целях иллюстрации, нижеследующее описание Фиг.5 относится к файлам, которые хранятся на компьютере или в сети.

На этапе 502 один или более выбранных элементов или блоков информации идентифицируют и извлекают из компьютерных файлов и объектов, и эти элементы сохраняют или отображают в записи в индексной базе данных (например в индексной базе 206 данных по Фиг.2). Для каждого файла один или более выбранных элементов, которые идентифицированы и извлечены, могут включать в себя любой или все пункты следующего перечня: название, сетевой адрес, имя файла, описание файла, заданные ключевые слова, текст в файле, связи в файле и т.п., или любую другую информацию, при этом их хранят с идентификатором, который идентифицирует данный файл.

На этапе 504 инициируют запрос с целью идентификации одного или более компьютерных файлов или объектов. Например, пользователь, выполняющий поиск одного или более выбранных файлов, может ввести один или более элементов поиска либо другие критерии поиска в форму поиска (например, форму 208 поиска по фиг.2). В качестве другого примера, запрос может быть результатом других операций в системе, которая, например, отслеживает взаимодействия пользователя с компьютером и автоматически генерирует запрос, например, на предмет файлов, контактной информации и т.п., к которым доступ осуществлялся наиболее часто или наиболее редко.

На этапе 506 пользователь инициирует поиск, нацеленный на один или более элементов поиска либо другие критерии поиска.

На этапе 508 выполняют поиск в индексной базе данных на предмет записей, которые включают в себя упомянутые один или более элементов поиска.

На этапе 510 возвращают список предварительных результатов (например, список 212 предварительных результатов по Фиг.2), указывающий файлы, которые по меньшей мере частично удовлетворяют критериям поиска. В некоторых вариантах реализации список предварительных результатов может включать в себя известное из уровня техники ранжирование перечисляемых файлов по релевантности.

На этапе 512 коррелируют файлы, указанные в списке предварительных результатов, с другими компьютерными объектами (например, файлами, контактной информацией и т.п.), которые имеют ассоциативные связи с этими файлами. Ассоциативные связи представляют отношения между компьютерными файлами (обобщенно называемыми объектами), которые основываются на взаимодействии пользователя с объектами или других взаимодействиях между объектами. Например, ассоциативные связи могут быть определены системой 216 ассоциативных связей (Фиг.2).

На этапе 514 выдают список объединенных результатов, идентифицирующий файлы, которые по меньшей мере частично удовлетворяют критериям поиска, а также идентифицирующий другие компьютерные объекты (например, файлы, контактную информацию и т.п.), которые имеют ассоциативные связи с файлами, удовлетворяющими критериям поиска.

На этап 516 пользователь осуществляет доступ к одному или более объектам из списка объединенных результатов.

Фиг.6 - блок-схема, иллюстрирующая безындексную систему 600 поиска, которая обеспечивает поиск компьютерных файлов и объектов 602 согласно настоящему изобретению. Поиск компьютерных файлов 602 может использоваться с целью идентификации файлов 602 или доступа к ним в соответствии с критериями поиска, выбранными пользователем. Компьютерные файлы 602 могут представлять собой любой набор компьютерных файлов. Например, эти файлы могут быть сгенерированы динамически по запросу, например, программы на макроязыке (такой как программа на макроязыке, относящаяся к Web-серверу), или в результате запроса базы данных, или могут храниться на конкретном компьютере или в сети, либо это могут быть файлы, соответствующие одному или более доступным в сети узлам связанных файлов (например, Web-сайтам). В целях иллюстрации, нижеследующее описание Фиг.6 относится к файлам 602, которые хранятся на компьютере или в сети.

Пользователь, выполняющий поиск одного или более выбранных файлов, вводит один или более элементов поиска либо другие критерии поиска в форму 208 поиска, которая отображается на дисплее компьютера (не показан), доступном пользователю. Пользователь инициирует поиск, в результате чего поисковый запрос с упомянутыми одним или более элементами поиска либо другими критериями посылается в средство 610 поиска. Средство 610 поиска выполняет поиск в файлах 602 на основе одного или более элементов поиска либо других критериев и возвращает список 612 предварительных результатов, в котором перечислены файлы, которые по меньшей мере частично удовлетворяют критериям поиска.

Для каждого файла упомянутые один или более выбранных критериев могут включать в себя любые или все пункты следующего перечня: название, сетевой адрес, имя файла, описание файла, заданные ключевые слова, текст в файле, связи в файле и т.п., или любую другую информацию, при этом их хранят с идентификатором, который идентифицирует файл. В некоторых вариантах реализации список 612 предварительных результатов может включать в себя ранжирование по релевантности для перечисляемых файлов известным из уровня техники способом. Например, начальный набор может быть сгенерирован посредством всех видов запросов типа: "найти файлы, созданные в пределах заданного временного интервала", или "найти пользователей, которые связывались со мной на прошлой неделе", или "найти солнечные дни за последние 4 месяца".

Файлы в списке 612 предварительных результатов коррелируют с другими компьютерными объектами (например, файлами, личной контактной информацией и т.п.), которые имеют ассоциативные связи с этими файлами. Ассоциативные связи идентифицируют и определяют посредством автоматической системы 616 ассоциативных связей, которая автоматически определяет ассоциативные связи между действиями пользователя на компьютере, компьютерными объектами (например, файлами, контактной информацией и т.п.) и другими событиями. Ассоциативные связи, определенные системой 616 ассоциативных связей, представляют собой отношения между компьютерными файлами (обобщенно называемых объектами), которые основываются на взаимодействии пользователя с объектами или других взаимодействиях между объектами.

В списке 618 объединенных результатов перечислены файлы, которые по меньшей мере частично удовлетворяют критериям поиска, а также перечислены другие компьютерные объекты (например, файлы, контактная информация и т.п.), которые имеют ассоциативные связи с файлами из списка 612 предварительных результатов. В некоторых вариантах реализации в списке 618 объединенных результатов файлы, удовлетворяющие критериям поиска, могут быть упорядочены в соответствии с ранжированием по релевантности известным из уровня техники способом. Затем пользователь может осуществить доступ к одному или более требующимся файлам.

Фиг.7 - функциональная блок-схема автоматической системы 216 ассоциативных связей, которая автоматически определяет ассоциативные связи между действиями пользователя на компьютере, компьютерными объектами (например, файлами, контактной информацией и т.п.) и другими событиями. Ассоциативные связи позволяют системе 216 ассоциативных связей идентифицировать компьютерные файлы, контактную информацию и прочую информацию (обобщенно называемые объектами), которые связаны друг с другом, посредством использования действий пользователя, например.

Согласно вышеприведенному описанию ассоциативные связи между объектами могут включать в себя отношения подобия между ними и степень их важности. Степень важности объектов и отношения подобия между ними можно определить на основе взаимодействий пользователя с объектами на компьютере. Взаимодействия пользователя на компьютере могут иметь место на обычном настольном или портативном компьютере, либо на любом другом эксплуатируемом пользователем вычислительном устройстве, таком как карманный компьютер, цифровой сотовый телефон и т.п. В целях простоты изложения эти типы устройств обобщенно называются в данном описании компьютерами. Систему 216 ассоциативных связей можно реализовать в качестве программного обеспечения, хранящегося в одном или более такого рода компьютерах и исполняемого ими.

Следует, однако, понимать, что ассоциативные связи между различными объектами не обязательно должны быть результатом непосредственных манипуляций пользователя на компьютере, но, например, могут основываться на взаимодействиях между подсетями (например, когда падает напряжение в Сан-Франциско, Интернет в Бостоне на 60% медленнее); атмосферных явлениях (например, в Сиэтле становится облачно, когда атмосферное давление падает ниже заданного значения); или изменениях цен на рынке ценных бумаг (курсы акций компании ААА и компании ВВВ упадут на следующий день после того, как курс акций компании ССС упадет на 2%). Помимо этого, ассоциативные связи могут связывать объекты разных типов (индивидуума с файлом, сообщение электронной почты с файлом и т.п.).

Система 216 ассоциативных связей включает в себя систему 702 сбора данных, которая собирает данные, относящиеся к действиям пользователя на компьютере, действиям компьютера, взаимодействиям между пользователем и различными компьютерными объектами (например, приложениями, файлами, сеансами связи, людьми и т.п.) и иные события. Например, система сбора данных может собирать данные, относящиеся к событиям в компьютерной системе (например, функционированию приложений или других элементов программного обеспечения, различным операциям над компьютерными файлами, совместному использованию компьютерных данных или иных объектов и т.п.), обмену данными между компьютерами (например, обмен данными посредством электронной почты, обмен данными посредством мгновенного обмена сообщениями), внешним данным (например, новостям, событиям и т.п.) и людям (например, именам, почтовыми псевдонимами и т.п.).

В одном варианте реализации система 702 сбора данных может включать в себя средство 704 мониторинга действий в системе, которое, например, выполняет мониторинг действий пользователя на эксплуатируемом пользователем компьютере (не показан). Средство 704 мониторинга действий в системе может быть реализовано в качестве компьютерной программы, для которой другие приложения или операционная система предоставляют информацию о действиях пользователя на компьютере, таких как поисковые запросы, открытие или изменение документа или другого файла и т.п. Например, хотя объекты могут обладать многими свойствами, поиск, выполняемый пользователем, и результаты поиска могут указывать, какие свойства наиболее важны для пользователя. Для каждого такого действия средство 704 мониторинга действий в системе создает или добавляет запись информации (иногда называемой "метаданными"), которая хранится в базе 706 данных компьютерной системы.

Например, средство 704 мониторинга действий в системе может включать в себя средство мониторинга действий универсального ввода данных, которое обеспечивает единую точку входа для всех взаимодействий пользователя с компьютером или по меньшей мере заданных взаимодействий пользователя с компьютером. В данной реализации универсального ввода данных средство 704 мониторинга действий в системе может определить и сохранить в качестве метаданных в базе 706 данных компьютерной системы один или все элементы из следующего списка: данные о способе ввода (например, текст, речь, мышь и т.п.), данные о языке ввода (английский, китайский и т.п.), данные о режиме ввода (например, диктовка или ввод команд с клавиатуры), данные о содействии при вводе (например, автоматическое завершение печатаемого слова, угадывание команд и т.п.), данные обратной связи при вводе (например, требуется ли для компьютера дополнительная информация, исправления неверных догадок, сделанных компьютером, и т.п.), и т.п. Например, если пользователь копирует или сохраняет изображение в Web-броузере, то средство 704 мониторинга действий в системе может сохранить сетевой адрес (например, уникальный указатель ресурса (URL)) исходной страницы, а также URL самого изображения, в качестве метаданных в базе 706 данных компьютерной системы.

В базе 706 данных компьютерной системы хранится информация (например, "метаданные") о компьютерных файлах, хранящихся на компьютере, и о действиях, выполняемых на компьютере. Метаданные могут включать в себя обычную информацию, например такую, которая характерна для сгенерированных компьютером документов, включая то, когда файл был создан, кем файл был создан, и историю изменения файла. Кроме того, некоторые типы компьютерных файлов могут иметь специфические поля метаданных, которые не применимы для других типов файлов. Например, поля метаданных для файла типа фотографии могут включать в себя размер изображения, где было снято изображение, кто снял изображение, кто на изображении и т.п. В одном варианте реализации в базу 706 данных системы можно добавить новые поля метаданных, чтобы приспособиться к новым типам файлам или чтобы сохранить новую информацию о существующем типе файлов.

В Таблице 1А приведена иллюстративная информация, которая может быть получена средством 704 мониторинга действий в системе и сохранена в базе 706 данных компьютерной системы. В отношении различных компьютерных файлов и компьютерной информации (обобщенно называемых объектами), с которыми пользователь может взаимодействовать, средство 704 мониторинга действий в системе может собирать данные, относящиеся к любому или всем элементам из следующего списка: создатель/автор объекта, тип объекта, любой указатель на объект (если доступен), события активации, размер объекта и т. д. Например, средство 704 мониторинга действий в системе может получать информацию об объектах, с которыми взаимодействует пользователь компьютера, определять то, являются ли объекты новыми или уникальными относительно других объектов, перечисленных в базе 706 данных компьютерной системы (например, на основе уникального идентификатора объекта), собирать или сохранять данные о действиях в базе 706 данных компьютерной системы в ассоциативной связи с уникальным идентификатором объекта этого объекта.

Таблица 1А. Сбор и анализ данных
Логические структурыОперации
Сбор данныхОбработка данных
Объекты, с которыми взаимодействуют пользователи
Общиесоздатель/автор объекта, тип объекта, указатель на объект, если последний все еще существует, события активации, размер объектаполучить информацию об объектах, определить, имеются ли новые/уникальные и групповые события на уровне уникального идентификатора объекта, создать ассоциативную(ые) связь(и)
Индивидуумы
индивидуумы в программе электронной почты пользователяпсевдонимы клиентов электронной почтысоздать ассоциативную(ые) связь(и)
индивидуумы в списке личной контактной информации пользователяфайлы списка личной контактной информациисоздать ассоциативную(ые) связь(и)
индивидуумы-пользователи системы мгновенного обмена сообщениями, и индивидуумы, с которыми пользователь ведет интерактивную перепискусписок приятелей, подобный списку псевдонимов для электронной почтысоздать ассоциативную(ые) связь(и)
Обмен данными
электронная почтасобытия электронной почты (открытие, закрытие), адреса электронной почтысоздать ассоциативную(ые) связь(и)
телефонные сообщениясобытия телефонных сообщений (открытие, закрытие), псевдоним для электронной почтысоздать ассоциативную(ые) связь(и)
мгновенные сообщениясобытия в сеансе мгновенного обмена сообщениями (открытие, закрытие), индивидуумысоздать ассоциативную(ые) связь(и)
сообщения интерактивной перепискисобытия в сеансе интерактивной перепискисоздать ассоциативную(ые) связь(и)
Файлы
любые файлы, созданные, открытые, сохраненные, воспроизведенные, посланные и т.п.Имена файлов, местоположение в каталоге, сетевой URLсоздать ассоциативную(ые) связь(и)
Элементы Web
Web-страницыуказатели URLсоздать ассоциативную(ые) связь(и)
воспроизведенные потоковые элементыуказатели URLсоздать ассоциативную(ые) связь(и)
Уведомлениятип уведомления, ответное уведомлениесоздать ассоциативную(ые) связь(и)
Приложенияуказатель на приложениесоздать ассоциативную(ые) связь(и)

Объекты, с которыми взаимодействует пользователь компьютера, могут быть ассоциативно связаны с другими индивидуумами, компьютерными файлами, обменом данными с другими индивидуумами, сетевыми или Web-элементами и приложениями, выполняемыми или доступными на этом компьютере. Средство 704 мониторинга действий в системе может выполнять операции получения и сохранения в базе 706 данных компьютерной системы для каждого из перечисленных типов иллюстративной информации.

Система 216 ассоциативных связей включает в себя систему 708 обработки взаимосвязей, которая определяет одну или более взаимосвязей между объектами или метаданными, полученными системой 702 сбора данных или хранящимися в базе 706 данных компьютерной системы. В одном иллюстративном варианте реализации система 708 обработки взаимосвязей включает в себя систему 710 подобия или ассоциативной связи, которая определяет степень подобия или ассоциативной связи между по меньшей мере парой компьютерных файлов или объектов. Степень подобия или ассоциативной связи может быть представлена, например, в качестве числового значения между 0 и 1, где 1 обозначает идентичность между объектами, а 0 показывает абсолютное отсутствие связи между ними. Система 710 ассоциативной связи может быть реализована в качестве одной или более программ, результатом работы которых в отношении заданного целевого файла и набора других файлов является ранжирование по степени подобия между ними.

Следует понимать, что разные типы документов, файлов или объектов могут иметь разные типы подобия. Например, две фотографии могут выглядеть аналогично, могут быть сняты в одно и то же время, могут относиться к одному и тому же индивидууму, месту или событию, могут быть одного цвета, могут быть посланы одним и тем же индивидуумам или совместно распечатаны, могут быть частями одной и той же фотографии (например, одна может быть вырезана из другой) и т.д. В Таблице 1В приведены иллюстративные ассоциативные связи или подобия, которые система 710 ассоциативной связи может идентифицировать и сохранить в базе 706 данных компьютерной системы. Как отмечено, ассоциативные связи или подобия могут относиться к объектам или файлам, имеющим совместно используемое содержимое, имеющим место в аналогичное время или в аналогичных компьютерных местоположениях (таких как компьютер, каталог и т.п.), посланным одному и тому же индивидууму или принятым от него, связанным между собой посредством ссылок.

Таблица 1В. Сбор и анализ данных
Логические структурыОперации
Сбор данныхОбработка данных
Контекст: ассоциативные связи между объектами
Имеющие общее содержимое
событие "вырезать/вставить", событие "вставить", объектыуровень общности
событие "сохранить как"уровень общности
Происходящие почти в одно и то же время
Открытие на одной и той же машине в одно и то же времяактивирующие события открытия/закрытия, объекты, дата/время событийдлительность между временами, перекрывающиеся сеансы
Происходящие почти в одном и том же "месте"
на одной и той же машине имя машинысоздать ассоциативную(ые) связь(и)
поблизости друг от друга в каталогеместоположение в структуре каталогаминимальное количество перескоков по древовидной структуре от одного к другому
поблизости друг от друга в Webсобытие, связанное со ссылкой, ссылки от, ссылки насохранить метаданные в базе данных компьютерной системы
по одной и той же электронной почтесобытия, связанные с вложениями в сообщение, объектыгруппировать на уровне обмена данными
Посылаемые друг другу/принимаемые друг от друга
элемент, посланный другому индивидуумусобытие посылки, объектыфильтрация в отношении индивидуума и наборов элементов
указатель на элемент, посланный другому индивидуумусобытие вставки, объектыфильтрация в отношении индивидуума и наборов элементов
открытие индивидуумомсобытие открытия, объектыфильтрация в отношении индивидуума и наборов элементов
сохранение индивидуумомсобытие сохранения, объектыфильтрация в отношении индивидуума и наборов элементов
Активация одного из другого
элементы, загруженные из Web-страницысобытие загрузки, объекты
связанные по ссылке посредством URLсобытие, связанное со ссылкой, объекты, ссылка от, ссылка на