Система, способ и интерфейс для обеспечения персонализированного поиска и доступа к информации

Патент 2419858

Авторы

Правообладатели

МАЙКРОСОФТ КОРПОРЕЙШН (US)

Классы МПК

G06F17/30 - информационный поиск; структуры баз данных для этой цели

Система, способ и интерфейс для обеспечения персонализированного поиска и доступа к информации

Иллюстрации

Показать все

Изобретение относится к области автоматического усовершенствования и выбора запросов и/или результатов поиска в соответствии с персонализированной пользовательской моделью. Техническим результатом является расширение функциональных возможностей за счет использования персонализированной пользовательской модели при осуществлении поиска. Система выполняет формирование персонализированного поиска информации. Данная система включает в себя пользовательскую модель для определения характеристик пользователя. Пользовательская модель может создаваться автоматически через анализ информации пользователя, его действий и всего контекста. Компонент персонализации автоматически модифицирует запросы и/или результаты поиска, принимая во внимание пользовательскую модель для персонализации поиска информации для пользователя. Пользовательский интерфейс принимает запросы и отображает результаты поиска от одной или большего количества местных и/или удаленных поисковых машин, причем интерфейс может корректироваться в диапазоне от более персонализированного поиска до более обобщенного поиска. 3 н. и 12 з.п. ф-лы, 15 ил.

Реферат

Область техники, к которой относится изобретение

Настоящее изобретение относится в общем случае к компьютерным системам, а более конкретно, настоящее изобретение относится к автоматическому усовершенствованию и выбору запросов и/или результатов поиска в соответствии с персонализированной пользовательской моделью.

Уровень техники

Учитывая широкую популярность «Всемирной паутины» и Интернет, пользователи могут получать информацию, относящуюся почти к любой теме, из большого количества информационных источников. Для поиска информации пользователи в общем случае применяют различные поисковые машины (поисковые механизмы) к задаче поиска информации. Поисковые машины позволяют пользователям находить по Интернет веб-страницы, содержащие информацию или другой материал, которые содержат определенные слова или фразы. Например, если они хотят найти информацию о Джордже Вашингтоне, первом президенте Соединенных Штатов, то они могут напечатать «Джордж Вашингтон первый президент», нажать кнопку поиска, и поисковая машина возвратит список веб-страниц, которые содержат информацию об этом известном президенте. Однако, если бы проводился более обобщенный поиск, например, если просто напечатать термин «Вашингтон», то возвратилось бы намного больше результатов, таких как относящиеся к географическим регионам или учреждениям, связанным с тем же самым именем.

В Сети существует много поисковых машин. Например, AllTheWeb, AskJeeves, Google, HotBot, Lycos, MSN Search, Teoma, Yahoo - только некоторые из многих примеров. Большинство этих поисковых машин обеспечивают по меньшей мере два режима поиска информации, например, через их собственный каталог сайтов, которые организованы с помощью тем для просмотра пользователями, или с помощью выполнения поиска по ключевым словам, которые вводят через портал пользовательского интерфейса в браузер. В общем случае, поиск по ключевым словам найдет, при наилучшей способности компьютера, все веб-сайты, которые содержат любую информацию, относящуюся к любым ключевым словам и фразам, которые определены. Сайт поисковой машины имеет поле для ввода пользователями ключевых слов и кнопку, которую нужно нажать для запуска поиска. Многие поисковые машины имеют подсказки о том, как использовать ключевые слова для эффективного поиска. Подсказки обычно обеспечиваются для того, чтобы помочь пользователям более точно определять термины поиска, чтобы посторонняя или несвязанная информация не возвращалась и не мешала процессу поиска информации. Таким образом, ручное уточнение терминов сохраняет пользователям много времени, помогая уменьшить прием нескольких тысяч сайтов для сортировки при поиске конкретной информации.

Одной из проблем во всех методиках поиска является требование ручного определения или уточнения терминов поиска для генерации требуемых результатов за короткое время. Другая проблема состоит в том, что поисковые машины работают одинаково для всех пользователей, независимо от различных пользовательских потребностей и обстоятельств. Таким образом, если два пользователя вводят тот же самый запрос поиска, то они получают те же самые результаты, независимо от их интересов, хронологии предыдущего поиска, вычислительного контекста или окружающего контекста (например, расположения, используемой машины, времени дня, дня недели). К сожалению, современные процессы поиска предназначены для того, чтобы принимать явные команды для поиска вместо того, чтобы рассматривать эти другие персонализированные факторы, которые могут предложить понимание фактических или желаемых целей поиска информации пользователем.

Раскрытие изобретения

Далее представлена упрощенная сущность изобретения для обеспечения основного понимания некоторых аспектов изобретения. Эта сущность не является обширным обзором изобретения. Она не предназначена для идентификации ключевых/критических элементов изобретения или для определения объема изобретения. Задача состоит в том, чтобы представить некоторые концепции изобретения в упрощенной форме в качестве вводной части к более подробному описанию, которое представлено ниже.

Настоящее изобретение относится к системам и способам, которые расширяют способы поиска информации, используя пользовательские модели, которые облегчают персонализацию поиска информации в соответствии с характеристиками пользователя, учитывая, насколько информация имеет отношение или соответствует наилучшим образом соответствующим пользователям. Данные модели могут объединяться с традиционными алгоритмами поиска для модификации запросов поиска и/или модификации результатов поиска для автоматического фокусирования способов поиска информации на элементах или результатах, которые, более вероятно, будут соответствовать пользователю, принимая во внимание личные характеристики пользователя. Различные методики обеспечивают для персонализации поиска через данную модель с помощью учета таких аспектов, как информация пользователя (например, информация, хранящаяся на компьютере пользователя), интересы, опыт (квалификацию) и определенный контекст, в котором эта информация нужна (например, запрос на поиск, вычислительное событие) для улучшения опыта поиска пользователя. Это усовершенствование можно соблюдать с помощью предоставления пользователям более выборочного или фильтрованного поиска элементов, представляющих интерес, удаления несвязанных элементов и/или повторного ранжирования (упорядочивания) возвращаемых результатов поиска на основе персонализированных предпочтений пользователя.

Пользовательские модели могут быть получены из множества источников, включающих в себя каталоги с широкими возможностями, которые рассматривают прошлые пользовательские события, предыдущие обмены информацией клиента, регистрацию или хронологию поиска, параметры пользователя, демографические данные, и/или основываясь на подобии другим пользователям (например, совместная фильтрация). Кроме того, могут применяться другие методики, такие как машинное самообучение для контроля поведения пользователя в течение долгого времени, для определения и/или усовершенствования пользовательских моделей. Данные модели могут объединяться со способами автономного или сетевого поиска (или с их комбинациями) для модификации результатов поиска для создания результатов поиска информации, которые, наиболее вероятно, будут представлять интерес для соответствующего пользователя. Таким образом, пользовательские модели используют для автоматической и эффективной дифференциации персонализированного поиска от обобщенного поиска.

В одном конкретном примере обобщенный поиск может включать в себя термин «погода». Так как модель может определять, что пользователь находится в конкретном городе (например, из учетной записи электронной почты, сохраненных документов, имеющих адрес пользователя, или с помощью явного или неявного определения местоположения), может автоматически выполняться персонализированный поиск (например, через автоматическую модификацию запроса и/или результатов), который возвращает относящуюся к погоде информацию, которая относится к городу, в котором пользователь находится в настоящее время. В мобильной ситуации, контекст (ситуация) для поиска может отличаться, и таким образом запрос и/или результаты могут модифицироваться соответствующим образом (например, поиск, выполняемый с мобильного компьютера пользователя, когда из недавнего резервирования авиабилетов или из недавно переданного другу мгновенного сообщения обнаружено, что в настоящее время он находится вне города). Могут обеспечиваться пользовательские интерфейсы, которые возвращают персонализированные результаты и предоставляют возможность настройки алгоритмов персонализированного поиска от наиболее обобщенного поиска по всему спектру до более персонализированного поиска.

Для достижения описанных ранее и связанных с ними целей, конкретные иллюстративные аспекты изобретения описаны в связи с последующим описанием и прилагаемыми чертежами. Эти аспекты показывают различные способы, с помощью которых можно воплощать данное изобретение, все из которых охватывает настоящее изобретение. Другие преимущества и новые особенности изобретения будут очевидны из последующего подробного описания изобретения при рассмотрении его вместе с чертежами.

Краткое описание чертежей

Фиг.1 является схематической структурной схемой, показывающей архитектуру поиска информации в соответствии с одним из аспектов настоящего изобретения.

Фиг.2 - структурная схема, показывающая пользовательскую модель в соответствии с одним из аспектов настоящего изобретения.

Фиг.3 - последовательность операций, показывающая процесс поиска информации в соответствии с одним из аспектов настоящего изобретения.

Фиг.4-9 показывают примеры пользовательского интерфейса в соответствии с одним из аспектов настоящего изобретения.

Фиг.10-13 показывают примерный алгоритм персонализации в соответствии с одним из аспектов настоящего изобретения.

Фиг.14 - схематическая структурная схема, показывающая соответствующую конфигурацию в соответствии с одним из аспектов настоящего изобретения.

Фиг.15 - схематическая структурная схема типовой вычислительной конфигурации, с которой может взаимодействовать настоящее изобретение.

Осуществление изобретения

Настоящее изобретение относится к системам и способам, которые используют пользовательские модели для персонализации обобщенных запросов и/или результатов поиска согласно информации, которая имеет отношение к соответствующему пользователю. В одном из аспектов обеспечивают систему, которая облегчает генерацию персонализированного поиска информации. Данная система включает в себя пользовательскую модель для определения характеристик пользователя. Компонент персонализации автоматически модифицирует запросы и/или результаты поиска, принимая во внимание пользовательскую модель для персонализации поиска информации для пользователя. Компонент пользовательского интерфейса принимает запросы и отображает результаты поиска от одной или большего количества местных и/или удаленных поисковых машин, причем интерфейс может настраиваться в диапазоне от более персонализированного поиска до более обобщенного поиска.

В данной заявке термины «компонент», «услуга», «модель» и «система» относятся к связанному с применением компьютера объекту, или к аппаратным средствам, или к комбинации аппаратных средств и программного обеспечения, или к программному обеспечению, или к выполняемому программному обеспечению. Например, компонент может быть процессом, выполняющимся в процессоре, процессором, задачей, исполняемым кодом, потоком выполнения, программой и/или компьютером, но не ограничен ими. Для иллюстрации, и приложение, выполняющееся на сервере, и сервер могут быть компонентом. Один или большее количество компонентов могут находиться в пределах процесса и/или потока выполнения, и компонент может быть локализован на одном компьютере и/или распределен между двумя или большим количеством компьютеров. В данном описании термин «вывод» в общем случае относится к процессу принятия решения или определения состояний системы, среды и/или пользователя из ряда наблюдений, которые зафиксированы через события и/или данные. Вывод может использоваться для идентификации определенного контекста или действия, или, например, может генерировать распределение вероятности по состояниям.

Обращаясь сначала к фиг.1, система 100 показывает архитектуру поиска информации в соответствии с одним из аспектов настоящего изобретения. Система 100 изображает обобщенную схему персонализации результатов поиска. Компонент 110 персонализации включает в себя пользовательскую модель 120, а также компоненты обработки (например, алгоритмы поиска, модифицируемые в соответствии с пользовательской моделью) для использования модели для воздействия на результаты поиска с помощью модификации запроса 130 и/или модификации результатов 140, возвращенных из поиска. Пользовательский интерфейс 150 генерирует запрос 130 и принимает модифицированные или персонализированные результаты, которые основаны на модификации 170 запроса и/или модификации 160 результатов, которые обеспечивает компонент 110 персонализации. В данном описании термин «модификация запроса» относится и к изменению относительно терминов в запросе 130, и к изменениям в алгоритме, который соответствует запросу 130 к документам, для получения персонализированных результатов 140. Модифицированные запросы и/или результаты 140 возвращают из одной или большего количества местных и/или удаленных поисковых машин 180. Глобальная база 190 данных из пользовательских статистических данных может поддерживаться для облегчения обновления пользовательской модели 120.

В общем случае существуют по меньшей мере два подхода к настройке результатов поиска, основываясь на пользовательской модели 120. В одном из аспектов с помощью модификации запроса обрабатывают начальный входной запрос и модифицируют или повторно генерируют запрос (через пользовательскую модель) для получения персонализированных результатов. Описанная ниже обратная связь по релевантности (по важности) является разновидностью с двумя циклами этого процесса, причем запрос генерирует результаты, которые приводят к модификации запроса (используя явные или неявные выводы о начальном наборе результатов), который приводит к персонализированным результатам, которые персонализированы для краткосрочной модели, основываясь на наборе результатов и запросов. Долговременные пользовательские модели могут также использоваться в контексте обратной связи по релевантности. Дополнительно, как обсуждается выше, модификация запроса также относится к изменениям, которые делают в алгоритме(ах), используемом для сравнения запроса с документами. В другом аспекте при модификации результатов берут вводимую пользователем информацию «как есть» для генерации запроса, который приводит к результатам, которые затем модифицируют (через пользовательскую модель) для генерации персонализированных результатов. Следует отметить, что модификация результатов обычно включает в себя некоторую форму повторного ранжирования и/или выбора из большего набора альтернатив. Модификация результатов может также включать в себя различные типы накопления и суммирования всех или подмножества результатов.

Способы модификации результатов включают в себя сравнение статистического подобия (в котором интересы пользователей и их информация представлены как векторы и соответствуют элементам) и сравнение категорий (в котором интересы пользователей и их информация представляют и соответствуют элементам, используя меньший набор дискрипторов). Приведенные выше процессы модификации запроса или модификации результатов могут объединяться, или независимо, или в интегрированном процессе, когда вводят зависимость между двумя процессами и используют для достижения цели. Чтобы показать персонализированный поиск, приведены следующие примеры.

В одном из примеров пользователь, который ищет информацию, расположен в Сиэтле. Поиск информации о дорожном движении возвращает информацию, относящуюся к дорожному движению в Сиэтле, а не к дорожному движению вообще. Или поиск пиццы возвращает только рестораны пиццы в соответствующем районе города, который относится к пользователю.

В другом примере пользователь, который ищет информацию, предварительно искал термин «Порше». Поиск термина «Ягуар» возвращает результаты, относящиеся к автомобильному значению термина «Ягуар», в противоположность животному или компьютерной игре или часам; другие результаты могут также возвращаться, но предпочтение отдают тем, которые относятся к автомобильному значению.

В другом случае пользователь, который ищет информацию, ищет термин «Буш», и большинство результатов - о президенте. Однако этот человек ранее читал статьи Ванневара Буша и переписывался по электронной почте с Сьюзен Буш, таким образом результатам, соответствующим этим элементам, присваивают более высокий приоритет. Как можно оценить, поиск может модифицироваться множеством различных способов, учитывая данные, хранящиеся и обрабатываемые с помощью пользовательской модели 120, которая описана более подробно ниже относительно фиг.2.

Обращаясь к фиг.2, пользовательская модель 200 показана в соответствии с одним из аспектов настоящего изобретения. Пользовательскую модель 200 используют для дифференциации персонализированного поиска от обобщенного поиска. Один аспект в успешной персонализации предназначен для создания модели пользователя, которая точно отражает его интересы и проста для поддержания и настройки к изменениям относительно долгосрочных и краткосрочных интересов. Пользовательскую модель можно получать из разнообразия источников, которые включают в себя, но не ограничены ими:

1) Из расширенной истории 210 вычислительного контекста, которая может быть получена из местных, мобильных или удаленных источников (например, открытые приложения, содержимое этих приложений и подробная хронология такого обмена информацией, включающая в себя ее расположение).

2) Из расширенного каталога 220 информационных ресурсов, к которым ранее с которым обращались (например, документов, веб-страниц, сообщений электронной почты, мгновенных сообщений, заметок, назначенных в календаре мероприятиях и т.д.).

3) Из результатов отслеживания обмена 230 информацией клиента, включающих в себя недавние или частые контакты, интересующие темы, полученные из ключевых слов, взаимоотношения в структуре организации, назначенные мероприятия и т.д.

4) Из истории или журнала регистрации предыдущих посещений веб-страниц или местных/удаленных сайтов с данными, которые включают в себя историю предыдущих запросов 240 на поиск.

5) Из профиля интересов пользователя 250, который можно определять явно или неявно, получая через фоновый контроль.

6) Из демографической информации 260 (например, места жительства, пола, возраста, биографических данных, квалификации (места работы) и т.д.).

Из приведенных выше примеров можно понять, что пользовательская модель 200 может основываться на многих различных источниках информации. Например, модель 200 могут получать из истории или журнала регистрации местоположений, посещаемых пользователем в течение долгого времени, что можно контролировать с помощью таких устройств, как система глобального позиционирования (GPS). При контроле с помощью GPS, необработанная пространственная информация может преобразовываться в текстовые названия городов и почтовые индексы. Необработанная пространственная информация может преобразовываться в текстовые названия городов и почтовые индексы для мест, в которых пользователь останавливался или жил, или в которых, например, произошла потеря сигнала GPS. Местоположения, в которых пользователь останавливался или жил, или в которых произошла потеря сигнала GPS, могут идентифицироваться и преобразовываться в текстовые метки с помощью базы данных фирм и мест, представляющих интерес. Другие факторы включают в себя регистрацию времени дня или дня недели для определения местоположения и мест, представляющих интерес.

В других аспектах данного изобретения могут обеспечиваться компоненты для управления параметрами, которые предназначены для управления тем, как совокупность информации пользователя, назначенные мероприятия, обзоры документов или файлов, действия или местоположения могут группироваться в подмножества или им могут присваиваться весовые коэффициенты дифференцированно в процедурах сравнения для персонализации, основываясь на типе, возрасте или других комбинациях. Например, алгоритм поиска может ограничиваться теми аспектами совокупности информации пользователя, которые относятся к запросу (например, документы, которые содержат запрашиваемый термин). Точно также сообщения электронной почты могут анализироваться за предыдущий 1 месяц, тогда как обращения в Интернет - за предыдущие 3 дня, а информация пользователя, созданная в течение прошлого года. Может быть желательно, чтобы информация о местоположении GPS использовалась только за сегодняшний день или за другой период времени. Параметрами можно управлять автоматически для создания подмножеств (например, через процесс оптимизации, который изменяет параметры и проверяет ответ от пользователя или от системы), или пользователи могут изменять один или большее количество этих параметров через пользовательский интерфейс, причем такие параметры настройки могут быть функцией характера запроса, времени дня, дня недели или других контекстных наблюдений или наблюдений за деятельностью.

Модели можно получать для людей или групп людей 270, например, через методику совместной фильтрации (описанную ниже), которая разрабатывает профили с помощью анализа подобия среди людей или групп людей. Вычисление подобия может основываться на содержимом и/или использовании элементов. Следует отметить, что моделирование инфраструктуры и соответствующая обработка могут выполняться в клиенте, во множестве клиентов, в одном или большем количестве серверов или в комбинациях серверов и клиентов.

Методики машинного обучения 280 могут применяться для изучения характеристик и интересов пользователя в течение долгого времени. Модели обучения могут включать в себя, по существу, любой вид системы, например, статистические/математические модели и процессы для моделирования пользователей и определения персональных настроек и интересов, которые включают в себя использование байесовского обучения, которое может генерировать байесовские модели зависимости, такие как байесовские сети, простые байесовские классификаторы и/или другие методологии статистической классификации, которые включают в себя, например, машины поддерживающих векторов (SVM). Другие виды моделей или систем могут включать в себя нейронные сети и скрытые модели Маркова, например. Хотя могут использоваться сложные модели принятия решения в соответствии с настоящим изобретением, следует признать, что также могут использоваться другие подходы. Например, вместо более тщательного вероятностного подхода могут также использоваться детерминированные предположения (например, отсутствие нового поиска конкретного веб-сайта в течение времени X может подразумевать по установленным правилам, что пользователя больше не интересует соответствующая информация). Таким образом, в дополнение к принятию решений в состоянии неопределенности, логические решения могут также приниматься относительно состояния, расположения, контекста, интересов, устремлений и т.д. пользователей.

Модели обучения могут тренироваться с помощью хранилища данных пользовательских событий (не показано), которое собирает или объединяет данные из множества различных источников данных. Такие источники могут включать в себя различные компоненты сбора данных, которые записывают или регистрируют данные пользовательских событий (например, звонки по сотовому телефону, звуковую информацию, записанную с помощью микрофона, информацию системы глобального позиционирования (GPS), информацию из электронного календаря, информацию от контролирующего оборудования системы технического зрения, активность на «рабочем столе», взаимодействие с веб-сайтами и т.д.). Следует отметить, что система 100 может воплощаться, по существу, любым способом, который поддерживает персонализированную обработку запросов и результатов. Например, система может воплощаться как сервер, серверная ферма, в клиентских приложениях, или более обобщенно, включать в себя веб-службу(ы) или другое автоматизированное приложение(я), которые взаимодействуют с функциональными средствами поиска, такими как пользовательский интерфейс 150 и поисковая машина 180.

Перед продолжением методики совместной фильтрации, применяемые в позиции 270 для пользовательской модели 200, описаны более подробно. Эти методики могут включать в себя использование совместных фильтров для анализа данных и определения профилей для пользователя. Системы совместной фильтрации в общем случае используют централизованную базу данных о пользовательских предпочтениях для предсказания дополнительных тем, которые могут запрашивать пользователи. В соответствии с настоящим изобретением совместную фильтрацию применяют в пользовательской модели 200 для обработки предыдущих действий пользователя из группы пользователей, которые могут указывать предпочтения данного пользователя, которые предсказывают вероятные или возможные профили для новых пользователей системы. Могут использоваться несколько алгоритмов, включающих в себя методики, основанные на коэффициентах корреляции, вычислениях подобия на основе вектора и статистических байесовских способах.

Фиг.3 показывает методологию 300 поиска информации в соответствии с настоящим изобретением. Хотя в целях простоты объяснения, методология показана и описана как последовательность действий, следует понять и признать, что настоящее изобретение не ограничено данным порядком действий, поскольку некоторые действия, в соответствии с настоящим изобретением, могут происходить в другом порядке и/или одновременно с другими действиями, по сравнению с показанными и описанными действиями. Например, специалисты поймут и оценят, что методология может альтернативно быть представлена как последовательность взаимодействующих состояний или событий, таких, какие существуют в диаграмме состояний. Кроме того, не все показанные действия могут требоваться для воплощения методологии в соответствии с настоящим изобретением.

Явно или неявно собранная информация об интересах пользователя может использоваться различными способами и зависящим от запроса способом, причем могут применяться многочисленные классы алгоритмов. Многие из алгоритмов учитывают имеющуюся в наличии личную информацию пользователя и/или действия, и/или запрос, и/или результаты, которые возвращает поисковая машина, и учитывают результаты измерения или то, что заменяет результаты измерения для статистических зависимостей между такой информацией и глобальной информацией.

Процесс 300 изображает два основных способа, которые могут быть применяться, однако, как отмечено выше, комбинации модификаций на основе запроса или модификаций на основе результатов могут применяться для персонализации извлеченной информации. На этапе 310 определяют одну или большее количество пользовательских моделей, как предварительно описано выше относительно фиг.2. На этапе 320 пользовательский запрос модифицируют в соответствии с моделью, определенной на этапе 310. Это может включать в себя автоматическое усовершенствование или уточнение запроса, чтобы он содержал только термины, которые соотносятся с интересами пользователя, которые определяют с помощью модели. На этапе 330 выполняют поиск с помощью модифицированного запроса, передавая модифицированный запрос к одной или большему количеству поисковых машин, причем результаты для модифицированного запроса возвращают на этапе 340.

В другой ветви процесса 300 выполняют поиск, передавая запрос пользователя к одной или большему количеству поисковых машин на этапе 350. Возвращенные результаты затем модифицируют на этапе 360, принимая во внимание пользовательскую модель. Это может включать в себя фильтрацию или переупорядочение результатов, основываясь на вероятности того, что некоторые результаты больше соответствуют предпочтениям пользователя для поиска необходимой информации. На этапе 370 модифицированные результаты представляют пользователю через отображение пользовательского интерфейса.

Последующее обсуждение описывает один конкретный пример смоделированной системы персонализированного поиска. В этом случае пользовательская модель может включать в себя каталог всех элементов, которые пользователь ранее просматривал, которые включают в себя сообщения электронной почты, документы, веб-страницы, назначенные в календаре мероприятия, примечания, мгновенные сообщения, блоги (электронные дневники) и т.д. Элементы отмечают с помощью метаданных (например, времени доступа/создания/модификации, типа элемента, автора элемента и т.д.), которые могут использоваться для выборочного добавления/исключения элементов для разработки пользовательской модели. В данном случае пользовательская модель находится в клиентской машине, причем к пользовательской модели существует доступ от запоминающего устройства в пределах клиентской машины при использовании поисковой машины.

Так как пользовательская модель обычно выполняется на клиентской машине, если клиентская машина не имеет местный каталог совокупности информации, в которой выполняют поиск, то получение статистической информации по термину для всей совокупности для повторного ранжирования может быть трудной задачей или требовать много времени для вычисления. Поэтому в последующем примере статистические данные совокупности аппроксимируют при использовании набора результатов.

Запрос направляют к поисковой машине (в Интернет или к корпоративной сети), и она возвращает результаты. Результаты модифицируют через пользовательскую модель. Модификация также происходит на клиентской машине. Для каждого результата вычисляют подобие элемента с каталогом пользователя для идентификации результатов, которые представляют больше интереса для пользователя. Существуют несколько способов выполнения такого сравнения, например, такой как:

Уравнение персонализированного подобия psim =

Персонализированное подобие суммируют по всем интересующим терминам. Для каждого термина подобие результата пропорционально тому, как часто термин появляется в результате (tf_t), обратно пропорционально количеству документов в совокупностях, в которых выполняют поиск, в которых данный термин появляется (df_t), и пропорционально тому, в скольких документах термин появляется в каталоге пользователя (pdf_t). Интересующие термины могут включать в себя термины в заголовке результата, термины в краткой сводке результата, термины в расширенной сводке результата, термины во всей веб-странице, или некоторое подмножество этих терминов. Количество документов в совокупностях, в которых появляется данный термин, можно аппроксимировать, используя количество документов в наборе результатов, в котором появляется данный термин, где документы представлены полным текстом документа или отрывком из набора результатов, описывающим документ.

В одном из воплощений идентифицирует термины в пределах интервала из двух слов для каждого термина запроса в краткой сводке результата или в заголовке. В общем случае, все элементы в каталоге независимо от типа или времени используются для вычисления значения персонализированного подобия для каждого результата. Стандартное подобие каждого элемента затем объединяют с персонализированным подобием для каждого элемента. В одном из воплощений использует линейную комбинацию положения элемента в исходном списке результатов с нормализованной версией оценки psim каждого элемента. Другое воплощение включает в себя объединение положений в исходном списке и в персонализированном списке или оценок из исходного и персонализированного списков.

Обращаясь к фиг.4-9, показаны примеры пользовательского интерфейса для персонализированного поиска в соответствии с одним из аспектов настоящего изобретения. Следует отметить, что соответствующие изображенные интерфейсы могут обеспечиваться в различных других отличающихся установках и контексте. Как пример, обсуждаемые приложения и/или модели могут быть связаны, например, с настольным инструментальным средством разработки, приложением электронной почты, приложением электронного календаря и/или веб-браузером, хотя могут использоваться приложения другого типа. Эти приложения могут быть связаны с графическим пользовательским интерфейсом (ГПИ, GUI), причем графический пользовательский интерфейс обеспечивает изображение, имеющее один или большее количество объектов отображения (не показаны), которые включают в себя такие аспекты, как конфигурируемые значки, кнопки, ползунки, поля для ввода информации, опции выбора, меню, вкладки и т.д., имеющие многочисленные конфигурируемые размеры, форму, цвет, текст, данные и звуки, для облегчения работы с приложениями и/или моделями. Кроме того, ГПИ и/или модели могут также включать в себя множество другой вводимой информации или средств управления для регулирования и конфигурирования одного или большего количества аспектов настоящего изобретения, которые будут описаны более подробно ниже. Они могут включать в себя прием команд пользователя от мыши, клавиатуры, устройств голосового ввода информации, веб-сайта, удаленной веб-службы и/или другого устройства, такого как фотокамера или устройство ввода видеоинформации, чтобы воздействовать или изменять операции описанных ГПИ и/или моделей.

Фиг.4 показывает интерфейс 400 для представления персонализированных результатов. В этом примере запросом является термин «Буш». Стандартные результаты поиска показывают с левой стороны в позиции 410, а персонализированные результаты показывают с правой стороны в позиции 400. Ползунок 430 используют для управления функцией, которая объединяет стандартные и персональные результаты в пределах от отсутствия персонализации до полной персонализации.

Фиг.5 показывает интерфейс 500, в котором результаты персонального интереса дополнительно выделяют с помощью увеличения их размера шрифта пропорционально их оценке psim; могут также использоваться цвет или другие выделения при представлении. Дополнительно, термины, которые вносят существенный вес в оценку psim, могут выделяться в пределах отдельных кратких сводок результата. Слева в позиции 510 показывают упорядоченные стандартные результаты с помощью увеличения размера шрифта. Интерфейс в позиции 500 показывает персонализированную комбинацию, в которой снова выделены с помощью увеличения размера шрифта элементы, представляющие персональный интерес.

Фиг.6 показывает процесс обеспечения персонализированных запросов с помощью интерфейса 600. В этом случае на этапе 610 учитывают N первых результатов, которые были возвращены от запроса. На этапе 620 вычисляют подобие в соответствии с пользовательской моделью и возвращенными результатами. На этапе 630 объединяют персонализированные и стандартные результаты, и эти результаты повторно упорядочивают на этапе 640, причем их отображают как персонализированные результаты в позиции 600.

Фиг.7-9 показывают влияние описанного выше управления персонализацией. Обращаясь к фиг.7, интерфейс 700 настраивают через управление 710 персонализацией, где используют термин поиска «Итон». Верхний результат для Итонского колледжа имеет положение 1/100 в позиции 720. Управление 710 персонализацией перемещают вправо, и в списке появляются некоторые персонализированные результаты. Результат, который появляется в позиции 32 в списке стандартных результатов, теперь показан в позиции 4. На фиг.8, управление 810 персонализацией перемещают немного вправо, указывая больше персонализации при поиске. В этом случае сгенерировано такое расположение результатов, где вверху находятся результаты, относящиеся к Итонской школе, причем Итонская школа связана с родственником пользователя. В этом случае предыдущее положение на фиг.7 было 32 из 100. На фиг.9 ползунок персонализации перемещен в крайнее правое положение в позиции 910, обеспечивая более персонализированное расположение результатов, относящихся к почтовому сообщению о школьной форме в Итонской школе на текущую дату.

Фиг.10-13 показывают примерный процесс, который может использоваться для персонализации запросов и/или результатов в соответствии с одним из аспектов настоящего изобретения. Фиг.10 показывает оси под позициями 1000-1020, которые показывают измерения стандартного поис