Построение и применение веб-каталогов для фокусированного поиска

Иллюстрации

Показать все

Изобретение относится к системам и способам осуществления поиска в глобальных и локальных сетях. Техническим результатом является расширение функциональных возможностей. Система для фокусированного поиска содержит веб-каталог, который включает в себя множество доменов и/или сайтов, которые имеют отношение к тематическому разделу и/или характеристикам пользователя. Каждому из сайтов в пределах каталога назначен вес, который показывает релевантность сайта по отношению к тематическому разделу и/или характеристикам пользователя. Поисковая машина принимает запрос и использует веб-каталог для фокусирования поиска на коллекции сайтов. Результаты поиска возвращают пользователю. 4 н. и 38 з.п. ф-лы, 20 ил., 1 табл.

Реферат

ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ

Настоящая заявка испрашивает приоритет предварительной заявки на выдачу патента США, поданной экспресс-почтой под № EV 330021427 US от 23 января 2004 года и озаглавленной «BUILDING SUBWEBS» («Построение веб-каталогов»), все содержание которой включено в настоящее описание посредством ссылки.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение в целом относится к осуществлению поиска в сети Интернет и/или сети интранет (локальной сети, использующей Интернет-технологии) и более конкретно к системам и способам, которые содействуют тематической категоризации или осуществлению настройки доменов и/или ветвей и которые дополнительно содействуют осуществлению поиска таких категоризации.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Эволюция компьютерных и сетевых технологий от высокозатратных низкопроизводительных систем обработки данных к недорогим высокопроизводительным системам связи, решения задач и развлечений, предусмотрела экономичное и времясберегающее средство уменьшения бремени исполнения повседневных задач, таких как переписка, оплата счетов, покупка товаров и сбор информации. Например, вычислительная система, взаимосвязанная с сетью Интернет посредством проводной или беспроводной технологии, может предоставлять пользователю информационный канал для почти мгновенного доступа к изобилию информации из хранилища web-сайтов (узлов собрания гипертекстовых документов сети Интернет) и серверов (обслуживающих устройств общего пользования), расположенных по всему миру, по нажатию кончиков пальцев пользователя.

Типично, что к информации, доступной посредством web-сайтов и серверов, осуществляют доступ посредством web-обозревателя (средства просмотра web-страниц в сети Интернет), выполняющегося на web-клиенте (к примеру, на вычислительном устройстве). Например, web-пользователь может развернуть web-обозреватель и осуществить доступ к web-сайту путем ввода унифицированного указателя ресурса (URL) web-сайта (например, web-адреса и/или адреса в сети Интернет и/или сети интранет) в адресную строку web-обозревателя и путем нажатия клавиши ввода на клавиатуре или выбора щелчком по кнопке мыши управляющего элемента интерфейса «начать», используя мышь. URL типично включает в себя четыре порции информации, которая содействует осуществлению доступа: протокол (язык вычислительных устройств для связи друг с другом), который содержит набор правил и стандартов для обмена информацией, расположение web-сайта, наименование организации, которая содержит в рабочем состоянии этот web-сайт, и, для web-адресации - суффикс (например, com, org, net, gov и edu), идентифицирующий тип организации.

В некоторых случаях пользователь заранее знает наименование сайта или сервера, и/или URL на сайт или сервер, к которым пользователь желает осуществить доступ. В таких ситуациях пользователь может осуществлять доступ к сайту, как описано выше, посредством ввода URL в адресную строку и соединения с сайтом. Однако в большинстве случаев пользователь не знает URL или наименование сайта. Взамен пользователь применяет поисковую функцию для облегчения определения местоположения конкретного сайта, основываясь на предусмотренных пользователем ключевых словах. В настоящее время на этом поприще существует два разнородных класса поисковых функций - отражающая специфику конкретного домена поисковая функция, чей поиск ограничен конкретным сетевым доменом или сайтом (например, www.domain.com), и функция расширенного (общего) поиска (например, машина общего поиска), которая отыскивает по всему собранию гипертекстовых документов сети Интернет (или сети интранет) сайты, имеющие отношение к введенным ключевым словам. Например, пользователь может пожелать локализовать (определить) сайт, который содержит информацию, касающуюся компьютерного вируса. В качестве первого варианта можно было бы начать прямо с конкретного (сетевого) домена (например, www.computervirus.com), который специализируется на информации, относящейся к компьютерным вирусам, и отыскивает документы (например, www.computervirus.com/virus1.htm) в рамках такого домена, содержащие существенную информацию. Более точно, пользователь будет вводить URL www.computervirus.com в адресную строку web-обозревателя и будет направлен на этот сайт. На этом сайте пользователь может вводить ключевые слова в диалоговое окно поиска, и поиск будет возвращать документы в пределах домена www.computervirus.com, которые пользователь может отбирать. Однако релевантная информация, которая лежит вне этого сетевого домена, не будет возвращена пользователю. Например, релевантная страница из домена www.compvirus.com не может быть возвращена, так как она не лежит в пределах сетевого домена www.computervirus.com. Таким образом, для того чтобы пользователю получить релевантные данные извне домена www.computervirus.com, он должен знать URL-адреса других доменов, которые содержат в своем составе информацию, и искать такие домены.

В качестве альтернативы, пользователь может вводить ключевые слова в машину расширенного поиска, которая будет осуществлять поиск во всем собрании гипертекстовых документов сети Интернет или другом наборе сайтов (например, интранет) и возвращать сайты, которые она определяет имеющими отношение к ключевым словам. Часто, однако, машина расширенного (общего) поиска будет возвращать значительное количество сайтов, которые являются полностью не имеющими отношение к конкретным интересам пользователя. Например, если пользователь осуществляет поиск, используя ключевое слово «вирус», кроме получения информации, относящейся только к компьютерным вирусам, он или она возможно принимают информацию, имеющую отношение к биологическим вирусам так же, как и к компьютерным вирусам. Пользователь после этого может просмотреть путем прокрутки множества возвращенных сайтов и попытаться определить, имеют ли они отношение к интересам пользователя. Просматривание путем прокрутки возвращенных результатов может быть чрезвычайно расходующим время и расстраивающим пользователя, так как машины расширенного (общего) поиска могут возвращать значительное количество сайтов при выполнении поиска. Пользователь может попытаться сузить поиск посредством употребления сочетания булевых операторов, но построить соответствующий булевый поиск, который будет в результате возвращать сайты, содержащие только релевантную информацию, может быть трудно. Более того, некоторые традиционные машины расширенного поиска пытаются делать вывод, что именно ищет пользователь, основываясь на ключевых словах. Например, если пользователь ввел термин «вирус» в машину расширенного поиска, поисковая машина может возвращать множество сайтов совместно с предложениями по сужению поиска. Более конкретно, поисковая машина может возвращать множество предложений, таких как «вы хотите отыскать компьютерный вирус?», «вы хотите отыскать биологический вирус?» и т. д. Для многих поисков (особенно для более детальных и точных поисков) этот традиционный способ требует осуществления отбора продолжающейся иерархии предлагаемых поисков, и возвращаемые сайты могут, тем не менее, испытывать недостаток релевантной информации. Кроме того, пользователь может пожелать локализовать сайт, который не будет вызван возвращаемыми предложениями поиска.

Таким образом, в данной области техники существует настоятельная необходимость в системе и/или методологии осуществления поиска, которые предусматривают фокусированные результаты, такие же, как могут быть найдены при осуществлении отражающего специфику конкретного домена поиска, без принесения в жертву выгод, имеющих отношение к поиску, проводимому посредством машины расширенного поиска.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Нижеследующее представляет собой упрощенное краткое описание изобретения, для того чтобы предусмотреть фундаментальное понимание некоторых аспектов изобретения. Это краткое описание не является исчерпывающим обзором изобретения. Оно не сфокусировано на определении ключевых/критических признаков изобретения или на установление границ объема изобретения. Его единственной целью является предоставить некоторые общие представления об изобретении в упрощенной форме, в качестве вступления в более детализированное описание, которое представлено позднее.

Настоящее изобретение употребляет группирование подсовокупности доменов и/или ветвей (совместно указанных в последующем описании как просто «сайты»), которые имеют отношение к конкретному тематическому разделу, подмножеству индивидуумов, или любое другое группирование сайтов, для содействия удобствам в связи с осуществлением поиска по Интернет. Эти сайты в последующем описании содержат страницы документов, которые могут быть извлечены пользователем. Например, подсовокупность сайтов может быть отобрана и сгруппирована, основываясь на возрасте группы индивидуумов, которые типично просматривают такие сайты, политическом членстве индивидуумов, которые просматривают такие сайты, географическом местоположении индивидуумов, просматривающих такие сайты, религии индивидуумов, просматривающих такие сайты и т.д. Например, подсовокупность имеющих отношение сайтов может быть релевантной по отношению к конкретному тематическому разделу, который желает отыскать пользователь. Более конкретно, пользователи в возрасте от 10 до 20 лет возможно отыскивают разнородные сайты, по сравнению с пользователями в возрасте от 40 до 50 лет, и индивидуумы с первенствующим политическим членством типично отыскивают сайты, обособленные от индивидуумов с оппозиционным политическим членством. В другом примере, набор сайтов (например, Интернет) может быть концептуально рассмотрен как множество тематических разделов, в котором тематический раздел определен сайтами в пределах набора сайтов, имеющих отношение к этому тематическому разделу. При отыскивании информации, имеющей отношение к конкретному тематическому разделу, могло бы быть полезным располагать номенклатурой (списком) сайтов, уже найденных как существенные по отношению к тематическому разделу заранее, до выполнения поиска. Настоящее изобретение описывает систему и/или методологию для накопления номенклатуры сайтов, которые могут быть сгруппированы в соответствии с тематическим разделом, возрастом индивидуума, политической принадлежностью индивидуума, географическим местоположением индивидуума и т. д., и дополнительно раскрывает систему и/или методологию для назначения весов релевантности каждому из сайтов, занесенных в перечень. В целях читаемости, термин «тематический раздел» в последующем описании будет применяться по отношению не только к традиционному определению «тематический раздел», но также к другим группированиям имеющих отношение сайтов (например, сайтов, сгруппированных в соответствии с существенностью по отношению к конкретному возрастному диапазону, географическому местоположению,…). Этот набор взвешенных по релевантности сайтов, которые имеют отношение к конкретному тематическому разделу или группе, далее указаны как веб-каталог (подузел веб). Веб-каталоги могут быть модифицированы для сохранения текущими, когда видоизменена информация в Интернете, когда меняются пользовательские предпочтения, или по любым другим подходящим причинам. Более того, веб-каталоги могут быть сохранены (например, на жестком диске, компакт-диске (CD), цифровом многофункциональном диске (DVD), …), размножены и перемещены между пользователями.

В соответствии с одним из аспектов настоящего изобретения веб-каталог включает в себя перечень сайтов, имеющих отношение к тематическому разделу, который представлен веб-каталогом, и каждому сайту в пределах веб-каталога назначен настроенный вес в соответствии с релевантностью сайта по отношению к тематическому разделу. Таким образом, например, сайтам, определенным как высокорелевантные по отношению к тематическому разделу, представленному веб-каталогом, будет назначен больший вес релевантности, чем сайтам, определенным как менее релевантные по отношению к тематическому разделу. Впоследствии машина расширенного (общего) поиска может употреблять один или более тематически-специфичных веб-каталогов для содействия фокусированию поиска. Более конкретно, один или более веб-каталогов могут быть отобраны для уместного фокусирования поиска, и поисковый запрос может быть введен в машину расширенного (общего) поиска. Впоследствии результаты поиска могут быть определены, основываясь на системах ранжирования традиционной поисковой машины совместно с весом релевантности, назначенным сайтам, которые определяют веб-каталог. Например, сайты, возвращенные поисковой машиной, которая существует в пределах веб-каталога, будут принимать повышение в ранжировании, соответствующее назначенной взвешенной релевантности. В соответствии с другим аспектом настоящего изобретения множество сайтов, которые могут быть возвращены из машины расширенного (общего) поиска, отбрасываются, потому что они не содержатся в веб-каталоге, который был отобран для фокусирования поиска. Это изобретение может также быть использовано для представления пользователю возвращаемого классифицированного/кластеризованного возвращаемого результата поисковой машины, для того, чтобы для данного множества было накоплено большое количество подмножеств сайтов, которые соответственно являются частью конкретных разнородных веб-каталогов. Например, веб-каталог, имеющий отношение к здоровью и медицине, и веб-каталог, имеющий отношение к вычислительной технике, могут быть в наличии и применяться в связи с поисковой машиной. Если запрос «Вирус» введен в поисковую машину, результаты, имеющие отношение к медицине, и результаты, имеющие отношение к вычислительным устройствам, могут быть классифицированы и отображены для пользователя раздельно (например, сайты в пределах веб-каталога здоровья и медицины и сайты в пределах вычислительной техники могут быть сгруппированы соответственно).

В соответствии с одним из аспектов настоящего изобретения веб-каталоги могут быть созданы с использованием перечня запросных терминов, которые имеют отношение к конкретному тематическому разделу. Например, запросы из запросной записи, имеющие отношение к тематически-специфичному веб-сайту, могут быть применены как список запросных терминов. После этого для выполнения многократных поисков может быть использована машина расширенного поиска, в то время как применяется несколько разнородных тематически-специфичных запросных терминов. Так как запросные термины имеют отношение к конкретному тематическому разделу, веб-сайты, которые являются релевантными по отношению к тематическому разделу, будут возвращены многократно для разнородных запросных терминов (например, один и тот же веб-сайт будет возвращен при использовании разнородных запросных терминов). Более того, настоящее изобретение предусматривает осуществление обзора соседних сайтов (например, сайтов, которые привязаны входящей ссылкой и исходящей ссылкой к/из сайта, возвращенного в поиске) и определение их релевантности, касающейся тематического раздела интересов. Веса, которые являются указывающими на существенность конкретного сайта по отношению к тематическому разделу, назначают сайтам, возвращенным в пределах поиска. Веса вычисляют, по меньшей мере частично, на основе количества раз, которое сайт и/или соседние сайты были возвращены при использовании большого количества различных имеющих отношение к тематическому разделу поисковых терминов. Более того, веб-каталоги могут быть созданы, основываясь по меньшей мере частично, на свойствах пользователя. Например, если возраст/пол/местоположение/и т.д. в пользователе поисковой машины известны, веб-каталоги могут быть построены для таких характеристик возраста/пола/местоположения/и т.д. Более конкретно, может быть построен веб-каталог, который применяется 20-30-летними адресатами, которые в текущий момент находятся в Техасе. Кроме того, веса, соответствующие сайтам в пределах веб-каталога, могут быть основаны по меньшей мере частично на личном пользовательском предшествующем поиске или истории просмотра, содержащем страницы результатов, и т.д.

В соответствии с другими аспектами настоящего изобретения веб-навигатор (средство web-просмотра) может употреблять веб-каталоги в связи с определением того, какие именно страницы предназначены для посещения собрания гипертекстовых Интернет-документов. Например, веб-навигатор будет более часто посещать страницы в пределах популярного веб-каталога, по сравнению со страницами, которые находятся в пределах непопулярных веб-каталогов, или страницами, которые совсем не использованы в связи с веб-каталогом.

Для достижения вышеупомянутых и имеющих отношение целей, в настоящем описании изобретения описаны некоторые пояснительные аспекты изобретения совместно с последующим описанием и приложенными чертежами. Эти аспекты показывают, однако, только немногие различные направления, в которых принципы изобретения могут быть применены, и настоящее изобретение задумано, чтобы включить в себя все такие аспекты и их эквиваленты. Другие преимущества и оригинальные признаки изобретения очевидны из последующего подробного описания изобретения при рассмотрении совместно с чертежами.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг.1 - структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.

Фиг. 2 - еще одна структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.

Фиг. 3 - еще одна структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.

Фиг. 4 - еще одна структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.

Фиг. 5 - блок-схема способа для использования веб-каталогов для улучшения релевантности результатов поиска в связи с аспектом настоящего изобретения.

Фиг. 6 - блок-схема способа для модифицирования веб-каталогов в соответствии с аспектом настоящего изобретения.

Фиг. 7 - примерное разбиение Интернет на большое количество тематических разделов в соответствии с аспектом настоящего изобретения.

Фиг. 8 - примерное отображение поиска, которое может быть применено в связи с настоящим изобретением.

Фиг. 9 - структурная схема системы, которая содействует созданию веб-каталога в соответствии с аспектом настоящего изобретения.

Фиг. 10 - другая структурная схема системы, которая содействует созданию веб-каталога в соответствии с аспектом настоящего изобретения.

Фиг. 11 - блок-схема способа для создания веб-каталога в соответствии с аспектом настоящего изобретения.

Фиг. 12 - другая блок-схема способа для создания веб-каталога в соответствии с аспектом настоящего изобретения.

Фиг. 13 - иллюстрирует примерную запросную запись и примерный веб-каталог, выработанный, основываясь на запросной записи в соответствии с аспектом настоящего изобретения.

Фиг. 14 - структурная схема системы, которая содействует улучшенному осуществлению веб-навигации в соответствии с аспектом настоящего изобретения.

Фиг. 15 - иллюстрирует переносимость веб-каталогов в соответствии с аспектом настоящего изобретения.

Фиг. 16 - иллюстрирует результаты, возвращенные из разных поисковых машин, сравненные с результатами, возвращенными из фокусированного веб-каталогом поиска в соответствии с аспектом настоящего изобретения.

Фиг. 17 и 18 - иллюстрируют данные, которые показывают превосходство фокусированных веб-каталогом поисков в сравнении с традиционными поисками в соответствии с аспектом настоящего изобретения.

Фиг. 19 - иллюстрирует примерное операционное окружение, в котором настоящее изобретение может функционировать.

Фиг. 20 - иллюстрирует другое примерное операционное окружение, в котором настоящее изобретение может функционировать.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Настоящее изобретение описано ниже со ссылкой на чертежи, в которых подобные номера ссылок использованы, чтобы ссылаться на подобные элементы по всему описанию. В последующем описании в целях разъяснения многочисленные специфические детали помещены на передний план, для того чтобы предусмотреть исчерпывающее понимание настоящего изобретения. Может быть очевидным, однако, что настоящее изобретение может быть выполнено на практике без этих специфических деталей. В других примерах хорошо известные структуры и устройства показаны в виде структурной схемы, для того чтобы содействовать описанию настоящего изобретения.

Используемые в этой заявке термины «компонент», «обработчик», «модель», «система» и подобные задуманы, чтобы ссылаться на родственную вычислительному устройству сущность, выполненную либо в аппаратных средствах, либо в сочетании аппаратных средств и программного обеспечения, либо в программном обеспечении. Например, компоненты могут быть, но не в качестве ограничения, программным процессом, выполняющимся на устройстве обработки данных, устройством обработки данных, объектом, исполняемым файлом, потоком выполнения команд, программой и/или вычислительным устройством. В качестве иллюстрации оба приложения, запущенные на сервере (обслуживающем устройстве общего пользования), и сам сервер могут быть компонентами. Один или более компонентов могут находиться в пределах процесса и/или потока выполнения команд и компонент может быть локализован на одном вычислительном устройстве и/или распределен по двум или более вычислительным устройствам. Также, эти компоненты могут исполнять с разнообразного машиночитаемого носителя имеющиеся разнообразные структуры данных, хранящиеся на нем. Компоненты могут связываться посредством локальных и/или удаленных процессов, например, в соответствии с сигналом, имеющим один или более пакетов данных (например, данных из одного компонента, посредством сигнала, взаимодействующего с другим компонентом в локальной системе, распределенной системе, и/или через сеть, такую как Интернет, с другими системами).

На фиг. 1 проиллюстрирована система 100, которая содействует улучшенной точности и производительности во время выполнения поиска по набору сайтов. Система 100 использована применительно к осуществлению поиска в Интернете информации, имеющей отношение к пользовательскому запросу. Понятно, однако, что Интернет - это просто показанный в качестве примера набор сайтов, который может быть подвергнут поиску в соответствии с настоящим изобретением. Любой набор сайтов, находящихся в том числе, и не только в Интернет, интранет или где-то в другом месте, могут быть найдены, употребляя настоящее изобретение. Например, набор сайтов, сохраненный на жестком диске клиента, может быть подвергнут поиску в связи с настоящим изобретением. Настоящее изобретение улучшает традиционные поисковые технологии посредством концептуального разбиения множества доменов (например, www.domain.com), путей (например, www.domain.com/path), кластеров доменов и/или путей, и других подходящих сайтов, расположенных в Интернет, на соседство имеющих отношение сайтов или веб-каталогов 102-106, которые сохранены в пределах хранилища данных 108. Каждый из веб-каталогов 102-106 имеет отношение к конкретному тематическому разделу интересов для пользователя, и таким образом включает в себя большое количество сайтов (например, доменов, путей, кластеров доменов и/или путей, …), которые являются существенными в отношении такого тематического раздела. Например, веб-каталог 102 может иметь отношение к автомобилям; таким образом, каждый сайт, включенный в пределы веб-каталога 102, будет полностью релевантным по отношению к тематическому разделу автомобилей. Должно быть понятно, что Интернет (или любой другой набор сайтов) может быть рассмотрен как набор любого количества тематических разделов, и что два или более тематических разделов могут включать в себя имеющую отношение информацию. Следовательно, разнородные веб-каталоги, которые представляют имеющие отношение тематические разделы, могут включать в себя большое количество одних и тех же сайтов. Более того, один веб-каталог может полностью заключать в себе другой веб-каталог. Веб-каталоги 102-106 показаны как полностью раздельные один от другого только в иллюстрационных целях, и такая раздельность не должна быть интерпретирована в качестве ограничения объема настоящего изобретения. Более того, веб-каталоги могут быть созданы, основываясь, по меньшей мере, частично, на характеристиках пользователей поисковой машины. Например, может быть создан веб-каталог, содержащий сайты, типично отыскиваемые индивидуумами конкретного возрастного диапазона. Другие характеристики пользователя, такие как местоположение пользователя, пол пользователя, политическое членство пользователя, расовая принадлежность и т.д., могут быть также употреблены для создания веб-каталога, содержащего сайты, которые имеют отношение к таким характеристикам пользователя.

Сайты в пределах веб-каталогов 102-106 настроены весом в соответствии с их релевантностью по отношению к тематическим разделам и/или характеристикам пользователя, которые веб-каталоги 102-106 представляют. Например, веб-каталог 104 включает в себя N сайтов и N весов, где N - это целое число. Каждый сайт ассоциативно связан с весом, который, при рассмотрении совместно с другими весами в пределах веб-каталога 104, может иллюстрировать релевантность сайта по отношению к тематическому разделу веб-каталога 104. Более конкретно, в пределах веб-каталога 104 сайту 1 назначен вес со значением вес1, а сайту 2 назначен вес со значением вес2. Таким образом, может быть сделано определение относительно того, какой из двух сайтов имеет более высокую релевантность по отношению к тематическому разделу веб-каталога 104, посредством сравнения весов со значениями вес1 и вес2. Более того, веб-каталоги 102-106 могут быть сохранены в базе данных как части пользовательского профиля и/или как независимые объекты. Например, хранилище 108 данных может быть доступным посредством веб-сайта. После посещения веб-сайта и ввода идентифицирующей пользователя информации (например, имени пользователя и пароля) веб-каталоги 102-106 могут быть извлечены и применены в связи с поиском. Также, веб-каталоги 102-106 могут быть сохранены как объекты и переданы разнородным пользователям для их использования (например, веб-каталоги 102-106 могут быть прикреплены к электронному письму или использованы другим пользователем). Более того, веб-каталоги 102-106 могут быть настроены по индивидуальным требованиям большим количеством пользователей для удовлетворения специфических нужд.

Система 100 использует веб-каталоги 102-106 для фокусирования поиска по набору сайтов (например, Интернет), имеющих отношение к одному или более тематическим разделам. Так как сайты в пределах веб-каталогов 102-106 релевантны к конкретному тематическому разделу, но не ограниченны одним специфическим доменом, то пользователь может уверенно найти тематическую информацию без опасений быть «утопленным» в несущественной информации. Система 100 включает в себя селектор 110 веб-каталога, который отбирает один или более веб-каталогов для использования во время поиска. В соответствии с одним из аспектов настоящего изобретения селектор 110 веб-каталога может быть ассоциативно связан с интерфейсом пользователя (не показан), представленным пользователю на устройстве 112 отображения, на котором интерфейс пользователя предоставляет возможность пользователю отбирать желаемый(е) веб-каталог(и) для использования в связи с осуществлением поиска тематической информации. В соответствии с другим аспектом настоящего изобретения селектор 110 веб-каталога может автоматически отбирать один или более веб-каталогов для применения в связи с поиском информации, основываясь на точке входа на набор сайтов или текущий сайт (например, веб-сайт), находящийся в просмотре. Например, если пользователь в настоящее время находится на сайте, относящемся к покупке автомобилей, селектор 110 веб-каталога может автоматически отобрать один или более веб-каталогов с тематическими разделами, относящимися к автомобилям. Более того, селектор 110 веб-каталога может отобрать соответствующий веб-каталог(и), основываясь на запросных терминах, введенных в машину расширенного поиска, и/или пользовательской истории. Например, если пользователь имеет историю осуществления обозрения страниц компьютерной поддержки и вводит термин «вирус» в поисковую машину, селектор 110 веб-каталога может отбирать веб-каталог, относящийся к компьютерам, предпочтительнее, нежели осуществлять отбор веб-каталога, относящегося к биологическим болезням.

Селектор 110 веб-каталога работает в соединении с поисковым компонентом 114, который принимает поисковый запрос. Например, поисковый компонент 114 может быть машиной расширенного поиска, и запрос может порождаться пользователем, компьютерной программой или подобными. Селектор 110 веб-каталога может отобрать один или более веб-каталогов заранее до приема поискового запроса поисковым компонентом 114 или после того как поисковый компонент 114 принимает поисковый запрос. Например, если пользователь вручную отбирает один или более веб-каталогов для использования в связи с поиском, веб-каталоги будут отобраны заранее до приема поискового запроса. Однако, если селектор 110 веб-каталога использует поисковый запрос для определения того, какой именно веб-каталог(и) необходимо отобрать, такой отбор очевидно будет завершен не ранее чем после того как поисковый компонент 114 примет поисковый запрос.

После приема поискового запроса поисковый компонент 114 будет выполнять поиск информации в соответствии с таким запросом, и выбранный веб-каталог будет использован в связи с поиском. Веб-каталог 104 проиллюстрирован как выбранный веб-каталог, но должно быть понятно, что селектор веб-каталога может отобрать любой подходящий веб-каталог или комбинацию веб-каталогов для способствования осуществлению поиска. В соответствии с одним из аспектов настоящего изобретения поиск может быть выполнен только по тем сайтам, которые содержатся в отобранном веб-каталоге 106. Это позволяет машинам расширенного поиска использовать существующие поисковые алгоритмы, при этом возвращая только сайты, определенные как имеющие отношение к тематическому разделу, представленному веб-каталогом 106. Подобным образом, поисковый компонент 114 может отыскивать по всему Интернет (или другому подходящему набору сайтов) релевантную информацию, и возвращенные сайты, не существующие в веб-каталоге 104, могут быть удалены, до возврата результатов поиска пользователю. Результаты, локализованные (местоположение которых найдено) поисковым компонентом 114 и не удаленные, могут быть доставлены пользователю посредством устройства 112 отображения.

В соответствии с другим аспектом настоящего изобретения сайтам в пределах веб-каталога 104, локализованным поисковым компонентом 114, может дано предпочтение в соответствии с их назначенным весом. Более конкретно, поисковый компонент 114 может быть машиной расширенного поиска и локализовать/ранжировать сайты в традиционной манере, основываясь на поисковом запросе. Сайты, локализованные поисковым компонентом 114, которые существуют в пределах веб-каталога 104, могут впоследствии быть подняты в ранге в соответствии с их назначенным весом релевантности. Таким образом, традиционная система и/или методология ранжирования, употребленная поисковым компонентом 114, может быть интегрирована с взвешиванием сайтов в пределах веб-каталога 104. Следовательно, например, сайт в пределах веб-каталога 104, который мог бы быть записан четвертым при применении традиционных поисковых методологий, может быть поднят в ранге на позицию, показывающую большую релевантность в отношении к поисковому запросу. Таким образом, функция традиционной системы ранжирования и вес, назначенный сайтам, применяют, чтобы ранжировать результаты поиска. Ранжированные и локализованные результаты могут затем быть доставлены пользователю посредством устройства 112 отображения. Более того, в связи с предоставлением пользователю результатов поиска может быть применено сочетание ранжирования и фильтрации.

Далее со ссылкой на фиг.2 проиллюстрирована система 200, которая содействует фокусированному поиску по одной или нескольким тематическим областям заинтересованности. Система 200 также содействует (облегчает) фильтрованному осуществлению поиска в соответствии с пользовательскими характеристиками (например, полом, этнической принадлежностью, местоположению, возрасту, …). Система 200 осуществляет поиск по набору сайтов посредством употребления веб-каталога 202, который доступен пользователю в пределах хранилища 204 данных. Веб-каталог 202 включает в себя N сайтов, где N является целым числом. Сайты могут быть доменами, ветвями, кластерами сайтов или другими подобными сайтами. Каждый из N сайтов в пределах веб-каталога 202 включает в себя информацию, релевантную к тематическому разделу и/или характеристике пользователя, представленными веб-каталогом 202, и каждому из N сайтов назначен вес, показывающий его релевантность по отношению к тематическому разделу и/или характеристике пользователя. Более конкретно, сайту 1 назначен вес со значением вес1, сайту 2 назначен вес со значением вес2 и сайту N назначен вес со значением весN. Таким образом, рассмотрение веса со значением вес1 относительно веса со значением вес2 будет информативным в отношении того, является ли сайт 1 более релевантным, чем сайт 2, по отношению к тематическому разделу, представленному веб-каталогом 202.

Система 200 включает в себя селектор 206 веб-каталога, который отбирает один или более веб-каталогов для использования в связи с тематически настроенным и/или фильтрованным поиском. В то время как хранилище 204 данных проиллюстрировано как включающее в себя только веб-каталог 202, должно быть понятно, что любое подходящее количество веб-каталогов может быть сформировано и использовано при проведении фокусированного поиска. В этой примерной иллюстрации селектор 206 веб-каталога выбрал веб-каталог 202. Селектор 206 веб-каталога может передавать на отображающее устройство 208 информацию, по которой веб-каталог(и) был отобран. Система 200 дополнительно включает в себя поисковый компонент 210, который в ответ на запрос осуществляет поиск по меньшей мере по сайтам, содержащимся в пределах веб-каталога 202. В соответствии с одним из аспектов настоящего изобретения поисковый компонент 210 работает в традиционной манере и осуществляет поиск по всему набору сайтов (например, по всему Интернет), касающихся условий поиска из запроса. После этого, возвращенные сайты, не содержащиеся в пределах веб-каталога 202, могут быть удалены, или возвращенные сайты могут быть ранжированы в соответствии с традиционными способами ранжирования совместно с весами, назначенными сайтам в веб-каталоге 202. Таким образом, сайты, локализованные поисковым компонентом 210 и содержащиеся в пределах веб-каталога 202, будут принимать повышение в ранжировании, в то время как сайты, локализованные поисковым компонентом 210 и не содержащиеся в пределах веб-каталога 202, не будут принимать повышение. Таким образом, ранжирование сайтов может быть функцией методологий ранжирования традиционной поисковой машины, совместно с весами, назначенными сайтам в пределах веб-каталога 202. Ранжированные результаты могут затем быть переданы из поискового компонента 210 на устройство 208 отображения.

Система 200 может быть ассоциативно связана с компонентом 212 подстройки, который содействует изменению/настройке по индивидуальным требованиям веб-каталога 202 (например, до и/или после того как веб-каталог 202 был выбран селектором 206 веб-каталога). Например, компонент 212 подстройки может быть использован для добавления и/или удаления конкретных сайтов из веб-каталога 202 посредством пользовательского интерфейса 214. Это может быть полезным, когда подвергаются изменениям имена сетевых доменов и/или ветвей, добавляются или удаляются из Интернета сайты, изменяется сод