Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств

Патент 2632423

Авторы

Правообладатели

Общество с ограниченной ответственностью "ЯНДЕКС" (RU)

Классы МПК

G06F17/30 - информационный поиск; структуры баз данных для этой цели

Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств

Иллюстрации

Показать все

Изобретение относится к представлению поисковой системой поисковых результатов. Технический результат – улучшение поиска, проводимого поисковыми системами. Поисковая система для предоставления поисковых результатов на множество клиентских устройств, включающая в себя по меньшей мере один сервер, первую базу данных с множеством списков словопозиций, вторую базу данных с информацией, относящейся к предыдущим пользовательским взаимодействиям с поисковыми результатами, сеть передачи данных. 2 н. и 9 з.п. ф-лы, 10 ил.

Реферат

Область техники

[01] Настоящее техническое решение относится к способам предоставления поисковой системой поисковых результатов множеству клиентских устройств.

Уровень техники

[02] На текущий момент интернет предоставляет доступ к огромному количеству информации. В общем случае, пользователь может получить доступ к ресурсу в сети передачи данных двумя основными способами. Пользователь может получить доступ к конкретному ресурсу напрямую, введя адрес ресурса (обычно URL - единый указатель ресурса, например, http://www.webpage.com), или же выбрав ссылку в электронном сообщении или на другом веб-ресурсе. В другом случае пользователь может выполнить поиск с помощью поисковой системы для нахождения желаемого ресурса. Последнее особенно подходит для тех случаев, когда пользователю известна интересующая его тематика, но неизвестен конкретный адрес интересующего ресурса.

[03] Существует множество доступных пользователю поисковых систем. Некоторые из них считаются универсальными поисковыми системами (такие как Яндекс (Yandex™), Google™, Yahoo™ и подобные им). Другие считаются вертикальными поисковыми системами - например, поисковые системы, нацеленные на определенную тему поиска - такие как Momondo™, поисковая система для поиска авиаперелетов.

[04] Вне зависимости от того, какая поисковая система используется, в данной области техники известно, что поисковая система обычно выполнена с возможностью получать от пользователя поисковый запрос, включающий в себя единственный поисковый термин или множество поисковых терминов, с разных клиентских устройств (настольный компьютер, портативный компьютер, ноутбук, смартфон, планшет и т.д.), на котором может быть запущено множество приложений. Поисковая система затем осуществляет поиск и идентифицирует множество документов, соответствующих одному или нескольким поисковым терминам.

[05] Обычно поисковая система предоставляет поисковые результаты пользователя на странице результатов поиска (SERP), созданной поисковой системой. Поисковые результаты организованы на странице конкретным образом, определенным поисковой системой. Обычно поисковые результаты, в общем случае, расположены в вертикальном списке, в котором наиболее релевантные поисковые результаты находятся в начале (т.е. сверху на SERP), а за ними идут следующие по релевантности результаты (т.е. сразу под наиболее релевантными поисковыми результатами) и так далее. Общее описание типичной SERP может совпадать с тем, что опубликовано Google Inc. на http://www.googleguide.com/results_page.html, и оно полностью включено в настоящую заявку посредством ссылки.

[06] Для определения последовательности, в которой поисковые результаты появятся на SERP, поисковая система ранжирует поисковые результаты по их релевантности с использованием алгоритма ранжирования, который может учитывать различные факторы, указывающие на релевантность. В данной области техники это известно как «зависимое от запроса ранжирование» ("query-specific ranking", здесь и далее упоминаемое как "QSR"). Более полное описание подходов и операций ранжирования поисковыми системами может быть найдено в международной патентной заявке No. WO 2015/004607 А2, опубликованной 15 января 2015 года и озаглавленной «Компьютерный способ и система для поиска инвертированного индекса с множеством списков словопозиций» (далее «заявка 607»), которая полностью включена здесь посредством ссылки. Как описано в заявке 607, один из способов, по которым поисковая система извлекает зависимое от запроса ранжирование - с помощью информации, например, данных основанных на щелчках (кликах), описанных в заявке, относящихся к пользовательским взаимодействиям с поисковыми результатами, предоставленными в отношении конкретных поисковых запросов. Данные, основанные на щелчках, - не единственный тип информации, относящийся к пользовательским взаимодействиям с поисковыми результатами, доступный поисковым системам для улучшения извлечения QSR. Другая информация, например, относящаяся к движениям курсора пользователя и отслеживанию направления взгляда пользователя, также обычно доступна для поисковых систем с этой целью.

[07] Хотя обычные способы организации поисковых результатов на SERP в соответствии с их QSR и способы извлечения самого QSR находятся на надлежащем уровне, возможны дальнейшие улучшения, которые могут быть полезны в определенных обстоятельствах.

Раскрытие

[08] Таким образом, объектом настоящего технического решения является улучшение поиска, проводимого поисковыми системами.

[09] Типичная визуальная конфигурация поисковых результатов на SERP (как описано выше) считается оптимальной, так как основана на предпосылке, что именно таким образом пользователи обычно взаимодействуют с поисковыми результатами. Т.е., предполагается, что, когда пользователям предоставили SERP, они сначала смотрят на первый в списке поисковый результат, думая, что он наиболее релевантный. А если он не наиболее релевантен, пользователь переходит по странице ниже, сверху вниз, последовательно рассматривая каждый перечисленный поисковый результат, пока не найдет тот поисковый результат, который наиболее соответствует искомой информации.

[10] Было обнаружено, что на самом деле так происходит не всегда. Пользователи не всегда взаимодействуют с SERP таким образом. Например, существуют обстоятельства, при которых пользователь начинает рассматривать самый первый поисковый результат в списке, расположенный в самом верху SERP, а затем рассматривает поисковые результаты в случайном порядке. В более конкретном примере, данный набор поисковых результатов является списком из 6 элементов, показанных на SERP в порядке QSR (или, реже, в порядке QIR - в любом случае, упоминаемом здесь и далее как «порядок ранжирования по релевантности»), и пользователь, которому предоставили поисковые результаты, может сначала посмотреть на первый в списке поисковый результат, расположенный на SERP сверху. Если этот первый в списке поисковый результат не предоставил пользователю искомую информацию, пользователь затем (неожиданно) может перейти к пятому по счету поисковому результату от верха страницы. Если этот пятый в списке поисковый результат не предоставил пользователю искомую информацию, пользователь затем может вернуться обратно ко второму по счету поисковому результату от верха страницы, и так далее в любом конкретном случае. (Это описание служит только примером объясняемой методологии, а не описанием того, что на самом деле происходит для каждой (любой) данной SERP.)

[11] Кроме того, не всегда случается, что пользователь начинает просмотр с самого верха страницы. В конкретном примере, не ограничивающем объем настоящего технического решения, данного набора поисковых результатов, которые являются списком из шести элементов, показанных на SERP в порядке QSR, пользователь может начать с четвертого по счету поискового результата от верха страницы. Если этот четвертый в списке поисковый результат не предоставил пользователю искомую информацию, пользователь затем может перейти к шестому по счету поисковому результату от верха страницы. Если этот шестой в списке поисковый результат не предоставил пользователю искомую информацию, пользователь затем может вернуться ко второму по счету поисковому результату от верха страницы, и так далее в любом конкретном случае. (Это описание также служит только примером объясняемой методологии, а не описанием того, что на самом деле происходит для каждой (любой) данной SERP.)

[12] Кроме того, при некоторых обстоятельствах пользовательское поведение на SERP может распространяться не только на вертикальный список. Например, в примере, аналогичном тому, что описан выше, пользователь может сначала просмотреть первый в списке поисковый результат на верху SERP, а затем перейти к уточненному результату справа от SERP, а дальше просмотреть пятый в списке поисковый результат в середине SERP, а затем вернуться ко второму в списке поисковому результату ближе к началу SERP.

[13] Обычно пользовательские взаимодействия с SERP такого типа, описанные в примерах выше, учитываются при определении QSR для аналогичных поисковых запросов в будущем. Это основано на предположении, что пользователь быстро просматривает список поисковых результатов, определяет, какой из перечисленных поисковых результатов является наиболее релевантным для искомой информации, и начинает просматривать его. Если этот поисковый результат из списка не предоставляет пользователю искомой информации, он возвращается обратно к списку поисковых результатов и переходит к тому результату, который, как ему кажется, предоставит искомую информацию. И так далее, и тому подобное, пока он не найдет искомую информацию. Таким образом поисковая система собирает данные о том, какие результаты из списка поисковых результатов сочтены пользователями системы релевантными поисковому запросу, и в каком порядке ранжировать эти результаты. Цель заключается в том, чтобы поисковые результаты располагались в идеальном порядке QSR. В чрезвычайно упрощенном примере (который используется только в иллюстративных целях), в следующий раз, когда пользователь введет именно этот конкретный поисковый запрос, позиция поисковых результатов может поменять свое индивидуальное положение, чтобы новый порядок (начиная с самого верха SERP), совпадал с тем, что был определен как наиболее релевантный на основе предыдущих пользовательских взаимодействий с SERP, как было описано выше.

[14] В вышеупомянутых примерах тот факт, что пользователь «начинает» с конкретного поискового результата в списке, не обязательно означает, что пользователь «щелкает» на этот поисковый результат (хотя он может и щелкнуть), это значит, что пользователь рассматривает информацию, представленную на SERP, об этом конкретном поисковом результате в списке, чтобы определить, предоставлена ли ему релевантная информация. Обычно на известном уровне техники это определяется отслеживанием движений пользовательского курсора или направления взгляда пользователя, а также пользовательских переходов по ссылкам и возвращений на SERP.

[15] Обнаружилось, что при некоторых обстоятельствах упомянутое выше предположение неверно. При некоторых обстоятельствах, вопреки очевидному, пользователи начинают с поискового результата из списка, который ранжирован ниже, чем самый высокоранжированный поисковый результат, не по причине того, что они думают, будто тот поисковый результат, с которого они начинают, наиболее релевантен из всех предоставленных поисковых результатов. Без попыток выдвинуть какую-то конкретную теорию, предположим, что причина, по которой пользователь так действует, связана с тем, как он получает доступ к поисковой системе. Например, если доступ к поисковой системе осуществляется из веб-браузера настольного компьютера, поисковые результаты будут предоставлены в совершенно другом визуальном формате, чем в случае, если доступ к поисковой системе осуществляется с помощью специализированного приложения на смартфоне. В первом случае обычно предоставляются результаты вместе с другой информацией в формате с большим количеством графики (причем этот формат может сильно различаться, как будет описано здесь ниже). Во втором случае результаты обычно предоставляются как простой список текстовых элементов, без графики.

[16] Например, современные SERP во многих случаях не представляют собой простую единственную колонку с текстовым списком поисковых результатов, снабженных гиперссылкой на URL интернет-источника (который является поисковым результатом) с текстовым информационным фрагментом (сниппетом), предоставляющим информацию, которая может быть найдена на этом ресурсе. Например, на Фиг. 1 показана типичная SERP 10 поисковой системы Google™ (управляется Google Inc.) для поискового запроса «эйфелева башня»; к странице был совершен доступ из браузера настольного компьютера. Как можно видеть на Фиг. 1, SERP в общем случае делится на два столбца 12, 14. В левом столбце 12 представлен список URL, которые поисковая система считает релевантными конкретному запросу «эйфелева башня», причем список приведен в порядке QSR, вместе с текстовыми фрагментами информации (сниппетами), которую можно обнаружить по этим URL, 161, 162, 163, 164, 165, 166, 167. В центре столбца 12, под третьим в списке поисковым результатом 163, и над четвертым в списке поисковым результатом 164, находится раздел 18 поисковых результатов для новостей и раздел 20 поисковых результатов для изображений. Раздел 18 поисковых результатов для новостей предоставляет список новостных элементов, релевантных поисковому запросу «эйфелева башня». Раздел 20 поисковых результатов для изображений предоставляет набор картинок, релевантных поисковому запросу «эйфелева башня». В правом столбце 16 находится «карточка 22 объекта» для объекта «эйфелева башня». «Карточка 22 объекта» предоставляет картографический фрагмент 24, показывающий положение Эйфелевой башни в Париже, Франция, а также изображение 26 Эйфелевой башни в Париже, Франция. (Эйфелева башня в Париже, Франция является наиболее вероятным объектом, который искали посредством поискового запроса «эйфелева башня»). Кроме того, «карточка объекта» включает в себя (i) фрагмент 28 информации из статьи в Википедии об Эйфелевой башне в Париже, Франция; (ii) информацию 30, относящуюся к самому популярному расписанию посещения Эйфелевой башни в Париже, Франция (источник неизвестен); (iii) отзывы 32 об Эйфелевой башне, Париж, Франция (из Google™ Reviews) и (iv) указание 34 некоторых других запросов, которые вводили люди, искавшие информацию по запросу «эйфелева башня».

[17] Визуальный эффект от SERP, показанной на Фиг. 1, сильно отличается от более традиционной SERP, показанной на Фиг. 2. SERP, показанная на Фиг. 2, является типичной SERP 40 поисковой системы DuckDuckGo™ (управляется DuckDuckGo, Inc.) для поискового запроса «эйфелева башня»; к странице был совершен доступ из браузера настолько компьютера. Как можно видеть на Фиг. 2, SERP 40 в общем случае имеет единственный столбец. В начале SERP 40 находится простая карточка 42 объекта. Под карточкой 42 объекта находятся два простых, расположенных друг за другом текстовых рекламных объявления 441, 442. Под двумя рекламными объявлениями 441, 442 представлен список URL, которые поисковая система считает релевантными конкретному запросу «эйфелева башня», причем список приведен в порядке QSR, вместе с текстовыми фрагментами информации (сниппетами), которую можно обнаружить по этим URL, 461, 462, 463, 464.

[18] Визуальный эффект от SERP, показанной на Фиг. 3, сильно отличается тех SERP, что показаны на Фиг. 1 и 2. SERP, показанная на Фиг. 3, является типичной SERP 50 поисковой системы Яндекс (Yandex™) (управляется ООО Яндекс) для поискового запроса «эйфелева башня»; к странице был совершен доступ со специализированного приложения, запущенного на смартфоне iPhone™, произведенном Apple Inc. и работающем на iOS. Как можно видеть на Фиг. 3, SERP 50 включает в себя один столбец и предоставляет простой текстовый список URL, которые поисковая система считает релевантными конкретному запросу «эйфелева башня», причем список приведен в порядке QSR, вместе с текстовыми фрагментами информации (сниппетами), которую можно обнаружить по этим URL, 521, 522, 523. На SERP 50 не предоставляется другой информации.

[19] В более показательном примере, когда к поисковой системе совершается голосовой доступ с помощью персонального помощника (т.е. Сири (Siri™), разработанная Apple Inc., или Кортана (Cortana™), разработанная Microsoft Inc.), результаты будут представлять собой произнесенные вслух слова. Поисковый результат, предоставленный пользователю первым, в общем случае будет выбран самой поисковой системой, без начального предоставления выбора пользователю. В этом случае визуальное представление сводится к минимуму или и вовсе не присутствует, и пользователю не предоставляется SERP, чтобы использовать ее для выбора из различных результатов поиска.

[20] Учитывая это, но опять же без попыток выдвинуть какую-то конкретную теорию, получается, что способ представления поисковых результатов влияет на пользовательское взаимодействие с поисковыми результатами. Сложность, которая представлена этим сценарием, заключается в том, что QSR поисковых результатов должно быть в общем случае одинаковым, вне зависимости от того как пользователь взаимодействует с поисковой системой (хотя QSR может и различаться у разных поисковых систем). Таким образом, для данного идентичного (во всех смыслах) поискового запроса, вне зависимости от того, как был получен доступ к поисковой системе, поисковые результаты должны быть одинаковы. Однако в общем случае, из-за того, что пользовательские взаимодействия с поисковыми результатами используются при определении QSR для будущих аналогичных поисковых запросов, в этом отношении поисковой системой собираются неверные данные. Это приводит к неверным QSR для будущих аналогичных поисковых запросов. Для пользователей неверные QSR часто являются всего лишь незначительным неудобством, поскольку искомая информация обычно все равно оказывается в пределах самых высоко ранжированных поисковых результатов, пусть даже эти поисковые результаты и могут быть ранжированы не в том порядке. Для поисковой системы, однако, неверные QSR приводят к значительным потерям ресурсов. Чтобы рассмотреть эту ситуацию в контексте, следует понимать, что современная поисковая система может проводить 50000 поисков в секунду, каждую секунду каждого дня месяца. И это число не остается постоянным, а повышается. Поисковые системы должны отслеживать пользовательские взаимодействия с поисковыми результатами по многим причинам. Одна из причин упоминалась выше - это сбор обратной связи для улучшения будущих поисков. Но это не единственная причина. Чем больше взаимодействия осуществит пользователь с SERP, чтобы найти искомую информацию, тем больше ресурсов требуется от поисковой системы по отношению к этому единственному поиску. Этот недостаток увеличивается с каждым поиском, и потеря поисковой системой ресурсов становится огромной. Настоящее техническое решение было разработано благодаря пониманию этих процессов и желанию улучшить эффективность поисковой системы.

[21] Таким образом, одним объектом настоящего технического решения является способ предоставления поисковой системой поисковых результатов на множество клиентских устройств, причем поисковая система включает в себя:

- по меньшей мере один сервер;

- первую базу данных с множеством списков словопозиций, выполненную с возможностью электронного обмена данными по меньшей мере с одним сервером,

- вторую базу данных с информацией, относящейся к предыдущим пользовательским взаимодействиям с поисковыми результатами, предоставленными системой, причем система выполнена с возможностью электронного обмена данными по меньшей мере с одним сервером,

- сеть передачи данных выполнена с возможностью обеспечения электронного обмена данными по меньшей мере между одним сервером и множеством клиентских устройств,

способ включает в себя осуществление по меньшей мере одним сервером:

- получения поискового запроса от одного из множества клиентских устройств по сети передачи данных, причем поисковый запрос включает в себя информацию, указывающую на принадлежность приложения, запущенного на клиентском устройстве, от которого был получен поисковой запрос;

- осуществления поиска по меньшей через первую базу данных для определения поисковых результатов, отвечающих на поисковый запрос, причем поисковые результаты ранжированы по релевантности;

- определения вероятной последовательности пользовательских взаимодействий с поисковыми результатами на основе информации во второй базе данных и на основе информации, указывающей на принадлежность приложения, запущенного на одном из клиентских устройств, от которого был получен поисковой запрос, причем вероятная последовательность пользовательских взаимодействий с поисковыми результатами отличается от порядка ранжирования поисковых результатов по релевантности;

- отправки поисковых результатов на одно из клиентских устройств по сети передачи данных, причем поисковые результаты включают в себя информацию, предоставляющую возможность визуальной конфигурации поисковых результатов, предоставленных пользователю приложением, от которого был получен поисковой запрос, в соответствии вероятной последовательностью пользовательских взаимодействий с поисковыми результатами, поддерживая при этом порядок ранжирования поисковых результатов по релевантности.

[22] Настоящее техническое решение является попыткой улучшить текущий уровень техники с помощью отслеживания поисковой системой пользовательских взаимодействий с поисковыми результатами для того, чтобы иметь возможность предоставлять визуальную конфигурацию поисковых результатов, принимая во внимание принадлежность (или принадлежности) приложения (запущенного на клиентском устройстве), с которого осуществляется доступ к поисковой системе, при модификации порядка (т.е. QSR) ранжирования поисковых результатов по релевантности.

[23] Таким образом, настоящее техническое решение может предоставить возможность (в зависимости от обстоятельств) различной визуальной конфигурации поисковых результатов в различных обстоятельствах, без влияния на порядок ранжирования по релевантности.

[24] Таким образом, в некоторых вариантах осуществления настоящего технического решения клиентскому устройству предоставляются инструкции на отображение поисковых результатов не в порядке ранжирования по релевантности (поддерживая при этом порядок).

[25] В некоторых вариантах осуществления настоящего технического решения клиентскому устройству предоставляются инструкции на отображение поисковых результатов в порядке, который не является линейно-вертикальным.

[26] В некоторых вариантах осуществления настоящего технического решения клиентскому устройству предоставляются инструкции на отображение поисковых результатов в порядке, который не является линейно-горизонтальным.

[27] В некоторых вариантах осуществления настоящего технического решения клиентскому устройству предоставляются инструкции на отображение по меньшей мере одного поискового результата по-другому по сравнению с другими поисковыми результатами. В некоторых вариантах осуществления настоящего технического решения по меньшей мере один поисковый результат обладает по меньшей мере одним отличительным признаком по сравнению с остальными поисковыми результатами: другой шрифт, или другой размер шрифта, или другой цвет, или другой стиль шрифта, или другое подчеркивание шрифта, или другой шрифтовой эффект.

[28] В некоторых вариантах осуществления настоящего технического решения клиентскому устройству предоставляются инструкции на отображение поисковых результатов исключительно изображений, связанных с одним из поисковых результатов, рядом с этим одним поисковым результатом.

[29] В некоторых вариантах осуществления настоящего технического решения принадлежность приложения, запущенного на клиентском устройстве, от которого был получен поисковой запрос, заключается в том, что это приложение является веб-браузером для настольного компьютера.

[30] В некоторых вариантах осуществления настоящего технического решения клиентскому устройству предоставляются инструкции на отображение поисковых результатов; инструкции находятся в информации, относящейся к предыдущим пользовательским взаимодействиям с поисковыми результатами, предоставленными системой; эта информация является результатом использования алгоритма машинного обучения.

[31] В некоторых вариантах осуществления настоящего технического решения способ дополнительно включает в себя:

- получение от одного из множества клиентских устройств по сети передачи данных информации, связанной с текущим пользовательским взаимодействием с результатами; и

- обновление информации во второй базе данных, информации связанной с предыдущими пользовательскими взаимодействиями, теми поисковыми результатами, которые были предоставлены системой, без обновления в системе информации, относящейся к порядку ранжирования по релевантности.

[32] Другим объектом настоящего технического решения является поисковая система, включающая в себя:

- по меньшей мере один сервер, выполненный с возможностью предоставления поисковой системой поисковых результатов на множество клиентских устройств, в соответствии со способом, описанным здесь;

- первую базу данных со множеством списков словопозиций, выполненную с возможностью электронного обмена данными по меньшей мере с одним сервером;

- вторую базу данных с информацией, относящейся к предыдущим пользовательским взаимодействиям с поисковыми результатами, полученным системой, причем система выполнена с возможностью электронного обмена данными по меньшей мере с одним сервером; и

- сеть передачи данных выполнена с возможностью обеспечения электронного обмена данными по меньшей мере между одним сервером и множеством клиентских устройств.

[33] В контексте настоящего описания «сервер» подразумевает под собой компьютерную программу, работающую на соответствующем оборудовании, которая способна получать запросы (например, от клиентских устройств) по сети и выполнять эти запросы или инициировать выполнение этих запросов. Оборудование может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не является обязательным для настоящего технического решения. В контексте настоящего технического решения использование выражения «сервер» не означает, что каждая задача (например, полученные команды или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами; оба варианта включены в выражение «по меньшей мере один сервер».

[34] В контексте настоящего описания «клиентское устройство» подразумевает под собой аппаратное устройство, способное работать с программным обеспечением, подходящим к решению соответствующей задачи. Таким образом, примерами клиентских устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.) смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, ведущее себя как клиентское устройство в настоящем контексте, может вести себя как сервер по отношению к другим клиентским устройствам. Использование выражения «клиентское устройство» не исключает возможности использования множества клиентских устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.

[35] В контексте настоящего описания «база данных» подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, выполняющем процесс, на котором хранится или используется информация, хранящаяся в базе данных, или же база данных может находиться на отдельном оборудовании, например, выделенном сервере или множестве серверов.

[36] В контексте настоящего описания «информация» включает в себя информацию любого рода или типа, которая может храниться в базе данных. Таким образом, информация включает в себя, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы и т.д.

[37] В контексте настоящего описания «компонент» подразумевает под собой программное обеспечение (соответствующее конкретному аппаратному контексту), которое является необходимым и достаточным для выполнения конкретной(ых) указанной(ых) функции(й).

[38] В контексте настоящего описания «используемый компьютером носитель компьютерной информации» подразумевает под собой носитель абсолютно любого типа и характера, включая ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB флеш-накопители, твердотельные накопители, накопители на магнитной ленте и т.д.

[39] В контексте настоящего описания слова «первый», «второй», «третий» и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной связи между этими существительными. Так, например, следует иметь в виду, что использование терминов «первый сервер» и «третий сервер» не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий «второй сервер» обязательно должен существовать в той или иной ситуации. В дальнейшем, как указано здесь в других контекстах, упоминание «первого» элемента и «второго» элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, «первый» сервер и «второй» сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.

[40] Каждый вариант осуществления настоящего технического решения преследует по меньшей мере одну из вышеупомянутых целей и/или объектов. Следует иметь в виду, что некоторые объекты настоящего технического решения, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять и другим целям, отдельно не указанным здесь.

[41] Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящего технического решения станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

Краткое описание чертежей

[42] Для лучшего понимания настоящего технического решения, а также других его аспектов и характерных черт, сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:

[43] На Фиг. 1, Фиг. 2, Фиг. 3 показан известный уровень техники настоящего технического решения.

На Фиг. 4, Фиг. 5, Фиг. 6 показана схема различных сетевых компьютерных систем, подходящих для осуществления настоящего технического решения.

На Фиг. 7, Фиг. 8, и Фиг. 9 показан наглядный пример осуществления настоящего технического решения в поисковой системе Яндекс для поискового запроса «тренажеры», введенного в поисковое приложение Яндекс под iOS,

На Фиг. 10 показан наглядный пример осуществления настоящего технического решения в поисковой системе Яндекс для поискового запроса «тренажеры», введенного в браузер для настольного компьютера по URL www.yandex.com,

Осуществление

[44] На Фиг. 4 показана схема различных сетевых компьютерных систем, обменивающихся друг с другом данным по сети передачи данных, и включающих в себя поисковую систему 100. Следует понимать, что различные компьютерные системы являются только некоторыми вариантами осуществления настоящего технического решения. Таким образом, все последующее описание представлено только как описание показательного примера настоящего технического решения. Это описание не предназначено для определения объема или установления границ настоящего технического решения. Некоторые полезные примеры модификаций компьютерной систем также могут быть охвачены нижеследующим описанием. Целью этого является также исключительно помощь в понимании, а не определение объема и границ настоящего технического решения. Эти модификации не представляют собой исчерпывающий список, и специалистам в данной области техники будет понятно, что возможны и другие модификации. Кроме того, это не должно интерпретироваться так, что там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным вариантом осуществления этого элемента настоящего технического решения. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что компьютерные системы представляют собой в некоторых конкретных проявлениях достаточно простой вариант осуществления настоящего технического решения, и в подобных случаях представлен здесь с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящего технического решения будут обладать гораздо большей сложностью.

Поисковые системы - общее описание

[45] Обычно при формировании системы управления набором данных с возможностью поиска элементы данных индексируются в соответствии с некоторыми или всеми возможными поисковыми терминами, которые могут быть включены в поисковые запросы. Таким образом, системой создается, сохраняется и обновляется «инвертированный индекс». Инвертированный индекс включает в себя большое число «списков словопозиций», необходимых для просмотра во время выполнения поискового запроса. Каждый список словопозиций соответствует потенциальному поисковому термину и включает в себя «словопозиции», которые являются ссылками на элементы данных в наборе данных, включающем в себя данный поисковый термин (или иным образом удовлетворяющем некоторым иным условиям, которые выражаются поисковым термином). Например, если элементы данных являются текстовыми документами, что часто встречается в работе поисковых интернет- (или «веб-») систем, то поисковые термины являются индивидуальными словами (и/или некоторыми наиболее часто используемыми их комбинациями), а инвертированный индекс включает в себя один список словопозиций для каждого слова, которое встретилось по меньшей мере в одном документе.

[46] Поисковые запросы обычно выглядят как простой список из одного или нескольких слов, которые являются «поисковыми терминами» поискового запроса. Каждый такой поисковый запрос может пониматься как запрос поисковой системе на обнаружение каждого элемента данных в наборе данных, включающем в себя все поисковые термины, указанные в поисковом запросе. Обработка поискового запроса будет включать в себя поиск в одном или нескольких списках словопозиций инвертированного индекса. Как было описано выше, обычно каждому поисковому термину в поисковом запросе будет соответствовать список словопозиций. Поиск производится в списках словопозиций потому, что они могут легко сохраняться и управляться из быстродействующей памяти, в отличие от самих элементов данных (элементы данных обычно хранятся в более медленнодействующей памяти). Это, в общем случае, позволяет осуществлять поисковые запросы с гораздо более высокой скоростью.

QIR и QSR

[47] Обычно каждый элемент данных в наборе данных пронумерован. Элементы данных в наборе данных упорядочены не хронологически, географически или в алфавитном порядке, а обычно упорядочены (и пронумерованы) в порядке убывания их «независимой от запроса релевантности» ("query-independent relevance QIR"), как известно в данной области техники. Независимая от запроса релевантность QIR является эвристическим параметром, определяемым системой таким образом, что элементы данных с более высоким QIR статистически более вероятно окажутся сочтены релевантными инициаторами любого поискового запроса. Элементы данных в наборе данных будут упорядочены таким образом, что при завершении поиска элементы с более высоким значением QIR будут расположены сначала. Они, таким образом,