Система, способ и устройство для оценки сеансов просмотра

Иллюстрации

Показать все

Изобретение относится к вычислительной технике, а именно к поисковым системам в интернете. Технический результат - эффективное ранжирование веб-страниц в поисковых системах. Способ вычисления ранга страницы для веб-страницы, включающий осуществление доступа к данным истории просмотра, связанным с вебстраницей, данным истории просмотра, включающим параметр времени, вычисление оценочного ранга для веб-страницы посредством данных истории просмотра и параметра времени, ранжирование веб-страницы в списке в соответствии с оценочным рангом, заключается в том, что параметр времени включает первый и второй моменты времени и интервал времени от первого момента времени до второго момента времени, при этом осуществляют выбор последовательности из одного или нескольких моментов времени в пределах интервала времени, таким образом интервал времени разбивают на по меньшей мере два подынтервала времени. 2 н. и 12 з.п. ф-лы, 5 ил., 2 табл.

Реферат

Перекрестная ссылка на родственные заявки

По настоящей заявке истребуется преимущество приоритета в отношении международной патентной заявки № PCT/RU 2013/000603, поданной 15 июля 2013 г., озаглавленной Система, способ и устройство для оценки сеансов просмотра, которая в полном объеме включена в данный документ.

Область техники

Область настоящего изобретения относится к системам, способам и алгоритмам ранжирования веб-страниц, в частности ранжирования веб-страниц в истории просмотра.

Уровень техники

Для алгоритмов Интернет-поиска алгоритмы ранжирования применяют оценки авторитетности веб-страницы, которые позволяют канонически ранжировать веб-страницы. С помощью ранжирования поисковые системы могут предоставить список веб-страниц в ранжированном порядке на основании полученной оценки авторитетности. В одном из способов для оценки значимости страницы анализируется история просмотра пользователя и определяется значимость веб-страницы на основании вероятности посредством анализа стационарного распределения в графике просмотра пользователя. Существующие алгоритмы в своем анализе не содержат новизны (т.е. времени) истории просмотра страниц. Таким образом, страницы, которым была присвоена высокая оценка несколько дней назад, могут уже не быть столь же авторитетными для текущего поиска, хотя этим страницам по-прежнему будут присвоены их предыдущие высокие оценки.

Соответственно, существует потребность в системе, способе, устройстве и технологическом оснащении, которые попытаются решить, по меньшей мере, некоторые из вышеупомянутых проблем уровня техники.

Раскрытие изобретения

В первом аспекте применяется способ вычисления ранга страницы для веб-страницы. Способ включает: осуществление доступа к данным истории просмотра, связанного с веб-страницами, данные истории просмотра, включающие временные данные; вычисление оценочного ранга для веб-страницы посредством данных истории просмотра и параметра времени; а также ранжирование веб-страницы в списке в соответствии с оценочным рангом.

В этом способе вычисление оценочного ранга может включать: вычисление первой оценки посредством оценочного ранга просмотра данных истории просмотра и параметра времени; вычисление второй оценки посредством запросо-зависимого элемента для веб-страницы; и добавление первой оценки, уточняемой по первому коэффициенту по отношению ко второй оценке, уточняемой по второму коэффициенту для получения оценочного ранга.

В этом способе первый коэффициент может быть математически связан со вторым коэффициентом.

В этом способе временные данные могут выделить из истории данные просмотра, которые являются более поздними (т.е. более "свежими"), чем данные просмотра более давней истории.

В этом способе временные данные могут включать первый и второй моменты времени и интервал времени от первого момента времени до второго момента времени.

В этом способе вычисление оценочного ранга может включать применение производной функции для стационарного распределения марковского процесса, связанной с данными истории браузера.

В этом способе вычисление оценочного ранга для веб-страницы может включать: выбор последовательности из, по меньшей мере, одного момента времени внутри интервала времени; вычисление первого значения свежести для каждого из, по меньшей мере, одного момента времени и второго значения свежести для веб-страницы, связанного с каждым из, по меньшей мере, одного момента времени; и вычисление показателя свежести для веб-страницы как функции первого и второго значений свежести.

В этом способе данные истории просмотра могут соответствовать интервалу времени от первого момента времени до второго момента времени; и вычисление оценочного ранга для веб-страницы может включать: выбор последовательности из одного или нескольких моментов времени внутри интервала времени, и второй момент времени, где интервал времени разбит на по меньшей мере один подынтервал времени; вычисление для веб-страницы первого значения свежести для каждого момента времени из последовательности; вычисление для веб-страницы второго значения свежести для каждого момента времени из последовательности; и вычисление показателя свежести для веб-страницы как функции от первого и второго значений свежести.

В этом способе первый момент времени и каждый момент времени могут разделить интервал времени на два или более подынтервала времени.

В этом способе вычисление для веб-страницы первого значения свежести может использовать время создания веб-страницы и количество посещений веб-страницы в данных истории просмотра на протяжении подынтервала времени, непосредственно предшествующего подынтервалу времени каждого момента времени из последовательности.

В этом способе вычисление для веб-страницы второго значения свежести может использовать время создания веб-страницы и рассчитанное значение свежести, связанное с каждым моментом времени для веб-страниц, смежных с данной веб-страницей.

Способ может дополнительно включать вычисление для веб-страницы промежуточного показателя свежести для каждого момента времени из последовательности посредством любого соответствующего вычисленного промежуточного показателя свежести, связанного с моментом времени в последовательности, непосредственно предшествующим каждому моменту времени, если таковой имеет место, и второго значения свежести, связанного с каждым моментом времени. В этом способе вычисленный показатель свежести для веб-страницы может включать вычисленный промежуточный показатель свежести, связанный со вторым моментом времени.

В этом способе вычисляемый оценочный ранг для веб-страницы может использовать вероятность перехода, соответствующую веб-странице, умноженную на функцию показателя свежести.

В этом способе вычисляемый оценочный ранг для веб-страницы может включать: умножение расчетного времени пребывания для веб-страницы, полученного из матрицы перехода для данных истории просмотра, на функцию показателя свежести; и умножение стационарной вероятности распределения для веб-страницы на функцию показателя свежести.

Этот способ может дополнительно включать применение частных производных первой функции оценочного ранга для веб-страницы с данными обучения истории просмотра для определения значений параметров генерирования оценочного ранга второй функции.

Этот способ может дополнительно включать: вычисление основанного на запросе запросо-зависимого ранжирования для веб-страницы; и вычисление объединенного ранжирования для веб-страницы как функции запросо-зависимого ранжирования и оценочного ранга.

Во втором аспекте применяется сервер для вычисления ранга страницы веб-страницы. Сервер включает: процессор; базу данных для хранения записей, относящихся к истории просмотра; и программное обеспечение ранжирования страницы, работающее на сервере, дающее инструкции для выполнения процессором любого из способов, представленных выше.

В других аспектах предусматриваются различные комбинации множеств и подмножеств вышеуказанных аспектов.

Дополнительные аспекты и преимущества настоящего изобретения станут очевидны в свете нижеследующего описания. Однако следует понимать, что подробное описание, несмотря на то что оно отражает варианты реализации изобретения, представлено только в качестве примера, поскольку различные изменения и модификации в пределах спектра изобретения станут очевидными для специалистов в данной области из этого подробного описания.

Краткое описание чертежей

Со ссылкой на соответствующие варианты реализации изобретение будет описано применительно к чертежам, которые являются примерами, не ограничивающими объем различных вариантов реализации настоящего изобретения, на которых:

Фиг. 1 является схематическим изображением сети, включающей сервер поисковой системы, множество серверов, на которых размещены веб-сайты, и устройство, связанное с сетью, которое обращается к серверу поисковой системы в соответствии с вариантом реализации изобретения;

Фиг. 2 является схематическим изображением отображения истории просмотра веб-сайта устройства, показанного на фиг. 1, и других устройств и преобразований истории просмотра в график и таблицу для анализа в соответствии с вариантом реализации изобретения;

Фиг. 3 является схематическим изображением устройства на фиг. 1 и его приложения для просмотра в соответствии с вариантом реализации изобретения;

Фиг. 4 является схематическим изображением сервера поисковой системы по фиг. 1 и его (веб) приложение для определения ранга страницы в соответствии с вариантом реализации изобретения, и

Фиг. 5 является блок-схемой показательного алгоритма ранжирования просмотра, выполняемого приложением определения ранга страницы сервера поисковой системы на фиг. 1, в соответствии с вариантом реализации изобретения.

Осуществление изобретения

В данном описании представлена подробная информация о примерах вариантов реализации изобретения. Последующее описание и варианты реализации изобретения, описанные в данном документе, предоставляются для демонстрации примера или примеров конкретных вариантов реализации принципов настоящего изобретения. Эти примеры представлены с целью пояснения, а не ограничения этих принципов и раскрытия предмета изобретения. В нижеследующем описании одинаковые элементы обозначены в описании и на чертежах одинаковыми соответствующими номерами позиций.

Перед обсуждением подробностей специфических особенностей вариантов реализации изобретения в описании представлена сеть, имеющая устройство, такое как сервер, которое обеспечивает связь с другими устройствами, такими как клиенты, в соответствии с вариантом реализации изобретения. Затем информация представляется на примере устройства, в котором применяется вариант реализации изобретения.

Во-первых, представлен пример сетей, в которых могут работать устройства, соответствующие варианту реализации изобретения. Как показано на фиг. 1, подробная информация по примеру системы сетей и устройств связи будет представлена согласно варианту реализации изобретения. На фиг. 1 показана система связи 100, в которой сеть 102 соединяет сервер поисковой системы 104 с другими серверами 106 (т.е. 106a и 106b) и устройством 108a посредством различных каналов связи. Сеть 112 может быть соединена с сетью 102 через канал связи (не показан), который может быть проводным или беспроводным и постоянным или временным. Устройство 108 подключено к сети 102 посредством канала связи 110, который может быть проводным или беспроводным, и постоянным или временным. Сеть 102 может быть сетью Интернет. Устройства, подключенные к сети 112, например устройство 108b, могут получать доступ к серверу поисковой системы 104 и другим серверам 106 посредством сети 112. По отношению к устройству 108, подключенному (прямо или косвенно) к сети 102, представлены два типичных сервиса: поисковые системы веб-сайта; и общий просмотр веб-сайта. Типичные особенности каждого сервиса будут кратко обсуждаться в порядке очереди.

Для использования сервиса просмотра через серверы 106 в сети 102 устройство 108b может просматривать различные веб-сайты в Интернете с помощью веб-браузера в своем графическом интерфейсе пользователя (ГИП). Типичный сеанс просмотра может иметь определенное событие открытия (например, открытие нового окна или вкладки просмотра в ГИП) и может иметь определенное событие закрытия (например, закрытие окна сеанса действием пользователя или самим браузером). Сеанс может считаться завершенным по истечении определенного периода времени, который определен для сеанса браузера на данном веб-сайте (например, 15 минут на текущем веб-сайте, отображаемом в браузере (например, www.yahoo.com), без какой-либо входной активности для изменения текущего веб-сайта устройством 108b). Когда веб-страница генерируется в браузере, по мере того как пользователь на устройстве 108b активирует гиперссылку на веб-странице, например, через устройство ввода (такое как мышь), которое связано с устройством 108 через гиперссылку на веб-странице, инициируется запрос на получение веб-страницы, связанной с гиперссылкой от сервера, связанного с адресом гиперссылки. Полученная страница, если таковая имеется, воспроизводится в ГИП, и сеанс просмотра продолжается. На устройство 108 может быть установлено приложение мониторинга, связанное с браузером, которое отслеживает и контролирует сеансы просмотра и выдает данные в журнал просмотра, связанный с сеансами. Анонимизированная информация, описывающая действия просмотра пользователя (включая, например посещенные страницы, время посещения, переданные запросы и т.д.), хранится в журнале просмотра.

Для поисковой службы в сети 102, такой как типичная поисковая служба, сервер поисковой системы 104 размещает веб-сайт, который предоставляет ГИП на дисплей устройства, которое осуществляет доступ к веб-сайту, дает возможность ввести в ГИП текст, касающийся Интернет-запроса, который будет выполнен через сервер поисковой системы 104. Например, когда запрос вводится через ГИП (например, "What is the capital city of France <CR>"), текст запроса анализируется сервером поисковой системы 104; инициируется поиск веб-страниц, которые отслеживаются сервером поисковой системы 104 для определения набора веб-страниц, которые совпадают с поиском; при этом список ранжированных веб-страниц отображается в графическом интерфейсе пользователя. Как только пользователь вызовет на устройстве один или несколько результатов поиска, веб-страницы с сервера 106, связанные с вызванной ссылкой, извлекаются и отображаются на устройстве 108.

Данные, относящиеся к истории сеансов просмотра, и поиски веб-системы, инициированные на устройствах 108/108b, могут быть отслежены и сохранены в устройстве 108/108b на его локальном устройстве(ах) хранения данных, на сервере 104 в его локальной базе данных 104b и/или в других местах (не показаны) в сети 102. История просмотра содержит записи данных, относящиеся к каждой веб-странице, посещенной во время сеанса просмотра, включая данные о том, когда начался сеанс, как начался сеанс, какие веб-сайты были посещены, когда были посещены веб-сайты, какова была продолжительность пребывания на каждом веб-сайте, как был получен доступ на каждый из веб-сайтов, как был завершен сеанс и когда был завершен сеанс и другие записываемые элементы. Различные элементы данных сеанса могут быть сохранены в различных местах. На устройствах 108 могут быть установлены и могут работать программные приложения, которые наблюдают и отслеживают сеансы просмотра в журнале просмотра. Данные истории просмотра для одного или нескольких устройств 108 могут быть сохранены в различных местах, например в базах данных поставщиков услуг Интернет связи (ISP), в файлах данных локального браузера на устройствах, так как браузеры и поисковые системы могут быть объединены в приложениях (например, в Chrome и Яндекс), в базах данных мобильных сетей, в данных, сохраняемых подключаемыми модулями браузера, работающего на устройстве 108, и в других приложениях, установленных в смартфонах и компьютерах. Различные устройства 108n, осуществляющие доступ к серверу поисковой системы 104, также могут локально и/или удаленно сохранять данные, относящиеся к их истории поиска. Данные могут быть получены и объединены из одного или нескольких различных мест и от одного или нескольких устройств 108, затем обработаны и проанализированы для определения тенденций в использовании пользователями ресурсов Интернет на устройствах 108, осуществляющих доступ к серверу поисковой системы 104. Данные истории просмотра могут быть запрошены и получены из различных локальных и удаленных источников посредством способов сбора данных, известных в данной области техники.

На фиг. 2 представлено схематическое отображение данных истории просмотра/поиска от одного или нескольких устройств 108, осуществляющих доступ из инструмента отображения, используемого в варианте реализации изобретения для создания и заполнения структур данных для сохранения истории и моделей просмотра веб-сайта. Истории 200(1), 200(2) … 200(n) представляют списки данных посещения веб-сайта для сеансов просмотра и/или сеансов поиска. Например, история 200(1) содержит записи 202(1) для устройства 108a о сеансе просмотра конкретного окна просмотра, имевшего место приблизительно 1 января приблизительно в 1:00-1:10 после полудня. Информация сеанса может включать один или несколько посещенных URL-адресов, время посещения и длительность пребывания на странице и способ посещения (например, вход по URL-адресу или по гиперссылке, нажатой на предыдущей странице).

В совокупности истории 200(1)…(n) могут быть отображены на графике 204, представляющем историю браузера для нескольких устройств 108, осуществляющих доступ к нескольким веб-страницам с нескольких серверов 108 в различные моменты времени. На графике 204 вершины 206(1), (2) … (n) представляют веб-страницы (соответствующие URL-адресам), а дуги 208(1), (2) .. (m), показанные как направленные стрелки, показывают переход от одного веб-сайта к другому одного устройства 108 в его истории просмотра, где основанием дуги является текущий веб-сайт, а верхняя часть дуги (со стрелкой) представляет полученный целевой веб-сайт, посещаемый после перехода (например, после активации гиперссылки на текущем веб-сайте для перехода на другой веб-сайт). Может существовать несколько дуг 208, соединяющих две вершины 206, где различные вершины отражают указанные переходы на веб-страницы, инициированные независимо различными устройствами 108. Как вариант, дуга 208, соединяющая две вершины 206, может отражать совокупные переходы на веб-страницы для всех устройств 108. График 204 показывает все истории просмотра 200(1) … (n) и не отражает в этом изображении одной конкретной истории просмотра. Согласно варианту реализации отображаются истории просмотра и генерируется набор данных, аналогичный графику 204, с дополнительным параметром времени (в отношении даты/времени каждого сеанса просмотра, используемого для построения графика), а затем применяет алгоритмы формирования данных для ранжирования веб-страниц посредством графика просмотра, такого как график 204. Эти данные могут быть получены от интернет-браузеров, установленных на устройствах 108, и/или собраны с серверов 106.

График 204 может быть представлен в формате таблицы посредством таблицы 210, содержащей строки и столбцы для каждой из вершин 206(1), (2) … (n), представляют веб-страницы, а ячейки 212 в записи (i, j) в таблице 210 предоставляют данные просмотра для перехода от вершины 206i к вершине 206j на графике 204. Записи в диагонали на записи (i, i) в таблице 210 предоставляют данные просмотра, оставшиеся в вершине i в сеансе просмотра. Например, записи могут включать параметр времени (например, отражающий время, когда произошел переход между веб-страницами для одного или нескольких устройств (полученный из истории просмотра от одного или нескольких источников), данные перехода (например, отражающие то, как были активированы переходы), данные о местоположении (например, отражающие расположение компьютеров, на которых были просмотрены веб-страницы) и другие данные (например, отражающие тип программного обеспечения, используемого для просмотра, и т.д.). Следует иметь в виду, что таблица 210 содержит данные, которые могут быть получены из данных истории просмотра или из других источников.

Один аспект варианта реализации изобретения предусматривает временной коэффициент (а именно коэффициент «свежести»), который используется для применения весового значения к веб-странице, которое присутствует в истории просмотра для веб-сеанса. Этот коэффициент свежести рассчитывается на основании записей в таблице 210 и используется как коэффициент при ранжировании значимости веб-страницы в истории просмотра.

В описанных особенностях варианта реализации изобретения с целью демонстрации без ограничения объема изобретения следующие термины и соответствующие определения представлены как описывающие характеристики и взаимосвязь данных, относящихся к сеансам просмотра. Термины представлены в типичных уравнениях, которые один из вариантов реализации изобретения использует для отображения и ранжирования аспектов сеансов просмотра.

Для сеанса просмотра (обозначаемого в данном документе как "S"), проведенного на устройстве 108, веб-страницы, посещенные в сеансе S, обозначаются как страницы p1(S), p2(S), … pk(S)(S). В истории просмотра для каждого i∈{1, 2, …, k(S)-1} запись pi(S) переходит в pi+1(S): ("Pi(S)→pi+1(S)"). Страницы pi(S), Pi+1(S)являются смежными элементами сеанса S.

Для каждой страницы ("p") в истории просмотра s(p) является количеством сеансов, которые были инициированы на странице "p". Для каждой пары смежных элементов {pi, pi+1} сеанса I(pi, pi+1) является количеством сеансов, включающих эти пары смежных элементов.

График 204 алгебраически представлен как G=(V, Е), что можно рассматривать как другое алгебраическое представление данных, указанных в таблице 210. В этом отношении множество вершин V (представляющих вершины 206) включает все веб-страницы, определенные в истории просмотра, и включает дополнительную вершину x. Множество направленных дуг E (представляющих дуги 208) включает упорядоченные пары смежных элементов {p1, p2}. Множество Е также включает дополнительные дуги от последних страниц всех сеансов к вершине x.

Вероятность возврата σ(p) обозначается как вероятность выбора страницы p, когда начался новый сеанс просмотра. Она пропорциональна количеству сеансов с(p), начиная со страницы c. Соответственно, для одного варианта реализации изобретения вероятность возврата может быть установлена на ноль, так, чтобы σ(x)=0.

I(p, x) обозначает количество сеансов истории просмотра, который заканчивается на странице p, где p→x∈E. Вероятность перехода "ω" представляет вероятность активации гиперссылки на странице p1 для перехода на p2("p1→p2"), так, что:

ω ( p 1 → p 2 ) = I ( p 1 , p 2 ) / ( ∑ p 1 → p ∈ E I ( p 1 , p ) )                 У р а в н е н и е   1

Q(p) представляет расчетное время пребывания в истории просмотра на странице p. Ранжированное значение страницы p, обозначенное как ранг просмотра BR(p), выражается формулой:

BR(p)=Q(p)π(p) Уравнение 2

где

π ( p ) = α ˜ ( p ) σ ( p ) + ( 1 − α ) ∑ p ¯ ≠ x : p ¯ → p ∈ E ω ( p ˜ → p ) π ( p ˜ )       У р а в н е н и е 3  

Следует иметь в виду, что уравнения 2 и 3 выполняются при p=x, а также если

Переменной, которая в варианте реализации изобретения вводится в анализ сеанса просмотра, является актуальность. Как правило, BR(p) может не отражать свежесть ссылки в истории просмотра. Таким образом, только ранжирование, основанное на BR(p), может представить результаты, в которых присутствует пользователь с ранжированием, где "старые" и "свежие" ссылки имеют вероятности, которые являются аналогичными, так как не учитывают временной компонент в своих вероятностях. Один из вариантов реализации изобретения включает показатель свежести истории просмотра, представляя функцию вероятности свежести просмотра (FBR). Более подробная информация по этому показателю свежести приводится ниже.

Для одного из вариантов реализации изобретения в рамках показателя свежести временные интервалы для сеанса просмотра используются для измерения «свежести» страницы в сеансе. Для сеанса просмотра с двумя моментами времени τ и T, где τ<T, временной интервал [τ, T] делится на К частей, так что для множества времен [ti-1, ti],

Время t(p) представляет время (например, дату), когда была создана страница p из V. Вершина x считается созданной в момент τ. Для временного интервала i∈{1, 2, … К} p∈V определяется как вершина (веб-страница), созданная до момента ti.

В одном из вариантов реализации изобретения вычисляется оценка свежести на странице браузера, которая затем может быть использована в алгоритме ранжирования при анализе истории просмотра. Вариант реализации изобретения определяет функцию F («Свежесть») в момент времени t=i для начального значения F i 0 ( p ) , представляющего значение свежести страницы p и ее гиперссылки следующим образом:

F i 0 ( p ) = a 0 n i ( p ) + b 0 m i ( p ) ,   p ≠ x ,       У р а в н е н и е   5 a

где a0 и b0 - неотрицательные параметры, ni(p)=1, если вершина p создается в i-м периоде, в противном случае ni(p)=0; mi(p) - количество посещений страницы за i-й период. В качестве первоначального расчета вариант реализации изобретения может установить F i 0 ( x ) = 0 . Чем выше значение F i n ( x ) в уравнении 5, тем "свежее" его оценка.

Иными словами, вариант реализации изобретения предусматривает значение свежести для веб-страницы p, ("f(p)"), которое основано на комбинации множества коэффициентов, каждый из которых может иметь весовое значение по отношению к другим коэффициентам. В одном из вариантов реализации изобретения f(p) для веб-страницы p включает элемент FBR(p) и запросо-зависимый элемент ("QD(p)") для веб-страницы. Элемент QD может быть получен из функции ранжирования документа, такой как ВМ25 (или "Okapi ВМ25"). Таким образом, f(p) может быть выражено как:

fq(p)=λFBR(p)+(1-λ)QD(p,q) Уравнение 5b

где λ может иметь значения от 0 до 1. Таким образом, первый коэффициент для FBR(p) математически связан со вторым коэффициентом QD(p, q). Здесь математическая зависимость обратно пропорционально определяет два элемента по коэффициентам λ и (1-λ). В других вариантах реализации изобретения к элементам FBR и QD могут быть применены независимые коэффициенты.

Уравнение 5a позволяет рассчитать начальную величину F i 0 ( p ) . Уравнение 6, представленное ниже, определяет прирост (дельту) значения свежести, которое основано на распространении начального значения свежести по вершинам по направлению к исходящим дугам графика. В одном из вариантов реализации изобретения распространение включает использование времени, связанного с историей просмотра (в виде метки времени как значение свежести для веб-страниц в истории браузера) и арифметическое распределение компонента времени по веб-странице в истории просмотра в качестве части оценочного ранга для веб-страниц. Например, в истории просмотра переходу с веб-страницы X на веб-страницу Y 1 января 2013 г. будет предоставлен определенный оценочный ранг, основанный на свежести этого перехода относительно даты выполнения алгоритма ранжирования в соответствии с вариантом реализации изобретения. Также из истории просмотра переходу с веб-страницы X на веб-страницу Y на 1 февраля 2013 г. будет предоставлен другой оценочный ранг, основанный на свежести этого перехода относительно даты выполнения алгоритма ранжирования. Переход, выполненный 1 февраля 2013 г., может быть ранжирован выше (т.е. иметь более высокий удельный вес), чем переход, выполненный 1 января 2013 г., так как переход 1 февраля 2013 г. произошел позднее, чем переход 1 января 2013 г. В одном варианте реализации изобретения инкрементное значение свежести рассчитывается следующим образом:

Δ F i ( p ) = μ F i 0 ( p ) + ( 1 − μ ) ∑ p ¯ ≠ x : p ¯ → p ∈ E W i ( p ) ∑ p ' ∈ V : p ¯ → p ' ∈ E W i ( p ' ) Δ F i ( p ˜ ) ,       У р а в н е н и е   6

где µ∈[0, 1]. Wi(p) является оценкой, присвоенной по "локальному" показателю свежести вершине p в i-й период. Этот локальный показатель определяется таким же образом, как начальные значения показателя F i 0 :

W i ( p ) = a 1 n i ( p ) + b 1 m i ( p ) + ∑ j ≤ i n j ( p ) ,   a 1 , b 1 ≥ 0.       У р а в н е н и е   7

В одном из вариантов реализации изобретения показатель свежести распространяется на исходящие гиперссылки со страницы, даже если среди них нет ни одной свежей гиперссылки. Таким образом, в расчете весовое значение страницы увеличивается по значению (например, увеличивается на 1), если она была создана до момента ti. Результаты уравнения 7 демонстрируют влияние смежных элементов на показатель свежести страницы.

С учетом указанных выше уравнений вариант реализации изобретения определяет показатель свежести Fi следующим образом:

Fi(p)=βFi-1(p)+ΔFi(p) Уравнение 8

В качестве общей характеристики, если не происходит никаких действий, связанных с вершиной P (параметр β из (0, 1)), с течением времени показатель свежести уменьшается. Уменьшение может быть линейным, нелинейным или экспоненциальным. В одном из вариантов реализации изобретения применяется экспоненциальное уменьшение, так что:

Fi(p)=βiΔF0(p) Уравнение 9

если не было никаких действий по просмотру в период [τ, ti]. Уравнения 8 и 9 представляют типичную формулу, которая может быть реализована в алгоритме для арифметически распределяемого компонента времени по всей веб-странице в истории просмотра как часть оценочного ранга для веб-страниц.

В примере применения анализа свежести в истории просмотра по одному из вариантов реализации изобретения предполагается, что для уравнения 7 все рассматриваемые вершины и дуги создаются до времени ti.

Для этого примера показатель свежести задает для страницы p на графике G оценку свежести FK(p). Значение количества сеансов, I, факторизуется с учетом вероятностной оценки свежести, так что I(p1, p2) заменяется на I(p1, р2)×FK(p2). Таким образом, вероятность свежести перехода ωF(p1→p2) дуги p1→p2 представляется как:

π F ( p ) = α ˜ ( p ) σ ( p ) + ( 1 − α ) ∑ p ˜ ≠ x : p ˜ → p ∈ E ω F ( p ˜ → p ) π F ( p ˜ ) .     У р а в н е н и е   10

где

Таблица А
Параметр Описание
[τ; T] рассматриваемый период времени
K количество интервалов времени
a0 коэффициент усиления Fi0(p) принимается во внимание, если t(p)=i
a1 коэффициент усиления Wi(p) принимается во внимание, если t(p)=i
b0 коэффициент усиления Fi0(p) принимается во внимание, если пользователь щелкает по p в i-й период
b1 коэффициент усиления Wi(p) принимается во внимание, если пользователь щелкает по p в i-й период
µ коэффициент затухания для Fi(p), рассчитанный коэффициент затухания для расчета оценки FBR
β Скорость уменьшения Fi(p)

Ниже представлено описание способов, используемых для выявления некоторых показательных значений параметров, представленных в таблице А. После определения значений, представленных в таблице А, может быть вычислен хронологический ранг для веб-страницы посредством уравнения 10.

Ниже приводится описание других функций по варианту реализации изобретения. Для показательного набора данных истории браузера fq(p) представляет значение свежести страницы p для запроса q, для которого добавляется запросо-зависимый элемент (в уравнении 5б). Показательная история просмотра включает множество страниц V q 1 , V q 2 , … V q k для каждого запроса q, которые упорядочены от наиболее актуальных ("самые последние") до наименее актуальных ("более старых") страниц. Другими словами, V q 1 - это множество всех страниц с наивысшей оценкой, выбранных из меток k, страницы из множества V q k имеют наиболее низкую оценку. Для любых двух страниц p 1 ∈ V q i , p 2 ∈ V q j ухудшение оценки h я