Устройство и способ определения времени создания веб-ресурса

Иллюстрации

Показать все

Изобретение относится к компьютерной технике, а именно к способу определения времени создания веб-ресурса. Технический результат заключается в определении наиболее вероятного времени создания веб-ресурса и достигается за счет применения способа определения времени создания целевой страницы, включающего создание сети страниц, имеющей множество страниц, содержащих целевую страницу и множество ссылок. Каждая из исходных страниц и страниц назначения представляют собой одну из множества страниц. Каждая страница является исходной страницей и страницей назначения по меньшей мере для одной ссылки. Вероятностное распределение сети страниц соответствует определению гипотетического времени создания целевой страницы. Вероятностное распределение сети страниц основано на вероятностном распределении ссылок для каждой ссылки из множества ссылок, вероятностное распределение ссылок основано на времени создания для исходной страницы и времени создания для страницы назначения соответственно. Значение гипотетического времени создания предоставляет наибольшее значение определенного вероятностного распределения сети страниц, значение гипотетического времени создания соответствует времени создания целевой страницы. 2 н. и 16 з.п. ф-лы, 3 ил., 2 прилож.

Реферат

Перекрестная ссылка

Отсутствует

Область техники

Настоящая технология относится к устройству и способу определения времени создания веб-ресурса.

Уровень техники

Сеть Интернет предоставляет доступ к огромному количеству информации. Доступная информация содержит различные типы содержимого, например фотографии, видео, аудио и тому подобное, и относится к различной тематике, например, помимо всего прочего, новости, погода, информация о дорожном движении, развлечения, финансы и тому подобное. Существующие веб-страницы постоянно обновляются для поддержания актуальности информации, кроме того, постоянно создаются новые страницы, содержащие новую информацию и с возможностью доступа к ним через Интернет.

Доступ к информации осуществляется с помощью широкого спектра электронных устройств, например стационарных компьютеров, переносных компьютеров, смартфонов, планшетов и тому подобных. Пользователь также может использовать навигацию на конкретном веб-сайте напрямую, используя адрес данного веб-ресурса, к которому он желает получить доступ. Например, когда пользователь желает получить доступ к онлайновым банковским операциям банка Royal Bank of Canada, пользователь понимает, что он должен получить доступ к веб-сайту . В другом случае, пользователь ищет информацию, не зная точно, на каком веб-ресурсе находится нужная информация, или не зная адреса этого ресурса, и по этой причине вынужден выполнять веб-поиск с использованием поисковой системы, например YANDEX, GOOGLE, YAHOO! и тому подобных. Как известно, пользователь вводит поисковый запрос и поисковая система предоставляет список веб-ресурсов, соответствующих поисковому запросу, известный как страница результатов работы поисковой системы, или сокращенно SERP.

Для быстрого и эффективного получения информации через Интернет важно знать, когда был создан веб-ресурс. Время создания веб-ресурса часто используется для решения многих задач, связанных с получением информации, например для планирования работы поискового робота, ранжирования результатов поиска, сортировки результатов поиска и тому подобного. В связи с этим, возникает потребность в устройстве и способе определения наиболее вероятного времени создания веб-ресурса.

Раскрытие изобретения

Таким образом, задачей предлагаемой технологии является устранение по меньшей мере некоторых недостатков, присущих известному уровню техники.

В соответствии с первым общим аспектом настоящей технологии, предоставлен способ определения времени создания целевой страницы, при этом способ выполняется на сервере, подключенном к коммуникационной сети. Способ содержит создание сети страниц, содержащей множество страниц, в том числе целевую страницу и множество ссылок. Каждая ссылка из множества ссылок имеет исходную страницу и страницу назначения. Каждая из исходных страниц и страниц назначения представляют собой одну из множества страниц. Каждая страница из множества страниц представляет собой одну исходную страницу и страницу назначения по меньшей мере для одной из множества ссылок. Для множества ссылок, вероятностное распределение сети страниц соответствует гипотетическому времени создания целевой страницы. Вероятностное распределение сети страниц основано на вероятностном распределении для каждой ссылки из множества ссылок. Вероятностное распределение для каждой ссылки основано на времени создания для исходной страницы из ссылки и времени создания для страницы назначения из ссылки. Значение гипотетического времени создания предоставляет наибольшее значение определенного вероятностного распределения сети страниц, значение гипотетического времени создания соответствует времени создания целевой страницы.

В другом аспекте, сервер коммуникативно подключен ко множеству узлов через коммуникационную сеть, при этом сервер содержит модуль обработки, сконфигурированный для создания сети страниц, содержащей множество страниц, в том числе целевую страницу и множество ссылок. Каждая ссылка из множества ссылок имеет исходную страницу и страницу назначения, каждая из исходных страниц и страниц назначения представляют собой одну из множества страниц. Каждая страница из множества страниц представляет собой одну исходную страницу и страницу назначения по меньшей мере для одной из множества ссылок. Модуль обработки дополнительно сконфигурирован для определения вероятностного распределения сети страниц для множества ссылок и соответствует гипотетическому времени создания целевой страницы. Вероятностное распределение сети страниц основано на вероятностном распределении для каждой ссылки из множества ссылок. Вероятностное распределение для каждой ссылки основано на времени создания для исходной страницы из ссылки и времени создания для страницы назначения из ссылки. Модуль обработки дополнительно сконфигурирован для определения гипотетического времени создания ресурса, принимая наибольшее значение вероятностного распределения сети страниц, значение предположительного времени соответствует времени создания целевой страницы.

В контексте настоящего описания, поскольку иное не предусмотрено, термин "сервер" представляет собой компьютерную программу, выполняемую на соответствующем оборудовании и способную принимать запросы (например, от клиентского устройства) через сеть и выполнять эти запросы или запускать механизм выполнения запросов. Оборудование может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не является обязательным для настоящей технологии. В контексте настоящей технологии использование выражения «сервер» не означает, что каждая задача (например, полученные инструкции или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «по меньшей мере один сервер».

В контексте настоящего описания, если не предусмотрено иное, термин "электронное устройство" означает любое компьютерное оборудование, на котором программное обеспечение способно выполнять поставленные задачи. Таким образом, примерами электронных устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.), смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, ведущее себя как электронное устройство в настоящем контексте, может вести себя как сервер по отношению к другим электронным устройствам. Использование выражения «электронное устройство» не исключает возможности использования множества электронных устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.

В контексте настоящего описания термин "база данных" подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, которое выполняет процесс, сохраняющий или использующий информацию, хранящуюся в базе данных, или же она может находиться на отдельном оборудовании, например выделенном сервере или множестве серверов.

В контексте настоящего описания термин "информация" содержит информацию любого рода или типа, которая может храниться в базе данных. Таким образом, информация содержит, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы и т.д.

В контексте настоящего описания слова "первый", "второй", "третий" и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной связи между этими существительными. Так, например, следует иметь в виду, что использование терминов "первый сервер" и "третий сервер" не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. Кроме того, как указано здесь в другом контексте, упоминание "первого" элемента и "второго" элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, "первый" сервер и "второй" сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.

Каждый вариант осуществления настоящей технологии включает по меньшей мере одну из вышеупомянутых целей и/или объектов, но наличие всех их вместе не является обязательным. Следует иметь в виду, что некоторые объекты данной технологии, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или могут удовлетворять другим целям, отдельно не указанным здесь.

Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящей технологии станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

Краткое описание чертежей

Для лучшего понимания настоящей технологии, а также других ее аспектов и характеристик сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:

Фиг. 1 представляет собой схематическое изображение сетевой среды 100, выполненной в соответствии с вариантом реализации настоящей технологии;

Фиг. 2 представляет собой схематическое изображение примера сети страниц в соответствии с вариантом реализации настоящей технологии;

Фиг. 3 представляет собой график последовательности определения времени создания веб-страницы в соответствии с вариантом реализации настоящей технологии; и

Приложения А и В содержат дополнительную информацию, связанную с реализацией способа на Фиг. 3.

Осуществление изобретения

Ссылаясь на Фиг. 1, представлено схематическое изображение системы 100, выполненной в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объем. Важно иметь в виду, что нижеследующее описание системы 100 представляет собой описание иллюстративных вариантов осуществления настоящей технологии. Таким образом, все последующее описание представлено только как описание иллюстративного примера настоящей технологии. Таким образом, нижеследующее их описание должно рассматриваться исключительно как описание иллюстративных примеров настоящей технологии.

В некоторых случаях, следует полагать, что полезные примеры модификаций системы 100 также могут быть охвачены нижеследующим описанием. Модификации описаны всего лишь для облегчения понимания, а не определения объема и границ настоящей технологии. Эти модификации представляют собой далеко не полный перечень, и специалистам в данной области будет понятно, что возможны и другие модификации. Кроме того, это не должно интерпретироваться так, что там, где это еще не было сделано, т.е. там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным вариантом осуществления этого элемента настоящей технологии. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что сетевая среда 100 представляет собой в некоторых конкретных проявлениях достаточно простой вариант осуществления настоящей технологии и в подобных случаях представлена здесь с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящей технологии будут обладать гораздо большей сложностью.

Сетевая среда 100 содержит электронное устройство 102 и коммуникационную сеть 110. Электронное устройство 102 подключено к коммуникационной сети 110 через канал связи 103. Электронное устройство 102 обычно связано с пользователем (не показан) и по этой причине иногда называется "электронное устройство пользователя" или "клиентское устройство". В проиллюстрированном варианте реализации технологии, электронное устройство 102 представляет собой переносной компьютер. Реализация электронного устройства 102 не ограничивается реализацией в виде переносного компьютера 102. В качестве примера, электронное устройство 102 может быть реализовано в виде смартфона, персонального компьютера (настольного компьютера, переносного компьютера, нетбука и так далее), беспроводного электронного устройства (мобильного телефона, смартфона, планшета и тому подобных), а также сетевого оборудования (маршрутизатора, коммутатора или шлюза). Общий вариант осуществления электронного устройства 102 известен в области техники и поэтому не будет здесь подробно описан.

Несмотря на то что настоящее описание создано со ссылкой на сетевую среду 100, имеющую одно электронное устройство 102, следует понимать, что сетевая среда 100 способна содержать более одного электронного устройства 102.

Электронное устройство пользователя 102 содержит пользовательский интерфейс ввода (например, клавиатуру, мышь, сенсорную панель, сенсорный монитор, микрофон и тому подобное) для получения данных, вводимых пользователем. Электронное устройство 102 также содержит пользовательский интерфейс вывода (например, экран, динамики, принтер и тому подобное) для визуального, звукового или тактильного вывода данных пользователю. Электронное устройство пользователя 102 содержит интерфейс сетевого взаимодействия (например, модем, сетевую карту и тому подобное) для двустороннего обмена данными через коммуникационную сеть 110 с помощью канала связи 103. Электронное устройство 102 также содержит процессор, связанный с пользовательским интерфейсом ввода, пользовательским интерфейсом вывода и интерфейсом сетевого взаимодействия. Процессор сконфигурирован для выполнения различных способов, включая способы, описанные ниже в данном документе. С этой целью процессор может сохранять или иметь доступ к машиночитаемым командам, выполнение которых инициирует процессор выполнять различные описанные здесь процедуры. Как известно в данной области, электронное устройство пользователя 102 содержит аппаратное и/или программное обеспечение и/или встроенное программное обеспечение для запуска различных приложений. Некоторые приложения сконфигурированы для получения и передачи информации через коммуникационную сеть 110. Примерами таких приложений являются приложения браузера, поисковые приложения, приложения потоковой музыки, приложения для обмена фотографиями и тому подобные.

В проиллюстрированном варианте реализации настоящей технологии, коммуникационная сеть 110 представляет собой сеть Интернет. В других вариантах осуществления настоящей технологии, коммуникационная сеть 110 может быть реализована иначе - в виде глобальной коммуникационной сети, локальной коммуникационной сети, частной коммуникационной сети и тому подобной.

Канал связи 103 также имеет несколько вариантов реализации, не ограничивающих объема настоящей технологии, конкретный вариант реализации канала связи 103 для электронного устройства пользователя 102 зависит от реализации самого электронного устройства 102. На проиллюстрированном варианте реализации настоящей технологии, в котором электронное устройство пользователя 102 реализовано в виде переносного компьютера, канал связи 103 для первого электронного устройства 102 представляет собой либо беспроводной канал связи (например, Wireless Fidelity, или сокращенно WiFi®, Bluetooth® и тому подобный), либо проводной канал связи (например, универсальная последовательная шина или USB-подключение). Боле того, канал связи 103, подключающий электронное устройство 102 к коммуникационной сети 110, поддерживает более одного типа связи. Например, в данном варианте реализации технологии, приводимом в качестве примера, переносной компьютер 102 подключается к сети 110 с помощью беспроводного, а также проводного соединения.

Важно иметь в виду, что варианты осуществления реализации электронного устройства 102, канала связи 103 и коммуникационной сети 110 даны исключительно в иллюстрационных целях. Таким образом, специалисты в данной области техники смогут понять подробности других конкретных вариантов осуществления электронного устройства 102, 104 каналов связи 103, 105 и коммуникационной сети 110. По этой причине представленные здесь примеры не ограничивают объема настоящей технологии.

Электронное устройство 102 содержит аппаратное, и/или программное, и/или встроенное программное обеспечение (или их комбинацию), как известно в данной области техники, для выполнения поискового приложения 104. В общем случае, задачей поискового приложения 104 является предоставление пользователю (не показан) возможности выполнения поиска с использованием вышеупомянутого сервера поисковой системы 120.

Способ реализации поискового приложения 104 ничем не ограничен. Один из примеров поискового приложения 104 может быть реализован при доступе пользователя к веб-сайту, связанному с поисковой системой, для получения доступа к поисковому приложению 104. Например, доступ к поисковому приложению осуществляется путем ввода URL-адреса, связанного с поисковой системой, на сайте . Важно иметь в виду, что поисковое приложение 104 может быть вызвано с помощью любой другой коммерчески доступной или собственной поисковой системы. Таким образом, в данном варианте реализации технологии, поисковое приложение 104 выполняется с помощью браузера.

В общем случае, поисковое приложение 104 содержит интерфейс 106 запроса и интерфейс результатов 108 поиска. Основной задачей интерфейса запроса 106 является предоставление возможности пользователю (не показан) вводить свой запрос или «строку поиска». Основной задачей интерфейса результатов поиска 108 является предоставление результатов поиска, отвечающих запросу пользователя, который был введен в интерфейс 106 запроса. Обработка поискового запроса и предоставление результатов поиска будет описано более подробно ниже.

Также, к коммуникационной сети 110 подключен сервер поисковой системы 120 для выполнения процедуры поиска в ответ на поисковые запросы, принимаемые сервером поисковой системы 120. Сервер поисковой системы 120 подключен к электронному устройству 102 через коммуникационную сеть 110. Сервер поисковой системы 120 также подключен к другим серверам, например, помимо прочего, к серверам сетевой конфигурации, серверам сетевых ресурсов, серверам приложений и другим серверам сетевой конфигурации, через коммуникационную сеть 110.

Сервер поисковой системы 120 может представлять собой обычный компьютерный сервер. В примере варианта реализации настоящей технологии, сервер 120 поисковой системы может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Сервер поисковой системы 120 может быть реализован в виде другого сетевого оборудования, например, помимо прочего, маршрутизатора, коммутатора или шлюза, базовой станции и тому подобного. Сервер поисковой системы 120 может представлять собой любое другое подходящее аппаратное, и/или прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, сервер поисковой системы 120 является одиночным сервером. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, функциональность сервера поисковой системы 120 может быть распределена и может выполняться с помощью нескольких серверов. Механизм реализации сервера поисковой системы 120 является общеизвестным. Тем не менее, выражаясь кратко, сервер поисковой системы 120 содержит интерфейс сетевого взаимодействия (не показан), который структурирован и сконфигурирован для взаимодействия с электронным устройством 102 и другими устройствами, подключенными к коммуникационной сети 110. Сервер поисковой системы 120 дополнительно содержит по меньшей мере компьютерный процессор (не показан), функционально соединенный с интерфейсом связи и настроенный и сконфигурированный с возможностью выполнять различные процессы, описанные в данном документе. Как хорошо известно в данной области техники, сервер поисковой системы 120 может быть дополнительно подключен (или, в противном случае, иметь доступ) к одному или более модулю, например, помимо прочего, модулю поискового робота, модулю сортировки и модулю ранжирования.

Сервер поисковой системы 120 может быть сконфигурирован для выполнения поисковых веб-запросов. Функциональные особенности сервера поисковой системы 120 хорошо известны, тем не менее, выражаясь кратко, поисковая система 115 сконфигурирована для: (i) получения поискового запроса от электронного устройства 102; (ii) обработки поискового запроса (нормализации поискового запроса и так далее); (iii) выполнения поиска веб-ресурсов, соответствующих поисковому запросу, за счет доступа к индексам 122, индексы 118 содержат веб-ресурсы, обработанные поисковым роботом; и (iv) возврата на электронное устройство 102 списка результатов поиска, предоставляемых поисковому приложению для вывода пользователю SERP, содержащих ссылки на веб-ресурсы, соответствующие поисковому запросу.

Сервер поисковой системы 120 коммуникативно подключен (или, в противном случае, имеет доступ) к поисковому кластеру 122. Основной задачей поискового кластера 122 является выполнение поиска в ответ на запрос пользователя, введенный с помощью интерфейса 106 запроса, и вывод результатов поиска для представления их пользователю с помощью интерфейса 108 результатов поиска. Далее следует описание варианта осуществления поискового кластера 122, не ограничивающего объем технологии. Тем не менее, следует иметь в виду, что существуют другие варианты осуществления поискового кластера 122, не ограничивающие объем технологии. Важно также иметь в виду, что для упрощения нижеследующего описания конфигурация поискового кластера 122 была сильно упрощена. Считается, что специалисты в данной области техники смогут понять подробности реализации поискового кластера 122 и его компонентов, которые могли быть опущены в описании с целью упрощения.

В общем случае задачей поискового кластера 122 является (i) проведение поиска; (ii) проведение анализа результатов поиска и ранжирование результатов поиска; (iii) группировка результатов и компиляция страницы результатов поиска (SERP) для вывода на электронное устройство 102. Конфигурация поискового кластера 122 для выполнения поиска ничем не ограничена. Специалистам в данной области техники будут понятны некоторые способы и средства для выполнения поиска с помощью поискового кластера 122, и, соответственно, некоторые структурные компоненты поискового кластера 122 будут описаны только на поверхностном уровне.

В некоторых вариантах реализации настоящей технологии, не ограничивающих ее объем, поисковый кластер 122 содержит модуль обработки 124. Модуль обработки 124 способен выполнять несколько поисковых задач, содержащих, помимо прочего, общий поиск, вертикальный поиск, мета-поиск, многоуровневый поиск и тому подобный. Указанные варианты различных типов поиска не будут описаны в данном документе в качестве возможного ограничения для любого из типов поиска. Любые типы поиска, использование любых способов и средств, как будет понятно специалистам в данной области, могут использоваться для выполнения поисковых задач, описанных в данном документе. С этой целью модуль обработки 124 содержит (или, в противном случае, имеет доступ к) модуль поиска 126.

Модуль веб-поиска 126 имеет доступ к базе данных 128 для выполнения веб-поиска. Несмотря на то что база данных 128 схематически проиллюстрирована в виде единичной структуры, предполагается, что база данных 128 может быть реализована в виде распределенной структуры, например, база данных 128 может состоять из различных компонентов, каждый компонент может быть сконфигурирован для выполнения конкретного вида поиска. Следует также полагать, что модуль поиска 126 имеет доступ ко множеству баз данных 128. Несмотря на то что модуль поиска 126 показан в данном документе как подключенный к одиночной базе данных 128, настоящая технология не ограничена использованием одиночной базы данных 128.

Сетевая среда 100 также содержит первый узел веб-ресурса 130 и второй узел веб-ресурса 132. Первый узел веб-ресурса 130 содержит множество веб-ресурсов, доступ к которым осуществляется за счет подключения к первому узлу веб-ресурса 130 через коммуникационную сеть 110. Второй узел веб-ресурса 132 содержит множество веб-ресурсов, доступ к которым осуществляется за счет подключения ко второму узлу веб-ресурса 132 через коммуникационную сеть 110. Первый и второй узлы веб-ресурса 130, 132 также подключены друг к другу через коммуникационную сеть 110 или же напрямую.

В проиллюстрированном примере, каждый из узлов веб-ресурса 130, 132 выполнен в виде отдельного сервера. Так же, как и сервер поисковой системы 120, каждый из узлов веб-ресурсов 130, 132 может быть реализован как обычный компьютерный сервер. В примере варианта осуществления настоящей технологии, каждый узел сетевого ресурса 130, 132 может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Каждый из узлов сетевых ресурсов 130, 132 также может быть реализован с помощью любого другого подходящего аппаратного обеспечения, и/или программного обеспечения, и/или встроенного программного обеспечения или их комбинации. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, каждый узел веб-ресурса 130, 132 является одиночным сервером. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, функциональность каждого узла веб-ресурса 130, 132 может быть реализована с помощью нескольких серверов. Также следует рассматривать тот вариант, что узлы веб-ресурса 130, 132 могут быть реализованы в виде одного и того же сервера.

Следует понимать, что узлы веб-ресурса 130, 132 и размещенные на узлах 130, 132 веб-ресурсы представлены в этом документе в качестве примера. Сетевая среда 100 также содержит любое количество и тип серверов сетевых ресурсов, и каждый сервер сетевых ресурсов может содержать любое количество и тип сетевых ресурсов.

Каждый из узлов веб-ресурсов 130, 132 содержит множество веб-страниц, как упоминалось выше. Каждая веб страница создается в заданное время, называемое временем создания веб-страницы. Время создания веб-страницы определяется как время, за которое веб-страница выгружается на узел 130, 132 и становится доступной через коммуникационную сеть 110 для электронного устройства 102, расположенного удаленно от узла 130, 132.

Несмотря на то что веб-страница может обновиться уже после создания, для размещения обновленной информации, для целей способа 500, описанного ниже, время создания веб-страницы считается оригинальным временем создания, когда оригинальная версия веб-страницы впервые выгружена и доступ к ней возможен через коммуникационную сеть 110.

Часто информация о времени создания встроена в содержимое страницы или в исходный код ее создания. Например, веб-страница может иметь временную отметку в нижней части страницы, отображающую дату и время ее создания. В другом примере, используемый для создания веб-страницы HTML-код содержит теги, указывающие на время, когда веб-страницы была выгружена. Анализ веб-страницы может быть произведен различными способами для определения времени ее создания.

В общем случае, время создания данной веб-страницы может быть определено несколькими различными способами. Например, время создания страницы может быть извлечено за счет анализа URL-адреса (унифицированный указатель ресурса) веб-страницы для извлечения временных выражений. Время создания также может быть извлечено за счет анализа содержимого страницы, например текста, изображений и тому подобного. Заголовок документа, содержащийся в HTML-коде или в содержимом страницы, содержит информацию о времени создания. В другом примере, HTML-код создания веб-страницы может содержать теги, указывающие на время создания веб-страницы. Различные машинообучаемые алгоритмы, характеристические алгоритмы и тому подобные используются для извлечения информации о времени создания. Время создания определяется с использованием различных методов, например, описанных выше, которым, в определенных случаях отдается предпочтение. Например, информация о времени создания, содержащаяся в URL-адресе для данной страницы, может быть более точной и достоверной, чем информация о времени создания, полученная из заголовка или содержимого страницы. Если информация о времени создания, полученная за счет анализа времени и даты, содержащейся на веб-странице, а также, если информация, полученная за счет анализа части веб-страницы, не противоречит информации, полученной за счет анализа других частей веб-страницы, то считается, что время создания веб-страницы является известным и достоверным. Тем не менее, если информация о времени создания является ошибочной (например, анализ различных частей веб-страницы дает разное время создания), то считается, что время создания страницы не известно или не определено и требует уточнения.

Информация о времени создания веб-страницы может также приблизительно быть определена за счет использования входящих и исходящих ссылок на страницу. Например, для данной исходной страницы имеется множество исходящих ссылок на различные страницы назначения, время создания для исходной страницы может быть получено не ранее, чем самое последнее время создания страницы назначения исходящих ссылок. Аналогично, для данной страницы, имеющей входящие ссылки, время создания веб-страницы может быть определено не ранее, чем время создания исходной страницы для этих входящих ссылок. Если данная страница имеет больше одной входящей ссылки, тогда время создания страницы может быть получено не ранее, чем самое последнее время создания исходной страницы для входящих ссылок.

Следует также полагать, что эти ссылки от исходной страницы на страницу назначения имеют свое собственное время создания ссылок, которое отличается от времени создания исходной страницы. Например, исходная страница может быть обновлена позднее, чем время ее создания, для включения ссылок на страницу назначения. В этом случае, если время обновления (то есть время создания ссылки) может быть определено, например, из временной отметки обновления, содержащейся в содержимом страницы, время создания ссылки берется в качестве определения времени создания целевого документа. Тем не менее, информация о времени создания, полученная за счет использования более ранней входящей ссылки и более поздней исходящей ссылки, как описано выше, используется как наиболее подходящий диапазон времени создания. Для задач приложений, например планирования работы поискового робота, сортировки или ранжирования результатов поиска, такая информация является наиболее подходящей.

Способ 500 определения времени создания веб-страницы будет описан ниже со ссылкой на Фиг. 2. Способ 500 представляет собой способ, основанный на ссылках, использующий описанные выше способы, не выдает никакой информации, связанной временем создания страниц или информации, полученной за счет использования вышеупомянутых способов, предоставляющих раздробленную информацию, например месяц и год создания, без указания времени и дня создания.

Способ 500 запускается на сервере, например на сервере поисковой системы 120, подключенном к коммуникационной сети 110. Веб-страница с неизвестным временем создания именуется в данном документе как целевая страница. Несмотря на то что способ 500 описан ниже со ссылкой на одиночную целевую страницу, следует понимать, что сервер поисковой системы 120 совместим с более чем одной целевой страницей, имеющей неизвестное или неопределенное время создания.

На шаге 520, изображение сети страниц 300 сети страниц 200 содержит множество страниц и множество ссылок, созданных между ними. Изображение сети страниц 300 представляет собой отображение актуальной сети страниц 200, содержащих существующие страницы и существующие между ними ссылки.

Фиг. 3 отображает пример изображения сети страниц 300 примера сети страниц 200. Пример сети страниц 300 изображен в виде диаграммы с веб-страницами А, В, С, D, Ε и F, показанными в виде узлов (отмечены крестиками) и линий, обозначающих связи между соответствующими страницами. В этом изображенном примере 300, узлы (веб-страницы) А, В, С, D, Ε и F сети страниц 200 упорядочены последовательно по времени их создания, независимо от того, известно ли это точно или приблизительно. В этом изображенном примере сети страниц 300, узлы (веб-страницы) А, В, С, D, Ε и F расположены на равном расстоянии друг от друга, независимо от различий во времени их создания. Тем не менее, предполагается, что расстояние между идущими подряд узлами (веб-страницами) указывает на разницу во времени создания этих страниц. Следует также понимать, что изображение сети страниц 300 приводится только в качестве примера и иллюстрации. Изображение сети страниц 300 сети страниц 200 может быть представлено в других формах, например, помимо прочего, иллюстративной, векторной, матричной, графической и тому подобных.

Ссылаясь на Фиг. 3, способ 500 будет описан ниже с использованием примера сценария сети страниц 200, содержащих страницы А, В, С, D, Ε и F. Пример сети страниц 200, проиллюстрированный на Фиг. 3, также содержит ссылки LCA, LFA, LCB, LEB, LDC, LFA, LFC и LFE, соединяющие страницы А, В, С, D, Ε и F.

В описанном варианте реализации способа 500, не ограничивающем объем технологии, каждая из страниц А, В, С, D, Ε и F, содержащаяся в сети страниц 200, связана по меньшей мере с одной другой страницей А, В, С, D, Ε и F сети страниц 200 с помощью ссылки L. Таким образом, каждая страница А, В, С, D, Ε и F, содержащаяся в сети страниц, имеет по меньшей мере одну входящую или исходящую ссылку. Каждая из ссылок L, содержащаяся в сети страниц 200, начинается на одной странице сети страниц 200 и заканчивается на другой странице А, В, С, D, Ε и F сети страниц 200. Другими словами, для каждой ссылки L, содержащейся в сети страниц 200, созданной на шаге 520, обе страницы, как исходная, так и страница назначения, представляют собой страницы, содержащиеся в сети страниц. Таким образом, в этом варианте реализации технологии, не ограничивающем объем технологии, любые ссылки со страниц А, В, С, D, Ε и F сети страниц 200 на страницы, не содержащиеся в сети страниц 200, опущены. Также опущены ссылки, соотносящиеся сами с собой, то есть ссылки, начинающиеся и заканчивающиеся на одной и той же странице, даже если эта страница содержится в сети страниц 200. В дополнение, сеть страниц 200, созданная на шаге 520, содержит все ссылки между любой страницей А, В, С, D, Ε и F сети страниц 200 и любой другой страницей А, В, С, D, Ε и F сети страниц.

В варианте реализации технологии, не ограничивающем ее объем, все страницы А, В, С, D, Ε и F, содержащиеся в сети страниц 200, размещены на одном и том же узле, например на узле 130, 132. Тем не менее, следует полагать, что способ 500 реализован с использованием сети страниц 200, которая содержит страницы из более чем одного узла.

Каждая из страниц А, В,