Система управления индексацией партнерских объявлений

Иллюстрации

Показать все

Изобретение относится к области поисковых систем, а именно к средствам управления индексацией партнерских объявлений. Техническим результатом является повышение быстродействия, за счет увеличения скорости обновления индекса партнерских объявлений. Способ включает в себя получение обновленного партнерского объявления; определение раздела, связанного с обновленным партнерским объявлением, раздел включает в себя первое ранее известное партнерское объявление и второе ранее известное партнерское объявление, первое ранее известное партнерское объявление и второе ранее известное партнерское объявление сгруппированы в раздел на основе общей характеристики; проверку того, что обновленное партнерское объявление отличается от первого ранее известного партнерского объявления и второго ранее известного партнерского объявления, обновление поискового индекса на основе обновленного раздела, которое включает определение части поискового индекса, связанной с обновленной частью раздела, и переиндексацию только упомянутой части. Система реализует указанный способ. 2 н. и 40 з.п. ф-лы, 4 ил.

Реферат

Область техники

Настоящая технология относится к области поисковых систем в общем смысле, и в частности - к системе и способу управления индексацией партнерских объявлений.

Уровень техники

Пользователи получают доступ к Интернету по большому количеству причин. В общем случае, пользователи получают доступ к Интернету с перспективной получения определенного контента (информации, изображений, приложений и т.д.). Этот определенный контент может быть связан с работой, например, если конкретный пользователь проводит рыночное исследование конкурента. Этот определенный контент также может иметь личный характер - например, при поиске места для проведения отпуска. Естественно, некоторый доступный контент в Интернет может иметь личную и деловую ценность. Например, пользователь может быть заинтересован в биржевой информации одновременно для бизнеса и личных инвестиционных целей.

В определенных условиях, пользователь может быть заинтересован, например, в покупке б/у автомобиля. Данный пользователь может с этой целью получить доступ к Интернету для просмотра рекламных объявлений (называются также «реклама» и «предложения»), связанной с б/у автомобилями, выставленными на продажу. Для поиска подобной информации существует множество способов. Например, если пользователь находится в Нью-Йорке, он может получить доступ к поисковой системе и ввести запрос «продажа б/у автомобилей, Нью-Йорк». Другой пользователь может получить доступ к одной из множества доступных досок объявлений (например, "Craiglist" или "Kijiji") и просматривает соответствующие разделы досок объявлений. Еще какой-то пользователь может получить доступ к агрегатору рекламных каналов, агрегатор отвечает за агрегирования рекламных каналов из нескольких источников.

В патенте США 8447120 раскрыта технология, в которой система поиска изображений обновляется постепенно по мере того, как новые изображения становятся доступными. Обновление постепенно выполняется и инициируется в тех случаях, когда новые изображения являются достаточно большими или достаточно сильно отличаются от уже имеющихся изображений, используемых в поиске изображений. Происходит постепенное обновление листовых узлов словарного дерева на основе новых изображений. Частотная характеристика каждого листового узла оценивается с помощью верхних и/или нижних пороговых значений, для изменения узлов словарного дерева на основе частотной характеристики. После завершения постепенного обновления, сервер, который выполнял постепенное обновление, переключается в активное состояние для обработки клиентских запросов по поиску изображений, а другой сервер, который обрабатывал клиентские запросы, переключается в неактивное состояние, ожидая последующих дополнительных обновлений, до тех пор, пока не переключится обратно в активное состояние.

В патентной публикации США 2003/0101183 раскрыта возможность одновременного использования обратного индекса, применяемого для идентификации документов в ходе поиска информации, для индексации во время обновления обратного индекса при поступлении новых документов. Прерывание при использовании индекса сохраняется на приемлемом уровне путем разбиения индекса и обновления только одиночных секций индекса в данный момент времени, и далее - путем дальнейшего разделения индекса на высокоскоростную дополнительную часть, которая может быть скорректирована одновременно в режиме реального времени, и периодически объединяться с более крупной основной частью. Эти две структуры объединяются во время чтения после краткой блокировки с перемещением указателя.

Раскрытие технологии

Задачей предлагаемой технологии является устранение по меньшей мере некоторых недостатков, присущих известному уровню техники.

В одном аспекте, варианты осуществления настоящей технологии предусматривают способ управления индексацией партнерских объявлений. Способ может быть выполнен на сервере. Способ включает в себя получение обновленного партнерского объявления; определение раздела, связанного с обновленным партнерским объявлением, раздел включает в себя первое ранее известное партнерское объявление и второе ранее известное партнерское объявление, первое ранее известное партнерское объявление и второе ранее известное партнерское объявление сгруппированы в раздел на основе характеристики, являющейся общей для первого ранее известного партнерского объявления и второго ранее известного партнерского объявления; в ответ на индикацию того, что обновленное партнерское объявление отличается от первого ранее известного партнерского объявления и второго ранее известного партнерского объявления, обновление раздела на основе обновленного партнерского объявления.

В некоторых вариантах осуществления технологии способ дополнительно включает в себя обновление поискового индекса на основе обновленного раздела. Обновление поискового индекса может включать в себя определения поискового индекса, связанного с обновленной частью раздела. В некоторых вариантах осуществления технологии сервер переиндексирует только ту часть поискового индекса, которая связана с обновленной частью раздела.

В некоторых вариантах осуществления технологии способ дополнительно включает в себя подготовку обновленной части раздела для индексации, предшествующую обновлению поискового индекса. Эта подготовка может содержать один или несколько следующих этапов: (i) десериализацию; (ii) унификацию; (iii) проверку раздела на соответствие бизнес-логике; (iv) обработку изображений; (v) подсчет статической релевантности; (vi) кластеризацию рекламных объявлений; (vii) проверку объема кластера и (viii) сериализацию обработанных разделов.

В некоторых вариантах осуществления технологии сервер обновляет только ту часть раздела, которая связана с обновленным партнерским объявлением.

В некоторых вариантах осуществления технологии, в том случае, когда обновленное партнерское объявление свидетельствует о том, что первое ранее известное партнерское объявление или второе ранее известное партнерское объявление более не активно, способ включает в себя удаление соответствующего первого или второго ранее известного партнерского объявления. Если обновленное партнерское объявление свидетельствует о том, что новое партнерское объявление отличается от первого ранее известного партнерского объявления и второго ранее известного партнерского объявления, способ дополнительно включает в себя создание нового партнерского объявления в разделе, содержащем первое ранее известное партнерское объявление и второе ранее известное партнерское объявление. Если обновленное партнерское объявление свидетельствует о том, что первое ранее известное партнерское объявление или второе ранее известное партнерское объявление были изменены, способ дополнительно включает в себя обновление соответствующего первого или второго ранее известного партнерского объявления.

В некоторых вариантах осуществления технологии, обновленное партнерское объявление реализовано в виде XML-канала. Обновленное партнерское объявление, первое ранее известное партнерское объявление и второе ранее известное партнерское объявление могут представлять собой рекламные объявления.

В другом аспекте, варианты осуществления настоящей технологии предусматривают систему управления индексацией партнерских объявлений, система включает в себя устройство обработки объявлений. Устройство обработки объявлений выполнено с возможностью: получения обновленного партнерского объявления; определения раздела, связанного с обновленным партнерским объявлением, раздел включает в себя первое ранее известное партнерское объявление и второе ранее известное партнерское объявление, первое ранее известное партнерское объявление и второе ранее известное партнерское объявление сгруппированы в раздел на основе характеристики, являющейся общей для первого ранее известного партнерского объявления и второго ранее известного партнерского объявления; в ответ на индикацию того, что обновленное партнерское объявление отличается от первого ранее известного партнерского объявления и второго ранее известного партнерского объявления, обновление раздела на основе обновленного партнерского объявления.

В контексте настоящего описания «сервер» подразумевает под собой компьютерную программу, работающую на соответствующем оборудовании, которая способна получать запросы (например, от клиентских устройств) по сети и выполнять эти запросы или инициировать выполнение этих запросов. Оборудование может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не является обязательным для настоящей технологии. В контексте настоящей технологии использование термина «сервер» не означает, что каждая задача (например, полученные инструкции или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса; и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «по меньшей мере один сервер».

В контексте настоящего описания «клиентское устройство» подразумевает под собой аппаратное устройство, способное работать с программным обеспечением, подходящим к решению соответствующей задачи. Таким образом, примерами клиентских устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.) смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, ведущее себя как клиентское устройство в настоящем контексте, может вести себя как сервер по отношению к другим клиентским устройствам. Использование выражения «клиентское устройство» не исключает возможности использования множества клиентских устройств для получения/передачи, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.

В контексте настоящего описания «база данных» подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, которое выполняет процесс, который сохраняет или использует информацию, хранящуюся в базе данных, или же она может находиться на отдельном оборудовании, например, выделенном сервере или множестве серверов.

В контексте настоящего описания «информация» включает в себя информацию любого рода или типа, которая может храниться в базе данных. Таким образом, информация включает в себя, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы и т.д.

В контексте настоящего описания «компонент» подразумевает под собой программное обеспечение (соответствующее конкретному аппаратному контексту), которое является необходимым и достаточным для выполнения конкретной(ых) указанной(ых) функции(й).

В контексте настоящего описания «используемый компьютером носитель информации» подразумевает под собой носитель абсолютно любого типа и характера, включая ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB флеш-накопители, твердотельные накопители, накопители на магнитной ленте и т.д.

В контексте настоящего описания слова «первый», «второй», «третий» и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной связи между этими существительными. Так, например, следует иметь в виду, что использование терминов "первый сервер" и "третий сервер" не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. В дальнейшем, как обсуждается здесь в других контекстах, упоминание "первого" элемента и "второго" элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, "первый" сервер и "второй" сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.

Техническим результатом, на который направлено настоящее изобретение является увеличение скорости обновления индекса партнерских объявлений. Поскольку индексация каждого нового партнерского объявления не требует перестройки всего индекса, то оно попадает в индекс, а значит становится доступным для поиска гораздо быстрее, чем при использовании существующих методов индексации.

Каждый вариант осуществления настоящей технологии включает по меньшей мере одну из вышеупомянутых целей и/или объектов, но наличие всех не является обязательным. Следует иметь в виду, что некоторые объекты данной технологии, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или могут удовлетворять другим целям, отдельно не указанным здесь.

Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящей технологии станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

Краткое описание чертежей

Для лучшего понимания не ограничивающих вариантов осуществления настоящей технологии, а также других его особенностей и характеристик сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:

На Фиг. 1 изображена принципиальная схема системы 100, система 100 реализована в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объем.

На Фиг. 2 схематически представлен контент первого партнерского сообщения, передающегося между компонентами системы 100, изображенной на Фиг. 1.

На Фиг. 3 схематически представлены данные, хранящиеся в постоянном хранилище 300, которое поддерживается в рамках базы данных партнерских объявлений 132, являющейся частью системы 100, изображенной на Фиг. 1.

На Фиг. 4 изображена схематическая блок-схема способа 400, выполнение способа происходит в рамках системы 100, изображенной на Фиг. 1, способ 400 реализован в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объема.

На Фиг. 4 представлен не ограничивающий вариант осуществления постоянного хранилища 300', обновление которого осуществляется как часть выполнения этапа 406 способа 400, показанного на Фиг. 4.

Осуществление технологии

На Фиг. 1 изображена принципиальная схема системы 100, система 100 выполнена с возможностью реализации вариантов осуществления настоящей технологии, не ограничивающих ее объема. Важно иметь в виду, что система 100 представлена как иллюстративный вариант осуществления настоящей технологии. Таким образом, нижеследующее ее описание должно рассматриваться исключительно как описание иллюстративных примеров настоящей технологии. Это описание не предназначено для определения объема или установления границ настоящей технологии. Некоторые полезные примеры модификаций системы 100 также могут быть охвачены нижеследующим описанием. Целью этого является также исключительно помощь в понимании, а не определение объема и границ настоящей технологии. Эти модификации не представляют собой исчерпывающий список, и специалистам в данной области техники будет понятно, что возможны и другие модификации. Кроме того, это не должно интерпретироваться так, что там, где это еще не было сделано, т.е. там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным способом осуществления этого элемента данной технологии. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что система 100 представляет собой в некоторых конкретных проявлениях достаточно простой вариант осуществления настоящей технологии, и в подобных случаях представлен здесь с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящей технологии будут обладать гораздо большей сложностью.

Система 100 включает в себя устройство 102 обработки объявлений. Устройство 102 обработки объявлений может быть выполнено в виде сервера (отдельно не пронумерован). В альтернативном варианте осуществления технологии устройство 102 обработки объявлений может быть выполнено в распределенном виде, в котором некоторые или все компоненты устройства 102 обработки объявлений, описанные ниже, будут реализованы на различных вычислительных машинах. Например, в варианте осуществления настоящей технологии, не ограничивающем ее объем, устройство 102 обработки объявлений может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что устройство 102 обработки объявлений может представлять собой любое другое подходящее аппаратное и/или прикладное программное, и/или системное программное обеспечение или их комбинацию.

Устройство 102 обработки объявлений содержит кластер 103 индексации. Кластер 103 индексации включает в себя разделитель 104. В общем случае, разделитель 104 выполнен с возможностью заполнения базы данных обработанных партнерских объявлений (будет описана ниже), содержащей партнерские объявления, на получение обновленных партнерских объявлений, на инициацию индексации обновленных партнерских объявлений и т.д. С этой целью, разделитель 104 содержит или, как показано на Фиг. 1, имеет доступ к хранилищу 106 партнерских данных. Теперь следует отметить, что, несмотря на то, что в варианте осуществления настоящей технологии, не ограничивающего ее объем, изображенном на Фиг. 1, хранилище 106 партнерских данных представляет собой единое физическое хранилище, в других вариантах осуществления настоящей технологии, не ограничивающих ее объем, хранилище 106 партнерских данных может быть выполнено в распределенном виде. В качестве примера в других вариантах осуществления настоящей технологии, не ограничивающих ее объем, хранилище 106 партнерских данных может быть выполнено в виде множества устройств для хранения данных (не показаны), каждое из множества устройств для хранения данных может быть связано, например, с конкретным партнером и соответствующими партнерскими объявлениями или подгруппой партнеров и соответствующей подгруппой партнерских объявлений.

Также следует отметить, что термин «партнерский» в термине «хранилище партнерских данных» или «партнерское объявление» не подразумевает каких-либо особых отношений между источником данных в хранилище 106 партнерских данных и оператором, управляющим устройством 102 обработки объявлений. Например, в некоторых вариантах осуществления, не ограничивающих объем настоящей технологии, хранилище 106 партнерских данных может хранить данные от нескольких источников, каждый из которых не имеет никаких особых отношений с оператором, управляющим устройством 102 обработки объявлений. В этих примерах, каждый источник может загружать свои данные в хранилище 106 партнерских данных без вступления в какие-либо деловые отношения с оператором, управляющим устройством 102 обработки объявлений.

В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, хранилище 106 партнерских данных может хранить данные от нескольких источников, причем каждый источник (или, по меньшей мере, некоторые из источников) находится в соглашении с оператором, управляющим устройством 102 обработки объявлений. То, как именно выглядит структура этого соглашения, никак конкретно не ограничено, и может включать в себя неоплачиваемую подписку на данные от источника, оплачиваемую подписку на данные от источника, подписку в обмен на предоставление рекламных баннеров или даже подписку «обратной оплаты», в рамках которой источник данных получает оплату за загрузку его данных на хранилище 106 партнерских данных.

Кроме того, в некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, хранилище 106 партнерских данных может принадлежать и/или управляться и/или контролироваться тем же лицом, что и оператор, управляющий устройством 102 обработки объявлений. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, хранилище 106 партнерских данных может принадлежать и/или управляться и/или контролироваться лицом, отличным от того, которое контролирует оператора устройства 102 обработки объявлений. В этих примерах, хранилище 106 партнерских данных может принадлежать и/или управляться и/или контролироваться одним из лиц, загружающих данные на устройство 102 обработки объявлений (которое будет выступать в качестве агрегатора объявлений от различных источников), либо же третьей стороной, которая будет выступать в качестве агрегатора данных от различных источников.

Данные, размещенные в хранилище 106 партнерских данных, могут принимать различные формы. Поэтому контент хранилища 106 партнерских данных или партнерские объявления, полученные из него (как будет описано ниже) не должны быть истолкованы как ограничение вариантов осуществления настоящей технологии. В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, данные, размещенные в хранилище 106 партнерских данных, могут представлять собой рекламные объявления о различных товарах или услугах. В качестве примера и только с иллюстративными целями различных вариантов осуществления настоящей технологии, не ограничивающих ее объем, предполагается, что хранилище 106 партнерских данных содержит данные, представляющие собой рекламные объявления о продаже б/у автомобилей. Излишне говорить, что данные, хранящиеся в хранилище 106 партнерских данных, и соответствующие партнерские объявления могут включать в себя новостные ленты, новости фондовых бирж, RSS-каналы и т.п.

Также на Фиг. 1 изображен первый партнер 108, второй партнер 110 и третий партнер 112, все они хотят предоставить партнерские объявления, содержащие рекламные объявления о продаже б/у автомобилей. Следует отметить, что число партнеров, потенциально присутствующих в системе 100, никак конкретно не ограничено. В вышеупомянутом примере предполагается, что каждый из партнеров - первый партнер 108, второй партнер 110 и третий партнер 112 - хочет загрузить свои соответствующие рекламные объявления, связанные с продажей б/у автомобилей, в хранилище 106 партнерских данных.

В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, каждый из партнеров - первый партнер 108, второй партнер 110 и третий партнер 112 - выполнен с возможностью передачи хранилищу 106 партнерских данных соответствующего объявления, содержащего подробности рекламного объявления, причем соответствующее объявление представляет собой первое партнерское объявление 118, второе партнерское объявление 120 и третье партнерское объявление 122. В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, каждое партнерское объявление - первое партнерское объявление 118, второе партнерское объявление 120 и третье партнерское объявление 122 - может быть реализовано на расширяемом языке разметки (XML). В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, каждое партнерское объявление - первое партнерское объявление 118, второе партнерское объявление 120 и третье партнерское объявление 122 - может быть реализовано в любом другом подходящем коммерчески доступном или собственном формате.

Контент каждого партнерского объявления - первого партнерского объявления 118, второго партнерского объявления 120 и третьего партнерского объявления 122 - никак конкретно не ограничен и, естественно, будет зависеть от типа информации, содержащейся в хранилище 106 партнерских данных. Пример контента первого партнерского объявления 118, второго партнерского объявления 120 и третьего партнерского объявления 122 будет приведен со ссылкой на Фиг. 2, на которой изображен контент первого партнерского объявления 118 (только для иллюстрации). Следует отметить, что остальные - второе партнерское объявление 120 и третье партнерское объявление 122 - могут быть выполнены по существу аналогичным (но не обязательно идентичным) образом.

Первое партнерское объявление 118 включает в себя индикатор 202 источника, который обычно указывает на имя источника, отправляющего первое партнерское объявление 118. В этом примере, индикатор 202 источника указывает на первого партнера 108, являющегося источником первого партнерского объявления 118. В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, индикатор 202 источника может содержать уникальный идентификатор, связанный с источником партнерского объявления, название компании источника партнерского объявления или Единый Указатель Ресурсов (URL), связанный с расположением конкретного рекламного объявления на конкретном партнерском веб-сайте, с которым связано первое партнерское объявление 118.

Первое партнерское объявление 118 дополнительно включает в себя первую рекламную часть 204, вторую рекламную часть 206, третью рекламную часть 208 и N-ную рекламную часть 210. Естественно, число рекламных частей 204, 206, 208, 210, содержащихся в первом партнерском объявлении 118, не ограничивается представленными здесь. Таким образом, можно предположить, что данное первое партнерское объявление 118 может включать в себя один экземпляр первой рекламной части 204 - посвященный, соответственно, только одному рекламному объявлению. С другой стороны, данное первое партнерское объявление 118 может включать в себя множество N рекламных частей 210, каждая из которых представляет соответствующее рекламное объявление. Поэтому можно говорить, что данное первое партнерское объявление 118 может представлять собой одно рекламное объявление или несколько рекламных объявлений.

Контент каждой из рекламных частей - первой рекламной части 204, второй рекламной части 206, третьей рекламной части 208 и N-ной рекламной части 210 - будет зависеть, конечно, от природы рекламного объявления. Возвращаясь к используемому примеру, рекламное объявление о продаже б/у автомобилей, каждая из рекламных частей - первая рекламная часть 204, вторая рекламная часть 206, третья рекламная часть 208 и N-ная рекламная часть 210 - будет включать в себя некоторые или все следующие аспекты: (i) год выпуска автомобиля; (ii) марку автомобиля; (iii) модель автомобиля; (iv) цену; (v) изображение или изображения автомобиля; (vi) дополнительную информацию об автомобиле.

Следует отметить, что в рамках вариантов осуществления технологии, представленных выше, первое партнерское объявление 118 связано с одним поставщиком объявлений (например, первым партнером 108). Естественно, возможно, что данное партнерское объявление 118, в других вариантах осуществления настоящей технологии, не ограничивающих ее объем, фактически может быть связано с объявлениями от нескольких партнеров. Таким образом, возможно, что данное первое партнерское объявление 118 будет включать в себя несколько индикаторов 202 источника. Например, каждый индикатор 202 источника может быть связан с соответствующей рекламной частью - первой рекламной частью 204, второй рекламной частью 206, третьей рекламной частью 208 и N-ной рекламной частью 210. Даже если первое партнерское объявление 118 связано с одним поставщиком объявлений, оно, тем не менее, может содержать несколько индикаторов 202 источника, каждый индикатор 202 источника связан с соответствующей рекламной частью - первой рекламной частью 204, второй рекламной частью 206, третьей рекламной частью 208 и N-ной рекламной частью 210.

Кластер 103 индексации, изображенный на Фиг. 1, дополнительно включает базу 132 данных обработанных партнерских объявлений. База 132 данных обработанных партнерских объявлений получает обработанные партнерские объявления от разделителя 104 и хранит их, как будет более подробно описано ниже. Кластер 103 индексации дополнительно включает индексатор 134. В общем случае, задачей индексатора 143 является создание индексов на основе обработанных партнерских объявлений, хранящихся в базе данных обработанных партнерских объявлений 132, и обновление индексов на основе обновлений объявлений, полученных от хранилища 106 партнерских данных.

Даже если индексатор 134 изображен как одна физическая единица, в других вариантах осуществления настоящей технологии, не ограничивающих ее объем, индексатор 134 может быть реализован в распределенном виде. В этих вариантах осуществления настоящей технологии, не ограничивающих ее объем, когда индексатор 134 реализован в распределенном виде, передача информации между разделителем 104 и одним из множества индексаторов 132 может быть реализована путем распределения нагрузки. Другими словами, разделитель 134 может выбирать один из множества доступных индексаторов 132 на основе того, например, насколько загружен данный индексатор из множества индексаторов 132 по сравнению с другими из множества доступных индексаторов 132.

Далее будет описана функция разделителя 104 в контексте того, как разделитель 104 обрабатывает новые партнерские объявления. Тем не менее, некоторые из описанных процессов, применяемых к новым партнерским объявлениям, могут быть с соответствующими изменениями применены к получению и обработке обновленных партнерских объявлений (будет описано ниже). Разделитель 104 получает объявление из хранилища 106 партнерских данных (объявление было загружено в хранилище 106 партнерских данных одним или несколькими партнерами - первым партнером 108, вторым партнером 110 или третьим партнером 112). Следует отметить, что в некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, новое (или обновленное) партнерское объявление, полученное из хранилища 106 партнерских данных может отражать информацию от одного из партнеров - первого партнера 108, второго партнера 110 и третьего партнера 112. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, новое (или обновленное) партнерское объявление, полученное из хранилища 106 партнерских данных может отражать информацию от нескольких партнеров - первого партнера 108, второго партнера 110 и третьего партнера 112.

В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, разделитель 104 получает доступ к хранилищу 106 партнерских данных для получения объявления. Получение доступа может осуществляться на периодической или случайной основе, например, каждые 15 минут, каждый час, каждый день, каждую неделю, каждый понедельник, вторник, пятницу данной недели или в любой комбинации из вышеприведенных вариантов. Эти варианты осуществления можно рассматривать как «pull» технологию. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, хранилище 106 партнерских данных может передавать объявление разделителю 104. Передача также может осуществляться на периодической или случайной основе, например, каждые 15 минут, каждый час, каждый день, каждую неделю, каждый понедельник, вторник, пятницу данной недели или в любой комбинации из вышеприведенных вариантов. Эти варианты осуществления можно рассматривать как «push» технологию. Естественно, комбинация обоих подходов также может быть использована.

Как только разделитель 104 получает объявление, разделитель 104 разбирает полученное объявление на множество рекламных объявлений, потенциально содержащихся в нем. В данном примере рассматривается первое партнерское объявление 118 (Фиг. 2), разделитель 104 извлекает индикатор 202 и затем разбирает первое партнерское объявление 118 на первое рекламное объявление, содержащее первую рекламную часть 204, второе рекламное объявление, содержащее вторую рекламную часть 206, третье рекламное объявление, содержащее третью рекламную часть 208; и N-ное рекламное объявление, содержащее N-ную рекламную часть 210.

Разделитель 104 затем выполняет функцию унификации каждого из сгенерированных подобным образом рекламных объявлений. Более конкретно, функцией разделителя 104 является проверка того, чтобы каждое из рекламных объявлений содержало ключевые поля, сформированные одним и тем же образом. Функция унификации может быть особенно полезной в том случае, если формат предоставления партнерских объявлений никак заранее не был определен. Естественно, в тех случаях, когда формат предоставления партнерских объявлений был заранее определен, функция унификации может не выполняться.

Для целей данного примера, представленных ниже, ключевыми полями являются «марка», «модель» и «год», связанные с продажей б/у автомобилей. Естественно, в тех вариантах осуществления настоящей технологии, где предметом рекламных объявлений является объект другого типа, ключевые поля будут выглядеть иначе. Также следует отметить, что число ключевых полей не ограничено. В общем случае, число и содержимое ключевых полей может быть выбрано таким образом, что ключевые поля идентифицируют предмет рекламного объявления, и позволяют их разделить, как будет описано ниже.

На основе ключевых полей для каждого данного рекламного объявления, разделитель 104 определяет раздел, к которому следует отнести данное рекламное объявление (или, в общем, партнерское объявление). В общем случае, «раздел» представляет собой набор рекламных объявлений, сгруппированных в соответствии с характеристиками, связанными с ними. В этом примере, характеристикой может являться совокупность года, марки и модели данного продающегося б/у автомобиля. Разделитель 104 затем создает разделы (т.е. группы рекламных объявлений на основе выбранных характеристик ключевых полей) и сохраняет их в базе 132 данных обработанных партнерских объявлений. Следует отметить, что выбор года, марки и модели данного автомобиля был использован только в качестве примера. Важно иметь в виду, что любое число ключевых полей может быть использовано в качестве характеристики для группировки рекламных объявлений по разделам.

На Фиг. 3 изображен пример постоянного хранилища 300, расположенного в пределах базы 132 данных обработанных партнерских объявлений. В рамках этого примера, постоянное хранилище 300 содержит три раздела: первый раздел 302, второй раздел 304 и третий раздел 306, число разделов (три) выбрано произвольно только в качестве примера.

Для иллюстрационных целей предполагается, что первый раздел 302 был создан на основе следующих характеристик: "<Год><2011>", "<Марка><Ford>", "<Модель><Escort>". Второй раздел был создан на основе следующих характеристик: "<Год><2009>", "<Марка><BMW>", "<Модель><325>". Третий раздел был создан на основе следующих характеристик: "<Год><2010>", "<Марка><Mazda>", "<Модель><3>".

Соответственно на основе вышеприведенных характеристик, следующие партнерские объявления были сгруппированы в соответствующие разделы. Первый раздел 302 содержит "<партнер 1><предложение 1>", что соответствует первому предложению от первого партнера 108, "<партнер 2><предложение 2>", что соответствует второму предложению от второго партнера 110, и "<партнер 3><предложение 1>", что соответствует третьему предложению от третьего партнера 112.

Второй раздел 304 содер