Система и способ использования контента онлайнового разговора для выбора рекламного контента и/или другой релевантной информации для отображения

Иллюстрации

Показать все

Группа изобретений относится к средствам анализа контента онлайновых разговоров с использованием технологий информационной проходки. Техническим результатом является обеспечение динамического выбора контекстуального или релевантного рекламного контента для отображения. В системе и способе определяют, что ключевое слово выбора рекламы, которое было оценено, было также охарактеризовано как ключевое слово намерения пользователя, осуществляют повторное взвешивание ключевого слова выбора рекламы, которое также было охарактеризовано как ключевое слово намерения пользователя, чтобы назначить ему больший вес в алгоритме распределения суммарной вероятности, который используется для выбора контента рекламы, и используют результаты реализации технологии информационной проходки для нахождения релевантного рекламного контента и/или другой релевантной информации для отображения совместно с контентом онлайнового разговора. 3 н. и 9 з.п. ф-лы, 6 ил.

Реферат

Ссылки на родственные заявки

Нет.

Сведения об исследованиях или разработках, субсидируемых государством

Нет.

Область техники, к которой относится изобретение

Настоящее изобретение относится к вычислительным средам. В частности, варианты осуществления настоящего изобретения относятся к системам и способам анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки. Кроме того, варианты осуществления настоящего изобретения относятся к использованию результатов реализации технологии информационной проходки для нахождения релевантного рекламного контента и/или другой релевантной информации (например, словарных определений, ссылок на дополнительную информацию и т.п.) для отображения.

Предшествующий уровень техники

Все большее количество людей использует инструменты онлайнового разговора, например мгновенный обмен сообщениями, для облегчения связи с семьей, друзьями и коллегами. Зачастую совместно с контентом онлайнового разговора отображается одна или несколько реклам. Однако поскольку отображаемые рекламы обычно не имеют отношения к пользователю, эти рекламы редко замечают и, даже когда замечают, на них часто не обращают внимание.

Кроме того, тема онлайновых разговоров часто принимает форму вопросов, касающихся конкретной темы или продукта, в котором пользователь может быть заинтересован. Даже, если контент онлайнового разговора указывает, что пользователь имеет конкретную заинтересованность в определенной теме, для нахождения информации по теме, пользователю приходится обращаться к общей машине поиска вне окна онлайнового разговора и пытаться найти релевантную информацию в обычно обширном списке ресурсов.

Соответственно, желательно иметь способ использования контента онлайнового разговора для динамического выбора контекстуального или релевантного рекламного контента для отображения. Кроме того, предпочтительно иметь способ использования контента онлайнового разговора для динамического выбора другой релевантной информации (например, словарных определений, ссылок на дополнительную информацию и т.п.) для отображения.

Сущность изобретения

Варианты осуществления настоящего изобретения предусматривают способы использования контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) для выбора рекламного контента для отображения. В одном варианте осуществления способ может включать в себя этапы, на которых принимают контент онлайнового разговора, извлекают одно или несколько ключевых слов из контента онлайнового разговора и выбирают рекламный контент для отображения на основании одного или нескольких извлеченных ключевых слов. При желании, способ может дополнительно включать в себя этап, на котором отображают рекламный контент, выбранный совместно с онлайновым разговором.

В другом варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, идентифицируют любые ключевые слова намерения пользователя из одного или нескольких оцененных ключевых слов и, если какие-либо ключевые слова намерения пользователя идентифицированы, повторно взвешивают одно или несколько оцененных ключевых слов в соответствии с идентифицированными ключевыми словами намерения пользователя.

В еще одном варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, определяют, произошла ли смена темы, и, если определено, что смена темы произошла, повторно взвешивают одно или несколько оцененных ключевых слов на основании исторических данных.

Варианты осуществления настоящего изобретения дополнительно предусматривают способы использования контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) для выбора релевантной информации (например, словарных определений, ссылок на дополнительную информацию и т.п.) для отображения. В одном варианте осуществления способ может включать в себя этапы, на которых принимают контент онлайнового разговора, извлекают одно или несколько ключевых слов из контента онлайнового разговора и выбирают релевантную информацию для отображения на основании одного или нескольких извлеченных ключевых слов. При желании, способ может дополнительно включать в себя этап, на котором отображают релевантную информацию, выбранную совместно с контентом онлайнового разговора.

В другом варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, идентифицируют любые ключевые слова намерения пользователя из одного или нескольких оцененных ключевых слов и, если какие-либо ключевые слова намерения пользователя идентифицированы, повторно взвешивают одно или несколько оцененных ключевых слов в соответствии с идентифицированными ключевыми словами намерения пользователя.

В еще одном варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, определяют, произошла ли смена темы, и, если определено, что смена темы произошла, повторно взвешивают одно или несколько оцененных ключевых слов на основании исторических данных.

Дополнительные варианты осуществления настоящего изобретения предусматривают компьютерно-считываемые носители, имеющие компьютерно-выполняемые команды для осуществления способа. В одном варианте осуществления способ может включать в себя этапы, на которых принимают контент онлайнового разговора (например, сеанс мгновенного обмена сообщениями), извлекают одно или несколько ключевых слов из контента онлайнового разговора и находят, по меньшей мере, одно из рекламного контента и другой релевантной информации для отображения на основании одного или нескольких извлеченных ключевых слов.

Предусмотрены также компьютеры, запрограммированные на осуществление раскрытых здесь способов.

Краткое описание чертежей

Настоящее изобретение подробно описано со ссылкой на прилагаемые чертежи, в которых:

фиг.1 - блок-схема иллюстративной вычислительной среды, которую можно использовать для реализации настоящего изобретения;

фиг.2 - схема иллюстративной архитектуры системы согласно варианту осуществления настоящего изобретения;

фиг.3A и 3B - логическая блок-схема способа анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки и использования результатов такого анализа для нахождения релевантного рекламного контента и/или другой релевантной информации для отображения согласно варианту осуществления настоящего изобретения;

фиг.4 - логическая блок-схема способа повторного взвешивания ключевых слов на основании исторической информации и обнаружения смены темы согласно варианту осуществления настоящего изобретения; и

фиг.5 - иллюстративный снимок экрана пользовательского интерфейса для отображения рекламного контента и/или другой информации, относящейся к контенту онлайнового разговора совместно с таким контентом согласно варианту осуществления настоящего изобретения.

Подробное описание изобретения

Ниже приведено конкретное описание предмета настоящего изобретения в соответствии с установленными требованиями. Однако само по себе описание не призвано ограничивать объем этого патента. Напротив, авторы изобретения предусматривают, что заявленный предмет допускает различные реализации, включающие в себя различные этапы или комбинации этапов, аналогичные описанным в этом документе, в сочетании с другими современными или будущими технологиями. Кроме того, хотя термины “этап” и/или “блок” можно использовать здесь в связи с различными элементами используемых способов, эти термины не следует интерпретировать в отношении какого-либо определенного порядка между различными этапами, раскрытыми здесь, если порядок отдельных этапов не оговорен в явном виде.

Варианты осуществления настоящего изобретения предусматривают системы и способы анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки. Варианты осуществления настоящего изобретения дополнительно предусматривают способы и системы использования результатов реализации технологии информационной проходки для нахождения релевантного рекламного контента и/или другой информации для отображения.

Таким образом, варианты осуществления настоящего изобретения предусматривают системы и способы выбора релевантного рекламного контента и/или другой релевантной информации для отображения совместно с текстом онлайнового разговора на основании автоматического анализа контента онлайновых разговоров и контента рекламы, каковой контент можно описывать ключевыми словами или рекламными словами, и/или контента другой релевантной информации, каковой контент можно описывать ключевыми словами и пр.

Описанные здесь системы и способы полностью автоматизированы и облегчают выбор контекстуального рекламного контента и/или другой релевантной информации в соответствии с конкретными темами, которые относятся к контенту онлайнового разговора пользователя. Ключевые слова извлекаются из текста онлайнового разговора с использованием технологий информационной проходки. Извлеченные ключевые слова представляют темы, которые являются приближением заинтересованности(ей) пользователя во время онлайнового разговора. Затем, с использованием извлеченных ключевых слов, релевантные рекламы и/или другая информация выявляются для текущего пользователя и отображаются совместно с контентом онлайнового разговора. При желании, при нахождении рекламного контента и/или другой релевантной информации можно также учитывать другие факторы, например вероятности обращения, значения монетизации для ключевых слов, пользовательские профили и/или информацию, касающуюся поведения пользователя.

Благодаря использованию описанных здесь систем и способов, рекламный контент, отображаемый совместно с контентом онлайнового разговора, с большой степенью вероятности будет релевантен пользователю, что повышает вероятность того, что пользователь выберет рекламный контент и, таким образом, обратится к связанной с ним дополнительной информации. Такое обращение повышает вероятность того, что пользователь совершит покупку рекламируемого товара и, таким образом, максимизирует доход рекламодателя. Дополнительно, отображение другой релевантной информации совместно с контентом онлайнового разговора расширяет онлайновые возможности пользователя и повышает вероятность того, что он в дальнейшем воспользуется онлайновой услугой. Кроме того, при наличии, информацию профиля и поведения пользователя можно использовать при выборе контента, дополнительной настройки рекламного контента и другой релевантной информации на интересы пользователя.

Описав в общих чертах настоящее изобретение, приступим к описанию иллюстративной рабочей среды настоящего изобретения.

На чертежах в целом, где используется сквозная система обозначений, и в частности и в первую очередь на фиг.1 иллюстративная рабочая среда для реализации настоящего изобретения показана и обозначена как целое в виде среды (оборудования) 100 вычислительной системы. Среда вычислительной системы является лишь одним примером подходящей вычислительной среды 100 и не призвана накладывать какие-либо ограничения на объем использования или функциональные возможности изобретения. Кроме того, вычислительную среду 100 не следует рассматривать как имеющую какую-либо зависимость или требование в отношении любого компонента, проиллюстрированного в иллюстративной рабочей среде 100 или их комбинации.

Изобретение применимо ко многим другим средам или конфигурациям вычислительных систем общего назначения или специального назначения. Примеры общеизвестных вычислительных систем, сред и/или конфигураций, пригодных для применения изобретения, включают в себя, но без ограничения, персональные компьютеры, компьютеры-серверы, карманные или портативные устройства, многопроцессорные системы, системы на основе микропроцессора, телевизионные приставки, программируемую бытовую электронику, сетевые ПК, миникомпьютеры, универсальные компьютеры, телефонные системы, распределенные вычислительные среды, которые включают в себя любые из вышеперечисленных систем или устройств, и т.п.

Изобретение можно описать в общем контексте компьютерно-выполняемых команд, например программных модулей, выполняемых компьютером. В общем случае программные модули включают в себя процедуры, программы, объекты, компоненты, структуры данных и т.д., которые выполняют определенные задачи или реализуют определенные абстрактные типы данных. Изобретение можно применять на практике в распределенных вычислительных средах, где задачи выполняются удаленными устройствами обработки, связанными друг с другом посредством сети передачи данных. В распределенной вычислительной среде программные модули размещаются как на локальных, так и на удаленных компьютерных носителях данных, включая запоминающие устройства.

Согласно фиг.1 иллюстративная система для реализации изобретения включает в себя вычислительное устройство общего назначения в виде компьютера 110. Компоненты компьютера 110 включают в себя, но без ограничения, процессор 120, системную память 130 и системную шину 121, которая подключает различные компоненты системы, в том числе системную память, к процессору 120. Системная шина 121 может относиться к любому из нескольких типов шинных структур, включая шину памяти или контроллер памяти, периферийную шину и локальную шину с использованием различных шинных архитектур. В порядке примера, но не ограничения, такие архитектуры включают в себя шину «архитектуры промышленного стандарта» (ISA), шину «микроканальной архитектуры» (MCA), шину расширенной ISA (EISA), локальную шину «ассоциации по стандартизации видеоэлектроники» (VESA) и шину «взаимосоединения периферийных компонентов» (PCI), также именуемую шиной расширения.

Компьютер 110 обычно включает в себя различные компьютерно-считываемые среды. Компьютерно-считываемые среды могут представлять собой любые имеющиеся среды, к которым компьютер 110 может осуществлять доступ, и включают в себя энергозависимые и энергонезависимые среды, сменные и стационарные среды. В порядке примера, но не ограничения, компьютерно-считываемые среды могут содержать компьютерные носители данных и среды передачи данных. Компьютерные носители данных включают в себя энергозависимые и энергонезависимые, сменные и стационарные носители, реализованные с помощью любого метода или технологии для хранения информации, например компьютерно-считываемых команд, структур данных, программных модулей или других данных. Компьютерные носители данных включает в себя, но без ограничения, ОЗУ, ПЗУ, ЭСППЗУ, флеш-память или другую технологию памяти, CD-ROM, цифровые универсальные диски (DVD) или другие оптические диски, магнитные кассеты, магнитную ленту, накопитель на магнитных дисках или другие магнитные запоминающие устройства или любой другой носитель, который можно использовать для хранения полезной информации и к которому компьютер 110 может осуществлять доступ. Среды передачи данных обычно реализуют компьютерно-считываемые команды, структуры данных, программные модули или другие данные в сигнале, модулированном данными, например несущей волне или другом транспортном механизме, и включают в себя любые среды доставки информации. Термин «сигнал, модулированный данными» означает сигнал, одна или несколько характеристик которого изменяется таким образом, чтобы кодировать информацию в сигнале. В порядке примера, но не ограничения, среды передачи данных включает в себя проводные среды, например проводную сеть или прямое проводное соединение, и беспроводные среды, например акустические, РЧ, инфракрасные и другие беспроводные среды. Комбинации любых вышеперечисленных сред также подлежат включению в понятие компьютерно-считываемых сред.

Системная память 130 включает в себя компьютерные носители данных в виде энергозависимой и/или энергонезависимой памяти, например постоянной памяти (ПЗУ) 131 и оперативной памяти (ОЗУ) 132. Базовая система ввода/вывода (BIOS) 133, содержащая основные процедуры, которые помогают переносить информацию между элементами компьютера 110, например, при запуске, обычно хранятся в ПЗУ 131. ОЗУ 132 обычно содержит данные и/или программные модули, к которым процессор 120 может непосредственно обращаться или которыми он в данный момент оперирует. В порядке примера, но не ограничения, на фиг.1 показаны операционная система 134, прикладные программы 135, другие программные модули 136 и программные данные 137.

Компьютер 110 также может включать в себя другие сменные/стационарные, энергозависимые/энергонезависимые компьютерные носители данных. Исключительно для примера, на фиг.1 показаны привод 141 жесткого диска, который считывает с или записывает на стационарный энергонезависимый магнитный носитель, привод 151 магнитного диска, который считывает с или записывает на сменный энергонезависимый магнитный диск 152, и привод 155 оптического диска, который считывает с или записывает на сменный энергонезависимый оптический диск 156, например CD-ROM или другой оптический носитель. Другие сменные/стационарные, энергозависимые/энергонезависимые компьютерные носители данных, которые можно использовать в иллюстративной рабочей среде, включают в себя, но без ограничения, кассеты с магнитной лентой, карты флеш-памяти, цифровые универсальные диски, цифровую видеоленту, полупроводниковое ОЗУ, полупроводниковое ПЗУ и т.д. Привод 141 жесткого диска обычно подключен к системной шине 121 через интерфейс стационарной памяти, например интерфейс 140, и привод 151 магнитного диска и привод 155 оптического диска обычно подключены к системной шине 121 посредством интерфейса сменной памяти, например интерфейса 150.

Приводы и соответствующие компьютерные носители данных, рассмотренные выше и показанные на фиг.1, обеспечивают хранение компьютерно-считываемых команд, структур данных, программных модулей и других данных для компьютера 110. Например, на фиг.1 показано, что в приводе 141 жесткого диска хранятся операционная система 144, прикладные программы 145, другие программные модули 146 и программные данные 147. Заметим, что эти компоненты могут совпадать с или отличаться от операционной системы 134, прикладных программ 135, других программных модулей 136 и программных данных 137. Операционная система 144, прикладные программы 145, другие программные модули 146 и программные данные 147 обозначены здесь другими позициями, чтобы подчеркнуть, что они являются как минимум разными копиями. Пользователь может вводить команды и информацию в компьютер 110 через устройства ввода, например клавиатуру 162 и указательное устройство 161, например мышь, шаровой манипулятор или сенсорную панель. Другие устройства ввода (не показаны) могут включать в себя джойстик, игровую панель, спутниковую антенну, сканер и т.п. Эти и другие устройства ввода часто подключены к процессору 120 через интерфейс 160 пользовательского ввода, который подключен к системной шине, но могут подключаться посредством других интерфейсов и шинных структур, например параллельного порта, игрового порта или универсальной последовательной шины (USB). Монитор 191 или устройство отображения другого типа также подключено к системной шине 121 через интерфейс, например видеоинтерфейс 190. Помимо монитора 191, компьютеры также могут включать в себя другие периферийные устройства вывода, например громкоговорители 197 и принтер 196, которые могут подключаться через интерфейс 195 выходной периферии.

Компьютер 110 может работать в сетевой среде с использованием логических соединений с одним или несколькими удаленными компьютерами, например удаленным компьютером 180. Удаленный компьютер 180 может представлять собой персональный компьютер, карманное устройство, сервер, маршрутизатор, сетевой ПК, равноправное устройство или другой общий сетевой узел и обычно включает в себя многие или все элементы, описанные выше применительно к компьютеру 110, хотя на фиг.1 показано только запоминающее устройство 181. Логические соединения, описанные на фиг.1, включают в себя локальную сеть (ЛС) 171 и глобальную сеть (ГС) 173, но также могут включать в себя другие сети. Такие сетевые среды обычно применяются в учреждениях, компьютерных сетях в масштабе предприятия, интрасетях и Интернете.

При использовании в сетевой среде ЛС, компьютер 110 подключен к ЛС 171 через сетевой интерфейс или адаптер 170. При использовании в сетевой среде ГС, компьютер 110 обычно включает в себя модем 172 или другое средство установления связи в ГС 173, например Интернете. Модем 172, который может быть внутренним или внешним, может быть подключен к системной шине 121 через сетевой интерфейс 170 или другой пригодный механизм. В сетевой среде программные модули, описанные применительно к компьютеру 110, или часть из них могут храниться в удаленном запоминающем устройстве. В порядке примера, но не ограничения, на фиг.1 показано, что удаленные прикладные программы 185 размещены на запоминающем устройстве 181. Заметим, что показанные сетевые соединения являются иллюстративными и можно использовать другие средства установления линии связи между компьютерами.

Хотя многие другие внутренние компоненты компьютера 110 не показаны, специалистам в данной области техники хорошо известны такие компоненты и их взаимосвязь. Соответственно, дополнительные детали, касающиеся внутренней конструкции компьютера 110, не нуждаются в раскрытии в связи с настоящим изобретением.

При включении или перезагрузке компьютера 110, BIOS 133, хранящийся в ПЗУ 131, предписывает процессору 120 загрузить операционную систему или необходимую ее часть с привода 141 жесткого диска в ОЗУ 132. Когда скопированная часть операционной системы, обозначенная как операционная система 144, загружена в ОЗУ 132, процессор 120 выполняет код операционной системы и обеспечивает отображение на мониторе 191 визуальных элементов, связанных с пользовательским интерфейсом операционной системы 134. Обычно, когда пользователь открывает прикладную программу 145, программный код и соответствующие данные считываются с привода 141 жесткого диска, и необходимые части копируются в ОЗУ 132, причем скопированная часть обозначается здесь как 135.

Как отмечено выше, варианты осуществления настоящего изобретения относятся к системам и способам анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки и использования результатов такого анализа для нахождения релевантного рекламного контента и/или другой релевантной информации для отображения. На фиг.2 показана блок-схема, демонстрирующая общую архитектуру системы для анализа контента онлайнового разговора и нахождения рекламного контента и/или другой релевантной информации согласно варианту осуществления настоящего изобретения, причем общая архитектура системы в целом обозначена здесь позицией 200.

Система 200 включает в себя компонент 212 разделения слов для обнаружения промежутков между словами и использования этих промежутков для задания последовательности слов после получения потока исходного контента онлайнового разговора 210 (например, контента сеанса мгновенного обмена сообщениями). Компонент 212 разделения слов может быть особенно полезен в языках, формат которых предусматривает менее выраженные промежутки между словами, чем английский язык. Система 200 дополнительно включает в себя компонент морфологического анализа 214 для стандартизации слов из последовательности слов, т.е. для приведения слов к стандартному виду. Кроме того, система 200 включает в себя компонент 216 фильтрации игнорируемых слов для идентификации и фильтрации игнорируемых слов, т.е. слов, не относящихся к теме онлайнового разговора, из последовательности слов. В общем случае игнорируемые слова - это слова, которые, например, слишком часто используются в разговоре, чтобы надежно указывать заинтересованность пользователя в той или иной конкретной теме. Игнорируемые слова обычно обеспечиваются посредством заранее заданного списка и идентифицируются путем сравнения последовательности проанализированных слов с заранее заданным списком.

Система 200 дополнительно включает в себя компонент 218 извлечения ключевых слов разговора для извлечения ключевых слов из исходного онлайнового разговора и сравнения извлеченных ключевых слов с совокупностью списков для определения совпадений. Таким образом, компонент 218 извлечения ключевых слов разговора принимает ввод из рекламной базы данных 224, в которой может(ут) храниться список(и) рекламных ключевых слов для сравнения с извлеченными ключевыми словами, информационной базы данных 225, в которой может(ут) храниться список(ки) ключевых слов информации и список инициаторов намерения пользователя для сравнения с извлеченными ключевыми словами, а также вывод из компонента 216 фильтрации игнорируемых слов.

Компонент 218 извлечения ключевых слов разговора дополнительно классифицирует извлеченные ключевые слова по одной или более из трех категорий: ключевые слова 218A намерения пользователя, ключевые слова 218B выбора рекламы и ключевые слова 218C выбора релевантной информации. Ключевые слова 218A намерения пользователя - это ключевые слова, которые указывают конкретную заинтересованность пользователя конкретной темой и обычно следуют за заранее определенным инициирующим словом или сочетанием слов. Например, если пользователь вводит фразу “Я бы хотел купить Ягуар”, слово “ягуар” можно считать ключевым словом намерения пользователя, поскольку оно следует за сочетанием слов “Я бы хотел купить”. Слова или словосочетания, инициирующие ключевые слова 218A намерения пользователя, обычно обеспечиваются посредством заранее заданного списка ключевых слов 218A намерения пользователя и затем идентифицируются путем сравнения последовательности слов, введенных из компонента 216 фильтрации игнорируемых слов системы 200, с заранее заданным списком. Список инициаторов намерения пользователя может храниться в показанной информационной базе данных 225 или, при желании, может храниться в отдельной базе данных.

Ключевые слова 218A намерения пользователя также можно определять на основании информации 230 пользовательского профиля и/или информации 232 поведения пользователя, если эта информация доступна. Например, если в большом проценте онлайновых разговоров, которые пользователь провел за последние тридцать дней, он упоминал слово “ягуар”, это слово можно считать ключевым словом намерения пользователя. Ключевые слова 218A намерения пользователя призваны указывать список слов, в которых пользователь проявляет более чем нейтральную разговорную заинтересованность.

Ключевые слова 218B выбора рекламы - это ключевые слова, которые, при сравнении с одним или несколькими списками рекламных ключевых слов, хранящимися в рекламной базе данных 224, могут совпадать со словом в списке(ах). Заметим, что конкретное ключевое слово может представлять собой как ключевое слово 218A намерения пользователя, так и ключевое слово 218B выбора рекламы.

Ключевые слова 218C выбора релевантной информации - это ключевые слова, которые, при сравнении с одним или несколькими списками ключевых слов информации, хранящимися в информационной базе данных 225, могут совпадать со словом в списке(ах). Заметим, что конкретное ключевое слово может представлять собой ключевое слово 218A намерения пользователя и ключевое слово выбора 218C релевантной информации, может представлять собой ключевое слово 218B выбора рекламы и ключевое слово 218C выбора релевантной информации или может представлять собой ключевое слово 218A намерения пользователя, ключевое слово 218B выбора рекламы и ключевое слово 218C выбора релевантной информации. Обычно ключевые слова, извлеченные компонентом извлечения ключевых слов 218 разговора, можно отнести к более чем одной из этих категорий. В частности, ключевые слова 218A намерения пользователя обычно можно рассматривать как, по меньшей мере, одно из ключевого слова 218B выбора рекламы и ключевого слова 218C выбора релевантной информации.

Кроме того, система 200 включает в себя компонент 220 вычисления оценки частотности термина и обратной частотности документа (TF/IDF) для вычисления значений TF/IDF ключевых слов 218B выбора рекламы и/или ключевых слов 218C выбора релевантной информации, извлеченных компонентом 218 извлечения ключевых слов разговора. Затем это значение можно использовать для оценки ключевых слов относительно друг друга, чтобы те, которые имеют самые высокие оценки, можно было использовать при нахождении релевантного рекламного контента и/или другой релевантной информации, что более подробно описано ниже. (Специалистам в данной области техники очевидно, что TF/IDF - это стандартная техника, используемая при нахождении текстовой информации для ранжирования документов по релевантности.)

Кроме того, система 200 включает в себя компонент 222 повторного взвешивания намерения пользователя. Поскольку ключевые слова 218A намерения пользователя являются ключевыми словами, в которых пользователь проявляет более высокую заинтересованность, в других ключевых словах, которые он может использовать в нейтральном разговоре, ключевым словам 218A намерения пользователя присваивается больший вес при определении, на каких словах рекламный контент и/или полезная информация будет выбран(а) для отображения, что более подробно описано ниже. Компонент 222 повторного взвешивания намерения пользователя сравнивает список ключевых слов 218A намерения пользователя, извлеченных компонентом 218 извлечения ключевых слов разговора, с оцененными ключевыми словами выбора рекламы и релевантной информации, введенными из компонента 222 вычисления оценки TF/IDF, и обеспечивает дополнительный вес тем ключевым словам, которые выглядят, как ключевые слова 218A намерения пользователя и ключевые слова 218B выбора рекламы, и тем ключевым словам, которые одновременно выглядят, как ключевые слова 218A намерения пользователя и ключевые слова 218C выбора релевантной информации. В одном варианте осуществления ключевым словам 218A намерения пользователя присваиваются весовые коэффициенты свыше 1.0.

Кроме того, система 200 включает в себя компонент 226 обнаружения смены темы и повторного взвешивания для повторного взвешивания извлеченных ключевых слов на основании обнаруженных смен темы. Задачей компонента 226 обнаружения смены темы и повторного взвешивания является учет того факта, что поток 210 исходного контента онлайнового разговора может содержать множество тем.

Система 200 дополнительно содержит компонент 228 нахождения рекламного контента для нахождения рекламного контента (т.е. одной или нескольких реклам), который связан с рекламными ключевыми словами, имеющими наилучшее совпадение (или совпадения) с извлеченными и взвешенными ключевыми словами выбора рекламы. Компонент 228 нахождения рекламного контента получает ввод из рекламной базы данных 224 (в виде списка рекламных ключевых слов и/или статистики обращений, значений монетизации и т.п.), пользовательских профилей 230 и/или информации 232, касающейся поведения пользователя, если доступна, и вывод из компонента 226 обнаружения смены темы и повторного взвешивания.

Система 200 дополнительно включает в себя компонент 234 отображения рекламного контента, который отображает рекламный контент, найденный компонентом 228 нахождения рекламного контента, совместно с потоком исходного контента 210 онлайнового разговора, на соответствующем устройстве просмотра 236, например традиционном компьютерном мониторе и пр.

Кроме того, система 200 включает в себя компонент 238 нахождения релевантной информации для нахождения релевантной информации (например, словарных определений или ссылок на дополнительную информацию), которая связана с ключевыми словами выбора релевантной информации, имеющими наилучшее совпадение (или совпадения) с извлеченными и взвешенными ключевыми словами выбора релевантной информации. Компонент 238 нахождения релевантной информации принимает ввод из информационной базы данных 225 (в форме списка(ов) ключевых слов информации), а также вывод из компонента 226 обнаружения смены темы и повторного взвешивания.

Система 200 дополнительно включает в себя компонент 240 отображения релевантной информации, который отображает релевантную информацию, найденную компонентом 238 нахождения релевантной информации, совместно с потоком 210 исходного контента онлайнового разговора на соответствующем устройстве просмотра 236 (например, традиционном компьютерном мониторе и пр.).

Функции, осуществляемые каждым из этих компонентов системы, более подробно описаны ниже применительно к способу, показанному на фиг.3A и 3B.

Рекламный контент для отображения на соответствующем устройстве просмотра выбирается в соответствии с вариантами осуществления настоящего изобретения так, чтобы максимизировать доход поставщика рекламного контента (т.е. рекламодателя). Это непростая задача. С одной стороны, желательно выбирать рекламный контент, в котором пользователь больше всего заинтересован, чтобы увеличить вероятность того, что он обратится к контенту и, таким образом, получит дополнительную информацию и/или совершит покупку. С другой стороны, желателен рекламный контент, обеспечивающий наивысшее значение монетизации на основании рекламных ключевых слов. Эти две цели часто противоречат друг другу и достижение баланса между ними обеспечивает наиболее эффективную рекламу.

Следующая вероятностная формула интегрирует и естественным образом уравнивает эти факторы влияния для достижения максимальной прибыли в статистическом среднем и, таким образом, обеспечивает наиболее эффективную рекламу. Задача состоит в том, чтобы выбрать рекламный контент, который максимизирует значение монетизации в статистическом смысле (ожидаемое значение). Поскольку при онлайновых разговорах пользовательский ввод является динамическим и возрастающим, в определенные интервалы времени (например, каждые пятнадцать секунд) или для каждого предложения, одна или список реклам будет выбираться согласно вероятностной модели, которая призвана максимизировать среднее (ожидаемое) значение монетизации. Математически это можно выразить посредством следующей целевой функции:

где A представляет рекламу, W представляет рекламное слово, V представляет поток контента онлайнового разговора, U представляет пользователя, C представляет, обращается ли пользователь к отображаемой рекламе, и представляет значение монетизации для пары , в случае обращения к рекламе (C=TRUE, обращение), в противном случае (C=FALSE, впечатление).

Эту целевую функцию можно разложить следующим образом:

где I представляет, заинтересован ли пользователь в контенте рекламы, представляет, имеет ли отношение рекламное слово к потоку исходного онлайнового разговора, и представляет, имеет ли пользователь историческую заинтересованность в рекламном слове.

Вышеприведенное распределение суммарной вероятности можно разложить следующим образом:

где разные элементы представляют информацию из разных источников.

представляет вероятность того, что рекламное слово W имеет отношение к онлайновому разговору V и обеспечено компонентом 224 извлечения ключевых слов, показанным