Устройство и способ для автоматического регулирования фильтра
Иллюстрации
Показать всеИзобретение относится к устройству и способу для регулирования параметров фильтра. Технический результат заключается в возможности сортировки элементов списка. В способе предоставляют запоминающее устройство, содержащее отсортированный список элементов, содержащий множество элементов с упорядочением, при этом порядок элементов определяется посредством их ранга, процессор, формирующий графическое представление элементов в списке с упорядочением на дисплее, отвечающий физическому пользовательскому интерфейсу так, чтобы давать возможность пользователю перекомпоновывать или отбрасывать элементы в графическом представлении списка элементов, модифицирующий ранг элементов в списке согласно графическому представлению после перекомпоновки в ответе физическому пользовательскому интерфейсу, модифицирующий предысторию относительного рейтинга на основе переупорядоченного списка, и формирующий из модифицированной предыстории относительного рейтинга модифицированный набор параметров фильтра, и отвечающий физическому пользовательскому интерфейсу таким образом, чтобы давать возможность пользователю квалифицировать каждый элемент, как принадлежащий одному из предварительно определенного числа связанных с уровнем симпатии кластеров. 2 н. и 14 з.п. ф-лы, 3 ил.
Реферат
Рекомендательные системы используются в различных областях применения для того, чтобы рекомендовать элементы (товары, телепрограммы, песни и т.д.) с тем, чтобы смягчать проблему выбора пользователей, которые сталкиваются с чрезмерно большой совокупностью элементов, из которых следует выбирать. Предусмотрено два общих подхода для того, чтобы формировать рекомендательные системы. В первом подходе, элементы представляются посредством нескольких признаков, и пользовательские предпочтения также выражаются с точки зрения этих признаков. Этот подход, в общем, упоминается в качестве рекомендации на основе контента. Альтернативно, анализируется предыстория покупок/просмотра/прослушивания большого набора пользователей (возможно с прилагаемой рейтинговой информацией) для того, чтобы идентифицировать подобие между элементами или подобие между пользователями. Эти подобия затем используются для того, чтобы рекомендовать новые элементы пользователю. Этот второй подход зачастую упоминается в качестве совместной фильтрации. Новые элементы, предложенные в подходе на основе совместной фильтрации, представляют собой новые элементы, которые являются аналогичными элементам, которые нравятся пользователю, или новые элементы, которые нравятся пользователям, которые являются аналогичными данному пользователю. Следует отметить, что этот второй подход не запрашивает конкретную информацию относительно самих элементов, за исключением информации покупок/просмотра/прослушивания нескольких пользователей.
Вообще говоря, рекомендательная система действует в качестве фильтра для фильтрации элементов, которые могут быть интересными пользователю. Чтобы адаптировать такой фильтр к ожиданиям и потребностям пользователя, известны, например, подходы на основе контента и на основе совместной фильтрации.
В подходах на основе контента и на основе совместной фильтрации известно, что затруднительно предоставлять хорошие рекомендации новым пользователям. Новый пользователь должен сначала ранжировать определенное число элементов до того, как модуль рекомендаций может изучать его предпочтения и способен предоставлять хорошие рекомендации, в которых рейтинг предусмотрен либо на двухпунктовой шкале (нравится/не нравится), либо на шкале с большим числом пунктов (например, на пятипунктовой шкале, включающей в себя такие уровни симпатии, как "сильно не нравится", "не нравится", "нейтрально", "нравится", "сильно нравится").
Проблема с созданием или адаптацией параметров фильтра таким образом, что они представляют конкретные пользовательские предпочтения, состоит в том, что машина не может взаимодействовать с пользователем для того, чтобы выяснять пользовательские предпочтения. Другая проблема состоит в том, что информация относительно пользовательских предпочтений необходима в формате, который может быть обработан посредством машины. Тем не менее такой формат не может пониматься или исправляться среднестатистическим пользователем. Следовательно, требуется пользовательский интерфейс, который может легко пониматься пользователем и который обеспечивает возможность эффективного сбора данных, которые представляют пользовательские предпочтения. Базовая техническая задача заключается в том, чтобы формировать машинообрабатываемую информацию из взаимодействий пользователя, который неспособен предоставлять эту информацию непосредственно.
Запрашивание пользователя повторно ранжировать элементы известно из патента (США) 7,836,057, который выдан 16 ноября 2010 года. В патенте (США) 7,839,057, предлагается способ/система для того, чтобы помогать пользователю выбирать товар, к примеру, при покупке автомобиля. Пользователю явно предоставляется определенное число критериев выбора, которые являются релевантными для данной категории товаров, и для каждого критерия выбора, он может задавать с помощью ползунка то, до какой степени он хочет взвешивать данный критерий в процессе выбора товара. В результате система возвращает упорядоченный список товаров, в котором упорядочение основано на взвешивании критериев выбора. Затем, если пользователь не удовлетворен упорядочением товаров, он может повторно ранжировать список товаров. Система затем указывает то, как может регулироваться взвешивание критериев выбора, чтобы реализовывать этот повторно ранжированный список.
Способ, предложенный в патенте (США) 7,836,057, имеет ряд недостатков, которые делают его менее подходящим для более сложных процессов принятия решений, таких как то, что смотреть по телевизору или что брать напрокат из репозитория видео по запросу. Изучение вкуса нового пользователя телевизионной рекомендательной системы сложнее, чем задание весовых коэффициентов нескольких критериев выбора. Если рассматривается использование подхода на основе наивной байесовской классификации, то вкус пользователя может быть представлен посредством уровней симпатии для относительно большого набора пар «признак-значение» (см. Pronk V., W. Verhaegh, A. Proidl и M. Tiemann "Incorporating User Control into Recommender systems Based on Naive Bayesian Classification", in the Proceedings of the 2007 ACM Conference on Recommender systems, RecSys 2007, стр. 73-80, Миннеаполис, Миннесота, США).
Терминология, используемая в данном документе, приспосабливается для настоящего раскрытия сущности, в частности, использование терминов «уровень симпатии», а также «коэффициент перекоса». Эти два термина связаны следующим образом. Пусть r представляет собой коэффициент перекоса. В таком случае ассоциированный уровень симпатии λ задается посредством λ=r/(1+r). Наоборот, для данного уровня симпатии λ, ассоциированный коэффициент r перекоса задается посредством r=λ/(1-λ). Уровень симпатии в 0,5 соответствует "нейтрально", поскольку он приводит к нейтральному коэффициенту перекоса 1. Диапазон возможных уровней симпатии находится между 0 и 1, тогда как диапазон возможных коэффициентов перекоса находится между 0 и бесконечностью.
Пары признак-значение могут быть связаны, например, с присутствием определенного актера в данном фильме или с конкретным жанром, или с конкретным временем широковещательной передачи, или с конкретным широковещательным каналом. Предоставление пользовательского интерфейса, который предоставляет ползунок для каждой из этих пар признак-значение, является непрактичным. Помимо этого, если вовлечено такое большое число пар признак-значение, то запоминание общего представления взвешивания всех различных пар признак-значение является невыполнимым для пользователя, и их задание вручную не является практическим вариантом. Кроме того, явную обратную связь того, как весовые коэффициенты могут регулироваться для того, чтобы реализовывать данное повторное ранжирование данного списка, в равной степени затруднительно интерпретировать пользователю.
Дополнительный недостаток патента (США) 7,836,057 заключается в том, что обратная связь относительно того, как регулировать взвешивание критериев выбора, основана только на одном повторно ранжированном списке. Чтобы захватывать предпочтения пользователя для формирования телевизионных рекомендаций, один список элементов является слишком ограничивающим для того, чтобы изучать тонкие нюансы, которые составляют вкус пользователя. Чтобы захватывать предпочтения пользователя для того, чтобы формировать телевизионные рекомендации, требуется последовательность этапов повторного ранжирования, при которой надлежащим образом выбираются последовательные списки, которые пользователь запрашивается повторно ранжировать.
Еще один другой недостаток патента (США) 7,836,057, для изучения вкуса телезрителя, заключается в том, что пользователи запрашиваются повторно ранжировать все элементы, присутствующие в списке. Для вариантов применения, в которых число возможных элементов, из которых следует выбирать, является очень обширным, как в случае телезрителя, который может выбирать из телешоу, в данный момент передаваемых в широковещательном режиме, контента видео по запросу, YouTube-фильмов и т.д., достаточно вероятным является то, что данный список, который пользователь запрашивается повторно ранжировать, содержит один или более элементов, которые не знает пользователь. Даже если предоставляется дополнительная информация в отношении элементов, такая как жанр, то пользователю по-прежнему затруднительно ранжировать их. Следовательно, предлагается, что пользователь сначала удаляет элементы из списка, которые он не знает (например, для замены на другие элементы) до того, как список должен быть повторно ранжирован пользователем.
Еще один другой недостаток патента (США) 7,836,057 заключается в том, что, по сути, невозможно явно указывать то, какие элементы в списке не нравятся пользователю. Имеется вероятность того, что ему нравятся все из них, ни один из них или только первые m, где 0<m<n. Следовательно, другой аспект предпочтительного варианта осуществления изобретения заключается в том, что пользователь может размещать в списке между любой парой последовательных элементов, перед первым или после последнего элемента, разделитель, указывающий границу между нравящимися и ненравящимися элементами.
Задача изобретения заключается в том, чтобы предоставлять устройство и способ, которые обеспечивают возможность удобного для пользователя создания или адаптации фильтра для фильтрации элементов в зависимости от конкретных потребностей и/или ожиданий пользователя.
Согласно первому аспекту изобретения, эта задача решается посредством устройства для регулирования параметров фильтра, при этом устройство содержит или может соединяться с дисплеем, физическим пользовательским интерфейсом и запоминающим устройством. Устройство содержит процессор, который функционально соединяется с дисплеем, физическим пользовательским интерфейсом и запоминающим устройством. Запоминающее устройство содержит (множество) отсортированный список(ки) элементов, содержащий множество элементов с упорядочением, при этом порядок элементов определяется посредством их ранга. Процессор выполнен с возможностью формировать графическое представление элементов в списке с упорядочением на дисплее. Процессор дополнительно выполнен с возможностью отвечать физическому пользовательскому интерфейсу таким образом, чтобы давать возможность пользователю переупорядочивать (перекомпоновывать) и/или отбрасывать элементы в графическом представлении списка элементов. Процессор дополнительно выполнен с возможностью модифицировать ранг элементов в списке согласно графическому представлению после перекомпоновки в ответе физическому пользовательскому интерфейсу. Процессор дополнительно выполнен с возможностью модифицировать предысторию относительного рейтинга на основе переупорядоченного списка и формировать из модифицированной предыстории относительного рейтинга модифицированный набор параметров фильтра.
Модифицированный набор параметров фильтра, например, может задавать модифицированный пользовательский профиль для модуля рекомендаций.
Начальный отсортированный список элементов может сортироваться посредством некоторого ранга по умолчанию, который может создаваться произвольно. Альтернативно, начальный отсортированный список может сортироваться согласно предполагаемому или устаревшему пользовательскому профилю, который должен быть обновлен или индивидуализирован. Преимущество этого подхода, предлагаемого в данном документе, заключается в том, что пользователь видит и понимает элементы, которые отображаются, без необходимости знать то, какие признаки/пары значений или другая машинообрабатываемая информация ассоциированы с отображенными элементами, в то время как процессор может сразу обрабатывать информацию, ассоциированную с элементами, вместе с информацией, которая кодируется в порядке переупорядоченного или пересортированного списка, который вытекает из пользовательского взаимодействия.
Предпочтительно, процессор дополнительно выполнен с возможностью отвечать физическому пользовательскому интерфейсу таким образом, чтобы давать возможность пользователю квалифицировать каждый элемент как принадлежащий одному, по меньшей мере, из двух кластеров, например, как нравящийся или ненравящийся. Таким образом, элементы, показанные пользователю, могут разделяться на два кластера, и может формироваться предыстория (абсолютного) рейтинга. Эта предыстория (абсолютного) рейтинга затем может дополнительно обрабатываться посредством любого из нескольких способов классификации (совместная фильтрация, наивная байесовская классификация, методы опорных векторов и т.д.), который должен быть использован в качестве фильтра элементов (модуля рекомендаций). Эти фильтры элементов представляют собой классификаторы, которые типично компонуют пользовательский профиль или модель, которые выступают в качестве параметров фильтрации. Аналогично, предыстория относительного рейтинга может разбиваться, скажем, на 5 кластеров, в силу чего каждый кластер представляет рейтинг по шкале от 1 до 5 (в ожидаемом порядке). Она также может, и даже более надлежащим образом, использоваться в окружении совместной фильтрации.
Предоставление пользовательского интерфейса, который обеспечивает возможность кластеризации элементов, представляет собой средство для того, чтобы извлекать еще больше информации из простого пользовательского взаимодействия, при этом информация, извлеченная таким способом, является совместимой с внутренним представлением пользовательских предпочтений в устройстве.
Согласно предпочтительному варианту осуществления, процессор дополнительно выполнен с возможностью разбивать предысторию относительного рейтинга на два кластера: первые n элементов становятся нравящимися элементами, остальные - ненравящимися. Как подробнее указано ниже, это может предпочтительно достигаться посредством предпочтительного варианта осуществления процессора, который выполнен с возможностью разрешать пользователю размещать разделитель в перекомпонованном списке между любой парой последовательных элементов, перед первым или после последнего элемента, при этом разделитель указывает границу между нравящимися и ненравящимися элементами. Такой разделитель задает пороговое значение принятия решения. Такой предпочтительный вариант осуществления процессора может содержать или может соединяться с интерфейсным модулем, который обеспечивает возможность отображения и перемещения разделителя. Процессор затем выполнен с возможностью использовать позицию разделителя в качестве входного значения для формирования списка параметров фильтрации. Поскольку разделитель может быть размещен перед первым или после последнего элемента, пользователь имеет возможность отмечать все отображенные элементы в списке как "нравящиеся" или "ненравящиеся", соответственно.
В предпочтительном варианте осуществления, каждый элемент отличается посредством, по меньшей мере, одной пары признак-значение, которая представляет значение признака элемента. Согласно этому, процессор предпочтительно дополнительно выполнен с возможностью определять коэффициент индикации уровня симпатии, по меньшей мере, для некоторых пар признак-значение, отличающих элементы в переупорядоченном списке, так что произведение коэффициентов индикации уровня симпатии пар признак-значение для конкретного элемента совпадает с рангом элемента в переупорядоченном списке по сравнению с произведением коэффициентов индикации уровня симпатии пар признак-значение других элементов в переупорядоченном списке.
Ранг элемента в переупорядоченном списке коррелируется с уровнем симпатии и в силу этого с коэффициентом индикации уровня симпатии упомянутого элемента в том, что элементы с более высоким рангом, вероятно, больше нравятся конкретному пользователю, чем элементы с более низким рангом. В предпочтительном варианте осуществления, устройство определяет коэффициенты индикации уровня симпатии пар признак-значение таким образом, что порядок произведений коэффициентов индикации уровня симпатии пар признак-значение для каждого элемента (или, по меньшей мере, некоторых элементов) соответствует порядку, заданному посредством рангов элементов.
Процессор может быть дополнительно выполнен с возможностью модифицировать ранг элементов в списке согласно графическому представлению после перекомпоновки в ответ на пользовательское взаимодействие через физический пользовательский интерфейс. Атрибут имеет три состояния, которые описывают то, что происходило с элементом во время переупорядочения, а именно: (элемент) удален, (элемент) перемещен вверх, (элемент) перемещен вниз.
Устройство согласно изобретению обеспечивает возможность пользователю быстро указывать свои предпочтения удобным для пользователя способом и за счет этого эффективно формировать фильтр для фильтрации элементов.
Таким образом, изобретение предоставляет новый подход для того, чтобы иметь возможность быстро изучать вкус нового пользователя посредством запрашивания пользователя повторно ранжировать несколько надлежащим образом выбранных списков элементов.
Предпочтительно, коэффициент индикации уровня симпатии представляет собой коэффициент перекоса для конкретной пары признак-значение, и произведение коэффициентов перекоса пар признак-значение, отличающих конкретный элемент, представляет собой коэффициент перекоса упомянутого элемента. Поскольку элемент отличается посредством одной или более пар признак-значение, и уровень симпатии ассоциирован с элементом, уровни симпатии пар признак-значение, отличающих конкретный элемент, и уровни симпатии этого элемента взаимосвязаны. Если наивная байесовская классификация используется для того, чтобы определять уровни симпатии, пара признак-значение имеет коэффициент r перекоса, и коэффициент r(x) перекоса элемента x задается посредством произведения Πi∈F(x)ri коэффициентов перекоса пар F(x) признак-значение, отличающих упомянутый элемент. В таком варианте осуществления, процессор предпочтительно выполнен с возможностью решать набор линейных неравенств Σi∈F(x_j)ρi>Σi∈F(x_(j+1)) ρi, где ρi является логарифмом log(ri) коэффициента ri перекоса элемента i, и где обозначение x_j используется для того, чтобы указывать xj.
В дополнительном предпочтительном варианте осуществления, запоминающее устройство содержит множество упорядоченных списков элементов, при этом процессор выполнен с возможностью последовательно формировать графические представления элементов в каждом списке с упорядочением на дисплее. В таком варианте осуществления, процессор дополнительно выполнен с возможностью отвечать физическому пользовательскому интерфейсу таким образом, чтобы давать возможность пользователю перекомпоновывать и/или отбрасывать элементы в графическом представлении списков элементов и модифицировать ранг и атрибут элементов в списках согласно графическому представлению после перекомпоновки в ответе физическому пользовательскому интерфейсу.
В общем, предпочтительно, чтобы множество элементов имело, по меньшей мере, общий поднабор пар признак-значение, при этом уровни симпатии назначаются каждому элементу и каждой паре признак-значение таким образом, что уровень симпатии элемента задается посредством коэффициента индикации уровня симпатии (например, коэффициента перекоса), который является произведением коэффициентов индикации уровня симпатии пар признак-значение, отличающих упомянутый элемент. В этом отношении, дополнительно предпочтительно, чтобы процессор был выполнен с возможностью вычислять уровни симпатии пар признак-значение из ранга элементов после перекомпоновки упорядоченного списка элементов в ответ на вводы, которые вводятся пользователем через физический пользовательский интерфейс.
Запоминающее устройство предпочтительно содержит множество отсортированных списков элементов, с тем чтобы давать возможность определения уровней симпатии большего числа пар признак-значение без необходимости для пользователя сталкиваться с чрезмерно большим списком элементов. Если второй список элементов должен быть представлен пользователю, предпочтительно, чтобы порядок (ранг) элементов определялся на основе уровней симпатии пар признак-значение, как определено в предыдущем процессе регулирования фильтра.
Запоминающее устройство предпочтительно выполнено как база данных.
Предпочтительно, устройство выполнено с возможностью применять исходный элемент, который, например, выбирается пользователем через пользовательский интерфейс, и процессор выполнен с возможностью формировать отсортированный список элементов на основе степени подобия между исходным элементом и дополнительными элементами, сохраненными в этом запоминающем устройстве.
Согласно дополнительному аспекту изобретения, предоставляется способ регулирования параметров фильтрации. Способ содержит этапы:
- предоставления отсортированного списка элементов, содержащего множество элементов с упорядочением, при этом порядок элементов определяется посредством их ранга, и каждый элемент отличается посредством, по меньшей мере, одной пары признак-значение, которая представляет значение признака элемента,
- формирования графического представления элементов в списке с упорядочением на дисплее,
- ответа физическому пользовательскому интерфейсу таким образом, чтобы давать возможность пользователю переупорядочивать (перекомпоновывать) и/или отбрасывать элементы в графическом представлении списка элементов,
- модификации ранга элементов в списке согласно графическому представлению после перекомпоновки в ответе физическому пользовательскому интерфейсу, и
- модификации предыстории относительного рейтинга на основе переупорядоченного списка, и
- формирования из модифицированной предыстории относительного рейтинга модифицированного набора параметров фильтрации.
Согласно предпочтительному или альтернативному варианту осуществления, способ дополнительно содержит этапы определения коэффициента индикации уровня симпатии, по меньшей мере, для некоторых пар признак-значение, отличающих элементы в переупорядоченном списке, так что произведение коэффициентов индикации уровня симпатии пар признак-значение для конкретного элемента совпадает с рангом элементов в переупорядоченном списке по сравнению с произведением коэффициентов индикации уровня симпатии пар признак-значение других элементов в переупорядоченном списке.
Согласно предпочтительному варианту осуществления, способ дополнительно содержит этапы:
- применения исходного элемента, и
- формирования отсортированного списка элементов на основе степени подобия между исходным элементом и дополнительными элементами, сохраненными в этом запоминающем устройстве.
Дополнительно предпочтительно, если способ дополнительно содержит этап:
- формирования нового отсортированного списка элементов на основе определенных уровней симпатии пар признак-значение, отличающих элементы.
Согласно дополнительному предпочтительному варианту осуществления, способ дополнительно содержит этапы:
- формирования графического представления элементов в новом отсортированном списке элементов с упорядочением на дисплее,
- ответа физическому пользовательскому интерфейсу таким образом, чтобы давать возможность пользователю переупорядочивать (перекомпоновывать) и/или отбрасывать элементы в графическом представлении нового отсортированного списка элементов,
- модификации ранга элементов в новом отсортированном списке согласно графическому представлению после перекомпоновки в ответе физическому пользовательскому интерфейсу, и
- определения уровня симпатии, по меньшей мере, для некоторых пар признак-значение, отличающих элементы в переупорядоченном новом списке, так что произведение коэффициентов индикации уровня симпатии пар признак-значение для конкретного элемента совпадает с рангом элементов в переупорядоченном списке по сравнению с произведением коэффициентов индикации уровня симпатии пар признак-значение других элементов в переупорядоченном списке.
Вышеуказанные и другие аспекты, признаки и преимущества настоящего изобретения должны становиться очевидными из нижеприведенного более подробного описания, представленного в сочетании с нижеприведенными чертежами, на которых:
Фиг. 1 является схематичным представлением устройства для автоматического регулирования параметров фильтра;
Фиг. 2 является схематичным представлением устройства по фиг. 1, в котором элементы переупорядочиваются; и
Фиг. 3 является схематичным представлением альтернативного устройства для автоматического регулирования параметров фильтра.
Устройство 10 для автоматического регулирования параметров фильтра, проиллюстрированных на фиг. 1, соединяется с дисплеем 12 и физическим пользовательским интерфейсом 14, таким как мышь, сенсорная панель и т.п. Устройство содержит или соединяется с запоминающим устройством 16, которое содержит отсортированный список элементов x, содержащий множество элементов с упорядочением, при этом порядок элементов определяется посредством их ранга. Каждый элемент отличается посредством, по меньшей мере, одной пары i признак-значение, которая представляет значение признака элемента. Обычно, элемент x отличается посредством множества пар признак-значение (i1, i2, i3, ...). Дополнительно, уровень симпатии λ назначается каждому элементу x. Уровень симпатии элемента x задает ранг этого элемента. Запоминающее устройство 16 может быть неотъемлемой частью устройства 10 или может быть базой данных, с которой устройство 10 соединяется.
Устройство 10 дополнительно содержит модуль 18 пользовательского интерфейса, процессор 20 и модуль 22 интерфейса отображения.
Модуль 18 пользовательского интерфейса выполнен с возможностью принимать сигналы из физического пользовательского интерфейса 14 и перенаправлять соответствующие сигналы в процессор 20.
Процессор 20 соединяется с запоминающим устройством 16 и за счет этого может осуществлять доступ к одному или более отсортированных списков элементов, как описано выше. Процессор 20 дополнительно инструктирует модулю 22 интерфейса отображения формировать сигналы, которые приводят к графическому представлению отсортированного списка элементов на дисплее 12. Процессор 20 выполнен с возможностью работать в качестве модуля регулирования фильтра, как раскрыто ниже.
Фиг. 2 является представлением устройства 10 для автоматического регулирования фильтра, в котором пользователь переупорядочивает или перекомпонует элементы на дисплее 12. Перекомпоновка элементов на дисплее 12 изменяет ранги элементов. Поскольку ранг элемента коррелируется с его уровнем симпатии, различный ранг наиболее вероятно приводит к различному уровню симпатии элемента. Поскольку уровень симпатии элемента зависит от уровней симпатии пар признак-значение, отличающих этот элемент, изменение ранга элемента в конечном счете приводит к переоценке уровней симпатии пар признак-значение, как подробнее раскрыто ниже.
На фиг. 3, проиллюстрирована альтернативная компоновка, в которой запоминающее устройство 16 является не неотъемлемой частью устройства 10' для автоматического регулирования фильтра, а частью удаленной базы данных. Соответственно, предоставляется интерфейс 24 передачи данных, который обеспечивает возможность процессору 20 осуществлять доступ к запоминающему устройству 18 в удаленной базе данных.
Далее описывается работа устройства 10.
Базовая идея данного изобретения состоит в том, чтобы предоставлять для нового пользователя телевизионной рекомендательной системы или аналогичной рекомендательной системы простой и удобный подход для того, чтобы указывать свои предпочтения (и за счет этого регулировать фильтр элементов) посредством предложения, в интерактивном сеансе, последовательности последовательных списков элементов, при этом для каждого из последовательных списков элементов пользователь запрашивается выполнять следующие этапы.
1. Пользователь удаляет элементы, которые он не знает достаточно хорошо, чтобы ранжировать их, при этом возможно удаленный элемент заменяется посредством другого элемента.
2. Пользователь повторно ранжирует результирующий список элементов в порядке уменьшения пользовательских предпочтений.
3. Дополнительно, пользователь может размещать в списке между любой парой последовательных элементов, перед первым или после последнего элемента, разделитель, указывающий границу между нравящимися и ненравящимися элементами.
Устройство использует информацию, содержащуюся в упорядочении повторно ранжированного списка, для того, чтобы регулировать уровень симпатии надлежащих пар признак-значение, при этом информация из текущего повторно ранжированного списка может быть комбинирована с информацией из предыдущих повторно ранжированных списков. Отрегулированные параметры фильтра рекомендательной системы затем используются для того, чтобы определять надлежащий следующий список элементов, при этом типично последовательные списки все лучше и лучше совпадают со вкусом пользователя.
Чтобы повторно ранжировать список, пользователь просто перетаскивает элементы из данной позиции в списке первых n элементов в новую требуемую позицию в списке первых n элементов. Таким образом, он просто должен указывать относительные пользовательские предпочтения для элементов в первых n элементах. Из психологических исследований известно то, что пользователю проще предоставлять относительное ранжирование данного набора элементов, чем предоставлять абсолютные пользовательские предпочтения для набора элементов, для которых он должен задавать рейтинг по одному за раз.
Процедура удаления и повторного ранжирования выполняется определенное число раз, начиная с повторного ранжирования тщательно составленного начального списка первых n элементов, который еще не настроен на персональный вкус пользователя. На основе этого первого повторно ранжированного списка, модуль рекомендаций предоставляет следующий список первых n элементов, который уже пытается представлять вкус пользователя в некоторой степени лучше. Повторное ранжирование этого второго списка первых n элементов предоставляет в модуль рекомендаций дополнительную информацию относительно вкуса пользователя, приводя к еще лучшему списку первых n элементов в следующей итерации. Такие итерации повторного ранжирования могут повторяться до тех пор, пока пользователь не будет удовлетворен результирующим следующим списком первых n элементов или последовательностью следующих списков первых n элементов. Чтобы непрерывно улучшать модуль рекомендаций, последовательные списки первых n элементов могут быть выбраны таким образом, что один элемент появляется самое большее один раз в этих последовательных списках. Помимо этого, последовательные списки также не должны содержать элементы, которые являются почти идентичными друг другу, например, с точки зрения их ассоциированных пар признак-значение.
Таким образом, пользователь многократно получает обратную связь относительно того, насколько хорошо модуль рекомендаций изучил его вкус. Эта процедура считается более предпочтительной, чем простой рейтинг отдельных элементов, по одному за раз, без дополнительной обратной связи относительно того, насколько хорошо модуль рекомендаций изучил вкус пользователя. Поскольку предпочтительнее (вследствие повторной обратной связи) и проще повторно ранжировать вместо индивидуального рейтинга элементов, пользователь сохраняет мотивацию для того, чтобы продолжать предоставлять обратную связь. Как результат, модуль рекомендаций должен иметь возможность предоставлять значимые рекомендации на более ранней стадии.
На третьем этапе, пользователь может задавать разделитель между элементами, по которым он хочет получать рекомендации, и элементами, который он не считает достаточно интересными для рекомендации. Таким образом, пользователь не только имеет возможность предоставлять относительное ранжирование данного набора элементов, он также имеет возможность указывать свои предпочтения в абсолютном выражении. В ответ на размещение разделителя между двумя последовательными элементами i и i+1 в упорядоченном списке, процессор 20 задает пороговое значение t принятия решения равным (λ_i+λ_(i+1))/2. В случае если разделитель размещается перед первым элементом, процессор 20 задает пороговое значение t принятия решения равным (1+λ_1)/2. В случае если разделитель размещается после последнего элемента, скажем, элемента n, процессор 20 задает пороговое значение t принятия решения равным λ_n/2. Это пороговое значение принятия решения может быть использовано посредством классификатора для того, чтобы проводить различие между нравящимися и ненравящимися элементами. Например, наивный байесовский классификатор, реализованный посредством процессора, может задавать положительную априорную вероятность, например, равной 1-t. Таким образом, разделитель обеспечивает возможность надлежащего задания априорных вероятностей, присутствующих в наивном байесовском классификаторе, позволяя классификатору также проводить различие между нравящимися и ненравящимися элементами.
Чтобы регулировать "пользовательский профиль" (который представляет собой фильтр, фильтрующий элементы) на основе повторно ранжированного списка первых n элементов, предлагается следующий вариант осуществления. В этом варианте осуществления, предполагается рекомендательная система, которая использует наивный байесовский подход, в котором непосредственно регулируются уровни симпатии пар признак-значение, которые являются релевантными для элементов, которые появляются в списке первых n элементов.
РЕГУЛИРОВАНИЕ УРОВНЕЙ СИМПАТИИ ПАР ЗНАЧЕНИЙ ПРИЗНАКОВ
Для простоты, предполагается, что упорядочение данных n элементов основано на уровне симпатии, которую модуль рекомендаций присваивает для каждого из n элементов. Пусть набор всех возможных пар значений признаков задается посредством F={1, 2, ..., N}. Теперь, элемент x может отличаться посредством поднабора F(x)⊆F.
Для каждой пары признак-значение i∈F, вещественное значение ri∈[0,∞) указывает коэффициент перекоса этой пары признак-значение таким образом, что коэффициент r(x) перекоса элемента x задается посредством Πi∈F(x)ri. Ассоциированный и более интуитивный уровень симпатии задается посредством λ(x) и задается посредством r(x)/(1+r(x)).
Теперь, с учетом повторно ранжированного списка n элементов, обозначаемых посредством x1, x2, ..., xn, вопрос заключается в этом, можно или нет выбирать уровни симпатии пар i признак-значение, которые находятся в комбинированном наборе пар признак-значение F(x1)∪F(x2) ∪...F∪ (xn) для пар признак-значение, таким образом, что порядок уровней симпатии элементов λ(x1)>λ(x2)>...>λ(xn) совпадает с порядком, заданным посредством ранга в переупорядоченном (или перекомпонованном) списке элементов. Поскольку преобразование между уровнем симпатии и коэффициентом перекоса монотонно увеличивается, альтернативно можно сформулировать это как то, можно или нет выбирать коэффициенты перекоса пар i признак-значение, которые находятся в F(x1)∪F(x2)∪...F∪(xn), таким образом, что r(x1)>r(x2)>...>r(xn).
Затем, с использованием того, что логарифм является монотонно возрастающей функцией, эта проблема может быть упрощена до решения набора линейных неравенств следующим образом. Если обозначать log(ri) посредством ρi, то неравенство r(xj)>r(xj+1) может повторно выражаться как Σi∈F(x_j) ρi>Σi∈F(x_(j+1)) ρi, где обозначение x_j используется для того, чтобы указывать xj.
Эта проблема может выражаться в качестве набора линейных уравнений с ограничениями, решение для которого, если оно существует, может быть эффективно определено, например, посредством использования симплекс-метода. Е