Способ и система распознания пути категории

Иллюстрации

Показать все

Изобретение относится к способу и системе распознавания пути категории. Технический результат заключается в повышении точности распознавания пути категории. В способе выполняют получение от пользовательского устройства по сети с помощью сервера названия товара, которое пользователь вводит с помощью устройства пользователя, выполнение сервером сегментации слов в названии товара, чтобы получить набор ключевых слов, содержащий ключевые слова, входящие в название товара, и определение сервером пути категории названия товара в соответствии с набором ключевых слов и предварительно конфигурирующейся моделью распознавания категории товара, причем этот этап включает: поиск первой таблицы в модели распознавания категории товара, чтобы получить набор путей категории, содержащий набор ключевых слов, в котором первая таблица содержит соответствия между множеством путей категории и множеством ключевых слов, а также расчетным значением числа вхождений каждого из множества ключевых слов при каждом соответствующем пути категории, расчет интегрального расчетного значения для каждого пути категории из набора путей категории соответственно и выбор пути категории с наибольшим значением интегрального расчетного значения как пути категории названия товара. 2 н. и 6 з.п. ф-лы, 2 табл., 5 ил.

Реферат

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

Данная заявка пользуется преимуществом, связанным с китайской патентной заявкой No. 201210572005.2, поданной 25 декабря 2012 года, которая полностью включается в настоящую заявку в качестве ссылки.

ОБЛАСТЬ ТЕХНИКИ

Настоящее изобретение относится к области информационных технологий (ИТ), и в частности, к способу и системе распознавания пути категории.

УРОВЕНЬ ТЕХНИКИ

С развитием электронной коммерции, она становится все более и более популярной для пользователей сети, планирующих открывать онлайн-магазины. Система онлайн транзакций предоставляет торговую интернет-платформу, где все товары на веб-сайте классифицируются в соответствии с путем классификации, который был бы удобен для пользователей, чтобы найти нужный товар, и эта классификация может рассматриваться в качестве категории. Например, путь категории товара, такого как "спортивные брюки Metersbonwe", является следующим: "спортивная одежда/брюки/аксессуары>спортивная одежда>спортивные брюки", где "спортивная одежда /брюки/аксессуары" является категорией первого уровня, "спортивная одежда" - это категория второго уровня, и "спортивные брюки" является категорией третьего уровня. Торговая онлайн-платформа может управлять товарами в интернет-магазине в соответствии с их категориями.

На веб-сайте Потребитель Потребителю (С2С для краткости) или на веб-сайте Бизнес Клиенту (В2С для краткости), при выдаче товара, продавец или оперативный работник не только должен заполнить имя товара, но также должен вручную выбрать категорию первого уровня, категорию второго уровня и категорию низшего уровня товара. Тем не менее, есть несколько вариантов даже в каждом уровне категории, а иногда и у несколько категорий, которые относительно подходит для товара, но не особенно подходят в деталях. При этом продавец должен просматривать варианты тщательно и может затрудняться при приятии решения. В таких ситуациях есть вероятность выбора неправильной категория для товара.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В заявке раскрывается способ распознавания пути категории, в котором сервер получает от устройства пользователя через сеть название товара, которое пользователь вводит с помощью устройства пользователя, сервер выполняет сегментацию слов названия товара, чтобы получить набор ключевых слов, включая ключевые слова, входящие в название товара, и определяет путь категории названия товара в соответствии с набором ключевых слов и заданной моделью распознавания категории товара, причем заданная модель распознавания категории товара включает соответствия множества ключевых слов и множества путей категории и расчетного значения числа вхождений каждого из множества ключевых слов при каждом соответствующем пути категории.

Раскрывается также система распознавания пути категории, содержащая запоминающее устройство и процессор, причем запоминающее устройство сохраняет программы, которые могут исполняться процессором, и система включают получающий модуль, обрабатывающий модуль и модуль определения, причем получающий модуль выполняется с возможностью получать от устройства пользователя по сети название товара, которое пользователь вводит с помощью устройства пользователя; обрабатывающий модуль выполняется с возможностью осуществления сегментации слов в названии товара, чтобы получить набор ключевых слов, содержащий ключевые слова, включенные в название товара; и модуль определения, выполняющийся с возможностью определять путь категории названия товара в соответствии с набором ключевых слов и заданной моделью распознавания категории товара, причем модель распознавания категории товара содержит соответствия между множеством ключевых слов и множеством путей категории и расчетным значением числа вхождения каждого из множества ключевых слов при каждом соответствующем пути категории.

Соответственно, раскрывается машиночитаемый носитель, хранящий программы для осуществления изложенного выше способа.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фигура 1 иллюстрирует блок-схему последовательности операций способа распознавания пути категории в примере осуществления настоящего изобретения.

Фигура 2 иллюстрирует блок-схему последовательности операций способа распознавания пути категории в другом примере осуществления настоящего изобретения.

Фигура 3 иллюстрирует структурную диаграмму системы распознавания пути категории в примере осуществления настоящего изобретения.

Фигура 4 иллюстрирует структурную диаграмму системы распознавания пути категории в другом примере осуществления настоящего изобретения.

Фигура 5 иллюстрирует структурную диаграмму второго вычислительного модуля системы в примере осуществления настоящего изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Далее примеры будут описываться более подробно со ссылками на прилагающиеся чертежи.

Следующее описание имеет лишь иллюстративный характер и ни в коей мере не предназначено для ограничения изобретения, его применения или использования. В полном объеме изобретение может реализовываться в различных формах. Таким образом, в то время как описание изобретение включает в себя конкретные примеры, истинный объем изобретения не должен ими ограничиваться, так как другие модификации станут очевидными при изучении чертежей, спецификации и прилагаемой формулы изобретения. Для ясности одинаковые ссылочные номера будут использоваться на чертежах для идентификации подобных элементов.

Термины, использующиеся в данном описании, как правило, имеют свои обычные значения в данной области техники в рамках раскрытия и в конкретном контексте, где используется каждый термин. Некоторые термины, которые используются для описания изобретения, будут рассмотрены ниже в описании, чтобы обеспечить дополнительные указания специалисту относительно описания изобретения. Использование примеров в любом месте в этом описании, включая примеры каких-либо терминов, рассматривающихся здесь, является только иллюстративным и никоим образом не ограничивает объем и значение изобретения или любого приведенного в качестве примера термина. Кроме того, изобретение не ограничивается различными вариантами, приведенными в данном описании.

Ссылка в данном описании на «один из вариантов осуществления» «какой-либо вариант осуществления», «конкретный вариант осуществления" и т.п. в единственном или множественном числе означает, что один или более конкретных признаков, структур или характеристик, описывающихся в связи с вариантом воплощения, включены, по меньшей мере, в один из вариантов осуществления настоящего изобретения. Таким образом, появление фразы "в одном варианте" или "в любом варианте", "в конкретном варианте осуществления", как в единственном, так и множественном числе в различных местах по всему данному описанию, не обязательно относятся к одному варианту осуществления изобретения. Кроме того, конкретные признаки, структуры или характеристики могут быть объединены любым подходящим образом в одном или нескольких вариантах.

Как используется в описании и в формуле изобретения, которая прилагается, приведенные формы признаков включают ссылки на множественное число, если из контекста явно не следует иное. Кроме того, как используется в описании и в прилагающейся формуле изобретения, значение предлога "в" включает в себя "в" и "на", если из контекста явно не следует иное.

Использующиеся здесь термины "содержащий", "включающий", "имеющий" и т.п., следует понимать, что они являются открытыми, т.е., имеется в виду, что элементы включаются, но значение не ограничивается ими.

Как используется здесь, фраза "по крайней мере, один из А, В, и С" следует толковать в виде логического (А или В или С), используя неисключительное логическое ИЛИ. Следует понимать, что один или несколько этапов в способе могут быть выполнены в другом порядке (или одновременно), не изменяя принципам настоящего изобретения.

Как используется здесь, термин "модуль" или "узел", "субузел" или "субмодуль" может относиться к части или включать в себя специализированную интегральную схему (ASIC); электронную схему; комбинационную логическую схему; программируемую пользователем вентильную матрицу (FPGA); процессор (общий, индивидуальный или групповой), который выполняет программу; другие подходящие аппаратные компоненты, которые обеспечивают описанные функции; или сочетание некоторых или всех из указанных выше элементов, например, в системе-на-кристалле. Термин "модуль" или "узел", "субузел" или "субмодуль" может включать в себя устройство памяти (общей, выделенной или групповой), которое сохранят программу, исполняемую процессором.

Термин "программа", как он использован здесь, может включать в себя программное обеспечение, встроенные программы и/или микрокоды, и может относиться к программам, процедурам, функциям, классам и/или объектам. Термин "общие", как он использован здесь, означает, что некоторые или все программы нескольких модулей могут быть выполнены с помощью одного (общего) процессора. Кроме того, некоторые или все программы из нескольких модулей, могут храниться на одном (общем) устройстве памяти. Термин "группа", как он использован здесь, означает, что некоторые или все программы из одного модуля могут выполняться с использованием группы процессоров. Кроме того, некоторые или все программы из одного модуля могут сохраняться с помощью группы устройств памяти.

Системы и способы, описанные здесь, могут быть реализованы с помощью одной или более компьютерных программ, выполняемых одним или несколькими процессорами. Компьютерные программы включают инструкции, выполняющиеся процессорами, которые хранятся на постоянном машиночитаемом носителе. Компьютерные программы могут также включать сохраняющиеся данные.

Неограничивающие примеры постоянных машиночитаемых носителей являются энергонезависимые устройства памяти, магнитные устройства и оптические устройства хранения данных.

Далее приводится описание в отношении различных вариантов воплощения изобретения со ссылками на прилагающиеся чертежи на Фиг. 1-5. Следует понимать, что конкретные варианты осуществления, описанные в данном документе, предназначены только для объяснения настоящего изобретения, но не ограничивают его. В соответствии с целью данного изобретения, как раскрывается и подробно описывается здесь, это изобретение в одном аспекте относится к способу и устройству для управления идентификацией для мобильного терминала.

Примеры пользовательских устройств, которые могут использоваться в соответствии с различными вариантами, включают, но не ограничиваются, персональный компьютер (ПК), планшетный ПК (в том числе, но, не ограничиваясь, Apple iPad и другие устройства с сенсорным экраном, работающие на Apple iOS, Microsoft Surface, и другие устройства с сенсорным экраном под управлением операционной системы Windows, и планшетные устройства под управлением операционной системы Android), мобильный телефон, смартфон (в том числе, но не ограничиваясь ими, Apple iPhone, а Windows Phone и других смартфонов, работающих на операционных системах Windows Mobile или Pocket PC, и смартфоны, работающие на операционной системе Android, операционной системе Blackberry или операционной системе Symbian), электронные книги (включая, но не ограничиваясь, Amazon Kindle и Barnes & Noble Nook), ноутбуки (в том числе, но не ограничиваясь, компьютеры под управлением операционной системы Apple Mac, операционной системы Windows, операционной системы Android и/или операционной системы Google Chrome), или устройство на транспортном средстве под управлением любой из указанных выше операционных систем или любых других операционных систем, все из которых хорошо известны специалистам в данной области техники.

Примеры осуществления настоящего изобретения обеспечивают способ и систему для распознавания пути категории, Когда пользователь направляет информации о товаре, путь категории названия товара, введенного пользователем, автоматически распознается, и пользователю не нужно определять путь категории названия товара уровень за уровнем. Таким образом, распознавание пути категории названия товара может достигаться эффективно, и в целом повышается операционная эффективность и точность распознавания категории.

В примере осуществления настоящего изобретения, заданная модель распознавания категории товара используется для определения пути категории названия товара, введенного пользователем. В одном из примеров, система установления модели получает данные соответствия между всеми названиями товаров и их соответствующих путей категорий из базы данных веб-сайта С2С или веб-сайта В2С, и система установления модели делит полученные данные на первые данные и вторые данные случайным образом или в соответствии с заданным отношением, которое может быть, например, 5:5 или 7:3, или т.п.

В одном из примеров осуществления настоящего изобретения, после деления данных соответствия между названиями товаров и путями категорий, сохраняемыми в системе в первых данных и вторых данных, система установления модели использует первые данные, чтобы создать модель распознавания категории товара и использует вторые данные для оптимизации и проверки установленной модели распознавания категории товара с тем, чтобы определить путь категории названия товара с более высокой точностью с помощью модели распознавания категории товара.

В одном из примеров модель распознавания категории товара устанавливается, используя первые данные, с помощью следующего процесса:

1) Получение статистических данных о соответствии между названиями товаров и путями их категорий в первых данных, определение числа совпадений названий товаров при таком же пути категории для каждого пути категории, и формирование расчетной таблицы путей категории, которая включает полное расчетное значение названий товаров при каждом пути категории в первых данных.

Например, существует в общей сложности 57 названий товаров при пути категории "женская одежда/женские бутики>брюки>женские джинсы», и есть в общей сложности 107 названий товаров при пути категории "спортивная одежда/брюки/аксессуары>спортивная одежда>спортивные брюки".

2) Выполнение сегментации слов всех названий товаров в первых данных, получение всех ключевых слов всех названий товаров, вычисление числа вхождений для каждого ключевого слова и принятие числа вхождений в качестве расчетного значения ключевого слова, и создание расчетной таблицы ключевых слов, которая включает полное расчетное значение каждого ключевого слова в первых данных.

Например, если первое название товара "HSTYLE корейская модная женская одежда узкие с потертостями с прямыми брючинами джинсы" и второе название товара "Metersbonwe модная женская одежда узкие с прямыми брючинами джинсы", ключевые слова, полученные при выполнении сегментации слов названия первого товара, включают: "HSTYLE", "корейская", "модная", "женская одежда", "узкие", "с потертостями", "прямые брючины" и "джинсы", а ключевые слова, полученные при выполнении сегментации слов второго названия товара включают: "Metersbonwe", "модная", "женская одежда", "узкие", "прямые брючины" и "джинсы", тем самым полное расчетное значение вхождений каждого ключевого слова может быть получено при выполнении статистического анализа по ключевым словам в первом названии товара и во втором названии товара, то есть расчетное значение "HSTYLE" - 1, "корейская" - 1, "модная" - 2, "женская одежда" - 2, "узкие" - 2, "с потертостями" - 1, "прямые брючины" - 2, "джинсы" - 2 и "Metersbonwe" - 1.

3) Получение соответствия между названиями товаров и их путей категории в первых данных для установления соответствия между путями категории и названиями товаров.

Например, однозначное соответствие между названиями товаров и их путями категории в первых данных приводится в следующей таблице:

Одно или более соответствие между путями категории и названием товара можно получить после обработки данных из Таблицы 1, и детали одного или более соответствия можно увидеть в приведенной ниже таблице:

В одном из примеров осуществления настоящего изобретения, после получения одного или более соответствий между путями категории и названиями товара, система создание модели осуществляет статистический анализ названий товаров при каждом пути категории, в частности включая этапы: для каждого пути категории выполняется сегментацию слов всех названий товаров при пути категории, чтобы получить все ключевые слова в соответствии с путем категории, и выполняется статистический анализ данных по всем полученным ключевым словам, чтобы определить количество вхождений каждого ключевого слова при пути категории; и формируется расчетная таблица ключевых слов и путей категории, которая включает соответствие между путем категории и ключевым словам для каждого одного или более соответствия между путем категории и их названиями товаров, а также расчетным значением вхождений ключевых слов при каждом соответствующем пути категории.

В одном из примеров осуществления настоящего изобретения, система установления модели использует первые данные, чтобы получить расчетную таблицу путей категории, расчетную таблицу ключевых слов и расчетную таблицу ключевых слов и путей категории и эти таблицы берутся вместе с расчетными формулами для первоначального комплексного расчета значения названия товара при пути категории как исходной модели распознавания категории товара, где используются следующие расчетные формулы для первоначального интегрированного расчетного значения названия товара при пути категории:

В приведенных выше формулах, Р представляет собой полное расчетное значение названий товаров при пути Y категории, соответствующее названию X товара в расчетной таблице пути категории, Кi - i-тое ключевое слово в наборе К названия X товара X, Т представляет собой расчетное значение числа вхождений ключевого слова Кi при пути Y категории Y в таблице ключевых слов и путей категории, S(P, Ki) представляет собой расчетное значение числа вхождений ключевых слов Кi при пути Р категории, S (Р, K) представляет собой интегрированное расчетное значение набора K ключевых слов названия X товара при пути Y категории Y, n представляет собой количество ключевых слов в наборе X ключевых слов названия X товара, и А и В - заданные постоянные значения.

Для того чтобы улучшить точность первоначальной модели распознавания категории товара, вторые данные могут использоваться для вычисления точности этой исходной модели распознавания категории товара, при этом значения параметров А и В могут корректироваться в соответствии с расчетной точностью, а затем скорректированные параметры А и В подставляются в Формулу (1), чтобы получить скорректированную формулу (1), в результате чего получается скорректированная первоначальная модель распознавания категории товара, И вторые данные дополнительно используется для расчета точности скорректированной первоначальной модели распознавания категории товара. Такой процесс может повторяться, при этом первоначальная модель распознавания категории товара может корректироваться несколько раз до тех пор, пока точность скорректированной первоначальной модели распознавания категории товара не будет соответствовать значению, заданному системой установления модели. Скорректированная начальная модель распознавания категории товара, полученная таким образом, принимается в качестве окончательной модели распознавания категории товара.

В одном из примеров осуществления настоящего изобретения, способ использования вторых данных для вычисления точность первоначальной модели категории товара включает следующий процесс:

Соответствие между каждым названием товара и путем категории во вторых данных устанавливается в соответствии со следующим примером для названия X товара и его соответствующего пути Z категории:

Сегментация слов осуществляется для названия X товара, чтобы получить набор К ключевых слов названия X товара. Набор путей категории, включающий все пути категории, содержащие ключевое слово К получается путем поиска в таблице ключевых слов и путей категории. Затем, интегральное расчетное значение названия X товара при каждом пути категории в этом наборе путей категории рассчитывается соответственно. Например, при расчете интегрированного расчетного значения названия X товара при пути Y категории из набора путей категории, расчетное значение числа вхождений каждого ключевого слова в набор K ключевых слов название X товара рассчитывается по Формуле (1), а интегрированное расчетное значение названия X товара при пути Y категории рассчитывается по Формуле (2).

После получения интегрированного расчетного значения названия X товара для каждого пути категории из набора путей категории в соответствии с формулами (1) и (2), путь категории, соответствующей наибольшему интегрированному расчетному значению выбирается для сравнения с путем Z категории, который соответствует названию X товара во вторых данных. Если путь категория, соответствующий наибольшему расчетному значению, является точно таким же, как путь Z категории, то это означает, что распознание путь и категории для этого названия X товара является корректным, а в противном случае, если путь категория, соответствующий наибольшему интегрированному расчетному значению, не точно такой, как для пути Z категории, то это означает, что распознание пути категории для этого названия X товара является некорректным.

В одном из примеров осуществления настоящего изобретения, после того, как получено однозначное соответствие между каждым названием товара и его путем категории во вторых данных, система установления модели статистически рассчитывает число правильного распознавания путей категории и число неудачного распознавания путей категории для названия товара во вторых данных, чтобы получить точность распознавания категории, которая принимается в качестве точности исходной модели категории товара. Затем система установления модели сравнивает эту точность и заданное значение, если эта точность не менее, чем заданное значение, параметры А и В не нуждаются в коррекции; а в противном случае, если эта точность меньше, чем заданное значение, то параметры А и В корректируется таким образом, чтобы скорректировать первоначальную модель распознавания категории товара. Затем, точность скорректированного первоначальной модели категории товара вычисляется с использованием вторых данных в соответствии с указанным выше способом, и эта точность используется, чтобы определить, нужно ли подвергать текущие параметры А и В дальнейшей коррекции. Если текущие параметры А и В требуют корректировки, описанный выше процесс повторяется. Если текущие параметры А и В не нуждаются в корректировке, текущая модель распознавания категории товара принимается в качестве окончательной, которая не нуждается в дальнейшей коррекции.

В одном из примеров настоящего изобретения значения параметров А и В могут корректироваться в соответствии с пользовательским вводом или корректировкой способа. На практике, параметры А и В могут корректироваться с помощью различных способов в зависимости от конкретных требований.

В одном из примеров осуществления настоящего изобретения система установления модели распознания категории товара может настроить установленную модель распознавания категории товара в системе распознавания пути категории, которая будет использовать эту модель распознавания категории товара, чтобы определять путь категории названия товара, вводящегося пользователем. Либо система установления модели, либо система распознавания пути категории может загружаться в сервер на стороне сети. Как показано на Фигуре 1, способ распознавания пути категории в одном из примеров осуществления настоящего изобретения включает следующие блоки:

В блоке 101 название товара, вводящееся пользователем, получает система распознавания пути категории.

В этом примере пользователь может использовать систему распознавания пути категории для того, чтобы реализовать автоматическое распознавание пути категории названия товара, после того как пользователь вводит название товара через пользовательское устройство, название товара, вводящееся пользователем, может получать сервер по сети от пользовательского устройства посредством системы распознавания пути категории.

В блоке 102 проводится сегментация слов в названии товара, и получается набор ключевых слов названия товара.

В одном из примеров осуществления настоящего изобретения система распознавания пути категории выполняет сегментацию слов названия товара, чтобы получить набор его ключевых слов. Например, если название товара "HSTYLE корейская модная женская одежда узкие с потертостями джинсы с прямыми брючинами", получающийся набор ключевых слов включает ключевые слова "HSTYLE", "корейская", "модная", "женская одежда", "узкие", "с потертостями", "с прямыми брючинами" и "джинсы", а если название товара "Metersbonwe модная женская одежда узкие джинсы с прямыми брючинами", набор получающихся ключевых слов включает ключевые слова "Metersbonwe", "модная", "женская одежда", "узкие", "с прямыми брючинами" и "джинсы".

В блоке 103 путь категории названия товара определяется системой распознавания пути категории в соответствии с набором ключевых слов, получающемся в блоке 102, и предварительно сконфигурированной моделью распознавания категории товара. Затем путь категории, определяющийся системой распознавания пути категории, может возвращаться в пользовательское устройство сервером, загружающим систему распознавания пути категории, при этом пользовательское устройство может автоматически представить путь категории для облегчения операций пользователя.

В этом примере осуществления настоящего изобретения система распознавания пути категории выполняет сегментацию слов названия товара, вводящегося пользователем, чтобы получить набор ключевых слов в названии товара, а затем использовать этот набор ключевых слов и сконфигурированную модель распознавания категории товара, чтобы определить путь категории названия товара, так что распознавание пути категории названия товара могло быть реализовано автоматически без определения пользователем пути категории уровень за уровнем, и при этом избегая неправильного определения пути категории из-за ошибочных операций пользователя. Таким образом, повышается операционная эффективность и точность распознавания категории.

На Фигуре 2 показан способ распознавания пути категории в качестве примера осуществления настоящего изобретения, который включает в себя следующие блоки:

В блоке 201 получается название товара, вводящееся пользователем, а в блоке 202 проводится сегментация слов в названии товара и получается набор ключевых слов названия товара. Блоки 201 и 202 аналогичны блокам 101 и 102 и не будут описываться здесь подробно.

В блоке 203 набор путей категории, включая набор ключевых слов, определяется путем поиска набора ключевых слов в расчетной таблице ключевых слов и путей категории модели распознавания категории товара, где расчетная таблица ключевых слов и путей категории содержит соответствия между путями категории и ключевыми словами, а также расчетное значение числа вхождений каждого ключевого слова при соответствующем пути категории.

В одном из примеров система распознавания пути категории включает модель категории товара, которая включает расчетную таблицу ключевых слов и путей категории, расчетную таблицу ключевых слов и расчетную таблицу путей категории. Расчетная таблица ключевых слов и путей категории содержит соответствия между путями категории и ключевыми словами, а также расчетное значение числа вхождений каждого ключевого слова при соответствующем пути категории. Расчетная таблица ключевых слов содержит расчетное значение общего числа вхождений каждого ключевого слова, а расчетная таблица путей категорий содержит общее расчетное значение числа названий товаров при каждом пути категории.

В блоке 204 интегрированное расчетное значение каждого пути категории в наборе путей категории рассчитывается соответственно системой распознавания пути категории.

В одном из примеров интегрированное расчетное значение одного пути категории из набора путей категории рассчитывается на следующих этапах:

На этапе А соответственно вычисляется расчетное значение каждого ключевого слова из набора ключевых слов при пути категории.

При этом расчетное значение одного ключевого слова из набора ключевых слов рассчитывается на следующих этапах А1 и А2.

На этапе А1 первое расчетное значение числа вхождений ключевого слова при пути категории определяется путем поиска в таблице ключевых слов и путей категории, второе расчетное значение числа вхождений ключевого слова определяется путем поиска ключевого слова в расчетной таблице ключевых слов, а третье расчетное значение общего количества названий товаров при пути категории определяется путем поиска в расчетной таблице путей категории.

На этапе А2 расчетное значение ключевого слова при пути категории рассчитывается в соответствии с первым расчетным значением, вторым расчетным значением и третьем расчетным значением.

При этом система распознавания категории использует Формулу (1) модели распознавания категории товара, чтобы определить расчетное значение ключевого слово для ключевого слова при пути категории, в том числе: определяет сумму произведения второго расчетного значения и заданного первого параметра и произведения третьего расчетного значения и второго заданного параметра в качестве четвертого расчетного значения, принимая частное от деления первого расчетного значения на четвертое расчетное значение как расчетное значение ключевого слова для ключевого слова при пути категории, где Формула (1) заключается в следующем:

Здесь Р - третье расчетное значение, Р представляет собой полное значение названий товаров при пути Y категории, соответствующей названию X товара в расчетной таблице путей категорий, Кi - второе расчетное значение, Кi является i-тым ключевым словом из набора K ключевых слов названия X товара, Т - первое расчетное значение, Т представляет собой расчетное значение числа вхождений ключевого слова Кi при пути Y категории товара в расчетной таблице ключевых слов и путей категории, и сумма A*Ki и В*Р - четвертое расчетное значение, S(P, Ki) представляет собой расчетное значение ключевых слов для ключевого слова Ki при пути Р категории, А обозначает параметр, который является первым заданным параметром, В представляет параметр, который является вторым заданным параметр, где значения параметров А и В могут корректироваться, что может делать точность модели распознавания категории товара не менее заданного значения параметра.

На этапе В вычисляется произведение расчетных значений ключевых слов из набора ключевых, и это произведение рассматривается как интегрированное расчетное значение пути категории.

В одном из примеров произведение расчетных значений ключевых слов из набора ключевых слов рассчитывается по Формуле (2), приведенной ниже:

Здесь S (Р, K) представляет собой расчетное значение ключевого слова Ki при пути Р категории, S(P, K) представляет собой интегрированное расчетное значение набора K ключевых слов названия X товара при пути Y категории.

В блоке 205 путь категории с наибольшим интегрированным расчетным значением в наборе путей категории выбирается в качестве пути категории названия товара.

В примере осуществления настоящего изобретения система распознавания пути категории выбирает путь категории с наибольшим интегрированным расчетным значением в наборе путей категории, соответствующих набору ключевых слов названия товара, введенного пользователем, и принимает этот выбранный путь категории в качестве пути категории названия товара, так что автоматическое распознавание пути категории для названия товара может реализовываться для названия товара, введенного пользователем.

В примере осуществления настоящего изобретения, после получения набора ключевых слов в названии товара, введенного пользователем, и определения набора путей категории, содержащего набор ключевых слов, система распознавания пути категории может дополнительно вычислять интегрированное расчетное значение каждого пути категории из набор путей категории, чтобы выбрать путь категории с наибольшим интегрированным расчетным значением в качестве пути категории названия товара, введенного пользователем, при этом эффективное распознавание пути категории названия товара может реализовываться без определения пользователем пути категории названия этап за этапом, тем самым снижая нагрузку на пользователя и экономя время пользователя, а также уменьшая возможность ошибочного распознавания пути категории из-за неправильных действий пользователя. Таким образом, достигается реальное улучшение обслуживания пользователей и эффективности работы пользовательского устройства.

Для лучшего понимания способа распознавания пути категории в примере осуществления настоящего изобретения, определенная последовательность будет описана ниже.

Название товара, введенное пользователем: "Metersbonwe, модная женская одежда, узкие джинсы с прямыми брючинами". Система распознавания пути категории получает название товара: "Metersbonwe модная женская одежда узкие джинсы с прямыми брючинами", выполняет сегментацию слов в этом названии товара и получает набор ключевых слов, которые специфически включают ключевые слова: "Metersbonwe", "модная", "женская одежда", "узкие", "с прямыми брючинами" и "джинсы ". Затем система распознавания пути категории использует расчетную таблицу ключевых слов и путей категории сконфигурированной модели распознавания категории товара для получения набора путей категории, содержащего набор ключевых слов ("Metersbonwe", "модная", "женская одежда", "узкие", "с прямыми брючинами", "джинсы"), и полученный набор путей категории содержит пути категории: "женская одежда/женский бутик>брюки>женские джинсы" и "книги>одежда>соответствие женской одежды>соответствие джинсов".

Система распознавания пути категории обрабатывает два пути категории из полученного набора путей категории соответственно. В частности, система распознания пути категории проводит поиск в расчетной таблице ключевых слов и путей категории в модели распознавания категории товара для определения первого расчетного значения числа вхождений каждого ключевого слова из набора ключевых слов ("Metersbonwe", "модная", "женская одежда ", "узкие", "с прямыми брючинами", "джинсы") при пути категории "женская одежда/женский бутик>брюки>женские джинсы ". Первые расчетные значения для этих ключевых слов 100, 200, 50, 80, 300 и 400, соответственно, система распознавания пути категории продолжает определять второе расчетное значение числа вхождений каждого ключевого слова из набора ключевых слов ("Metersbonwe", "модная", "женская одежда", "узкие", "с прямыми брючинами", "джинсы") путем поиска в расчетной таблице ключевых слов в модели распознавания категории товара, и второе расчетное значения этих ключевых слов 300, 500, 1000, 400, 200 и 700 соответственно. Система распознавания пути категории продолжает определять полное количество названий товара при пути категории "женская одежда/женский бутик>брюки>женские джинсы» путем поиска в расчетной таблице пути категории в модели распознавания категории товара, и полное количество равняется 1000. После этого, система распознавания пути категории использует полученные расчетные значения для расчета значения ключевого слова для каждого ключевого слова из набора ключевых слов ("Metersbonwe", "модная", "женская одежда", "узкие", "с прямыми брючинами", "джинсы") в соответстви