Способ и устройство для обновления пользовательских данных
Иллюстрации
Показать всеИзобретение относится к области электронной публикации и, в частности, к способу и устройству для обновления пользовательских данных. Техническим результатом является снижение вычислительных затрат при обновлении данных. В способе обновления пользовательских данных получают исходную строку символов, которая соответствует цитируемому содержимому в пользовательских данных, в нередактированной электронной публикации. Выполняют поиск совпадения исходной строки символов в редактированной электронной публикации. Когда поиск совпадения успешен, обновляют цитируемое содержимое в пользовательских данных согласно результату поиска совпадения для получения обновленных пользовательских данных. 3 н. и 6 з.п. ф-лы, 11 ил.
Реферат
Настоящая заявка основана и испрашивает приоритет по патентной заявке Китая № 201410260916.0, поданной 12 июня 2014 г., полное содержание которой включается в настоящий документ посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к области электронной публикации и, в частности, к способу и устройству для обновления пользовательских данных.
УРОВЕНЬ ТЕХНИКИ
Электронные публикации имеют все больший спрос ввиду их короткого цикла редактирования и низких затрат на редактирование. При чтении электронных публикаций пользователи могут генерировать пользовательские данные, такое как закладки, примечания и резюме (дайджесты). Пользовательские данные могут включать в себя: цитируемое содержимое и пользовательскую информацию чтения, касающуюся цитируемого содержимого.
Цитируемое содержимое в пользовательских данных в общем случае представлено путем физического смещения. Иначе говоря, одно цитируемое содержимое может быть представлено в виде (позиция, длина), причем "позиция" представляет смещенную позицию текста цитируемого содержимого во всей электронной публикации, а "длина" представляет длину текста цитируемого содержимого. Например, примечание может быть выражено как "цитируемое содержимое (120 305-й символ, всего 32 символа), содержимое примечания (этот абзац так хорошо написан)". Однако, поскольку электронные публикации могут редактироваться множество раз, цитируемое содержимое, представленное путем физического смещения, имеет склонность изменяться после добавления и удаления содержимого в электронных публикациях. Таким образом, родственная технология обеспечивает способ обновления пользовательских данных: когда электронная публикация редактируется, подробное редактирование записей каждой версии записывается способами, подобными файлам коррекции, и цитируемое содержимое в пользовательских данных повторно вычисляется путем записей редактирования.
Однако в течение разработки настоящего изобретения было обнаружено, что вышеупомянутый способ имеет по меньшей мере следующие недостатки: поскольку генерирование файлов коррекции влечет очень высокие вычислительные затраты и должно обслуживаться отдельно, вышеупомянутый способ обновления пользовательских данных неприменим для широкого использования.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Для решения той проблемы, что генерирование файлов коррекции влечет очень высокие вычислительные затраты и должно обслуживаться отдельно, и вышеупомянутый способ обновления пользовательских данных неприменим для широкого использования, варианты осуществления настоящего изобретения обеспечивают способ обновления пользовательских данных, причем технические решения следующие.
Согласно первому аспекту вариантов осуществления настоящего изобретения, представлен способ обновления пользовательских данных. Способ включает в себя:
получение исходной строки символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования;
поиск совпадения исходной строки символов в электронной публикации после редактирования; и
когда поиск совпадения успешен, обновление цитируемого содержимого в пользовательских данных согласно результату поиска совпадения для получения обновленных пользовательских данных.
В одном варианте осуществления поиск совпадения исходной строки символов в электронной публикации после редактирования включает в себя:
непосредственный поиск совпадения исходной строки символов в электронной публикации после редактирования;
или,
сегментацию исходной строки символов на n предложений, расположенных по порядку, причем n является положительным целым числом; и последовательный поиск совпадения n предложений в электронной публикации после редактирования;
или,
непосредственный поиск совпадения исходной строки символов в электронной публикации после редактирования; когда поиск совпадения неуспешен, сегментацию исходной строки символов на n предложений, расположенных по порядку, причем n является положительным целым числом; и последовательный поиск совпадения n предложений в электронной публикации после редактирования.
В одном варианте осуществления последовательный поиск совпадения n предложений в электронной публикации после редактирования включает в себя:
поиск совпадения i-го предложения от начальной позиции поиска, 1≤i≤n; когда i=1, начальная позиция поиска является начальной позицией секции, где расположена исходная строка символов;
когда поиск совпадения i-го предложения успешен, обновление начальной позиции поиска для ее установки в конечную позицию совпавшего содержимого i-го предложения, и поиск совпадения (i+1)-го предложения от обновленной начальной позиции поиска, i+1≤n;
когда поиск совпадения i-го предложения неуспешен, поиск совпадения (i+1)-го предложения из позиции поиска, соответствующей i-му предложению; и
после завершения поиска совпадения всех n предложений, если существует совпавшее содержимое, которое полностью совпадает с n предложениями, или если существует совпавшее содержимое, которое совпадает с n предложениями частично, но степень совпадения которого находится в рамках предварительно определенного диапазона совпадения, определение, что поиск совпадения сегментированных предложений успешен.
В одном варианте осуществления способ дополнительно включает в себя:
если самое раннее успешно совпавшее предложение из n предложений не является 1-м предложением, сегментацию всех предложений от 1-го предложения до предложения непосредственно перед самым ранним успешно совпавшим предложением на m сегментаций слов, расположенных по порядку, причем m является положительным целым числом;
от начальной позиции совпавшего содержимого самого раннего успешно совпавшего предложения, поиск совпадения m сегментаций слов в обратном порядке; и
принятие начальной позиции совпавшего содержимого последней успешно совпавшей сегментации слов в качестве соответствующей начальной позиции исходной строки символов в электронной публикации после редактирования.
В одном варианте осуществления способ дополнительно включает в себя:
если последнее успешно совпавшее предложение из n предложений не является n-м предложением, сегментацию всех предложений от предложения непосредственно после последнего успешно совпавшего предложения до n-го предложения на q сегментаций слов, расположенных по порядку, причем q является положительным целым числом;
от конечной позиции совпавшего содержимого последнего успешно совпавшего предложения, последовательный поиск совпадения q сегментаций слов; и
принятие конечной позиции совпавшего содержимого последней успешно совпавшей сегментации слов в качестве соответствующей конечной позиции исходной строки символов в электронной публикации после редактирования.
Согласно второму аспекту вариантов осуществления настоящего изобретения, представлено устройство для обновления пользовательских данных. Устройство включает в себя:
модуль получения, сконфигурированный для получения исходной строки символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования;
модуль поиска совпадения, сконфигурированный для поиска совпадения исходной строки символов в электронной публикации после редактирования; и
модуль обновления, сконфигурированный, чтобы, когда поиск совпадения успешен, обновлять цитируемое содержимое в пользовательских данных согласно результату поиска совпадения для получения обновленных пользовательских данных.
В одном варианте осуществления модуль поиска совпадения сконфигурирован для непосредственного поиска совпадения исходной строки символов в электронной публикации после редактирования;
или,
модуль поиска совпадения сконфигурирован для сегментации исходной строки символов на n предложений, расположенных по порядку, причем n является положительным целым числом; и последовательного поиска совпадения n предложений в электронной публикации после редактирования;
или,
модуль поиска совпадения сконфигурирован для непосредственного поиска совпадения исходной строки символов в электронной публикации после редактирования; когда поиск совпадения неуспешен, сегментирования исходной строки символов на n предложений, расположенных по порядку, причем n является положительным целым числом; и последовательного поиска совпадения n предложений в электронной публикации после редактирования.
В одном варианте осуществления модуль поиска совпадения включает в себя:
блок поиска совпадения, сконфигурированный для поиска совпадения i-го предложения от начальной позиции поиска, 1≤i≤n; когда i=1, начальная позиция поиска является начальной позицией секции, где расположена исходная строка символов;
блок обновления позиции, сконфигурированный, чтобы, когда поиск совпадения i-го предложения успешен, обновить начальную позицию поиска для ее установки в конечную позицию совпавшего содержимого i-го предложения, и осуществлять поиск совпадения (i+1)-го предложения от обновленной начальной позиции поиска, i+1≤n;
блок продолжения поиска совпадения, сконфигурированный, чтобы, когда поиск совпадения i-го предложения неуспешен, осуществлять поиск совпадения (i+1)-го предложения от позиции поиска, соответствующей i-му предложению; и
блок определения, сконфигурированный, чтобы, после завершения поиска совпадения всех n предложений, если существует совпавшее содержимое, которое полностью совпадает с n предложениями, или если существует совпавшее содержимое, которое совпадает с n предложениями частично, но степень совпадения которого находится в рамках предварительно определенного диапазона совпадения, определять, что поиск совпадения сегментированных предложений успешен.
В одном варианте осуществления устройство дополнительно включает в себя:
первый блок сегментации слов, сконфигурированный, чтобы, если самое раннее успешно совпавшее предложение из n предложений не является 1-м предложением, сегментировать все предложения от 1-го предложения до предложения непосредственно перед самым ранним успешно совпавшим предложением на m сегментаций слов, расположенных по порядку, причем m является положительным целым числом;
блок поиска совпадения сегментации слов, сконфигурированный, чтобы от начальной позиции совпавшего содержимого самого раннего успешно совпавшего предложения осуществлять поиск совпадения m сегментаций слов в обратном порядке; и
блок определения начала, сконфигурированный для принятия начальной позиции совпавшего содержимого последней успешно совпавшей сегментации слов в качестве соответствующей начальной позиции исходной строки символов в электронной публикации после редактирования.
В одном варианте осуществления устройство включает в себя:
второй блок сегментации слов, сконфигурированный, чтобы, если последнее успешно совпавшее предложение из n предложений не является n-м предложением, сегментировать все предложения от предложения непосредственно после последнего успешно совпавшего предложения до n-го предложения на q сегментаций слов, расположенных по порядку, причем q является положительным целым числом;
блок поиска совпадения сегментаций слов, сконфигурированный, чтобы от конечной позиции совпавшего содержимого последнего успешно совпавшего предложения последовательно осуществлять поиск совпадения q сегментаций слов; и
блок определения конца, сконфигурированный для принятия конечной позиции совпавшего содержимого последней успешно совпавшей сегментации слов в качестве соответствующей конечной позиции исходной строки символов в электронной публикации после редактирования.
Согласно третьему аспекту вариантов осуществления настоящего изобретения, представлено устройство для обновления пользовательских данных. Устройство включает в себя:
процессор;
память для хранения инструкций, исполняемых процессором;
причем процессор сконфигурирован, чтобы:
получать исходную строку символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования;
осуществлять поиск совпадения исходной строки символов в электронной публикации после редактирования; и
когда поиск совпадения успешен, обновить цитируемое содержимое в пользовательских данных согласно результату поиска совпадения для получения обновленных пользовательских данных.
Технические решения, представленные вариантами осуществления настоящего изобретения, могут включать в себя следующие полезные эффекты:
Получается исходная строка символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования, для исходной строки символов ищется совпадение в электронной публикации после редактирования; и когда поиск совпадения успешен, цитируемое содержимое в пользовательских данных обновляется согласно результату поиска совпадения для получения обновленных пользовательских данных. С использованием способа обновления пользовательских данных, представленного вариантами осуществления настоящего изобретения, вычислительные затраты для генерирования файлов коррекции сберегаются, и способ обновления пользовательских данных, представленный вариантами осуществления настоящего изобретения, не требует отдельного обслуживания и, таким образом, может применяться широкомасштабно.
Следует понимать, что и вышеприведенное общее описание, и последующее подробное описание являются только примерными и пояснительными и не ограничивают заявленное изобретение.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Сопроводительные чертежи, которые включены в настоящее описание и составляют его часть, иллюстрируют варианты осуществления, соответствующие изобретению, и вместе с описанием служат для объяснения принципов изобретения.
Фиг. 1 изображает структурную схему среды осуществления, используемой в способе обновления пользовательских данных, представленном вариантами осуществления настоящего изобретения.
Фиг. 2 изображает блок-схему способа обновления пользовательских данных согласно примерному варианту осуществления.
Фиг. 3a изображает блок-схему способа обновления пользовательских данных согласно другому примерному варианту осуществления.
Фиг. 3b изображает схематичное представление, показывающее заданную секцию в электронной публикации до редактирования и соответствующую секцию в электронной публикации после редактирования согласно одному варианту осуществления настоящего изобретения.
Фиг. 4a изображает блок-схему способа обновления пользовательских данных согласно другому примерному варианту осуществления.
Фиг. 4b изображает схематичное представление, показывающее заданную секцию в электронной публикации до редактирования и соответствующую секцию в электронной публикации после редактирования согласно одному варианту осуществления настоящего изобретения.
Фиг. 5a изображает блок-схему способа обновления пользовательских данных согласно другому примерному варианту осуществления.
Фиг. 5b изображает схематичное представление, показывающее заданную секцию в электронной публикации до редактирования и соответствующую секцию в электронной публикации после редактирования согласно одному варианту осуществления настоящего изобретения.
Фиг. 6 изображает структурную схему устройства для обновления пользовательских данных согласно примерному варианту осуществления.
Фиг. 7 изображает структурную схему устройства для обновления пользовательских данных согласно примерному варианту осуществления.
Фиг. 8 изображает структурную схему устройства для обновления пользовательских данных согласно примерному варианту осуществления.
Конкретные варианты осуществления в этом раскрытии были показаны в качестве примера на вышеупомянутых чертежах и далее описываются подробно. Чертежи и письменное описание не предназначены для ограничения объема изобретательских концепций каким-либо образом. В действительности они представлены для иллюстрации изобретательских концепций специалисту в данной области техники со ссылками на конкретные варианты осуществления.
ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
Далее будет подробно сделано обращение к примерным вариантам осуществления, примеры которых иллюстрируются на сопроводительных чертежах. Последующее описание ссылается на сопроводительные чертежи, на которых одни и те же номера на различных чертежах представляют одни и те же или подобные элементы, если обратное не указано. Осуществления, изложенные в последующем описании примерных вариантов осуществления, не представляют всех осуществлений, согласующихся с изобретением. Вместо этого они являются лишь примерами устройств и способов, согласующихся с аспектами, ассоциированными с изобретением, изложенным в прилагаемой формуле изобретения.
Перед подробным объяснением и описанием вариантов осуществления настоящего изобретения сначала будут пояснены пользовательские данные, относящиеся к настоящему изобретению. В вариантах осуществления настоящего изобретения пользовательские данные включают в себя цитируемое содержимое и пользовательскую информацию чтения, относящуюся к цитируемому содержимому. Пользовательские данные могут быть любым из закладки, резюме и примечания.
Например, закладкой может быть "120 305-й символ, 3-я закладка", цитируемое содержимое "120 305-й символ" используется для указания, что чтение пользователя в прошлый раз подошло к позиции 120 305-го символа, и пользовательская информация чтения "3-я закладка" используется для указания, что это 3-я закладка в книге.
В качестве другого примера, резюме может быть "120 305-й символ, всего 32 символа, 1-е резюме", цитируемое содержимое "120 305-й символ, всего 32 символа" используется для указания, что пользовательские данные начинаются с позиции 120 305-го символа и имеют длину 32 символа, и пользовательская информация чтения "1-е резюме" используется для указания, что это 1-е резюме в книге; или цитируемым содержимым также может быть "120 305-й символ, 120 337-й символ", что указывает, что пользовательские данные начинаются от позиции 120 305-го символа и заканчивается в позиции 120 337-го символа.
В качестве еще одного примера, примечанием может быть "120 305-й символ, всего 32 символа, этот абзац так хорошо написан". Цитируемое содержимое "120 305-й символ, всего 32 символа" используется для указания, что цитируемое содержимое, для которого создается это примечание, начинается от позиции 120 305-го символа и имеет длину 32 символа, и информация чтения пользователя "этот абзац так хорошо написан" является содержимым примечания, созданным пользователем для цитируемого содержимого; или цитируемым содержимым также может быть "120 305-й символ, 120 337-й символ", что указывает, что цитируемое содержимое, для которого создается примечание, начинается от позиции 120 305-го символа и заканчивается в позиции 120 337-го символа.
Фиг. 1 изображает структурную схему среды осуществления, задействованной в способе обновления пользовательских данных, представленном вариантами осуществления настоящего изобретения. Среда осуществления включает в себя по меньшей мере один терминал 120 и по меньшей мере один сервер 140.
Терминалом 120 может быть электронное оборудование, имеющее функцию чтения. Электронное оборудование может быть интеллектуальными телефонами, планшетными PC, интеллектуальными телевизорами или устройствами чтения электронных книг и так далее.
Терминал 120 может быть соединен с сервером 140 беспроводной сетью.
Сервером 140 может быть сервер или серверный кластер, состоящий из некоторого количества серверов, или центр службы облачного вычисления. Сервером 140 может быть сервер, который обеспечивает услугу обновления пользовательских данных терминалу 120.
Фиг. 2 изображает блок-схему способа обновления пользовательских данных согласно примерному варианту осуществления. Со ссылкой на фиг. 2, настоящий вариант осуществления описан посредством примера, где способ применяется в терминале, показанном на фиг. 1. Процесс способа включает в себя следующие этапы.
На этапе 201 исходная строка символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования получается.
На этапе 202 для исходной строки символов ищется совпадение в электронной публикации после редактирования.
На этапе 203, когда поиск совпадения успешен, цитируемое содержимое в пользовательских данных обновляется согласно результату поиска совпадения для получения обновленных пользовательских данных.
В способе обновления пользовательских данных, представленном вариантами осуществления настоящего изобретения, исходная строка символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования получается, для исходной строки символов ищется совпадение в электронной публикации после редактирования; и когда поиск совпадения успешен, цитируемое содержимое в пользовательских данных обновляется согласно результату поиска совпадения для получения обновленных пользовательских данных. С использованием способа обновления пользовательских данных, представленного вариантами осуществления настоящего изобретения, вычислительные затраты для генерирования файлов коррекции сберегаются, и способ обновления пользовательских данных, представленный вариантами осуществления настоящего изобретения, не требует отдельного обслуживания и, таким образом, может применяться широкомасштабно.
Вышеупомянутый этап 202 имеет три способа осуществления.
Во-первых, непосредственный поиск совпадения:
Для исходной строки символов непосредственно ищется совпадение в электронной публикации после редактирования.
Во-вторых, поиск совпадения с сегментацией предложения:
Исходная строка символов сегментируется на n предложений, расположенных по порядку, n является положительным целым числом, и для n предложений последовательно ищется совпадение в электронной публикации после редактирования.
В-третьих, комбинация непосредственного поиска совпадения и поиска совпадения с сегментацией предложения:
Для исходной строки символов непосредственно ищется совпадение в электронной публикации после редактирования; когда поиск совпадения неуспешен, исходная строка символов сегментируется на n предложений, расположенных по порядку, n является положительным целым числом; и для n предложений последовательно ищется совпадение в электронной публикации после редактирования.
Вышеупомянутые три способа осуществления будут объяснены в трех различных вариантах осуществления ниже.
Фиг. 3a изображает блок-схему способа обновления пользовательских данных согласно другому примерному варианту осуществления. Со ссылкой на фиг. 3a, настоящий вариант осуществления описан посредством примера, где способ применяется в терминале, показанном на фиг. 1, и терминал задействует непосредственный поиск совпадения. Процесс способа включает в себя следующие этапы.
На этапе 3a01 исходная строка символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования получается.
В настоящем варианте осуществления исходная строка символов, соответствующая цитируемому содержимому в пользовательских данных, полученных терминалом, может быть исходной строкой символов, соответствующей любому одному из закладки, резюме или примечания.
В настоящем варианте осуществления есть следующие два способа получения для терминала для получения исходной строки символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования:
Первый способ: терминал получает исходную строку символов согласно начальной позиции и длине цитируемого содержимого.
Например, когда цитируемым содержимым является "120 305-й символ, всего 32 символа", терминал получает, от позиции 120 305-го символа в текущей секции, строку символов с длиной 32 символа после 120 305-го символа, тем самым осуществляя получение исходной строки символов, соответствующей цитируемому содержимому.
Второй способ: терминал получает исходную строку символов согласно начальной позиции и конечной позиции цитируемого содержимого.
Например, когда цитируемым содержимым является "120 305-й символ, 120 337-й символ", терминал получает строку символов от позиции 120 305-го символа до позиции 120 337-го символа в текущей секции, тем самым осуществляя получение исходной строки символов, соответствующей цитируемому содержимому.
Фиг. 3b изображает схематичное представление, показывающее заданную секцию в электронной публикации до редактирования и соответствующую секцию в электронной публикации после редактирования согласно одному варианту осуществления настоящего изобретения. Со ссылкой на фиг. 3b, исходная строка китайских символов, соответствующая цитируемому содержимому в пользовательских данных, полученных терминалом, является ("Когда правление династии Чжоу ослабло, возникло семь враждующих царств, воюющих друг с другом, пока царство Цинь не взяло верх и не завладело империей; но когда судьба Цинь была воплощена, появилось два противоборствующих царства, Чу и Хань, чтобы бороться за господство, и Хань вышло победителем; рост успеха Хань начался, когда Лю Бан, великий родоначальник, сразил белого змея, чтобы поднять флаги восстания, которое закончилось, только когда вся империя принадлежала Хань").
На этапе 3a02 для исходной строки символов непосредственно ищется совпадение в электронной публикации после редактирования.
Когда терминал получает исходную строку китайских символов в электронной публикации после редактирования, терминал выполняет поиск, от начальной позиции секции, соответствующей заданной секции электронной публикации до редактирования, исходной строки символов в секции, соответствующей заданной секции, с длиной полученной исходной строки символов в качестве поисковой длины, и, таким образом, поиск совпадения исходной строки символов достигается.
Со ссылкой на фиг. 3b, от начальной позиции соответствующей секции после редактирования с длиной полученной исходной строки китайских символов в качестве поисковой длины терминал выполняет поиск исходной строки китайских символов в соответствующей секции. Терминал может найти строку китайских символов и, таким образом, терминал успешно осуществляет поиск совпадения исходной строки китайских символов.
На этапе 3a03, когда поиск совпадения успешен, цитируемое содержимое в пользовательских данных обновляется согласно результату поиска совпадения для получения обновленных пользовательских данных.
Когда терминал успешно осуществляет поиск совпадения исходной строки символов, терминал обновляет цитируемое содержимое пользовательских данных, соответствующих строке символов, согласно информации позиции совпавшей строки символов для получения обновленных пользовательских данных. Информацией позиции может быть начальная позиция совпавшей строки символов в электронной публикации после редактирования и конечная позиция совпавшей строки символов в электронной публикации после редактирования, или информацией позиции может также быть начальная позиция совпавшей строки символов в электронной публикации после редактирования и длина текста совпавшей строки символов в электронной публикации после редактирования.
Например, когда пользовательскими данными является закладка, терминал добавляет закладку в соответствующей позиции в электронной публикации после редактирования согласно позиции закладки; когда пользовательскими данными является резюме, терминал добавляет резюме в соответствующей позиции в электронной публикации после редактирования согласно начальной позиции резюме и цитируемому содержимому, соответствующему резюме; когда пользовательскими данными является примечание, терминал добавляет примечание в соответствующей позиции в электронной публикации после редактирования согласно начальной позиции примечания, цитируемому содержимому и содержимому примечания.
Со ссылкой на пример на этапе 3a02 в качестве примера, когда терминал успешно осуществляет поиск совпадения исходной строки китайских символов и пользовательскими данными, соответствующими исходной строке китайских символов, является "120 305-й символ, всего 32 символа, 1-е резюме", терминал обновляет цитируемое содержимое пользовательских данных, соответствующих строке китайских символов в электронной публикации после редактирования, согласно начальной позиции строки китайских символов и содержимому строки китайских символов, и полученными обновленными пользовательскими данными является "120 305-й символ, всего 32 символа, 1-е резюме".
В способе обновления пользовательских данных, представленном вариантами осуществления настоящего изобретения, исходная строка символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования получается, для исходной строки символов ищется совпадение в электронной публикации после редактирования; и когда поиск совпадения успешен, цитируемое содержимое в пользовательских данных обновляется согласно результату поиска совпадения для получения обновленных пользовательских данных. С использованием способа обновления пользовательских данных, представленного вариантами осуществления настоящего изобретения, вычислительные затраты для генерирования файлов коррекции сберегаются, и способ обновления пользовательских данных, представленный вариантами осуществления настоящего изобретения, не требует отдельного обслуживания и, таким образом, может применяться широкомасштабно.
Поскольку непосредственный поиск совпадения применим только в ситуации, когда исходная строка символов не редактируется, для ситуации, когда исходная строка символов редактируется, поиск совпадения не будет успешным. По этой причине предлагается следующий вариант осуществления.
Фиг. 4a изображает блок-схему способа обновления пользовательских данных согласно другому примерному варианту осуществления. Со ссылкой на фиг. 4a описан настоящий вариант осуществления, задействующий пример, где способ применяется в терминале, показанном на фиг. 1, и терминал задействует поиск совпадения с сегментацией предложения. Процесс способа включает в себя следующие этапы.
На этапе 4a01 терминал получает исходную строку символов, которая соответствует цитируемому содержимому в пользовательских данных, в электронной публикации до редактирования.
Этап 4a01 аналогичен или подобен этапу 3a01 из варианта осуществления, показанного на фиг. 3a, и, таким образом, подробное описание этого этапа не будет представлено в этом варианте осуществления.
На этапе 4a02 терминал сегментирует исходную строку символов на n предложений, расположенных по порядку; n является положительным целым числом.
Со ссылкой на исходную строку символов заданной секции до редактирования на фиг. 4b в качестве примера, исходная строка китайских символов, полученная терминалом, является , и терминал сегментирует исходную строку китайских символов на следующие семь предложений: , .
На этапе 4a03 терминал последовательно осуществляет поиск совпадения n предложений в электронной публикации после редактирования.
Терминал осуществляет поиск совпадения i-го предложения из начальной позиции поиска в электронной публикации после редактирования, 1≤i≤n; когда i=1, начальной позицией поиска является начальная позиция секции, где расположена исходная строка символов; когда поиск совпадения i-го предложения успешен, терминал обновляет начальную позицию поиска для ее установки в конечную позицию совпавшего содержимого i-го предложения, и осуществляет поиск совпадения (i+1)-го предложения от обновленной начальной позиции поиска, i+1≤n; когда поиск совпадения i-го предложения неуспешен, терминал осуществляет поиск совпадения (i+1)-го предложения из позиции поиска, соответствующей i-му предложению.
Следует заметить, что после завершения поиска совпадения всех n предложений, если существует совпавшее содержимое, которое полностью совпадает с n предложениями, или если существует совпавшее содержимое, которое совпадает с n предложениями частично, но степень совпадения которого находится в рамках предварительно определенного диапазона совпадения, определяется, что поиск совпадения сегментированных предложений успешен. Предварительно определенный диапазон совпадения измеряет точность совпавших предложений в целях предотвращения того, чтобы подобная, но не полная строка символов считалась совпадением, и в то же время предотвращения того, чтобы слишком длинная подобная строка символов считалась совпадением. Предварительно определенный диапазон совпадения может быть выражен формулой: 80%Len1≤Len2≤120%Len1, где Len1 - длина текста исходной строки символов, Len2 - длина текста совпавшей строки символов.
Будет сделано описание с использованием семи предложений, полученных на вышеупомянутом этапе 4a02, и соответствующей секции после редактирования, показанной на фиг.4b, в качестве примера. Терминал принимает начальную позицию проверенной соответствующей секции в качестве начальной позиции поиска и последовательно осуществляет поиск совпадения вышеупомянутых семи предложений в соответствующей секции после редактирования. От начальной позиции с длиной 1-го предложения в качестве поисковой длины терминал выполняет поиск 1-го предложения в секции, и затем терминал может найти 1-е предложение, и, таким образом, терминал осуществляет поиск совпадения 1-го предложения успешно. Терминал обновляет начальную позицию поиска для ее установки в конечную позицию "," 1-го предложения. От конечной позиции "," 1-го предложения с длиной 2-го предложения в качестве поисковой длины терминал выполняет поиск 2-го предложения в секции, и затем терминал может также найти 2-е предложение, и, таким образом, терминал также осуществляет поиск совпадения 2-го предложения успешно. Терминал обновляет начальную позицию поиска для ее установки в конечную позицию ";" 2-го предложения. И затем от конечной позиции ";" 2-го предложения терминал осуществляет поиск совпадения 3-го предложения, и терминал может также осуществлять поиск совпадения успешно. Терминал обновляет начальную позицию поиска для ее установки в конечную позицию "," 3-го предложения. От конечной позиции "," 3-го предложения с длиной 4-го предложения в качестве поисковой длины терминал выполняет поиск 4-го предложения в секции вплоть до конечной позиции секции. Но терминал не находит 4-го предложения. Таким образом, терминал осуществляет поиск совпадения 4-го предложения неуспешно; терминал не обновляет начальную позицию поиска, но п