Способ и система создания краткого изложения цифрового контента
Иллюстрации
Показать всеИзобретение относится к обработке цифрового контента (в частности, текстовых, аудио- и видеофайлов), а конкретнее к созданию кратких изложений цифрового контента. Техническим результатом является расширение арсенала средств создания кратких изложений цифрового контента. В способе создания краткого изложения цифрового контента получают указание на цифровой контент и выполняют синтаксический анализ текстового представления контента. Разделяют контент на упорядоченное множество фрагментов, включающее в себя первый и второй фрагменты. Выполняют семантический анализ каждого фрагмента и определяют параметр полезности для каждого фрагмента и связи между каждой парой фрагментов. В ответ на то, что параметр полезности второго фрагмента превышает предварительно определенное пороговое значение, включают второй фрагмент в подмножество фрагментов для включения в краткое изложение цифрового контента. В ответ на получение указания на связь второго фрагмента с первым включают первый фрагмент в подмножество фрагментов. Создают краткое изложение цифрового контента на основе подмножества фрагментов. 2 н. и 60 з.п. ф-лы, 6 ил.
Реферат
[001] Настоящая технология относится к электронным устройствам и способам обработки цифрового контента (в частности, текстовых, аудио- и видеофайлов). Конкретнее, настоящее техническое решение относится к системам и способам для создания кратких изложений цифрового контента.
УРОВЕНЬ ТЕХНИКИ
[002] Разработки в сфере компьютерных технологий позволяют обрабатывать большие объемы данных, включая компьютерную обработку различных типов цифрового контента. Компьютерное создание кратких изложений цифрового контента является одной из сложных задач компьютерной лингвистики. Основная задача компьютерного создания кратких изложений цифрового контента обладает двумя аспектами: (i) скорость обработки (поскольку некоторые краткие изложения необходимо создавать «на лету») и (ii) точность (т.е. предоставление краткого изложения без потерь общего смысла).
[003] Из патентной заявки США №US 20140072285 (опубл. 13 марта 2014) известна система аннотирования цифрового контента. Анализатор взаимодействия зрителей принимает медиафайл, содержащий цифровой контент, медиафайл включает в себя множество сегментов. Сегмент медиафайла оценивается на основе взаимодействия множества оценщиков. Метрики просмотра на сегменте медиафайла измеряются на основе взаимодействия зрителей с сегментом медиафайла. Множество векторов признаков формируются на основе измеренных взаимодействий зрителей, где векторы признаков в наборе векторов признаков основаны на взаимодействии множества зрителей. Модель обучается на основе набора векторов признаков и оценки, присвоенной сегменту медиафайла. Модель применяется к сегментам медиафайла для формирования рейтинга интереса для сегментов медиафайла. Отредактированный медиафайл генерируется на основе сегментов медиафайла, имеющих рейтинги интереса, которые отвечают критерию.
[004] Из патентной заявки США №US2015027390 (опубл. 1 октября 2015) известна система и способ создания сжатой версии элемента мультимедиа контента. Мультимедийный элемент контента сжимается на основе его звуковой дорожки и желаемой степени сжатия. Звуковая дорожка извлекается и обрабатывается с помощью автоматического распознавания речи для получения упорядоченного по времени текстового представления. Текстовое представление разбивается на множество последовательностей сегментов. Оценка информативности, основанная на оценке характерных черт и оценке различий, вычисляется для каждого из сегментов. Оценка связанности также вычисляется для сегментов во множестве последовательностей. Подпоследовательность одной из последовательностей сегментов оптимизируется для информативности и согласованности и выбирается для создания нового элемента контента - сжатой версии мультимедийного элемента контента.
[005] Из патентной заявки США №US20140156651 (опубл. 5 июня 2014) известен способ автоматического создания сжатой версии медиаконтента. Указанный способ включает: получение от компьютерного устройства запроса на создание сжатой версии медиаконтента; сегментирование медиаконтента на множество сегментов; в котором по меньшей мере один из множества сегментов связан с метаданными; в котором метаданные содержат характеристики ранжирования релевантности каждого из множества сегментов; в котором ранжирование содержит оценки связанности по сегментам в соответствии с метаданными; и выбор по меньшей мере одного выбранного сегмента из указанного множества сегментов; в котором по меньшей мере один выбранный сегмент связан с наивысшей оценкой.
РАСКРЫТИЕ
[006] Задачей предлагаемой технологии является расширение арсенала средств указанного назначения и предложить новые способы и системы для создания кратких изложений цифрового контента. Также технология в некоторых своих вариантах реализации позволяет устранить ряд недостатков, которые присущи известному уровню техники.
[007] Первым объектом настоящей технологии является способ создания краткого изложения цифрового контента, осуществляемый процессором компьютерного устройства. Способ включает в себя: получение указания на цифровой контент; синтаксический анализ текстового представления цифрового контента; разделение цифрового контента на упорядоченное множество фрагментов, включающее в себя первый фрагмент и второй фрагмент; семантический анализ каждого фрагмента текстового представления цифрового контента; определение параметра полезности для каждого фрагмента из множества фрагментов; определение связи между каждой парой фрагментов из множества фрагментов; в ответ на то, что параметр полезности второго фрагмента превышает предварительно определенное пороговое значение параметра полезности, включение второго фрагмента в подмножество фрагментов для включения в краткое изложение цифрового контента; в ответ на получение указания на связь второго фрагмента с первым фрагментом включение первого фрагмента в подмножество фрагментов; создание краткого изложения цифрового контента на основе подмножества фрагментов.
[008] Возможен вариант осуществления способа, в котором разделение цифрового контента на упорядоченное множество фрагментов осуществляют по меньшей мере частично на основе предварительно обученного первого алгоритма машинного обучения.
[009] Возможен вариант осуществления способа, в котором первый алгоритм машинного обучения предварительно обучен разделять цифровой контент на множество фрагментов, причем в качестве входных параметров первого алгоритма машинного обучения задают данные синтаксического анализа текстового представления цифрового контента, а обучение первого алгоритма машинного обучения представляет собой обучение с учителем на основе обучающей выборки.
[0010] Возможен вариант осуществления способа, в котором параметр полезности каждого фрагмента из множества фрагментов определяют по меньшей мере частично на основе предварительно обученного второго алгоритма машинного обучения.
[0011] Возможен вариант осуществления способа, в котором второй алгоритм машинного обучения предварительно обучен определять параметр полезности каждого фрагмента из множества фрагментов, причем в качестве входных параметров второго алгоритма машинного обучения задают данные семантического анализа текстового представления цифрового контента, а обучение второго алгоритма машинного обучения представляет собой обучение с учителем на основе обучающей выборки.
[0012] Возможен вариант осуществления способа, в котором на этапе определения параметра полезности полезность по меньшей мере одного фрагмента из множества фрагментов оценивают асессором, причем оценку, полученную от асессора, применяют в качестве дополнительного входного параметра второго алгоритма машинного обучения.
[0013] Возможен вариант осуществления способа, в котором размер первого фрагмента не равен размеру второго фрагмента.
[0014] Возможен вариант осуществления способа, в котором в ответ на получение указания на взаимосвязь второго фрагмента с первым фрагментом выполняют объединение первого и второго фрагмента в единый фрагмент.
[0015] Возможен вариант осуществления способа, в котором упорядоченное множество фрагментов включает в себя по меньшей мере три фрагмента: первый, второй и третий.
[0016] Возможен вариант осуществления способа, в котором указание на связь между каждыми двумя фрагментами из множества фрагментов представляет собой: параметр, указывающий на наличие связи между каждыми двумя фрагментами, либо параметр, указывающий на степень связанности между каждыми двумя фрагментами.
[0017] Возможен вариант осуществления способа, в котором определяют связь между каждой парой фрагментов из множества фрагментов по меньшей мере частично на основе предварительно обученного третьего алгоритма машинного обучения.
[0018] Возможен вариант осуществления способа, в котором третий алгоритм машинного обучения предварительно обучен определять связь между каждой парой фрагментов из множества фрагментов, причем в качестве входных параметров третьего алгоритма машинного обучения задают данные семантического и синтаксического анализов текстового представления цифрового контента, а обучение третьего алгоритма машинного обучения представляет собой обучение с учителем на основе обучающей выборки.
[0019] Возможен вариант осуществления способа, в котором на этапе определения связи между каждой парой фрагментов из множества фрагментов связь между по меньшей мере одной парой фрагментов из множества фрагментов цифрового контента оценивают асессором, причем оценку, полученную от асессора, применяют в качестве дополнительного входного параметра третьего алгоритма машинного обучения.
[0020] Возможен вариант осуществления способа, в котором определение связи между каждой парой фрагментов выполняют параллельно с этапом разделения цифрового контента на упорядоченное множество фрагментов.
[0021] Возможен вариант осуществления способа, в котором перед созданием краткого изложения цифрового контента на основе подмножества фрагментов дополнительно осуществляют проверку связи между каждой парой фрагментов из подмножества фрагментов на основе предварительно обученного третьего алгоритма машинного обучения и/или на основе проверки по меньшей мере одним асессором.
[0022] Возможен вариант осуществления способа, в котором указание на связь представляет собой параметр, указывающий степень связанности между фрагментами; причем перед проверкой связи между каждой парой фрагментов из подмножества фрагментов задают пороговое значение параметра, указывающего степень связанности между фрагментами.
[0023] Возможен вариант осуществления способа, в котором параметр полезности первого фрагмента не превышает предварительно определенное пороговое значение.
[0024] Возможен вариант осуществления способа, в котором перед определением параметра полезности для каждого фрагмента из множества фрагментов задают по меньшей мере одно дополнительное пороговое значение параметра полезности; создают по меньшей мере одно дополнительное краткое изложение цифрового контента на основе по меньшей мере одного дополнительного подмножества фрагментов.
[0025] Возможен вариант осуществления способа, в котором по меньшей мере одно дополнительное краткое изложение цифрового контента отличается по размеру от краткого изложения цифрового контента.
[0026] Возможен вариант осуществления способа, в котором перед этапом разделения цифрового контента получают запрос на создание краткого изложения цифрового контента.
[0027] Возможен вариант осуществления способа, в котором в ответ на получение запроса на создание цифрового контента отправляют асессору по меньшей мере одно указание на фрагмент цифрового контента для оценки его параметра полезности; на этапе определения параметра полезности для каждого фрагмента из множества фрагментов в качестве дополнительного входного параметра используют упомянутую полученную оценку параметра полезности по меньшей мере одного из фрагментов.
[0028] Возможен вариант осуществления способа, в котором запрос на создание краткого изложения цифрового контента включает в себя пороговое значение параметра полезности фрагментов цифрового контента для включения в краткое изложение цифрового контента.
[0029] Возможен вариант осуществления способа, в котором запрос на создание краткого изложения цифрового контента включает в себя указание на степень владения тематикой цифрового контента.
[0030] Возможен вариант осуществления способа, в котором на этапе определения связи между фрагментами в качестве входного параметра используют полученное значение степени владения тематикой цифрового контента.
[0031] Возможен вариант осуществления способа, в котором цифровой контент представляет собой текстовый файл.
[0032] Возможен вариант осуществления способа, в котором цифровой контент представляет собой аудиофайл.
[0033] Возможен вариант осуществления способа, в котором после получения цифрового контента осуществляют создание текстового представления аудиофайла.
[0034] Возможен вариант осуществления способа, в котором при разделении аудиофайла на фрагменты и при создании указаний на взаимосвязь между фрагментами дополнительно выполняют анализ на основе по меньшей мере одного из следующего: интонация, музыкальное сопровождение, тембр голоса, темп голоса, тон голоса, паузы.
[0035] Возможен вариант осуществления способа, в котором цифровой контент представляет собой видеофайл.
[0036] Возможен вариант осуществления способа, в котором после получения цифрового контента осуществляют создание текстового представления видеофайла.
[0037] Возможен вариант осуществления способа, в котором при разделении видеофайла на фрагменты и при определении взаимосвязи между фрагментами дополнительно выполняют анализ звукового представления на основе по меньшей мере одного из следующего: интонация, музыкальное сопровождение, тембр голоса, темп голоса, тон голоса, паузы, а также анализ визуального представления на основе по меньшей мере одного из следующего: фон, сцена, цветность.
[0038] Другим объектом настоящей технологии является компьютерное устройство для создания краткого изложения цифрового контента, включающее в себя процессор, коммуникационный интерфейс, процессор функционально связан с модулем получения цифрового контента, модулем разделения цифрового контента на упорядоченное множество фрагментов, модулем определения параметра полезности, модулем определения связи между фрагментами, причем процессор выполнен с возможностью осуществлять: получение указания на цифровой контент; синтаксический анализ текстового представления цифрового контента; разделение цифрового контента на упорядоченное множество фрагментов, включающее в себя первый фрагмент и второй фрагмент; семантический анализ каждого фрагмента текстового представления цифрового контента; определение параметра полезности для каждого фрагмента из множества фрагментов; определение связи между каждой парой фрагментов из множества фрагментов; в ответ на то, что параметр полезности второго фрагмента превышает предварительно определенное пороговое значение параметра полезности, включение второго фрагмента в подмножество фрагментов для включения в краткое изложение цифрового контента; в ответ на получение указания на связь второго фрагмента с первым фрагментом включение первого фрагмента в подмножество фрагментов; создание краткого изложения цифрового контента на основе подмножества фрагментов.
[0039] Возможен вариант осуществления компьютерного устройства, в котором процессор выполнен с возможностью осуществлять разделение цифрового контента на упорядоченное множество фрагментов по меньшей мере частично на основе предварительно обученного первого алгоритма машинного обучения.
[0040] Возможен вариант осуществления компьютерного устройства, в котором первый алгоритм машинного обучения предварительно обучен разделять цифровой контент на множество фрагментов, причем в качестве входных параметров первого алгоритма машинного обучения задают данные синтаксического анализа текстового представления цифрового контента, а обучение первого алгоритма машинного обучения представляет собой обучение с учителем на основе обучающей выборки.
[0041] Возможен вариант осуществления компьютерного устройства, в котором процессор выполнен с возможностью определять параметр полезности каждого фрагмента из множества фрагментов по меньшей мере частично на основе предварительно обученного второго алгоритма машинного обучения.
[0042] Возможен вариант осуществления компьютерного устройства, в котором второй алгоритм машинного обучения предварительно обучен определять параметр полезности каждого фрагмента из множества фрагментов, причем в качестве входных параметров второго алгоритма машинного обучения задают данные семантического анализа текстового представления цифрового контента, а обучение второго алгоритма машинного обучения представляет собой обучение с учителем на основе обучающей выборки.
[0043] Возможен вариант осуществления компьютерного устройства, в котором на этапе определения параметра полезности полезность по меньшей мере одного фрагмента из множества фрагментов оценивают асессором, причем оценку, полученную от асессора, применяют в качестве дополнительного входного параметра второго алгоритма машинного обучения.
[0044] Возможен вариант осуществления компьютерного устройства, в котором размер первого фрагмента не равен размеру второго фрагмента.
[0045] Возможен вариант осуществления компьютерного устройства, в котором в ответ на получение указания на взаимосвязь второго фрагмента с первым фрагментом процессор выполнен с возможностью выполнять объединение первого и второго фрагмента в единый фрагмент.
[0046] Возможен вариант осуществления компьютерного устройства, в котором упорядоченное множество фрагментов включает в себя по меньшей мере три фрагмента: первый, второй и третий.
[0047] Возможен вариант осуществления компьютерного устройства, в котором указание на связь между каждыми двумя фрагментами из множества фрагментов представляет собой: параметр, указывающий на наличие связи между каждыми двумя фрагментами, либо параметр, указывающий на степень связанности между каждыми двумя фрагментами.
[0048] Возможен вариант осуществления компьютерного устройства, в котором процессор выполнен с возможностью определять связь между каждой парой фрагментов из множества фрагментов по меньшей мере частично на основе предварительно обученного третьего алгоритма машинного обучения.
[0049] Возможен вариант осуществления компьютерного устройства, в котором третий алгоритм машинного обучения предварительно обучен определять связь между каждой парой фрагментов из множества фрагментов, причем в качестве входных параметров третьего алгоритма машинного обучения задают данные семантического и синтаксического анализов текстового представления цифрового контента, а обучение третьего алгоритма машинного обучения представляет собой обучение с учителем на основе обучающей выборки.
[0050] Возможен вариант осуществления компьютерного устройства, в котором на этапе определения связи между каждой парой фрагментов из множества фрагментов связь между по меньшей мере одной парой фрагментов из множества фрагментов цифрового контента оценивают асессором, причем оценку, полученную от асессора, применяют в качестве дополнительного входного параметра третьего алгоритма машинного обучения.
[0051] Возможен вариант осуществления компьютерного устройства, в котором процессор выполнен с возможностью определения связи между каждой парой фрагментов параллельно с этапом разделения цифрового контента на упорядоченное множество фрагментов.
[0052] Возможен вариант осуществления компьютерного устройства, в котором перед созданием краткого изложения цифрового контента на основе подмножества фрагментов процессор выполнен с возможностью дополнительно осуществлять проверку связи между каждой парой фрагментов из подмножества фрагментов на основе предварительно обученного третьего алгоритма машинного обучения и/или на основе проверки по меньшей мере одним асессором.
[0053] Возможен вариант осуществления компьютерного устройства, в котором указание на связь представляет собой параметр, указывающий степень связанности между фрагментами; причем перед проверкой связи между каждой парой фрагментов из подмножества фрагментов задают пороговое значение параметра, указывающего степень связанности между фрагментами.
[0054] Возможен вариант осуществления компьютерного устройства, в котором параметр полезности первого фрагмента не превышает предварительно определенное пороговое значение.
[0055] Возможен вариант осуществления компьютерного устройства, в котором перед определением параметра полезности для каждого фрагмента из множества фрагментов задают по меньшей мере одно дополнительное пороговое значение параметра полезности; процессор выполнен с возможностью создавать по меньшей мере одно дополнительное краткое изложение цифрового контента на основе по меньшей мере одного дополнительного подмножества фрагментов.
[0056] Возможен вариант осуществления компьютерного устройства, в котором по меньшей мере одно дополнительное краткое изложение цифрового контента отличается по размеру от краткого изложения цифрового контента.
[0057] Возможен вариант осуществления компьютерного устройства, в котором процессор выполнен с возможностью перед этапом разделения цифрового контента получать запрос на создание краткого изложения цифрового контента.
[0058] Возможен вариант осуществления компьютерного устройства, в котором в ответ на получение запроса на создание цифрового контента процессор выполнен с возможностью отправлять асессору по меньшей мере одно указание на фрагмент цифрового контента для оценки его параметра полезности; на этапе определения параметра полезности для каждого фрагмента из множества фрагментов в качестве дополнительного входного параметра используют упомянутую полученную оценку параметра полезности по меньшей мере одного из фрагментов.
[0059] Возможен вариант осуществления компьютерного устройства, в котором запрос на создание краткого изложения цифрового контента включает в себя пороговое значение параметра полезности фрагментов цифрового контента для включения в краткое изложение цифрового контента.
[0060] Возможен вариант осуществления компьютерного устройства, в котором запрос на создание краткого изложения цифрового контента включает в себя указание на степень владения тематикой цифрового контента.
[0061] Возможен вариант осуществления компьютерного устройства, в котором на этапе определения связи между фрагментами в качестве входного параметра используют полученное значение степени владения тематикой цифрового контента.
[0062] Возможен вариант осуществления компьютерного устройства, в котором цифровой контент представляет собой текстовый файл.
[0063] Возможен вариант осуществления компьютерного устройства, в котором цифровой контент представляет собой аудиофайл.
[0064] Возможен вариант осуществления компьютерного устройства, в котором после получения цифрового контента процессор выполнен с возможностью осуществлять создание текстового представления аудиофайла.
[0065] Возможен вариант осуществления компьютерного устройства, в котором при разделении аудиофайла на фрагменты и при создании указаний на взаимосвязь между фрагментами процессор выполнен с возможностью дополнительно выполнять анализ на основе по меньшей мере одного из следующего: интонация, музыкальное сопровождение, тембр голоса, темп голоса, тон голоса, паузы.
[0066] Возможен вариант осуществления компьютерного устройства, в котором цифровой контент представляет собой видеофайл.
[0067] Возможен вариант осуществления компьютерного устройства, в котором после получения цифрового контента процессор выполнен с возможностью осуществлять создание текстового представления видеофайла.
[0068] Возможен вариант осуществления компьютерного устройства, в котором при разделении видеофайла на фрагменты и при определении взаимосвязи между фрагментами процессор выполнен с возможностью дополнительно выполнять анализ звукового представления на основе по меньшей мере одного из следующего: интонация, музыкальное сопровождение, тембр голоса, темп голоса, тон голоса, паузы, а также анализ визуального представления на основе по меньшей мере одного из следующего: фон, сцена, цветность.
[0069] Настоящая технология позволяет создавать краткие содержания (сокращенные версии) цифрового контента с максимальной полезностью для пользователя. Причем краткое содержание цифрового контента предварительно не ограничивается по длительности, что позволяет использовать любое необходимое количество фрагментов для получения полезного и связного краткого изложения цифрового контента.
[0070] В контексте настоящего описания, если четко не указано иное, "электронное устройство", "компьютерное устройство", "клиентское устройство", "сервер", "удаленный сервер" и "компьютерная система" подразумевают под собой аппаратное и/или системное обеспечение, подходящее к решению соответствующей задачи. Таким образом, некоторые неограничивающие примеры аппаратного и/или программного обеспечения включают в себя компьютеры (серверы, настольные компьютеры, ноутбуки, нетбуки и так далее), смартфоны, планшеты, сетевое оборудование (маршрутизаторы, коммутаторы, шлюзы и так далее) и/или их комбинацию.
[0071] В контексте настоящего описания, если четко не указано иное, «машиночитаемый носитель», «хранилище», «устройство хранения» подразумевает под собой носитель абсолютно любого типа и характера, не ограничивающие примеры включают в себя ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB-ключи, флеш-карты, твердотельные накопители и накопители на магнитной ленте.
[0072] В контексте настоящего описания, если четко не указано иное, термин «модуль» подразумевает под собой программное обеспечение (соответствующее конкретному аппаратному контексту), которое является необходимым и достаточным для выполнения конкретной(ых) указанной(ых) функции(й).
[0073] В контексте настоящего описания, если четко не указано иное, «указание» информационного элемента может представлять собой сам информационный элемент или указатель, отсылку, ссылку или другой косвенный способ, позволяющий получателю указания найти сеть, память, базу данных или другой машиночитаемый носитель, из которого может быть извлечен информационный элемент. Например, указание на документ может включать в себя сам документ (т.е. его содержимое), или же оно может являться уникальным дескриптором документа, идентифицирующим файл по отношению к конкретной файловой системе, или каким-то другими средствами передавать получателю указание на сетевую папку, адрес памяти, таблицу в базе данных или другое место, в котором можно получить доступ к файлу. Как будет понятно специалистам в данной области техники, степень точности, необходимая для такого указания, зависит от степени первичного понимания того, как должна быть интерпретирована информация, которой обмениваются получатель и отправитель указателя. Например, если до установления связи между отправителем и получателем понятно, что указание информационного элемента принимает вид ключа базы данных для записи в конкретной таблице заранее установленной базы данных, включающей в себя информационный элемент, то передача ключа базы данных – это все, что необходимо для эффективной передачи информационного элемента получателю, несмотря на то, что сам по себе информационный элемент не передавался между отправителем и получателем указания.
[0074] В контексте настоящего описания, если конкретно не указано иное, слова «первый», «второй», «третий» и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной связи между этими существительными. Так, например, следует иметь в виду, что использование терминов «первый сервер» и «третий сервер» не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий «второй сервер» обязательно должен существовать в той или иной ситуации. В дальнейшем, как указано здесь в других контекстах, упоминание «первого» элемента и «второго» элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, «первый» сервер и «второй» сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.
[0075] Под термином «параметр полезности фрагмента цифрового контента» в контексте настоящей технологии понимается выражение степени интересности, важности, информативности фрагмента цифрового контента для пользователя. Например, в видеолекции фрагмент с введением и фрагмент с выводами обычно будут обладать большей полезностью для пользователя, чем фрагменты, на которых лектор делает отступления от основной темы для привлечения внимания аудитории (например, рассказывает анекдот).
[0076] Под термином «взаимосвязь фрагментов», «связанность фрагментов», «связь фрагментов» в контексте настоящей технологии понимается понятность для пользователя одного фрагмента при исключении другого фрагмента. Например, в первом фрагменте цифрового контента дано описание учебной задачи, а во втором фрагменте дан ответ на указанную учебную задачу. В таком случае второй фрагмент будет непонятен без первого, то есть связан с ним. При этом первый фрагмент может быть понятен без второго фрагмента.
[0077] Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящей технологии станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0078] Для лучшего понимания настоящей технологии, а также других ее аспектов и характерных черт сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:
[0079] на Фиг. 1 представлена принципиальная схема системы, выполненной в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объем;
[0080] на Фиг. 2 представлена блок-схема способа 200, выполняемого в рамках системы, изображенной на Фиг. 1, и выполненного в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объем;
[0081] на Фиг. 3 схематично показан этап разделения цифрового контента на упорядоченное множество фрагментов в соответствии с неограничивающими вариантами осуществления настоящей технологии;
[0082] на Фиг. 4 схематично показан этап определения параметра полезности определения параметра полезности для каждого фрагмента из множества фрагментов в соответствии с неограничивающими вариантами осуществления настоящей технологии;
[0083] на Фиг. 5 схематично показан этап определение связи между каждой парой фрагментов из множества фрагментов в соответствии с неограничивающими вариантами осуществления настоящей технологии;
[0084] на Фиг. 6 схематично показан этап создания краткого изложения цифрового контента на основе подмножества фрагментов в соответствии с неограничивающими вариантами осуществления настоящей технологии.
ОСУЩЕСТВЛЕНИЕ
[0085] На Фиг. 1 представлена принципиальная схема системы 100, выполненной в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объем. Важно иметь в виду, что нижеследующее описание системы 100 представляет собой описание иллюстративных вариантов осуществления настоящей технологии. Таким образом, все последующее описание представлено только как описание иллюстративного примера настоящей технологии. Это описание не предназначено для определения объема или установления границ настоящей технологии. Некоторые полезные примеры модификаций системы 100 также могут быть охвачены нижеследующим описанием. Целью этого является также исключительно помощь в понимании, а не определение объема и границ настоящей технологии. Эти модификации не представляют собой исчерпывающий список, и специалистам в данной области техники будет понятно, что возможны и другие модификации. Кроме того, это не должно интерпретироваться так, что там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным вариантом осуществления этого экземпляра настоящей технологии. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что система 100 представляет собой в некоторых конкретных проявлениях достаточно простой вариант осуществления настоящей технологии, и в подобных случаях представлен здесь с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящей технологии будут обладать гораздо большей сложностью.
[0086] Со ссылкой на Фиг. 1 система 100 включает в себя компьютерное устройство 102, связанное по сети передачи данных 120 с по меньшей мере одним сервером источника цифрового контента 130 и по меньшей мере одним клиентским устройством 140, ассоциированным с пользователем 150. Компьютерное устройство 102 включает в себя процессор 104, коммуникационный интерфейс (не показан), процессор 104 функционально связан с модулем 106 получения цифрового контента, модулем 108 разделения цифрового контента на упорядоченное множество фрагментов, модулем 110 определения параметра полезности и модулем 112 определения связи между фрагментами. В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, сеть передачи данных 120 может представлять собой Интернет. В других вариантах осуществления настоящей технологии, сеть передачи данных 120 может быть реализована иначе - в виде глобальной сети связи, локальной сети связи, частной сети связи и т.п.
[0087] Согласно неограничивающему варианту осуществления системы 100 на Фиг. 1 модули 106, 108, 110 и 112 являются частью компьютерного устройства 102. Однако возможны варианты осуществления системы 100, в которых по меньшей мере один из модулей 106, 108, 110, 112 не является частью компьютерного устройства 102, а, например, находится на отдельном сервере (не показан) и связан с компьютерным устройством 102 по сети передачи данных 120. Таким образом, то, как именно процессор 104 компьютерного устройства 102 функционально связан с модулями 106, 108, 110 и 112, не является ограничивающим условием настоящей технологии. При использовании модулей 106, 108, 110, и 112 процессор 104 выполнен с возможностью осуществлять различные операции, описанные ниже.
[0088] Компьютерное устройство 102 может представлять собой обычный компьютерный сервер, например сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Важно иметь в виду, что компьютерное устройство 102 может быть реализовано на любом подходящем аппаратном и/или прикладном программном, и/или системном программном обеспечении или их комбинации. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, компьютерное устройство 102 является одиночным сервером. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, функциональность компьютерного устройства 102 обработки может быть разделена и может выполняться с помощью нескольких компьютерных устройств.
[0089] Модификации коммуникационного интерфейса (не показан) хорошо известны в данной области техники. То, как именно компьютерное устройство 102 соединено с сервером источника цифрового контента 130 и клиентским устройством 140 никак конкретно не ограничено. В качестве примера, но не ограничения, компьютерное устройство 102 может быть связано с сервером источника цифрового контента 130 по проводной сети передачи данных (соединение на основе сети Ethernet). Компьютерное устройство 102 может быть связано с по меньшей мере одним клиентским устройством 140 через беспроводную сеть связи (например, среди прочего, соединение сети 3G, соединение сети 4G, беспроводной интернет Wireless Fidelity или коротко WiFi®, Bluetooth® и тому подобное). Альтернативно или дополнительно компьютерное устройство 102 может быть соединено с сервером источника цифрового контента 130, клиентским устройством 140 с использованием проводной или беспроводной сети передачи данных либо их комбинации.
[0090] Сервер источника цифрового контента 130 может представлять собой обычный компьютерный сервер, например сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Важно иметь в виду, что сервер источника цифрового контента 130 может быть реализо