Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr)

Иллюстрации

Показать все

Группа изобретений относится к технологиям обработки документов посредством систем оптического распознавания символов (OCR). Техническим результатом является расширение арсенала технических средств для анализа пригодности цифрового изображения для OCR. Предложен способ анализа пригодности цифрового изображения для OCR, выполняемый пользовательским электронным устройством. Способ содержит этап, на котором осуществляют получение пользовательским электронным устройством цифрового изображения документа. Далее согласно способу осуществляют определение с помощью классификатора на электронном устройстве пользователя параметра пригодности цифрового изображения для OCR, представляющего собой признак того, является ли цифровое изображение пригодным для создания результата OCR приемлемого качества. При этом указанный классификатор обучается на основании, по меньшей мере, прогнозируемого параметра зашумленности изображения для определения параметра пригодности документа для OCR и/или индикатора вероятности OCR и проходит валидацию после обучения указанного классификатора. 3 н. и 25 з.п. ф-лы, 5 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ

[0001] Настоящая технология относится к осуществляемым на компьютере способам и системам обработки документов в целом и, в частности, к способу и устройству для определения пригодности документа для оптического распознавания символов (OCR).

УРОВЕНЬ ТЕХНИКИ

[0002] Печатные документы на естественном языке до сих пор являются широко распространенным средством, используемым для коммуникации между людьми в рамках организаций, а также для распространения информации среди ее потребителей. С появлением повсеместно используемых мощных вычислительных ресурсов, включая персональные вычислительные ресурсы, реализованные в смартфонах, планшетах, ноутбуках и персональных компьютерах, а также с распространением более мощных вычислительных ресурсов облачных вычислительных сервисов, центров обработки данных и корпоративных серверов организаций и предприятий, шифрование и обмен информацией на естественном языке все чаще выполняется в виде электронных документов.

[0003] В отличие от печатных документов, которые по своей сути представляют собой изображения, электронные документы содержат последовательности цифровых кодов символов и знаков естественного языка. Поскольку электронные документы имеют перед печатными документами преимущества по стоимости, возможностям передачи и рассылки, простоте редактирования и изменения, а также по надежности хранения, за последние 50 лет развилась целая отрасль, поддерживающая способы и системы преобразования печатных документов в электронные.

[0004] Вычислительные способы и системы оптического распознавания символов, совместно с электронными сканерами, являются надежными и экономичными средствами получения изображений печатных документов и компьютерной обработки получаемых цифровых изображений, содержащих текст документов с целью создания электронных документов, соответствующих печатным.

[0005] С появлением смартфонов, оснащенных камерами, а также других мобильных устройств формирования изображения с процессорным управлением, появилась возможность получения цифровых изображений, содержащих текст документов, с помощью широкого диапазона различных типов широко распространенных портативных устройств, включая смартфоны, недорогие цифровые камеры, недорогие камеры видеонаблюдения, а также устройства получения изображений, встроенные в мобильные вычислительные приборы, включая планшетные компьютеры и ноутбуки.

[0006] Получаемые при помощи таких портативных устройств и приборов цифровые изображения содержащих текст документов могут обрабатываться вычислительными системами оптического распознавания символов, в том числе приложениями оптического распознавания символов (также именуемыми обработкой OCR), установленными в смартфонах или реализованными на серверах, для создания соответствующих электронных документов.

[0007] При реализации функции обработки OCR в локальном режиме эта функция может быть реализована на портативном устройстве, и цифровое изображение может обрабатываться с целью создания распознанного текстового документа. Как вариант, цифровое изображение, полученное электронным устройством пользователя (в сжатой форме или в фактическом размере), передается через сеть связи на сервер систем оптического распознавания символов для выполнения функции OCR на стороне сервера. Затем сервер (i) получает цифровое изображение (ii) распаковывает цифровое изображение для получения распакованного цифрового изображения (в случаях когда изображение передается в сжатой форме между портативным устройством и сервером) и (iii) выполняет функцию OCR на базе сервера для создания распознанного текстового документа на основе цифрового изображения, при этом распознанный текстовый документ содержит текст, сформированный на основе цифрового изображения. Затем сервер может передать распознанный текстовый документ обратно на электронное устройство пользователя через сеть связи (в исходном или сжатом виде).

[0008] Обычно локально выполняемая функция OCR обеспечивает более низкое качество вывода OCR по сравнению с функцией OCR на базе сервера (поскольку локально выполняемые системы OCR менее сложные, чем выполняемые на сервере системы OCR в связи с обычно ограниченными вычислительными ресурсами, доступными на портативном устройстве, по сравнению с сервером, выделенным для выполнения функции OCR).

[0009] В любом случае выполняется ли функция OCR локально или на сервере, эта функция содержит в некоторой степени предварительную обработку цифрового изображения для сокращения количества артефактов в цифровом изображении (т.е. сокращает зашумленность, оптическое размытие и т.д.). В рамках функции OCR портативное устройство или сервер выполняет бинаризацию и вычислительно емкие процедуры OCR.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0010] Задача настоящей технологии заключается в устранении, по меньшей мере, некоторых имеющихся недостатков, присутствовавших в известном уровне техники.

[0011] Варианты реализации настоящей технологии были разработаны на основе мнения изобретателей о том, что в известном уровне техники при имеющемся подходе к выполнению функции OCR локально или на сервере существует, по меньшей мере, одна техническая проблема. Не желая быть привязанными к какой-либо конкретной теории изобретатели считают, что до выполнения собственно обработки OCR (локально или на сервере) желательно выполнять обработку цифрового изображения (для OCR обработки локально или на базе сервера) с целью определения пригодности цифрового документа для OCR обработки (локально или на базе сервера).

[0012] Определение пригодности цифрового документа для обработки OCR в широком смысле заключается в определении того, может ли цифровой документ после обработки функцией OCR (локально или на базе сервера) обеспечить результат (т.е. распознанный текстовый цифровой документ) приемлемого качества (и, в случае неприемлемого качества результата, запросить пользователя повторно сформировать цифровое изображение документа). Приемлемое качество может, например (помимо прочего), измеряться количеством ошибок, содержащихся в распознанном текстовом документе (по максимальному количеству ошибок на странице или общему количеству ошибок в документе).

[0013] Причина и преимущество такого предварительного определения пригодности зависит, по меньшей мере, от того, выполняется ли функция OCR локально на портативном устройстве или на сервере.

[0014] Для тех случаев, когда функция OCR выполняется локально, возможность предварительной обработки заданного цифрового изображения для определения его пригодности для обработки OCR дает возможность пользователю выполнить повторное получение цифрового изображения с помощью портативного устройства в случае непригодности исходного цифрового изображения для обработки OCR. Иными словами, если установлено, что исходное изображение, полученное с помощью выполняемой локально OCR, скорее всего даст результат неудовлетворительного качества, пользователю может быть выдан запрос на повторное получение цифрового изображения до начала его обработки OCR. Это, в свою очередь, может дать более удовлетворительный результат выполнения функции OCR и его достижение в относительно более короткий период времени (в особенности если исходное полученное цифровое изображение не дало бы результата выполнения функции OCR приемлемого качества). В широком смысле, различные варианты реализации настоящей технологии могут улучшить качество окончательного распознавания с помощью выполняемой локально функции OCR по сравнению с существующими решениями на имеющемся уровне техники, которые не выполняют предварительную обработку для определения пригодности документа для OCR, что может привести к результатам выполнения функции OCR локально с неприемлемым качеством, в результате чего пользователь должен будет самостоятельно оценить неприемлемость качества выходных значений функции OCR и начать процесс получения и распознавания изображения заново.

[0015] Применение различных вариантов реализации настоящей технологии также может обеспечить сокращение потребности в вычислительных ресурсах, требуемых перед выполнением обработки OCR (и/или в ходе обработки OCR), что может обеспечить сохранение ресурса аккумулятора электронного устройства (например, аккумулятора портативного устройства).

[0016] В тех сценариях, когда функция OCR реализуется на сервере, определение пригодности цифрового документа для распознавания OCR на сервере с обеспечением приемлемого качества обеспечивает потенциальную экономию времени, необходимого для достижения необходимого качества распознавания, экономию пропускной способности сети связи, используемой для пересылки цифрового изображения между портативным устройством и сервером и т.д. Например, по сравнению с решениями, известными из уровня техники, которые не реализуют предварительную обработку для определения пригодности изображения для OCR, при которых цифровой файл отправляется на сервер для OCR обработки с получением результата распознавания OCR на базе сервера с неприемлемым качеством (в связи с чем потребуется оценка уровня пригодности результата OCR и выполнение процесса получения и распознавания изображения заново в виду неприемлемых окончательных результатов распознавания), реализация настоящей технологии дает возможность сокращения общего времени, необходимого для получения приемлемого качества выходного результата при выполнении OCR на сервере (в особенности в сценариях, когда исходное цифровое изображение было непригодным для оптического распознавания символов на базе сервера с приемлемым качеством).

[0017] Не желая быть привязанным к какой-либо конкретной теории, изобретатели также понимают, что пригодность цифрового изображения для обработки OCR (локально или на базе сервера) соотносится с уровнем зашумленности цифрового изображения. Изобретатели также понимают, что уровень низкого локального контраста может дополнительно (или как вариант) хорошо коррелировать с качеством выходных значений OCR. Исходя из этого понимания изобретатели устранили данный недостаток подходов, существующих в имеющемся уровне техники, за счет разработки способа определения на пользовательском электронном устройстве до передачи цифрового изображения на сервер (в случае OCR на базе сервера) или до обработки цифрового изображения функцией OCR локально, параметра пригодности получаемого цифрового изображения для OCR.

[0018] В широком смысле параметр пригодности документа для OCR является индикатором того, пригодно ли изображение для выдачи приемлемого результата при выполнении OCR на сервере. В соответствии с различными вариантами реализации настоящей технологии параметр пригодности документа для OCR определяется, как минимум, на основе уровня зашумленности цифрового изображения.

[0019] Некоторые варианты реализации настоящей технологии могут быть выполнены в облачной вычислительной среде. Облачная вычислительная среда основана на базе Интернет и обеспечивает общие ресурсы для компьютерной обработки и по требованию предоставляет данные для компьютеров и иных устройств. Эта модель обеспечивает повсеместный доступ по требованию к общему пулу настраиваемых вычислительных ресурсов (например, к компьютерным сетям, серверам, приложениям и службам), который может быть предоставлен и отменен при минимальных управляющих воздействиях. Облачные решения по вычислительным операциям и хранению данных дают пользователям и предприятиям различные возможности по хранению и обработке их данных в сторонних центрах обработки данных, которые могут быть расположены на далеком расстоянии от пользователя - от расстояния в пределах города до любого места в мире.

[0020] В соответствии с первым широким аспектом настоящей технологии обеспечивается способ анализа цифрового изображения. Способ выполняется электронным устройством пользователя. Этот способ включает: получение электронным устройством пользователя цифрового изображения документа; определение с помощью классификатора на электронном устройстве пользователя параметра пригодности цифрового изображения для OCR, представляющего собой признак того, является ли это цифровое изображение пригодным для создания результата OCR приемлемого качества, при этом такой классификатор обучается для определения параметра пригодности документа для OCR, по меньшей мере, на основе уровня зашумленности цифрового изображения; если параметр пригодности документа для OCR ниже заданного порогового значения, на электронном устройстве пользователя вызывается выполнение повторного получения цифрового изображения.

[0021] В некоторых вариантах реализации этот способ дополнительно включает выполнение OCR цифрового изображения при определении того, что параметр пригодности документа для OCR выше заданного порогового значения.

[0022] В некоторых вариантах реализации способа обеспечение выполнения OCR включает выполнение пользовательским электронным устройством функции OCR локально для создания распознанного текстового цифрового документа, представляющего текст, содержащийся в этом цифровом изображении.

[0023] В некоторых вариантах реализации способа обеспечение выполнения OCR включает передачу данных пользовательским электронными устройством на сервер, выполненный с возможностью осуществить OCR на базе сервера для (i) создания распознанного текстового цифрового документа, представляющего текст исходного цифрового изображения, и (ii) передачи распознанного текстового документа на пользовательское электронное устройство.

[0024] В некоторых вариантах реализации способа классификатор реализуется в виде алгоритма машинного обучения.

[0025] В некоторых вариантах реализации способа он дополнительно включает обучение алгоритма машинного обучения.

[0026] В некоторых вариантах реализации способа определение параметра пригодности документа для OCR включает: создание из изображения в оттенках серого контурного изображения; разделение серого цифрового изображения на неперекрывающиеся блоки; определение среднего контраста Ci в каждом блоке серого цифрового изображения; создание бинаризованной версии неперекрывающихся блоков серого цифрового изображения для определения контурных пикселей; определение текстовых блоков; определение контраста резких пикселей слабоконтрастных блоков; определение контраста фоновых пикселей слабоконтрастных блоков; определение средних значений для слабоконтрастных блоков; определение уровня ошибок R.

[0027] В некоторых вариантах реализации способа уровень ошибок R используется в качестве параметра пригодности документа для OCR.

[0028] В некоторых вариантах реализации способа создание контурного изображения включает применение к серому цифровому изображению фильтра.

[0029] В некоторых вариантах реализации способа фильтр представлен алгоритмом обнаружения контуров.

[0030] В некоторых вариантах реализации способа алгоритм обнаружения контуров представлен фильтром Собеля.

[0031] В некоторых вариантах реализации способа разделение серого изображения на неперекрывающиеся блоки включает выбор размера неперекрывающихся блоков, при котором значения яркости, зашумленности и размытия не имеют существенных различий в пределах заданного блока.

[0032] В некоторых вариантах реализации способа определение среднего контраста Ci в каждом блоке серого цифрового изображения включает выполнение анализа на основе гистограммы для определения значения контраста Ci для заданного блока.

[0033] В некоторых вариантах реализации способа выполнение анализа на основе гистограммы включает создание гистограммы яркости, при этом способ дополнительно включает определение минимального и максимального значения яркости, при котором 0,1% всех пикселей заданного блока имеют яркость меньше минимального значения, а 0,1% всех пикселей заданного блока имеют яркость выше максимума.

[0034] В некоторых вариантах реализации способа определение среднего значения контраста Ci в каждом блоке дополнительно включает определение разности между максимальным и минимальным значением.

[0035] В некоторых вариантах реализации способа создание бинарной версии блоков серого цифрового изображения для определения контурных пикселей включает применение порога бинаризации полусуммы максимального значения и минимального значения яркости заданного блока по формуле: th=½(Cmin+Cmax), где: th - порог бинаризации; Cmax - максимальное значение яркости; a Cmin - минимальное значение яркости.

[0036] В некоторых вариантах реализации способ дополнительно включает определение числа K бинаризованных контурных пикселей бинаризованного изображения в заданном блоке.

[0037] В некоторых вариантах реализации способа определение текстовых блоков включает определение заданного текстового блока исходя, как минимум, из одного из следующих условий: (i) количество бинарных контурных пикселей превышает заданное соотношение среди всех пикселей в заданном блоке (ii) показатель черных пикселей в бинаризованном изображение ниже заданного порога и (iii) значение контраста Ci ниже заданного уровня.

[0038] В некоторых вариантах реализации способ дополнительно включает выбор подмножества слабоконтрастных текстовых блоков.

[0039] В некоторых вариантах реализации способа определение контраста резких пикселей слабоконтрастных блоков включает определение контраста за счет уменьшения его значения с 255 до тех пор, пока сумма количества резких пикселей в контурном изображении, соответствующих заданному блоку, не станет больше или равна количеству контурных пикселей K, вычисленному по бинарной версии заданного блока.

[0040] В некоторых вариантах реализации способа определение контраста фоновых пикселей слабоконтрастных блоков включает определение значения как количества шумовых контурных пикселей, яркость которых ошибочно превышает в фоновых областях.

[0041] В некоторых вариантах реализации способа определение контраста фоновых пикселей слабоконтрастных блоков включает: определение количества фоновых бинарных пикселей бинаризованного цифрового изображения путем вычитания количества контурных пикселей K из общего количества пикселей в заданном блоке.

[0042] В некоторых вариантах реализации способа он дополнительно включает определение значения путем увеличения значения с нуля до тех пор, пока количество фоновых пикселей контурного изображения не станет равно или в первый раз не превысит заданное отношение Р количества фоновых бинарных пикселей в заданном блоке.

[0043] В некоторых вариантах реализации способа определение уровня ошибок R включает определение уровня ошибок R как: .

[0044] В некоторых вариантах реализации способа определение уровня ошибок R дополнительно включает использование статистической информации: (<Ci>, , , <Ri>, min(Ri)).

[0045] В некоторых вариантах реализации способа получение пользовательским электронным устройством цифрового изображения документа выполняется через интерфейс получения изображений пользовательского электронного устройства.

[0046] В соответствии с другим более широким аспектом настоящей технологии имеется электронное устройство, включающее процессор. Процессор выполнен с возможностью получения цифрового изображения документа; процессор также выполнен с возможностью определения с помощью классификатора параметра пригодности цифрового изображения для OCR, что является признаком того, является ли это цифровое изображение пригодным для создания результата OCR приемлемого качества, при этом классификатор обучается для определения параметра пригодности документа для OCR, по меньшей мере, на основе уровня зашумленности цифрового изображения; если параметр пригодности документа для OCR ниже заданного порога, обеспечивается повторное получение цифрового изображения.

[0047] В соответствии с другим более широким аспектом настоящей технологии предоставляется энергонезависимый машиночитаемый носитель информации, содержащий исполняемые команды, при выполнении которых электронное устройство, связанное с энергонезависимым машиночитаемым носителем информации, выполняет следующее: получение электронным устройством пользователя цифрового изображения документа; определение с помощью классификатора на электронном устройстве пользователя параметра пригодности цифрового изображения для OCR, представляющим собой признак того, является ли цифровое изображение пригодным для создания результата OCR приемлемого качества, при этом классификатор обучается для определения параметра пригодности документа для OCR, по меньшей мере, на основе уровня зашумленности цифрового изображения; если параметр пригодности документа для OCR ниже заданного порога, на электронном устройстве пользователя вызывается выполнение повторного получения цифрового изображения.

[0048] В контексте настоящего описания под "сервером" понимается компьютерная программа, работающая на соответствующем аппаратном обеспечении и способная получать запросы (например, от электронных устройств) по сети и выполнять эти запросы или обеспечивать выполнение этих запросов. Аппаратное обеспечение может быть представлено одним физическим компьютером или одной физической вычислительной системой, но ни одно из этих устройств не является обязательным требованием для настоящей технологии. В текущем контексте использование выражения "сервер" не означает, что каждая задача (например, полученные инструкции или запросы) или любая конкретная задача будет получена, выполнена или будет обеспечено ее выполнение тем же сервером (т.е. одним программным и/или аппаратным обеспечением); это должно означать, что в получении/отправке, выполнении или обеспечении выполнения любой задачи или запроса или при обработке результатов любой задачи или запроса может быть задействовано любое количество программных элементов или аппаратных устройств; при этом все это программное и аппаратное обеспечение может быть представлено одним или более серверами, при этом выражение "по меньшей мере один сервер" охватывает оба эти понятия. В некоторых вариантах реализации настоящей технологии сервер может быть реализован как часть облачной вычислительной системы.

[0049] В контексте настоящего описания под "электронным устройством" (или "пользовательским электронным устройством") понимается любое вычислительное аппаратное обеспечение, способное выполнять программное обеспечение, необходимое для выполнения поставленной задачи. Таким образом, к некоторым примерам электронных устройств (без ограничения) относятся персональные компьютеры (настольные, ноутбуки, нетбуки и т.д.), смартфоны, планшетные компьютеры и т.д. Необходимо отметить, что не исключается выполнение устройством, действующим в текущем контексте как электронное устройство, функций сервера для других электронных устройств. Использование выражения "электронное устройство" не исключает использования нескольких электронных устройств при получении/отправке, выполнении или обеспечении выполнения любой задачи или запроса или обработке результатов любой задачи или запроса или выполнении любых этапов способа, описанного в настоящем изобретении.

[0050] В контексте настоящего описания под "базой данных" понимается любая структурированная совокупность данных, независимо от конкретной структуры, программного обеспечения для управления базами данных или вычислительного аппаратного обеспечения, на котором данные хранятся, реализуются или иным способом передаются для использования. База данных может храниться на том же аппаратном обеспечении, на котором выполняется процесс или которое использует информацию, хранящуюся в базе данных, или на отдельном аппаратном обеспечении, например на выделенном сервере или множестве серверов.

[0051] В контексте настоящего описания выражение "носитель машиночитаемых данных" (или "устройство хранения данных") может включать носители любого характера и типа, включая ОЗУ, ПЗУ, диски (CD-ROM, DVD, дискеты, жесткие диски, и т.д.), ключи USB, твердотельные накопители, ЗУ на магнитной ленте и т.д.

[0052] Для различных вариантов реализации настоящей технологии предусмотрен, по меньшей мере, один из указанных выше объектов и/или аспектов, но не обязательно все эти объекты/аспекты в комплексе. Необходимо понимать, что некоторые аспекты настоящей технологии, полученные в результате попыток получить указанный выше объект, могут не удовлетворять требованиям этого объекта и/или могут удовлетворять требованиям других объектов, не указанных в частности в настоящем документе.

[0053] Дополнительные и/или альтернативные признаки, аспекты и преимущества реализации настоящей технологии станут очевидными из последующего описания, сопроводительных чертежей и прилагаемых пунктов формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0054] Для обеспечения лучшего понимания настоящей технологии, а также иных аспектов и дополнительных признаков, дается ссылка на последующее описание, которое должно использоваться совместно с сопроводительными чертежами, на которых:

[0055] На Фиг. 1 изображена система для реализации неограничивающих вариантов реализации настоящей технологии.

[0056] На Фиг. 2 приведено схематическое представление процесса обучения классификатора пригодности документа для OCR в системе на Фиг. 1.

[0057] На Фиг. 3 приведена блок-схема неограничивающего варианта реализации процесса определения параметра пригодности для OCR с использованием классификатора пригодности для OCR на Фиг. 2, и также схематически представлены вводы и выводы определенных шагов процесса определения параметра пригодности для OCR с помощью обученного классификатора на Фиг. 2.

[0058] На Фиг. 4 показана блок-схема неограничивающего варианта реализации способа определения пригодности документа для OCR, выполняемого классификатором пригодности для OCR, после обучения в ходе процесса, изображенного на Фиг. 2.

[0059] На Фиг. 5 показана лицевая сторона электронного устройства системы, изображенной на Фиг. 1, и обратная сторона электронного устройства системы, изображенной на Фиг. 1.

ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ РЕАЛИЗАЦИИ

[0060] На Фиг. 1 представлена структурная схема системы 100, пригодной для неограничивающих вариантов реализации настоящей технологии. Следует отчетливо понимать, что система 100, изображенная на схеме, является исключительно иллюстративным примером настоящей технологии. Таким образом, описание этой системы приводится исключительно как описание иллюстративных примеров настоящей технологии. Настоящее описание не направлено на описание объема или установление границ настоящей технологии. В некоторых случаях полезные примеры изменения системы 100 могут быть описаны ниже. Это сделано исключительно с целью улучшения понимания и, опять же, не для определения объема или установления границ настоящей технологии. Перечень этих изменений не является исчерпывающим и, насколько это будет понятно специалисту в данной области техники, весьма вероятны и иные изменения. При этом, если изменения не были выполнены (т.е. если не были описаны примеры изменений), не следует это интерпретировать как невозможность изменений, и как то, что описанное решение является единственно возможным для реализации этого элемента настоящей технологии. Специалисту в данной области техники будет понятно, что это, скорее всего, не так. Также следует понимать, что в некоторых случаях система 100 может обеспечивать простые варианты реализации настоящей технологии, и в этом случае они представлены таким образом, чтобы облегчить понимание. Специалисту в данной области техники будет понятно, что различные варианты реализации настоящей технологии могут представлять повышенную сложность.

[0061] Система 100 включает пользовательское электронное устройство 102. Реализация пользовательского электронного устройства 102 не имеет конкретных ограничений, но в качестве примера пользовательское электронное устройство 102 может быть реализовано как персональный компьютер (настольные компьютеры, ноутбуки, нетбуки и т.д.), устройство беспроводной связи (например, смартфон, сотовый телефон, планшетный компьютер и т.п.). В представленном на Фиг. 1 варианте реализации пользовательское электронное устройство 102 реализовано как устройство беспроводной связи.

[0062] Пользовательское электронное устройство 102 связано с интерфейсом получения изображения 103. В широком смысле интерфейс получения изображения 103 включает аппаратное обеспечение (и, при необходимости, связанное программное обеспечение) для получения цифрового изображения. Цифровое изображение может быть представлено, например, цифровым изображением печатного документа 140, содержащим текст 142 (и потенциально нетекстовые объекты, например изображение 144). Естественно, печатный документ 140 может содержать одну или более страниц, несколько или все из одной или более страниц с различным текстом 142 (включая перекрывающийся текст), различные изображения 144, различные разметки, различные шрифты, размеры шрифтов и т.д.

[0063] В изображенном на Фиг. 1 варианте реализации интерфейс получения изображений 103 реализован в виде камеры (следует отметить, что в некоторых вариантах реализации интерфейс получения изображения 103 может быть реализован как несколько камер, одна или более из которых располагается на лицевой стороне, изображенной на Фиг. 1, и/или одна или более из которых расположена на обратной, не показанной стороне на пользовательском электронном устройстве 102). Кратко рассмотрим Фиг. 5, на которой изображена лицевая сторона электронного устройства 102А и задняя сторона электронного устройства 102В. На лицевой стороне электронного устройства 102А находится передняя камера 103А, а на обратной стороне электронного устройства 102В находится задняя камера 103В. Для получения цифрового изображения печатного документа 140, возможно, будет более удобно использовать заднюю камеру 103В. При этом, если в приведенном ниже описании говорится о "камере", это относится к передней камере 103А или задней камере 103В (или к обеим камерам).

[0064] В альтернативном неограничивающем варианте реализации интерфейс получения изображения 103 может быть реализован в виде сканера (не изображен) для получения цифровой версии бумажного документа.

[0065] В соответствии со схематическим представлением на Фиг. 1 пользовательское электронное устройство 102 включает процессор 104. Процессор 104 может содержать один или более процессоров и/или один или более микроконтроллеров, выполненных с возможностью запуска инструкций и операций, связанных с работой пользовательского электронного устройства 102. В различных вариантах реализации процессор 104 может быть реализован с одним процессором, несколькими процессорами и/или иными электрическими компонентами, включая одну или более интегрированных схем и печатных плат. Процессор 104 может дополнительно содержать устройство кэш-памяти (не изображено) для временного локального хранения инструкций, данных или адресов компьютеров. В качестве примера процессор 104 может быть реализован как один или более процессоров или один или более контроллеров, выделенных для определенных задач обработки электронным устройством 102, или один многофункциональный процессор или контроллер.

[0066] Процессор имеет доступ к устройству хранения данных 106. Устройство хранения данных 106 может включать один или более носителей данных и, в общем, обеспечивать хранение данных, машиночитаемых кодов и т.п. В качестве примера устройство хранения данных 106 может содержать различные материальные машиночитаемые носители данных, в том числе постоянное запоминающее устройство (ПЗУ) и оперативное запоминающее устройство (ОЗУ). Устройство хранения данных 106 может включать одно или более фиксированных устройств хранения в виде, например, жестких дисков (HDD), твердотельных накопителей (SSD), карт флеш-памяти (например, карты Secured Digital или SD, встроенные карты MultiMediaCard или eMMD), а также иных пригодных форм памяти, связанных по двусторонней связи с процессором 104.

[0067] Устройство хранения данных 106 может хранить, помимо прочего, ряд машиночитаемых команд, которые вызывают выполнение процессором 104 (а также другими компонентами пользовательского электронного устройства 102) различных описанных в настоящем документе операций.

[0068] В различных вариантах реализации настоящей технологии различные компоненты пользовательского электронного устройства 102 могут быть оперативно связаны друг с другом по одной или более шинам (включая аппаратное и/или программное обеспечение), при этом шины не имеют отдельной нумерации. В качестве примера, но не в качестве ограничения, одна или более шин могут включать шину ускоренного графического порта - Accelerated Graphics Port (AGP) или иную графическую шину, шину улучшенной архитектуры промышленного стандарта - Enhanced Industry Standard Architecture (EISA), системную шину (FSB), соединение HYPERTRANSPORT (HT), шину архитектуры промышленного стандарта - Industry Standard Architecture (ISA), соединение INFINIBAND, шину с малым числом выводов (LPC), шину памяти, шину микроканальной архитектуры - Micro Channel Architecture (MCA), шину взаимодействия периферийных компонентов - Peripheral Component Interconnect (PCI), шину PCI-Express (PCI-X), шину SATA, местную шину Video Electronics Standards Association (VLB), интерфейс универсального асинхронного приема/передачи - Universal Asynchronous Receiver/Transmitter (UART), шину межсоединений интегральных схем - Inter-Integrated Circuit (I2C), шину последовательного периферийного интерфейса (SPI), интерфейс памяти Secure Digital (SD), интерфейс памяти MultiMediaCard (ММС), интерфейс памяти Memory Stick (MS), интерфейс ввода-вывода Secure Digital Input Output (SDIO), шину многоканального последовательного порта с буфером Multi-channel Buffered Serial Port (McBSP), шину универсального последовательного интерфейса - Universal Serial Bus (USB), шину контроллера универсальной памяти - General Purpose Memory Controller (GPMC), шину контроллера SDRAM (SDRC), шину универсального ввода-вывода - General Purpose Input/Output (GPIO), шину Separate Video (S-Video), шину последовательного интерфейса дисплея - Display Serial Interface (DSI), шину расширенной архитектуры для микроконтроллеров - Advanced Microcontroller Bus Architecture (АМВА)или иную подходящую шину или сочетание двух или более из этих шин.

[0069] Процессор 104 имеет доступ к сетевому интерфейсу 108. Сетевой интерфейс 108 (который может быть реализован в виде сетевой карты и т.п.) соединен с сетью связи 110 для оценки одного или более подключенных к ней сетевых узлов (как, например, сервер 112). В некоторых неограничивающих вариантах реализации настоящей технологии сеть связи 110 может быть реализована как сеть Интернет. В других вариантах реализации настоящей технологии сеть связи 110 может быть реализована иначе, например, в виде глобальной сети связи, локальной сети связи, частной сети связи и т.п.

[0070] Реализация линии связи (отдельно не пронумерована) между сетевым интерфейсом 108 и сетью связи 110 будет зависеть, помимо прочего, от реализации электронного устройства 102. Исключительно в качестве примера, но не для ограничения, в тех вариантах реализации настоящей технологии, где пользовательское электронное устройство 102 реализовано в виде беспроводного устройства связи (например, смартфона), линия связи может быть реализована как беспроводная линия связи (например, помимо прочего, линия связи по сети 3G, линия связи по сети 4G, Wireless Fidelity, или сокращенно Wi-Fi®, Bluetooth® и т.п.). В тех примерах, где пользовательское электронное устройство 102 реализовано в виде ноутбука, линия связи может быть беспроводной (например, Wireless Fidelity, или сокращенно Wi-Fi®, Bluetooth® и т.п.) или проводной (например, соединение на основе Ethernet).