2640296 - Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) на сервере

Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) на сервере

Иллюстрации

Показать все

Изобретение относится к средствам анализа цифрового изображения документа в вычислительной системе. Технический результат заключается в расширении арсенала технических средств анализа цифрового изображения документа. Вычислительная система, включающая: электронное устройство пользователя; сервер, к которому электронное устройство пользователя имеет доступ через сеть связи, этот сервер настроен на выполнение на сервере обработки OCR цифрового изображения для создания документа с распознанным текстом. В способе, исполняемом электронным устройством пользователя, выполняют этапы: получение пользовательским электронным устройством цифрового изображения документа; анализ с помощью классификатора, исполняемого электронным устройством пользователя, параметра качества OCR сжатого цифрового изображения, которое было получено из цифрового изображения путем использования алгоритма сжатия и параметра сжатия; для параметра качества OCR выше или равного заданному пороговому значению: передачу сжатого цифрового изображения на сервер для выполнения OCR на сервере. 3 н. и 26 з.п. ф-лы, 8 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ

[0001] Настоящая технология относится к осуществляемым на компьютере способам и системам обработки документов в целом и, в частности, к способу и устройству для определения пригодности документа для оптического распознавания символов (OCR) на сервере.

УРОВЕНЬ ТЕХНИКИ

[0002] Печатные документы на естественном языке до сих пор являются широко распространенным средством, используемым для коммуникации между людьми в рамках организаций, а также для распространения информации среди ее потребителей. С появлением повсеместно используемых мощных вычислительных ресурсов, включая персональные вычислительные ресурсы, реализованные в смартфонах, планшетах, ноутбуках и персональных компьютерах, а также с распространением более мощных вычислительных ресурсов облачных вычислительных сервисов, центров обработки данных и корпоративных серверов организаций и предприятий, шифрование и обмен информацией на естественном языке все чаще выполняется в виде электронных документов.

[0003] В отличие от печатных документов, которые по своей сути представляют собой изображения, электронные документы содержат последовательности цифровых кодов символов и знаков естественного языка. Поскольку электронные документы имеют перед печатными документами преимущества по стоимости, возможностям передачи и рассылки, простоте редактирования и изменения, а также по надежности хранения, за последние 50 лет развилась целая отрасль, поддерживающая способы и системы преобразования печатных документов в электронные.

[0004] Вычислительные способы и системы оптического распознавания символов, совместно с электронными сканерами, являются надежными и экономичными средствами получения изображений печатных документов и компьютерной обработки получаемых цифровых изображений содержащих текст документов с целью создания электронных документов, соответствующих печатным.

[0005] С появлением смартфонов, оснащенных камерами, а также других мобильных устройств формирования изображения с процессорным управлением, появилась возможность получения цифровых изображений содержащих текст документов с помощью широкого диапазона различных типов широко распространенных портативных устройств, включая смартфоны, недорогие цифровые камеры, недорогие камеры видеонаблюдения, а также устройства получения изображений, встроенные в мобильные вычислительные приборы, включая планшетные компьютеры и ноутбуки. Кроме того, некоторые из этих устройств имеют память, в которой хранится множество изображений (включая изображения текста и подобные им), к которым пользователь может захотеть применить оптическое распознавание символов OCR).

[0006] Получаемые при помощи таких переносных устройств и приборов цифровые изображения содержащих текст документов могут обрабатываться вычислительными системами оптического распознавания символов, в том числе приложениями оптического распознавания символов в смартфонах, для создания соответствующих электронных документов. Обычно цифровое изображение, полученное с помощью пользовательского электронного устройства, передается по сетям связи на сервер систем оптического распознавания символов для выполнения функции OCR на сервере (в противоположность локально выполняемой функции OCR, которая имеет тенденцию давать результаты OCR более низкого

[0007] скорость передачи цифрового изображения на сервер, а также экономии используемой полосы пропускания, связанной с передачей по сетям связи, при передаче на сервер применяется сжатие цифрового изображения в сжатое цифровое изображение. Сжатие выполняется с помощью кодека, использующего алгоритм сжатия, например, Joint Photographic Experts Group (JPEG) или JPEG 2000. Типичный алгоритм сжатия связан с параметром сжатия, например, коэффициентом сжатия.

[0008] Сервер (i) получает сжатое цифровое изображение, (ii) распаковывает цифровое изображение для получения распакованного цифрового изображения и (iii) исполняет функцию OCR на сервере для создания распознанного текстового документа на основе распакованного цифрового изображения, при этом распознанный текстовый документ содержит текст, сформированный на основе распакованного цифрового изображения. Затем сервер может предать распознанный текстовый документ обратно на электронное устройство пользователя через сеть связи (в исходном или сжатом виде).

[0009] Одной из причин реализации систем оптического распознавания символов с выполнением функций OCR на сервере (в противоположность локально выполняемой функции OCR) является качество цифрового изображения, получаемого с помощью портативных средств получения изображений документов (например, цифровые изображения, получаемые с помощью портативных устройств, ассоциируются с повышенной зашумленностью, оптическим смазом и иными дефектами и недостатками содержащих текст цифровых изображений, полученных с помощью портативных устройств и приборов, например, по сравнению со специальными приборами для сканирования документов).

[0010] Функция OCR на сервере включает предварительную подготовку распакованного цифрового изображения для уменьшения количества артефактов в распакованном цифровом изображении (то есть для уменьшения зашумленности, снижения оптического размытия и т.д.). Также в рамках функции OCR на сервере сервер выполняет высококачественную бинаризацию и процедуры OCR, требующие большого объема вычислений. Некоторые или все из них может быть нецелесообразно реализовывать локально на электронном устройстве пользователя (например, вычислительные мощности, необходимые для этой обработки, могут отсутствовать на электронных устройствах пользователей).

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0011] Задача настоящей технологии заключается в устранении, по меньшей мере, некоторых имеющихся недостатков, присутствовавших на известном уровне техники.

[0012] Варианты реализации настоящей технологии были разработаны на основе мнения изобретателей о том, что на известном уровне техники при имеющихся подходах к передаче сжатых цифровых изображений между электронным устройством пользователя и сервером при выполнении функции OCR на сервере существует, по меньшей мере, одна техническая проблема.

[0013] Не стремясь к ограничению в рамках какой-либо конкретной теории изобретатели считают, что при повышении коэффициента сжатия цифрового изображения для получения цифрового изображения меньшего размера (по сравнению с цифровым изображением) качество сжатого цифрового изображения (а точнее, качество распакованного цифрового изображения, получаемого из сжатого цифрового изображения) вероятно, может ухудшиться. Это в свою очередь потенциально приводит к ухудшению качества результата OCR распакованного цифрового изображения на сервере (что проявляется, например, в большем количестве ошибок в распознаваемом тексте). В то же время изобретатели считают, что может оказаться желательным использовать максимально возможный коэффициент сжатия (для экономии времени передачи и используемой полосы пропускания), все же обеспечивающий оптимальное качество сжатого цифрового изображения (чтобы обеспечить при выполнении функции OCR на сервере возможность получения результата приемлемого качества).

[0014] Изобретатели также считают, что несмотря на возможность передачи сжатого изображения на сервер для выполнения функции OCR на сервере и определения приемлемости полученного результата по качеству (чтобы в случае недостаточного качества результата потребовать от пользователя повторно сгенерировать цифровое изображение документа), такой подход приведет к недопустимым затратам времени на получение приемлемого уровня результата функции OCR на сервере.

[0015] Исходя из этого понимания изобретатели устранили этот недостаток подходов, существующих на имеющемся уровне техники, за счет разработки способа определения на пользовательском электронном устройстве параметра пригодности захватываемого цифрового изображения для OCR (или конкретнее, распакованного цифрового изображения, получаемого из сжатого цифрового изображения, которое получается из цифрового изображения) до передачи сжатого цифрового изображения на сервер. В широком смысле, параметр качества OCR указывает на то, будет ли распакованное цифровое изображение, созданное (или создаваемое) из сжатого цифрового изображения, которое в свою очередь создано (или создается) из цифрового изображения с помощью алгоритма сжатия с параметром сжатия (например, коэффициентом сжатия и т.д.), подходить для получения приемлемого результата при проведении OCR на сервере.

[0016] Варианты реализации настоящей технологии предполагают, что при параметре качества OCR, более или равном заранее определенному пороговому значению, выполняются следующие действия: сжатие цифрового изображения с использованием алгоритма сжатия и параметра сжатия для получения сжатого цифрового изображения и передача сжатого цифрового изображения на сервер для выполнения OCR на сервере.

[0017] С другой стороны, если параметр качества OCR окажется ниже порогового значения, варианты реализации настоящей технологии предполагают потребовать от электронного устройства пользователя повторного получения цифрового изображения печатного документа (например, путем отправки соответствующего сообщения на пользовательское электронное устройство).

[0018] Вместо этого варианты реализации настоящей технологии предполагают итеративно определить такое значение параметра сжатия (например, коэффициента сжатия), который обеспечит, чтобы параметр качества OCR был выше или равен заранее определенному пороговому значению (то есть, чтобы предлагаемый параметр сжатия обеспечивал приемлемый результат OCR на сервере).

[0019] Другими словами, варианты реализации настоящей технологии предназначены для поиска параметра сжатия (например, коэффициента сжатия), который является компромиссом между: (i) обеспечением достаточной скорости передачи по сети связи и/или используемой полосы пропускания и (ii) обеспечением необходимого уровня качества результата OCR, выполняемого над распакованным цифровым изображением, созданным из сжатого цифрового изображения с использованием параметра сжатия.

[0020] В соответствии с первым широким аспектом настоящей технологии обеспечивается способ анализа цифрового изображения документа. Этот способ выполняется в вычислительной системе, которая включает: пользовательское электронное устройство, сервер, доступ к которому с пользовательского электронного устройства осуществляется через сеть связи, этот сервер настроен на выполнение OCR обработки цифрового изображения для создания документа с распознанным текстом на сервере. Способ, выполняемый на пользовательском электронном устройстве, который включает: получение, с помощью пользовательского электронного устройства, цифрового изображения документа; анализ, выполняемым на пользовательском электронном устройстве классификатором, параметра качества OCR, связанного со сжатым цифровым изображением, сжатое цифровое изображение создается из цифрового изображения с использованием алгоритма сжатия и параметра сжатия; если параметр качества OCR выше или равен заранее определенному пороговому значению: передача сжатого цифрового изображения на сервер для выполнения OCR на сервере.

[0021] В некоторых вариантах реализации способа перед передачей способ также включает сжатие цифрового изображения с использованием алгоритма сжатия и параметра сжатия для создания сжатого цифрового изображения.

[0022] В некоторых вариантах реализации способа при параметре качества OCR, более или равном заранее определенному пороговому значению, выполняются следующие действия: сжатие цифрового изображения с использованием алгоритма сжатия и параметра сжатия для получения сжатого цифрового изображения и передача сжатого цифрового изображения на сервер для выполнения OCR на сервере.

[0023] В некоторых вариантах реализации этого способа он дополнительно включает, если параметр пригодности документа для OCR ниже заданного порога, на электронном устройстве пользователя вызывается выполнение повторного получения цифрового изображения..

[0024] В некоторых вариантах реализации способа анализ параметра качества OCR включает: сжатие цифрового изображения с помощью алгоритма сжатия для получения тестового сжатого цифрового изображения, при этом алгоритм сжатия использует параметр сжатия; распаковка тестового сжатого цифрового изображения для создания распакованного тестового цифрового изображения; применение классификатора к распакованному тестовому цифровому изображению для определения параметра качества OCR, при этом параметр качества OCR указывает, можно ли получить приемлемые результаты при OCR на сервере распакованного тестового цифрового изображения, сжатого с использованием соответствующего параметра сжатия.

[0025] В некоторых вариантах реализации способа анализ параметра качества OCR включает: выполнение первого сжатия цифрового изображения с помощью алгоритма сжатия для создания первого тестового сжатого цифрового изображения с использованием первого параметра сжатия; распаковка первого тестового сжатого цифрового изображения для создания первого тестового распакованного цифрового изображения; выполнение второго сжатия цифрового изображения с помощью алгоритма сжатия для создания второго тестового сжатого цифрового изображения с использованием второго параметра сжатия; распаковка второго тестового сжатого цифрового изображения для создания второго тестового распакованного цифрового изображения; применение классификатора к первому распакованному тестовому цифровому изображению для определения первого параметра качества OCR и ко второму распакованному цифровому изображению для определения второго параметра качества OCR; выбор одного из первого параметра сжатия и второго параметра сжатия, исходя из соответствующих первого параметра качества OCR и второго параметра качества OCR, указывающих на лучшую пригодность одного из соответствующих распакованных тестовых цифровых изображений для получения приемлемых результатов OCR на сервере; при этом сжатие цифрового изображения с помощью алгоритма сжатия для получения сжатого цифрового изображения выполняется с использованием параметра сжатия, выбранного из первого параметра сжатия и второго параметра сжатия.

[0026] В некоторых вариантах реализации способа анализ параметра качества OCR, связанного со сжатым цифровым изображением, включает: исполнение классификатора, обученного предсказывать параметр качества OCR для сжатого цифрового изображения, на базе основных характеристик, связанных с цифровым изображением, без сжатия цифрового изображения.

[0027] В некоторых вариантах реализации способа первичные характеристики включают как минимум одну из следующих характеристик: размер шрифта, количество символов, количество символов на страницу, яркость изображения, уровень контрастности изображения.

[0028] В некоторых вариантах реализации способа алгоритм сжатия реализован в виде кодека, выбранного из как минимум одного из следующих вариантов: JPEG и JPEG 2000.

[0029] В некоторых вариантах реализации способа анализ параметра качества OCR, связанного со сжатым цифровым изображением, дополнительно базируется на данных сжатия, полученных из кодека.

[0030] В некоторых вариантах реализации способа классификатор реализуется в виде алгоритма машинного обучения.

[0031] В некоторых вариантах реализации способа он дополнительно включает обучение алгоритма машинного обучения.

[0032] В некоторых вариантах реализации способа анализ параметра качества OCR включает: определение четырех изображений контура; разделение каждого из четырех изображений контура на неперекрывающиеся блоки; определение, для каждого из четырех изображений контуров, средней контрастности; создание бинарного варианта изображения для определения пикселей контура; определение резких пикселей для каждого блока; определение количества пикселей контура для каждого блока; определение блоков текста; определение параметра качества OCR, исходя из блоков текста.

[0033] В некоторых вариантах реализации способа способ также включает выбор этих блоков текста из блоков текста с самым малым размером шрифта, при этом определение параметра качества OCR выполняется для выбранных блоков текста с самым малым размером шрифта.

[0034] В соответствии с еще одним широким аспектом настоящей технологии обеспечивается система анализа цифрового изображения документа. Система включает электронное устройство пользователя, включающее процессор, настроенный на: доступ к серверу через сеть связи, сервер настроен на выполнение OCR цифрового изображения для получения документа с распознанным текстом на сервере; процессор также настроен на: получение цифрового изображения документа; анализ, с использованием исполняемого процессором классификатора, параметра качества OCR сжатого цифрового изображения, причем сжатое цифровое изображение было создано из цифрового изображения с использованием алгоритма сжатия и параметра сжатия; для параметра качества OCR выше или равного заранее определенному предельному значению: передача сжатого цифрового изображения на сервер для выполнения OCR на сервере.

[0035] В некоторых вариантах реализации системы процессор также настроен на сжатие цифрового изображения с использованием алгоритма сжатия и параметра сжатия для создания сжатого цифрового изображения.

[0036] В некоторых вариантах реализации системы процессор также настроен на то, что при параметре качества OCR, более или равном заранее определенному пороговому значению, выполняются следующие действия: сжатие цифрового изображения с использованием алгоритма сжатия и параметра сжатия для получения сжатого цифрового изображения и передача сжатого цифрового изображения на сервер для выполнения OCR на сервере.

[0037] В некоторых вариантах реализации системы процессор также настроен следующим образом: если параметр пригодности документа для OCR ниже заданного порога, на электронном устройстве пользователя вызывается выполнение повторного получения цифрового изображения.

[0038] В некоторых вариантах реализации системы для анализа параметра качества OCR процессор настроен на: сжатие цифрового изображения с помощью алгоритма сжатия для получения тестового сжатого цифрового изображения, при этом алгоритм сжатия использует параметр сжатия; распаковку тестового сжатого цифрового изображения для создания распакованного тестового цифрового изображения; применение классификатора к распакованному тестовому цифровому изображению для определения параметра качества OCR, при этом параметр качества OCR указывает, можно ли получить приемлемые результаты при обработке распакованного тестового цифрового изображения, сжатого с использованием соответствующего параметра сжатия, с помощью функции OCR на сервере.

[0039] В некоторых вариантах реализации системы, для анализа параметра качества OCR процессор настроен на: выполнение первого сжатия цифрового изображения с помощью алгоритма сжатия для создания первого тестового сжатого цифрового изображения с использованием первого параметра сжатия; распаковку первого тестового сжатого цифрового изображения для создания первого тестового распакованного цифрового изображения; выполнение второго сжатия цифрового изображения с помощью алгоритма сжатия для создания второго тестового сжатого цифрового изображения с использованием второго параметра сжатия; распаковку второго тестового сжатого цифрового изображения для создания второго тестового распакованного цифрового изображения; применение классификатора к первому распакованному тестовому цифровому изображению для определения первого параметра качества OCR и ко второму распакованному цифровому изображению для определения второго параметра качества OCR; выбор одного из первого параметра сжатия и второго параметра сжатия, исходя из соответствующих первого параметра качества OCR и второго параметра качества OCR, указывающих на лучшую пригодность одного из соответствующих распакованных тестовых цифровых изображений для получения приемлемых результатов OCR на сервере; при этом сжатие цифрового изображения с помощью алгоритма сжатия для получения сжатого цифрового изображения выполняется с использованием параметра сжатия, выбранного из первого параметра сжатия и второго параметра сжатия.

[0040] В некоторых вариантах реализации системы, для анализа параметра качества OCR, связанного со сжатым цифровым изображением, процессор также настроен на: исполнение классификатора, обученного предсказывать параметр качества OCR, связанный со сжатым цифровым изображением, на основе первичных характеристик, связанных с цифровым изображением, без сжатия цифрового изображения.

[0041] В некоторых вариантах реализации системы первичные характеристики включают как минимум одну из следующих характеристик: размер шрифта, количество символов, количество символов на страницу, яркость изображения, уровень контрастности изображения.

[0042] В некоторых вариантах реализации системы алгоритм сжатия реализован в виде кодека, выбранного из как минимум одного из следующих вариантов: JPEG и JPEG 2000.

[0043] В некоторых вариантах реализации системы для анализа параметра качества OCR, связанного со сжатым цифровым изображением, процессор настроен на использование данных сжатия, полученных из кодека.

[0044] В некоторых вариантах реализации системы классификатор реализуется в виде алгоритма машинного обучения.

[0045] В некоторых вариантах реализации системы процессор дополнительно настроен на обучение алгоритма машинного обучения.

[0046] В некоторых вариантах реализации системы, для анализа параметра качества OCR, процессор настроен на: определение четырех изображений контура; разделение каждого из четырех изображений контура на неперекрывающиеся блоки; определение, для каждого из четырех изображений контуров, средней контрастности; создание бинарного варианта изображения для определения пикселей контура; определение резких пикселей для каждого блока; определение количества пикселей контура для каждого блока; определение блоков текста; определение параметра качества OCR, исходя из блоков текста.

[0047] В некоторых вариантах реализации системы процессор также дополнительно настроен на выбор этих блоков текста из блоков текста с самым малым размером шрифта, при этом определение параметра качества OCR выполняется для выбранных блоков текста с самым малым размером шрифта.

[0048] В соответствии с еще одним широким аспектом настоящей технологии предлагается способ анализа цифрового изображения документа, способ выполняется пользовательским электронным устройством, указанное пользовательское электронное устройство настроено на связь, через сеть связи, с сервером, указанный сервер настроен на выполнение OCR цифрового изображения на сервере для создания документа с распознанным текстом. Указанный способ включает: получение, с помощью пользовательского электронного устройства, цифрового изображения документа; анализ, выполняемым на пользовательском электронном устройстве классификатором, параметра качества OCR, связанного со сжатым цифровым изображением, сжатое цифровое изображение создается из цифрового изображение с использованием алгоритма сжатия и параметра сжатия; при параметре качества OCR выше или равном заранее определенному пороговому значению: передача сжатого цифрового изображения на сервер для выполнения OCR на сервере.

[0049] В контексте настоящего описания под "сервером" понимается компьютерная программа, работающая на соответствующем аппаратном обеспечении и способная получать запросы (например, от электронных устройств) по сети и выполнять эти запросы или обеспечивать выполнение этих запросов. Аппаратное обеспечение может быть представлено одним физическим компьютером или одной физической вычислительной системой, но ни одно из этих устройств не является обязательным требованием для настоящей технологии. В текущем контексте использование выражения "сервер" не означает, что каждая задача (например, полученные инструкции или запросы) или любая конкретная задача будет получена, выполнена или будет обеспечено ее выполнение тем же сервером (т.е. одним программным и/или аппаратным обеспечением); это должно означать, что в получении/отправке, выполнении или обеспечении выполнения любой задачи или запроса или при обработке результатов любой задачи или запроса может быть задействовано любое количество программных элементов или аппаратных устройств; при этом все это программное и аппаратное обеспечение может быть представлено одним или более серверами, при этом выражение "по меньшей мере один сервер" охватывает оба эти понятия.

[0050] В контексте настоящего описания под "электронным устройством" (или "пользовательским электронным устройством") понимается любое вычислительное аппаратное обеспечение, способное выполнять программное обеспечение, необходимое для выполнения поставленной задачи. Таким образом, к некоторым примерам электронных устройств (без ограничения) относятся персональные компьютеры (настольные, ноутбуки, нетбуки и т.д.), смартфоны, планшетные компьютеры и т.д. Необходимо отметить, что не исключается выполнение устройством, действующим в текущем контексте как электронное устройство, функций сервера для других электронных устройств. Использование выражения "электронное устройство" не исключает использования нескольких электронных устройств при получении/отправке, выполнении или обеспечении выполнения любой задачи или запроса или обработке результатов любой задачи или запроса или выполнении любых этапов способа, описанного в настоящем изобретении.

[0051] В контексте настоящего описания под "базой данных" понимается любая структурированная совокупность данных, независимо от конкретной структуры, программного обеспечения для управления базами данных или вычислительного аппаратного обеспечения, на котором данные хранятся, реализуются или иным способом передаются для использования. База данных может храниться на том же аппаратном обеспечении, на котором выполняется процесс или которое использует информацию, хранящуюся в базе данных, или на отдельном аппаратном обеспечении, например, на выделенном сервере или множестве серверов.

[0052] В контексте настоящего описания выражение "носитель машиночитаемых данных" (или "устройство хранения данных") может включать носители любого характера и типа, включая ОЗУ, ПЗУ, диски (CD-ROM, DVD, дискеты, жесткие диски, и т.д.), USB-накопители, твердотельные накопители, ЗУ на магнитной ленте и т.д.

[0053] Для каждого из вариантов реализации настоящей технологии предусмотрен, по меньшей мере, один из указанных выше объектов и/или аспектов, но не обязательно все эти объекты/аспекты одновременно. Необходимо понимать, что некоторые аспекты настоящей технологии, полученные в результате попыток получить указанный выше объект, могут не удовлетворять требованиям этого объекта и/или могут удовлетворять требованиям других объектов, не указанных особо в настоящем документе.

[0054] Дополнительные и/или альтернативные признаки, аспекты и преимущества реализации настоящей технологии станут очевидными из последующего описания, сопроводительных чертежей и прилагаемых пунктов формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0055] Для обеспечения лучшего понимания настоящей технологии, а также иных аспектов и дополнительных признаков, дается ссылка на последующее описание, которое должно использоваться совместно с сопроводительными чертежами, на которых:

[0056] На Фиг. 1 изображена система для реализации неограничивающих вариантов реализации настоящей технологии.

[0057] На Фиг. 2 приведено схематическое представление функций сжатия и распаковки, выполняемое компрессором цифрового изображения в системе на Фиг. 1.

[0058] На Фиг. 3 приведено схематическое представление процесса обучения классификатора пригодности документа для OCR в системе на Фиг. 1.

[0059] На Фиг. 4 приведена блок-схема неограничивающего варианта реализации процесса определения параметра качества OCR, этот процесс выполняется классификатором пригодности для OCR на Фиг. 4.

[0060] На Фиг. 5 показана блок-схема неограничивающего варианта реализации способа определения пригодности документа для OCR на сервере, способ выполняется классификатором пригодности для OCR после обучения в ходе процесса, изображенного на Фиг. 3.

[0061] На Фиг. 6 показана блок-схема первого неограничивающего варианта реализации способа определения пригодности документа для OCR, способ является частью способа, приведенного на Фиг. 5.

[0062] На Фиг. 7 показана блок-схема второго неограничивающего варианта реализации способа определения пригодности документа для OCR, способ является частью способа, приведенного на Фиг. 5.

[0063] На Фиг. 8 показана лицевая сторона электронного устройства системы, изображенной на Фиг. 1, и обратная сторона электронного устройства системы, изображенной на Фиг. 1.

ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ РЕАЛИЗАЦИИ

[0064] На Фиг. 100 представлена структурная схема системы 100, пригодной для неограничивающих вариантов реализации настоящей технологии. Следует отчетливо понимать, что система 100, изображенная на схеме, является исключительно иллюстративным примером настоящей технологии. Таким образом, описание этой системы приводится исключительно как описание иллюстративных примеров настоящей технологии. Настоящее описание не направлено на описание объема или установление границ настоящей технологии. В некоторых случаях, ниже также могут быть описаны полезные примеры изменения системы 100. Это сделано исключительно с целью помочь в понимании и, опять же, не для определения объема или установления границ настоящей технологии. Перечень этих изменений не является исчерпывающим и, насколько это будет понятно специалисту в данной области техники, весьма вероятны и иные изменения. При этом, если изменения не были выполнены (т.е. если не были описаны примеры изменений), не следует это интерпретировать как невозможность изменений, и как то, что описанное решение является единственно возможным для реализации этого элемента настоящей технологии. Специалисту в данной области техники будет понятно, что это, скорее всего, не так. Также следует понимать, что в некоторых случаях система 100 может обеспечивать простые варианты реализации настоящей технологии, и в этом случае они представлены таким образом, чтобы облегчить понимание. Специалисту в данной области техники будет понятно, что различные варианты реализации настоящей технологии могут представлять повышенную сложность.

[0065] Система 100 включает пользовательское электронное устройство 102. Реализация пользовательского электронного устройства 102 не имеет конкретных ограничений, но, в качестве примера, пользовательское электронное устройство 102 может быть реализовано как персональный компьютер (настольные компьютеры, ноутбуки, нетбуки и т.д.), устройство беспроводной связи (например, смартфон, сотовый телефон, планшетный компьютер и т.п.). В представленном на Фиг. 1 варианте реализации пользовательское электронное устройство 102 реализовано в виде смартфона.

[0066] Пользовательское электронное устройство 102 связано с интерфейсом захвата изображения 103. В широком смысле интерфейс захвата изображения 103 включает аппаратное обеспечение (и, при необходимости, связанное с ним программное обеспечение) для захвата цифрового изображения. Цифровое изображение может быть представлено, например, цифровым изображением печатного документа 140, содержащим текст 142 (и потенциально нетекстовые объекты, например, изображение 144). Естественно, печатный документ 140 может содержать одну или более страниц, некоторые или все из одной или более страниц с различным текстом 142, различными изображениями 144, различной разметкой, различными шрифтами, размерами шрифтов и т.д.

[0067] В изображенном на Фиг. 1 варианте реализации интерфейс захвата изображений 103 реализован в виде камеры (следует отметить, что в некоторых вариантах реализации интерфейс захвата изображения 103 может быть реализован как несколько камер, одна или несколько из которых располагаются на лицевой стороне, изображенной на Фиг. 1, и/или одна или несколько из которых расположены на обратной, не показанной стороне пользовательского электронного устройства 102). Кратко рассмотрим Фиг. 8, на которой изображена лицевая сторона электронного устройства 102А и задняя сторона электронного устройства 102В. На лицевой стороне электронного устройства 102А находится передняя камера 103A, а на задней стороне электронного устройства 102В находится задняя камера 103В. Для захвата цифрового изображения печатного документа 140, возможно, будет более удобно использовать заднюю камеру 103В. При этом, если в приведенном ниже описании говорится о "камере", это относится к передней камере 103A или задней камере 103В (или к обеим камерам).

[0068] В альтернативном неограничивающем варианте реализации интерфейс захвата изображения 103 может быть реализован в виде сканера (не изображен) или другого устройства захвата изображения (не изображено) для получения цифровой версии бумажного документа.

[0069] В соответствии со схематическим представлением на Фиг. 1 пользовательское электронное устройство 102 включает процессор 104. Процессор 104 может содержать один или более процессоров и/или один или более микроконтроллеров, выполненных с возможностью запуска инструкций и операций, связанных с работой пользовательского электронного устройства 102. В различных вариантах реализации процессор 104 может быть реализован с одним процессором, несколькими процессорами и/или иными электрическими компонентами, включая одну или более интегрированных схем и печатных плат. Процессор 104 может дополнительно содержать устройство кэш-памяти (не изображено) для временного локального хранения инструкций, данных или адресов компьютеров. В качестве примера, процессор 104 может содержать один или более процессоров или один или более контроллеров, выделенных для определенных задач обработки пользовательского электронного устройства 102, или один многофункциональный процессор или контроллер.

[0070] Процессор имеет доступ к устройству хранения данных 106. Устройство хранения данных 106 может включать один или более носителей данных и в общем обеспечивать хранение данных, машиночитаемых кодов и т.п. В качестве примера, устройство хранения данных 106 может содержать различные материальные машиночитаемые носители данных, в том числе постоянное запоминающее устройство (ПЗУ) и оперативное запоминающее устройство (ОЗУ). Устройство хранения данных 106 может включать одно или более фиксированных устройств хранения в виде, например, жестких дисков (HDD), твердотельных накопителей (SSD), карт флеш-памяти (например, карты Secured Digital или SD, встроенные карты MultiMediaCard или eMMD), а также иных приемлемых форм памяти, связанных по двусторонней связи с процессором 104.

[0071] Устройство хранения данных 106 может хранить, помимо прочего, ряд машиночитаемых команд, которые вызывают выполнение процессором 104 (а также другими компонентами пользовательского электронного устройства 102) различных описанных в настоящем документе операций.

[0072] В различных вариантах реализации настоящей технологии различные компоненты пользовательского электронного устройства 102 могут быть оперативно связаны друг с другом по одной или более шин (включая аппаратное и/или программное обеспечение), при этом шины не имеют отдельной нумерации. В качестве примера, но не в качестве ограничения, одна или более шин могут включать шину ускоренного графического порта - Accelerated Graphics Port (AGP) или иную графическую шину, шину улучшенной архитектуры промышленного стандарта - Enhanced Industry Standard Architecture (EISA), системную шину (FSB), соединение HYPERTRANSPORT (HT), шину архитектуры промышленного стандарта - Industry Standard Architecture (ISA), соединение INFINIBAND, шину с малым числом выводов (LPC), шину памяти, шину микроканальной архитектуры - Micro Channel Architecture (MCA), шину взаимодействия периферийных компонентов

Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) на сервере

Патент 2640296