2571510 - Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении

Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении

Иллюстрации

Показать все

Изобретение относится к области обработки изображений. Техническим результатом является повышение качества исходных фрагментов изображений за счет осуществления фильтрации. Предложен способ обработки изображения документа. Способ включает в себя этап, на котором осуществляют идентификацию при помощи вычислительного устройства, содержащего один или более процессоров, множества изображений фрагментов в пределах изображения документа. Далее согласно способу осуществляют разделение при помощи вычислительного устройства множества изображений фрагментов на множество классов, причем каждый класс из множества классов включает в себя подмножество из множества изображений фрагментов, которые в значительной степени похожи друг на друга, где определение степени похожести одного фрагмента изображения на другой осуществляется на основании заданной меры, определяющей степень сходства между этими фрагментами. 3 н. и 18 з.п. ф-лы, 15 ил.

Реферат

УРОВЕНЬ ТЕХНИКИ

[0001] Текстовое изображение (растровое изображение текста), полученное путем сканирования или фотографирования документа, обычно имеет большое количество искажений и шумов, видимых при чтении с экрана и при печати в большом разрешении. Шум может носить, например, поверхностный характер (отдельные шумовые пиксели вдоль очертания символа). Подобные искажения присущи не только изображениям с текстовой информацией, но также и изображениям с графическим содержанием (схемы, графики, диаграммы и/или другие синтетические изображения).

[0002] Существует несколько решений для улучшения визуального восприятия растрового изображения документа. Например, можно распознать текст в документе и выбрать шрифт, наиболее близкий к исходному. К сожалению, не всегда возможно точно подобрать шрифт, а ошибки распознавания могут привести к подстановке неправильных символов. Более того, распознавание символов требует значительного времени и вычислительных ресурсов. По этим причинам распознавание символов не является практичным решением, когда требуется только улучшение визуального восприятия текста.

[0003] Другим возможным решением является векторизация растрового изображения. Векторизация - это сложный и ресурсоемкий процесс. Кроме того, векторизация не гарантирует, что сохраненный в векторном представлении документ не будет иметь больший размер и/или не будет содержать значительные искажения.

[0004] Еще одним простым подходом является использование метода фильтрации изображения. Существующие методы обычно не дают достаточно хороших результатов, когда применяются на текстовых изображениях. Различные способы локальной обработки, в которых улучшение качества изображения основано на значениях соседних пикселей, не способны обеспечить необходимые результаты.

[0005] Следовательно, существует потребность в способе улучшения изображения документа, который использует особые, недостаточно проработанные подходы в областях обработки изображений и/или компьютерной графики.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0006] Один из вариантов осуществления настоящего описания относится к способу снижения визуально обнаруживаемых дефектов в предварительно полученном изображении документа. Способ включает в себя идентификацию при помощи вычислительного устройства, содержащего один или более процессоров, множества изображений фрагментов в пределах изображения документа. Способ дополнительно включает в себя разделение при помощи вычислительного устройства множества изображений фрагментов на множество классов. Каждый класс из множества классов включает в себя подмножество множества изображений фрагментов, которые в значительной степени похожи друг на друга. Способ дополнительно включает в себя для каждого из множества классов: (1) обработку при помощи вычислительного устройства класса изображений фрагментов для создания комбинированного и существенно увеличенного изображения класса; и (2) фильтрацию при помощи вычислительного устройства комбинированного и существенно увеличенного изображения класса для создания отфильтрованного изображения для класса. Способ дополнительно включает в себя создание при помощи вычислительного устройства улучшенного изображения документа путем замены или изменения изображений фрагментов в пределах изображения документа на основе отфильтрованных изображений для соответствующих классов изображений фрагментов.

[0007] Другой вариант осуществления относится к системе, включающей в себя по меньшей мере одно вычислительное устройство, функционально связанное с по меньшей мере одним устройством памяти. По меньшей мере одно вычислительное устройство выполнено с возможностью идентификации множества изображений фрагментов в пределах изображения документа. По меньшей мере одно вычислительное устройство дополнительно выполнено с возможностью разделения множества изображений фрагментов на множество классов. Каждый класс из множества классов включает в себя подмножество множества изображений фрагментов, которые в значительной степени похожи друг на друга. По меньшей мере одно вычислительное устройство для каждого из множества классов дополнительно выполнено с возможностью: (1) обработки класса изображений фрагментов для создания комбинированного и существенно увеличенного изображения класса; и (2) фильтрации комбинированного и существенно увеличенного изображения класса для создания отфильтрованного изображения для класса. По меньшей мере одно вычислительное устройство дополнительно выполнено с возможностью создания улучшенного изображения документа путем замены или изменения изображений фрагментов в пределах изображения документа на основе отфильтрованных изображений для соответствующих классов изображений фрагментов.

[0008] Другой вариант осуществления относится к машиночитаемому носителю данных, на котором хранятся инструкции, исполнение которых процессором приводит к выполнению процессором операций. Операции включают в себя идентификацию множества изображений фрагментов в пределах изображения документа. Каждый из множества изображений фрагментов представляет собой один отдельный символ или часть отдельного символа. Операции дополнительно включают в себя разделение множества изображений фрагментов на множество классов. Каждый класс из множества классов включает в себя подмножество из множества изображений фрагментов, которые в значительной степени похожи друг на друга, и изображения фрагментов, представляющие одинаковый символ или одинаковую часть символа, сгруппированы в отдельный класс из множества классов. Операции дополнительно включают в себя для каждого из множества классов: (1) нормализацию изображений фрагментов класса для создания нормализованного набора изображений фрагментов класса; (2) обработку нормализованного набора изображений фрагментов класса для создания комбинированного и существенно увеличенного изображения класса; (3) фильтрацию комбинированного и существенно увеличенного изображения класса с использованием по меньшей мере одной из процедур ранговой фильтрации и процедур контурной фильтрации для создания отфильтрованного изображения для класса; (4) изменение каждого изображения фрагмента из нормализованного набора изображений фрагментов класса на основе отфильтрованного изображения для класса; и (5) выполнение обратной нормализации для каждого изображения фрагмента из нормализованного набора изображений фрагментов для создания итогового набора изображений фрагментов для класса. Операции дополнительно включают в себя создание улучшенного изображения документа путем замены или изменения изображений фрагментов в пределах изображения документа на основе изображений фрагментов в итоговом наборе изображений фрагментов для соответствующих классов изображений фрагментов.

[0009] Еще один вариант осуществления настоящего изобретения относится к способу снижения визуально обнаруживаемых дефектов в по меньшей мере части предварительно полученного изображения документа. Способ включает в себя получение выбранного пользователем участка изображения документа с пользовательского устройства ввода. Способ дополнительно включает в себя идентификацию при помощи вычислительного устройства множества изображений фрагментов в пределах по меньшей мере выбранной части изображения документа. Способ дополнительно включает в себя разделение при помощи вычислительного устройства множества изображений фрагментов на множество классов. Каждый класс из множества классов включает в себя подмножество множества изображений фрагментов, которые в значительной степени похожи друг на друга. Способ дополнительно включает в себя для каждого из множества классов: (1) обработку при помощи вычислительного устройства класса изображений фрагментов для создания комбинированного и существенно увеличенного изображения класса; и (2) фильтрацию при помощи вычислительного устройства комбинированного и существенно увеличенного изображения класса для создания отфильтрованного изображения для класса. Способ дополнительно включает в себя создание при помощи вычислительного устройства улучшенной выбранной части путем замены или изменения изображений фрагментов в пределах выбранной части изображения документа на основе отфильтрованных изображений для соответствующих классов изображений фрагментов.

[0010] Другой вариант осуществления относится к системе, включающей в себя по меньшей мере одно вычислительное устройство, функционально связанное с по меньшей мере одним устройством памяти. По меньшей мере одно вычислительное устройство выполнено с возможностью принимать выбранную пользователем часть изображения документа. По меньшей мере одно вычислительное устройство выполнено с возможностью идентификации множества изображений фрагментов в пределах по меньшей мере выбранной части изображения документа. По меньшей мере одно вычислительное устройство дополнительно выполнено с возможностью разделения множества изображений фрагментов на множество классов. Каждый класс из множества классов включает в себя подмножество множества изображений фрагментов, которые в значительной степени похожи друг на друга. По меньшей мере одно вычислительное устройство для каждого из множества классов дополнительно выполнено с возможностью: (1) обработки класса изображений фрагментов для создания комбинированного и существенно увеличенного изображения класса; и (2) фильтрации комбинированного и существенно увеличенного изображения класса для создания отфильтрованного изображения для класса. По меньшей мере одно вычислительное устройство дополнительно выполнено с возможностью создания улучшенной выбранной части путем замены или изменения изображений фрагментов в пределах выбранной части изображения документа на основе отфильтрованных изображений для соответствующих классов изображений фрагментов.

[0011] Еще один вариант осуществления относится к машиночитаемому носителю данных, на котором хранятся инструкции, исполнение которых процессором приводит к выполнению процессором операций. Операции включают в себя получение выбранной пользователем части изображения документа. Операции дополнительно включают в себя идентификацию множества изображений фрагментов в пределах по меньшей мере выбранной части изображения документа. Каждый из множества изображений фрагментов представляет собой один отдельный символ или часть отдельного символа. Операции дополнительно включают в себя разделение множества изображений фрагментов на множество классов. Каждый класс из множества классов включает в себя подмножество множества изображений фрагментов, которые в значительной степени похожи друг на друга. Изображения фрагментов, представляющие одинаковый символ или одинаковую часть символа, группируются в пределах отдельного класса из множества классов. Операции дополнительно включают в себя для каждого из множества классов: (1) нормализацию изображений фрагментов класса для создания нормализованного набора изображений фрагментов класса; (2) обработку нормализованного набора изображений фрагментов класса для создания комбинированного и существенно увеличенного изображения класса; (3) фильтрацию комбинированного и существенно увеличенного изображения класса с использованием по меньшей мере одной из процедур ранговой фильтрации и процедур контурной фильтрации для создания отфильтрованного изображения для класса; (4) изменение каждого изображения фрагмента из нормализованного набора изображений фрагментов класса на основе отфильтрованного изображения для класса; и (5) выполнение обратной нормализации для каждого изображения фрагмента из нормализованного набора изображений фрагментов для создания итогового набора изображений фрагментов для класса. Операции дополнительно включают в себя создание улучшенной выбранной части путем замены или изменения изображений фрагментов в пределах выбранной части изображения документа на основе изображений фрагментов в первых наборах изображений фрагментов для соответствующих классов изображений фрагментов.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0012] Изложенное описание будет более понятным из последующего подробного описания в сочетании с прилагаемыми чертежами, на которых одинаковыми числами обозначены ссылки на одинаковые элементы.

[0013] На РИС. 1 представлен типовой настольный сканер и персональный компьютер, которые используются вместе для преобразования печатных документов в оцифрованные электронные документы сохраненные на запоминающих устройствах и/или в электронной памяти в соответствии с примером осуществления изобретения.

[0014] На РИС. 2 представлена схема работы оптических компонентов настольного сканера, показанного на РИС. 1, в соответствии с примером осуществления изобретения.

[0015] На РИС. 3 представлена общая схема архитектуры различных типов компьютеров и других устройств с процессорным управлением в соответствии с примером осуществления изобретения.

[0016] На РИС. 4 показано цифровое представление отсканированного документа в соответствии с примером осуществления изобретения.

[0017] На РИС. 5 представлена блок-схема способа повышения качества изображения документа в соответствии с примером осуществления изобретения.

[0018] На РИС. 6 представлены участки на изображении, измененные с использованием функции гистограммы в соответствии с примером осуществления изобретения.

[0019] На РИС. 7А представлено бинаризованное изображение в соответствии с примером осуществления изобретения.

[0020] На РИС. 7В представлено бинаризованное изображение, показанное на РИС. 7А, с улучшенным качеством за счет применения способа, представленного на РИС. 5, в соответствии с примером осуществления изобретения.

[0021] На РИС. 8А представлен класс изображений похожих фрагментов, обнаруженных на изображении, в соответствии с примером осуществления изобретения.

[0022] На РИС. 8В представлено усредненное изображение для класса изображений похожих фрагментов, показанных на РИС. 8А, в соответствии с примером осуществления изобретения.

[0023] На РИС. 8С представлено увеличенное изображение класса, полученное из усредненного изображения для класса, показанного на РИС. 8В, в соответствии с примером осуществления изобретения.

[0024] На РИС. 8D представлено улучшенное изображение класса после выполнения дополнительной обработки изображения фрагмента, показанного на РИС. 8С, в соответствии с примером осуществления изобретения.

[0025] На РИС. 9А представлено серое изображение в соответствии с примером осуществления изобретения.

[0026] На РИС. 9В представлено серое изображение, показанное на РИС. 9А, с улучшенным качеством за счет применения способа, представленного на РИС. 5, в соответствии с примером осуществления изобретения.

[0027] На РИС. 10 представлена функциональная схема системы повышения качества изображения в соответствии с примером осуществления.

ПОДРОБНОЕ ОПИСАНИЕ

[0028] Настоящее описание представляет системы и способы, которые можно использовать для улучшения качества изображения с точки зрения визуального восприятия. В некоторых вариантах осуществления изобретения способ может позволять пользователю обрабатывать и сохранять отсканированное или сфотографированное изображение документа так, что текст на изображении визуально улучшается, становясь похожим на цифровой текст. В некоторых вариантах осуществления изобретения обработка изображения документа может выполняться автоматическим способом, например, когда открыт файл с документом. В некоторых вариантах осуществления, улучшения могут быть достигнуты, по меньшей мере частично, за счет увеличения растровых изображений символов и применения серии сглаживающих и ранговых фильтраций к участкам увеличенного изображения.

[0029] В некоторых вариантах осуществления система, приведенная в качестве примера, может выполнять увеличение и фильтрацию для каждого отдельного символа. В некоторых вариантах осуществления может выполняться поиск любых похожих изображений символа (и/или изображений фрагментов) и последующее усреднение их растровых изображений. Система впоследствии может увеличивать и фильтровать усредненные изображения символа. В дальнейшем фрагмент следует понимать как часть изображения, на которой может быть представлен целый символ или его часть и/или часть синтезированного изображения, графика, диаграммы, формулы, графического изображения, фона и т.д.

[0030] Обнаружение и усреднение фрагментов (например, изображений похожих символов) с последующей обработкой усредненных растровых изображений может дать в результате изображения с более высоким качеством, чем обработка каждого фрагмента (например, изображения символа) по отдельности. Изображение, содержащее текст, всегда имеет ограниченный набор символов; следовательно, изображение обычно содержит повторяющиеся символы. В случаях участков синтезированных изображений, неповторяющихся символов и/или фоновых участков изображения могут быть найдены самоподобные области (фрагменты) на изображении.

[0031] Низкое визуальное качество изображения зачастую является результатом разного рода шумов, искажений и/или других дефектов. В некоторых вариантах осуществления изобретения способ обработки изображений может выявлять все экземпляры изображений фрагмента конкретного типа (например, символа или части символа) в пределах полученного изображения. Часто разные экземпляры идентичных или в значительной степени похожих фрагментов (например, конкретного символа) могут быть повреждены по-разному (например, искажения и шумы могут различаться или возникать в разных частях символа). В таких случаях поврежденные символы можно восстановить путем применения специально вычисленной фильтрации, как подробно описано ниже.

[0032] Печатные документы могут быть преобразованы в оцифрованные изображения отсканированных документов с помощью различных средств, включающих в себя электронные оптико-механические сканирующие устройства и цифровые камеры. На РИС. 1 представлен типовой настольный сканер и персональный компьютер, которые используются вместе для преобразования печатных документов в оцифрованные электронные документы для хранения на запоминающих устройствах и/или в электронной памяти. Настольное сканирующее устройство 102 включает в себя прозрачное стеклянное дно 104, на которое лицевой стороной вниз помещается документ 106. Запуск сканирования приводит к получению оцифрованного изображения отсканированного документа, которое может быть передано на персональный компьютер (ПК) 108 для хранения на запоминающем устройстве. Программа, предназначенная для отображения изображения отсканированного документа, может вывести оцифрованное изображение отсканированного документа на экран 110 отображающего устройства ПК 112.

[0033] На РИС. 2 представлена схема работы оптических компонентов настольного сканера, показанного на РИС. 1. Оптические компоненты этого сканера с полупроводниковой светочувствительной матрицей (CCD) расположены под прозрачным стеклянным дном 104. Перемещаемый фронтально источник яркого света 202 освещает часть сканируемого документа 204, которая, в свою очередь, переизлучает и отражает свет вниз. Этот переизлученный и отраженный свет отражается от перемещаемого фронтально зеркала 206 на неподвижное зеркало 208, которое отражает излучаемый свет на массив CCD-элементов 210, генерирующих электрические сигналы пропорционально интенсивности света, поступающего на каждый из них. Цветные сканеры могут включать в себя три отдельных строки или массива CCD-элементов с красным, зеленым и синим фильтрами. Перемещаемые фронтально источник яркого света и зеркало двигаются вместе вдоль документа для получения изображения сканируемого документа. Другой тип сканера, использующего контактный датчик изображения, называется CIS-сканером. В CIS-сканере подсветка документа осуществляется перемещаемыми цветными светодиодами (LED), при этом отраженный свет светодиодов улавливается массивом фотодиодов, который перемещается вместе с цветными светодиодами.

[0034] На РИС. 3 представлена общая схема архитектуры различных типов компьютеров и других устройств, управляемых процессором. Схема архитектуры высокого уровня позволяет описать современную компьютерную систему (например, такую как ПК, представленный на РИС. 1), в которой программы отображения отсканированного документа и программы оптического распознавания символов хранятся на запоминающих устройствах для передачи в электронную память и выполнения одним или более процессорами, что преобразует компьютерную систему в специализированную систему оптического распознавания символов. Компьютерная система содержит один или множество центральных процессоров (ЦП) 302-305, один или более модулей электронной памяти 308, соединенных с ЦП при помощи шины подсистемы ЦП/память 310 или множества шин, первый мост 312, который соединяет шину подсистемы ЦП/память 310 с дополнительными шинами 314 и 316 или другими средствами высокоскоростного взаимодействия, включающими в себя множество высокоскоростных последовательных линий. Эти шины или последовательные линии в свою очередь соединяют ЦП и память со специализированными процессорами, такими как графический процессор 318, а также с одним или более дополнительными мостами 320, взаимодействующими с высокоскоростными последовательными линиями или с множеством контроллеров 322-327, например с контроллером 327, которые предоставляют доступ к различным типам запоминающих устройств 328, электронным дисплеям, устройствам ввода и другим подобным компонентам, подкомпонентам и вычислительным ресурсам.

[0035] На РИС. 4 показано цифровое представление отсканированного документа. На РИС. 4 небольшой участок изображения круглой формы 402, выделенный на примере печатного документа 404, показан в увеличенном виде 406. Соответствующий участок оцифрованного изображения отсканированного документа 408 также представлен на РИС. 4. Оцифрованный отсканированный документ включает в себя данные, которые представляют собой двухмерный массив значений пикселей. В представлении 408 каждая ячейка сетки под символами (такая как, например, ячейка 409) представляет собой квадратную матрицу пикселей. Небольшой участок 410 сетки показан с еще большим увеличением (412 на РИС. 4), при котором отдельные пиксели представлены в виде элементов матрицы (таких как элемент матрицы 414). При таком уровне увеличения края символов выглядят зазубренными, поскольку пиксель является наименьшим элементом детализации, который можно использовать для излучения света заданной яркости. В файле оцифрованного отсканированного документа каждый пиксель представлен фиксированным числом битов, при этом кодирование пикселей осуществляется последовательно. Заголовочная информация, содержащаяся в файле, указывает на тип кодировки пикселей, размерах отсканированного изображения и другую информацию, позволяющую программе отображения оцифрованного отсканированного документа получать данные кодирования пикселей и передавать команды устройству отображения или принтеру с целью воспроизведения двухмерного изображения исходного документа по этим кодировкам. Изображения отсканированных документов, представленных в виде монохромных изображений в оттенках серого, обычно используют 8-разрядное или 16-разрядное кодирование пикселей, в то время как при представлении цветного отсканированного изображения может выделяться 24 или более бит для кодирования каждого пикселя, в соответствии с множеством различных стандартов кодирования цвета. Например, в широко применяемом стандарте RGB для представления интенсивности красного, зеленого и синего цветов используются три 8-разрядных значения, закодированных в рамках 24-разрядного значения. Таким образом, оцифрованное отсканированное изображение по существу представляет собой документ в той же степени, в какой цифровые фотографии представляют визуальные образы. Каждый закодированный пиксель содержит информацию о яркости света в определенных крошечных областях изображения, а для цветных изображений в нем также содержится информация о цвете. В оцифрованном изображении отсканированного документа отсутствует какая-либо информация о значении кодирования пикселей, например указание на то, что небольшая двухмерная зона соседних пикселей представляет собой текстовый символ. Изображение области, содержащей текст, можно преобразовать из пиксельного изображения в растровое при помощи процесса, называемого «бинаризацией», где каждый пиксель представлен либо значением бита «0» (указывающим, что пиксель не содержится в участке текстового символа), либо значением бита «1» (указывающим, что пиксель содержится в участке текстового символа). Обозначение битов является, конечно, произвольным, и можно применять обратные обозначения, когда значение «1» указывает на фон, а значение «0» - на символ.

[0036] В отличие от этого обычный электронный документ, созданный с помощью текстового редактора, содержит различные типы команд рисования линий, ссылки на представления изображений, таких как оцифрованные фотографии, а также текстовые символы, закодированные в цифровом виде. Одним из наиболее часто используемых стандартов для кодирования текстовых символов является стандарт Юникод. В стандарте Юникод обычно применяется 8-разрядный байт для кодирования символов ASCII (американский стандартный код для обмена информацией) и 16-разрядные слова для кодирования символов и знаков множества языков, включая японский, китайский и другие языки с неалфавитными символами. Большая часть вычислительной работы, которую выполняет программа OCR (оптического распознавания символов), связана с распознаванием изображений текстовых символов на оцифрованном изображении отсканированного документа, и с преобразованием изображений символов в соответствующие кодовые комбинации стандарта Юникод. Очевидно, что для хранения текстовых символов стандарта Юникод будет требоваться гораздо меньше места, чем для хранения пиксельных изображений текстовых символов. Кроме того, текстовые символы стандарта Юникод можно редактировать, форматировать с использованием различных шрифтов, а также обрабатывать всеми доступными в текстовых редакторах способами, в то время как оцифрованные изображения отсканированного документа можно изменить только с помощью специальных программ редактирования изображений.

[0037] На начальном этапе преобразования изображения отсканированного документа в электронный документ печатный документ анализируется для определения в нем различных областей. Во многих случаях области могут быть логически упорядочены в виде иерархического ациклического дерева, состоящего из корня, представляющего документ как единое целое, промежуточных узлов, представляющих области, содержащие меньшие области, и конечных узлов, представляющих наименьшие области. Дерево, представляющее документ, включает в себя корневой узел, соответствующий всему документу, и шесть конечных узлов, каждый из которых соответствует одной установленной области. Области можно определить, применяя к изображению разные методы, включая различные типы статистического анализа распределения кодов пикселей или значений пикселей по изображению. Например, в цветном документе фотография может показать большее изменение цвета в области фотографии, также как и более частое изменение значений яркости пикселей по сравнению с областями, содержащими текст.

[0038] Как только начальная стадия анализа определит различные области на изображении отсканированного документа, области, которые с большой вероятностью содержат текст, дополнительно обрабатываются подпрограммами OCR с целью выявления текстовых символов и преобразования их в символы стандарта Юникод или любого другого стандарта кодировки символов. Для того чтобы подпрограммы OCR могли обработать области, содержащие текст, определяется начальная ориентация области, содержащей текст, благодаря чему различные способы сопоставления эталонов могут быть успешно применены подпрограммами OCR для определения текстовых символов. Следует отметить, что изображения документов могут быть не выровнены должным образом в рамках изображений отсканированного документа из-за погрешности в расположении документа на сканере или другом устройстве, создающем изображение, из-за нестандартной ориентации областей, содержащих текст, или по другим причинам. Области, содержащие текст, затем делят на изображения подобластей, содержащие отдельные знаки или символы, после чего эти изображения подобластей, как правило, масштабируются и ориентируются, а изображения символов центрируются внутри этих изображений подобластей для облегчения последующего автоматического распознавания символов, соответствующих изображениям символов.

[0039] Следует понимать, что представленные варианты осуществления, показанные и описанные применительно к РИС. 1-4, приводятся только в качестве примера, и способы, описанные в настоящем документе, не ограничиваются конкретными реализациями, описанными на этих рисунках. В различных вариантах осуществления изображение оригинального документа может быть получено со сканирующего устройства, фотографирующего устройства (например фотокамеры), другого устройства, оснащенного камерой (например мобильных устройств, таких как смартфоны, телефоны, планшетные ПК, ноутбуки и т.п.), из файла, хранимого в памяти компьютерного устройства, из учетной записи электронной почты, из онлайн хранилища или из любого другого источника, из которого может быть получено изображение документа.

[0040] На РИС. 5, показан способ улучшения качества по меньшей мере части изображения (например, изображения, содержащего текст) в соответствии с примером осуществления изобретения. Система обработки изображения может получать или иметь заранее полученное исходное изображение документа (501). В некоторых вариантах осуществления исходное изображение документа может быть заключено в файл данных, полученный системой (например: PDF, TIFF, JPEG, RAW, GIF, BMP, PNG, документ текстового редактора, электронная таблица, набор слайдов презентации и/или любой другой формат файла, способный отображать и/или включать в себя данные в виде изображений). В некоторых вариантах осуществления исходное изображение документа может быть получено от сканирующего устройства, такого как отдельный сканер, многофункциональное устройство или другое устройство, выполненное с возможностью сканирования изображений с печатных поверхностей (например, с бумаги). В различных вариантах осуществления система может получать исходный документ от пользователя системы или от третьего лица (например, лица, не являющегося пользователем системы). В некоторых вариантах осуществления система может получать исходный документ после того, как качество документа снизилось по сравнению с исходным качеством (например, с целью снижения размера файла перед передачей по сети данных, в результате процедуры сканирования сканирующим устройством и т.п.), и процесс, представленный на РИС. 5, может использоваться для по меньшей мере частичного восстановления качества документа. В некоторых вариантах осуществления система может улучшить качество изображения отсканированного документа с дефектами качества или со сниженным качеством исходного (например, бумажного) документа (например, неправильно отсканированного документа) без необходимости в получении исходного документа (например, в случае отсутствия или недоступности исходного документа) и/или без необходимости повторного сканирования с изменением ручных настроек сканирующего устройства (например, изменений настроек для оттенков серого), необходимых для улучшения качества изображения документа.

[0041] Система может быть выполнена с возможностью анализировать изображение и сегментировать изображение на подобные участки фрагментов изображения (502). Система может выполнять поиск самоподобных областей изображения, определяя степень сходства различных областей изображения. В некоторых вариантах осуществления, где часть изображения содержит текст, система может быть выполнена с возможностью сегментирования областей изображения таким образом, чтобы каждая выделенная область содержала отдельный символ. В некоторых вариантах осуществления объединенные сегменты могут покрывать площадь, которая меньше полного исходного изображения. В некоторых вариантах осуществления самоподобные области могут перекрывать друг друга. В некоторых вариантах осуществления система может быстро искать подобные фрагменты на изображении, содержащем текст, путем применения метода или алгоритма грубого оптического распознавания символов (OCR). Система может классифицировать распознанные одинаковые символы как часть отдельного класса символов или изображений фрагментов.

[0042] Для обнаружения подобных фрагментов на изображении может быть выбрана мера, определяющая степень сходства обнаруженных фрагментов. Система может определять в значительной степени похожие фрагменты как часть класса фрагментов, где каждый фрагмент из класса является представителем класса. Система может определять, принадлежат ли фрагменты конкретному классу, по меньшей мере частично на основе того, не превышает ли мера, связанная с фрагментами, пороговое значение для выбранной меры. Размерность класса определяется количеством фрагментов в классе (например, класс размерностью 1 включает в себя один единственный фрагмент, класс размерностью 5 включает в себя пять фрагментов, и т.д.). Неповторяющийся фрагмент (то есть фрагмент, не имеющий самоподобного) может образовать отдельный класс с размерностью 1, таким образом улучшение может быть применено ко всем областям изображения. Каждый класс включает в себя подмножество выявленных в пределах документа фрагментов. Например, первый класс может включать в себя подмножество фрагментов, включающее символ «а», второй класс может включать в себя подмножество фрагментов, включающее символ «b», и т.д.

[0043] В некоторых вариантах осуществления степень сходства обнаруженных фрагментов может определяться при помощи таких мер, как среднеквадратичная мера (MSE от Mean Squared Error) или средне-абсолютная мера (МАЕ от Mean Absolute Error). Такие меры являются простыми, но могут не обеспечивать столь же точную меру степени сходства двух изображений, как может быть получена посредством субъективной оценки.

[0044] В некоторых вариантах осуществления могут использоваться другие меры сходства, например: корреляция двух изображений, расстояние Хаусдорфа (или метрика Хаусдорфа) или различные модификации разных мер. Такие меры, как расстояние Хаусдорфа, являются более точными способами измерения сходства, чем МАЕ, но требуют больших вычислительных ресурсов.

[0045] В некоторых вариантах осуществления на разных стадиях могут использоваться обе меры. Например, в некоторых вариантах осуществления система может использовать такие меры, как МАЕ или MSE, для грубой оценки сходства на первом быстром этапе выявления классов и использовать другие меры (например, более точные меры, такие как расстояние Хаусдорфа) для определения представителей классов.

[0046] В некоторых вариантах осуществления система может выполнять дополнительную обработку обнаруженных подобных фрагментов для нормализации размера, формы и/или других характеристик фрагментов в пределах каждого класса (503). Например, размер и/или форма фрагментов могут быть нормализованы таким образом, что нормализованные фрагменты будут иметь в основном одинаковые размер и/или форму после обработки. Если исходное изображение является цветным или серым, фрагменты можно нормализовать к однородной степени яркости и контраста. В некоторых вариантах осуществления для цветных фрагментов может применяться нормализация оттенков. В некоторых вариантах осуществления система может быть выполнена с возможностью нормализации фрагментов в пределах класса путем использования наст

Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении

Патент 2571510