Способ распознавания графических объектов с использованием принципа целостности

Иллюстрации

Показать все

Изобретение относится к распознаванию графических образов. Его использование позволяет увеличить точность и помехозащищённость распознавания объектов изображения. Способ характеризуется разбиением изображения на области; выделением текстовых и нетекстовых областей; распознаванием объектов; предварительным назначением по крайней мере одной графической конструкции из наименьших единиц изображения в качестве типового элемента для составления распознаваемого объекта; предварительным представлением изображения этого объекта в виде совокупности типовых элементов одного типа с их взаимными пространственно-параметрическими соотношениями. Технический результат достигается благодаря тому, что осуществляют поиск и идентификацию изображения типового элемента; выбор найденного типового элемента для проверки на принадлежность распознаваемому объекту; выдвижение и проверку гипотезы о распознаваемом объекте по изображению из совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений. 2 с. и 23 з.п. ф-лы, 3 ил.

Реферат

Изобретение относится к распознаванию графических образов, в частности к распознаванию нетекстовых объектов и/или текста на изображении документа в электронном виде.

Указанные способы применяют в том числе, но не только при распознавании форм ввода данных, сочетающих типографский и рукописный тексты, и набор специальных ориентиров для осуществления навигации по документу. Это такие документы как опросные листы, анкеты, банковские счета - жесткой или свободной формы расположения полей.

Возможно применение указанных способов для распознавания объектов заданного вида из графического образа в электронной форме.

Из уровня техники известны способы распознавания образов из графического изображения путем сравнения полученного образа объекта как совокупности единичных элементов изображения - точек - с эталонным образом всего объекта или набором разных воплощений объекта, имеющимся в специальном справочнике-классификаторе.

Известен способ распознавания текстовой информации, при котором растровое изображение разбивается на области (блоки), предположительно содержащие изображения печатных символов текста с последующим сопоставлением изображения в блоках с эталонным описанием изображения, содержащимся в одном или нескольких специальных признаковых или растровых классификаторах.

Такой способ реализуется, например, в способе распознавания информации по патенту США № 5680479 (October 21, 1997, Wang, et al.).

Известен аналогичный способ, раскрытый в патенте США № 5684891 (November 4, 1997, Tanaka, et al.). В документе описан способ выполнения сегментации всего изображения для выделения изображения отдельного символа, который по мнению автора позволяет достичь большей достоверности и производительности процесса. Изображение символа, как совокупность точек, сравнивают с эталоном, имеющимся в классификаторе.

Недостатком способа следует считать применение сравнения изображения целого символа с полноразмерным шаблоном.

Технический результат состоит в увеличении точности и помехозащищенности распознавания объектов изображения.

Указанный технический результат достигается предварительным назначением надежно распознаваемых графических конструкций ограниченного числа разновидностей - типовых элементов (типовых графических конструкций) - в качестве элементов, из которых могут состоять распознаваемые объекты.

Указанные типовые элементы состоят из более чем одного наименьшего символа изображения.

Каждый распознаваемый объект описывают, как состоящий из одного или более заранее назначенных типовых элементов, как из частей с указанием их взаимных пространственно-параметрических соотношений. Причем в одном распознаваемом объекте могут присутствовать типовые элементы одного или (более) нескольких видов. Они могут отличаться относительным пространственным расположением, размерами и другими параметрами.

В качестве распознаваемых объектов могут быть графические элементы на изображении, элементы оформления документа, специальные графические элементы, используемые как реперы для навигации по документу, текстовые элементы, в том числе буквы печатного и/или рукописного шрифта.

Сущность изобретения состоит в следующем.

Предварительно назначают элементы одной или более разновидностей, встречающиеся на изображении, - типовые элементы, из которых могут состоять распознаваемые объекты. Например, отрезок прямой, окружность, овал, дуга и др.

Эти типовые элементы отличаются большей надежностью идентификации и распознавания на изображении, вследствие геометрической простоты.

Типовые элементы могут отличаться пространственно-параметрическими соотношениями. Например, для отрезка прямой это может быть длина, угол наклона, толщина линии (относительная или абсолютная); для дуги - это угол, радиус кривизны, ориентация и др.

Типовые элементы могут включать в себя части белого цвета или бесцветные области без черного или цветного изображения.

На фиг.1 показаны примеры простых типовых элементов.

В классификатор (словарь), используемый для распознавания объектов изображения (букв, реперов, др. элементов), заносят описание объекта в виде перечня типовых элементов, из которых состоит объект, их взаимного расположения и пространственно параметрических соотношений.

В классификатор также заносят все возможные варианты реализации изображения распознаваемого объекта, описанные как совокупность типовых элементов вместе с их взаимным расположением и относительными и/или абсолютными размерами. В указанном описании совокупности типовых элементов могут отличаться как составом типовых элементов, так и их пространственно-параметрическими соотношениями. Некоторые из возможных вариантов представления распознаваемого объекта изображения в виде наборов стандартных элементов на примере буквы "В" показаны на фиг.2.

Затем на изображении идентифицируют и распознают типовые элементы.

Выбирают группы типовых элементов. Для каждой группы типовых элементов выдвигают и проверяют гипотезу о принадлежности всех элементов группы в целом к одному предполагаемому объекту, описанному в классификаторе.

При недостаточно надежном результате проверки гипотезы выдвигают и проверяют гипотезу о принадлежности элементов группы в целом к другому предполагаемому объекту, описанному в классификаторе.

После проверки всех гипотез выбирают наиболее вероятный вариант распознаваемого объекта. В случае многозначного результата проверки гипотез используют дополнительную информацию или применяют дополнительные способы распознавания.

Типовые элементы могут образовывать более сложные типовые элементы путем объединения в различные сочетания разных и/или одинаковых элементов с разным взаимным расположением и разными размерами, например крест, - объединение горизонтального и вертикального прямых отрезков.

Примеры сложных типовых элементов показаны на фиг.3.

Описание распознаваемого объекта может быть задано в виде альтернативы, как по составу типовых элементов, так и по их взаимным пространственно-параметрическим соотношениям.

Описание распознаваемого объекта может быть задано в виде интервала для одного или нескольких взаимных пространственно-параметрических соотношений.

Описание распознаваемого объекта может быть задано в виде совокупности типовых элементов, связанных отношениями математической логики, в том числе типа "И", типа "ИЛИ", типа "НЕ".

Взаимосвязи стандартных элементов в распознаваемом объекте могут быть выражены в виде более чем одноуровневой структуры.

Типовые элементы могут содержать элементы белого цвета, а также без цвета.

Изобретение промышленно применимо, поскольку использует для реализации широко известные приемы и математический аппарат.

1. Способ распознавания объектов на изображении в электронной форме, характеризующийся разбиением изображения на области, выделением текстовых и нетекстовых областей, распознаванием объектов, предварительным назначением по крайней мере одной графической конструкции, состоящей более чем из одной наименьшей единицы изображения, в качестве типового элемента, из которого может быть составлен как из частей по крайней мере один распознаваемый объект, предварительным представлением изображения по крайней мере одного распознаваемого объекта в виде совокупности указанных типовых элементов по крайней мере одного типа с их взаимными пространственно-параметрическими соотношениями, отличающийся выполнением следующей процедуры: поиска и идентификации изображения по крайней мере одного типового элемента, выбора по крайней мере одного найденного типового элемента для проверки на принадлежность распознаваемому объекту, выдвижения и проверки гипотезы о распознаваемом объекте по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.

2. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде альтернативы.

3. Способ по п. 1, отличающийся тем, что состав типовых элементов, образующих изображение распознаваемого объекта, задают в виде альтернативы.

4. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде интервала.

5. Способ по п. 1, отличающийся тем, что по крайней мере часть изображения распознаваемого объекта состоит из типовых элементов, связанных отношениями математической логики.

6. Способ по п. 5, отличающийся тем, что этап идентификации изображения распознаваемого объекта как совокупности изображения типовых элементов включает анализ совокупности элементов, связанных отношением типа И, анализ совокупности элементов, связанных отношением типа ИЛИ, анализ совокупности элементов, связанных отношением типа НЕ.

7. Способ по п. 1, отличающийся тем, что взаимосвязи типовых элементов в распознаваемом объекте выражают в виде более чем одноуровневой структуры.

8. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент содержит единицы изображения белого цвета.

9. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент содержит прозрачные единицы изображения.

10. Способ по п. 1 или 2, отличающийся тем, что в случае многозначного результата проверки гипотез используют дополнительную информацию.

11. Способ по п. 1, отличающийся тем, что в случае многозначного результата проверки гипотез применяют дополнительные способы распознавания.

12. Способ по п. 1, отличающийся тем, что типовой элемент может быть составлен из более простых типовых элементов по крайней мере одной разновидности.

13. Способ по п. 1, отличающийся тем, что описание состава и взаимных пространственно-параметрических характеристик распознаваемого объекта в виде типовых элементов помещают в средство хранения и поиска.

14. Способ распознавания текста на изображении документа в электронной форме, характеризующийся разбиением изображения на области, выделением текстовых и нетекстовых областей, выделением областей, содержащих изображения букв, распознаванием букв, предварительным назначением графической конструкции по крайней мере одной разновидности, состоящей из более чем одного минимального элемента изображения, в качестве типового элемента, из которого может быть составлено, как из частей, по крайней мере одно изображение буквы, предварительным представлением изображения по крайней мере одной буквы в виде совокупности указанных типовых элементов одного или более типа с их взаимными пространственно-параметрическими соотношениями, отличающийся выполнением процедуры поиска и идентификации на области, содержащей изображение буквы, изображения по крайней мере одного типового элемента по крайней мере одной разновидности; выбора всех найденных типовых элементов на области, содержащей изображение буквы для проверки на принадлежность букве, выдвижения и проверки гипотезы о виде буквы по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.

15. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде альтернативы.

16. Способ по п. 14, отличающийся тем, что состав типовых элементов, образующих изображение распознаваемого объекта, задают в виде альтернативы.

17. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде интервала.

18. Способ по п. 14, отличающийся тем, что по крайней мере часть изображения распознаваемого объекта состоит из типовых элементов, связанных отношениями математической логики.

19. Способ по п. 18, отличающийся тем, что этап идентификации изображения распознаваемого объекта как совокупности изображения типовых элементов включает анализ совокупности элементов, связанных отношением типа И, анализ совокупности элементов, связанных отношением типа ИЛИ, анализ совокупности элементов, связанных отношением типа НЕ.

20. Способ по п. 14, отличающийся тем, что взаимосвязи типовых элементов в распознаваемом объекте выражают в виде более чем одноуровневой структуры.

21. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент содержит единицы изображения белого цвета.

22. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент содержит прозрачные единицы изображения.

23. Способ по п. 14 или 2, отличающийся тем, что в случае многозначного результата проверки гипотез используют дополнительную информацию.

24. Способ по п. 14, отличающийся тем, что в случае многозначного результата проверки гипотез применяют дополнительные способы распознавания.

25. Способ по п. 14, отличающийся тем, что описание состава и взаимных пространственно-параметрических характеристик распознаваемого объекта в виде типовых элементов помещают в средство хранения и поиска.