Способ выделения знаков в строке

Иллюстрации

Показать все

Реферат

 

O n СA =И-Е

H3OSPETEHNSI

Союа Советских

Социалистических

Республик

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

Зависимое от авт. свидетельства №

Заявлено 03. т 111.1970 (¹ 1469665 18-24) с присоединением заявки №

Приоритет

Опубликовано 23.1.1973. Бюллетень ¹ 8

Дата опубликования описания IО.IV.1973

М. Кл. С 06k 9/08

Комитет па делам ивобретений и открытий при Совете Министров

СССР

УДК 621.391.19(088.8) Автор изобретения

В. Г. Калмыков

Институт кибернетики АН Украинской ССР

Заявитель

СПОСОБ ВЫДЕЛЕНИЯ ЗНАКОВ В СТРОКЕ

Изобретение относится к области автоматического чтения печатных и машинописных знаков, расположенных в строке без четких пр об ело в.

В поле зрения читающих устройств обычно помещается не более одного 3tHBIK3. При считывании текста поле зрения движется вдоль строки,дискретным и шагами. На каждом шаге для изображен ия в поле зрения вычисляется ма кси мальная по всем эталонам распознаваемых знаков величина сходства. Символ знака, давшего максимальное сходство, называется предварительным ответом. Из множества предварительных ответов выделяются окончательные ответы распознавания.

Когда поле зрения чиркающего устройства находится в промежуточном положени и между двумя соседними знаками, две прилегаютцие части соседних знаков могут образовать такую конфигурацию (ложный знак), что ее сходство с некоторым эталоном может оказаться довольно больш им, иногда даже ббльшим, чем сходство каждого из прилегающих значков со своим эталоном.

Известен способ выделения знаков в строке, примененный в ч итающем автомате

ЧАРС.

Известный способ основан на предположении, что в окрестности знака наибольшая величина сходства достигается при созпадении изображения со своим эталоном, сходство ложных знаков с эталонами всегда меньше, чем сходство искомых знаков со своими эталонами.

5 Если изображение в поле зрения читающего устройства является искомым, то при дальнейшем продвижении изображения величина сходства, большая, чем найденная, не должна встретиться до тех пор, пока да н10 ное изобра кение не выйдет из поля зреняя.

Если данное изображение является не искомым, а ложным, то при дальнейшем продвижении в пределах расстояния, меньшего, чем ширина знака, может встретиться величина

15 сходства, большая, чем для данного изображения.

По известному способу выделение знаков в строке осуществляется так. В на1чальный момент, когда первый знак строки еще не

20 вошел или,не полностью вошел в поле зрения, запоминается величина сходства и значение промежуточного ответа для изображения, находящегося в поле зрения. При дальнейшем продвижении изображения в поле

25 зрения запомненная величина сходства сравнивается с тетоущей и из них выбирается большая, которая снова запоминается. Если изображение смещается на ширину зна т а прежде, чем запомненная величина сходства

30 заменена большей, то запомненное вместе с

3G7434

65 величиной сходства значение предварительного ответа появляется на выходе читающего устройства в качестве окончательного ответа, а величина сходства забывается. Если величина сходства меняется, то запоиинается также новое, текущее значение ответа. HpoIIecic повторяется до тех пор, пока не распознаны все знаки.

Однако предположение, на котором основан известный способ (сходство ложного значка с эталоном всегда меньше, чем сходство соседнего ичко мого знака со своим эталоном) часто нару.шается даже при незнач|ительном, мало заметном для глаза искажени и знака. Это приводит к ошибкам при автоматическом чтениями те кста.

Цель изобретения — IIoaI IIIIeIIIiHe надежности выделения знаков, имеющих искажения.

Цель достигается путем введения дополнительных операций выделения перво го з на ка в строке по максимуму сходства участко в строки с эталонаMIH начала строки, представляющими последовательность эталона пробела и эталона любого из pBGIIoçíB âBåìûõ знаков, последующей замены черных точек выделен ного знака белыми, нахождения остаточной строки, определе н ия второго знака в процессе по иска начала остаточной cTpoKIH и т. д. до выделения всех знаков в строке.

На фиг. 1 показано искаженное шумами слово «ПНИ» для иллюстрациями известного способа,выделения знаков в строке; на фиг. 2, а, б, в изображены эталоны знаков, применяемые в известном способе; фиг. 3 а, б, в, г, д, е иллюстрирует предлагаемый способ на примере того же искаженного слова; на фиг. 4 а, б, в показаны эталоны знаков, применяемые в предлагаемом способе.

Пример выделения знаков искаженного шумами слова «ПНИ» по известному способу (фиг. 1). Каждый знак занимает на сетчатке семь клеток в ш ирину и семь в высоту. В качестве меры сходства изображен ия и эталона принято расстояние по Хеммингу, т. е. для я змерения величины сходства в каждом случае подсчитывают количество несовпавш их чепурных и белых клеток изображения и этало.на. Чем больше сходство, тем меньше расстояние Хемминга. Чтобы выделить знаки в слове «ПНИ» известным способом, coiBMP.щают вертикаль 0 каждого эталона фиг. 2 с вертикалью 0 строки фиг. 1. Находят минимум расстоя ния по всем эталонам и залоMHIHBIoT его, а также символ знака, для которого это расстояние MHIHHMBJIbHQ. В данном случае минииум расстояния равен 18 для знака «П». Продвигают поле зрения вдоль строки, После первого шага в момент со впадения вертикали 0 эталона с вертикалью 1 строки минимальное расстоя н|ие меньше и равно 16 для знака «П», Запоминают п оследниe значения, забывая первые.

На втором шаге получается минимум расстояния, равный 5 для знака «П». Запоминают этан значения, забывая предыдущие. На шестом шаге расстояние для эталона «П» равно 4,,и снова предыдущие значения заменяются текущ ими. На десятом шахе запоминаются значения расстояния З,для знака «Н», на четырнадцатом шате — 2 для «П». Далее на протяжении семи шагов пе встречается м|инимального расстояния, ме ньшего, чем за помненное, и после двадцать первого. шага в качестве окончательного ответа выдано «П». Дальнейшее ра спознавание и зображения не .имеет смысла.

Выделение знаков в строке по предлагаемому способу состоит в следующем.

В начальный моиент, копда первый знак строки еще не вошел,или не полностью вошел в поле зрения, определяется максимальная по всем эталонам начала строки величина сходства. В качестве предварительного ответа принимается символ знака, входящего в эталон начала строки, давш ий MBIKcH|маль,ное сходство. З начения величины сходсчва и ответа запоминаются,,По мере продвижения поля зрения вдоль строки на каждом шате вычисляется максимальная по всем эталонам величина сходства и сравнивается с запомненной. Большая из них запоминается, меньшая забывается. За,поми нается также предварительный ответ, соответствующий большей величине сходства, Если поле зрения сместилось на величину, равную ширине знака, а за помненные величина сходства и предварительный ответ за это время не изменилиоь, то в качестве окончательного о твета принимается запом ненное значение предварительного ответа,.

После принятия решения об окончательном ответе выделяют остаточную строку, заменяя все точки распознанного изображения белыми. В этот момент выделенная остаточная строка занимает такое положение, что ее первый знак еще полностью не вошел в поле зрения читающего устройства.

Повторяя описанную процедуру нахождения остаточной строки и: начала строки столько ра з, сколько знаков в строке, распознают остальные знаии.

Пример распознавания слова «ПНИ», искаженного шумам и (фиг. 3). Знаки изобра.жены на сетчатке с параметрам и 7Х7. В качестве меры сходства изоб раакения и эталона при нято расстояние по Хеммингу.

Совмещая верти кали 0 эталонов начала строки (фант, 4);и вертикаль 0 на фиг. 3, а, получают мини|мальное расстояние 16 для знака «П». На четвертом шаге м|инимальное расстоян ие оказывается ра вным 5 для знака «П». При .дальнейшем продвижении в течение свми сдвигов расстояние уже не уменьшается, так как на месте эталона пробела появляются части знака «П». На восьмом

367434 шате в поле зрения появляется похожая на зна к «П» конфигурация с минимальным расстоянием до эталона «П», равным 4, т. е. меньшим, чем запомненное. Но расстояние до эталона пробела от совпадающего с ним изображения раино 8. В сумме минимальное по всем эта лонам начала строки расстояние на рассматриваемом шаге равно 13, что больше, чем запомненное. Таким образом, на одиннадцапом шаге (фиг. 3, б) начало строки считается найденным, и окончательный ответ для первого знака — «П».

На фланг. 3, в показа|на о статочная строка после распознавания первого знака. Как видно из пра фика на фиг. 3, г, после нахож-. дения начала остаточной строки получают ответ «Н» на девятнадцатом шаге. Снова вы-, деляют остаточную строиу (фиг. 4, д) и, находя ее начало, получают ответ «И» (фиг. 3, е). Слово «ПНИ» распознано правильно.

Пpедмет изобретения

Способ выделения знаков в строке, заключающийся в том, что изображение знака и считывающий узел перемещают дискретными шагами одно относительно другого, сравнивают изображение знака с эталонами, формируют сигнал сходства, величина которого соответствует степени совпадения знака с

10 эталоном, запоминают сигнал сходства и знак, давший максимальное сходство на текущем шаге, сравнивают сигналы сходства на каждом последующем шаге с запомненной величиной сигнала сходства, при превы1S шенин последующего сигнала сходства его запоминают и формируют сигналы опознавания знака по достижении сигналом сходства максимальной величины, отличающийся тем, что, с целью повышения надежности

20 выделения знаков, имеющих искажения, заменяют черные элементы изображения белым и и повторяют процесс поиска и опознавания следующего знака.

367434

10 го

Отдет И

1Риг.5

Фиг,.Ф

Корректоры: E. Талалаева и 3. Тарасова

Редактор И. Орлова

Типография, пр. Сапунова, 2

f25 фга

p15 70

ô5

Составитель В. Кудрявцев

Техред Л. Грачева

Заказ 803/12 Изд. № 1188 Тираж 647 Подписное

ЦНИИПИ Комитета по делам изобретений и открытий при Совете Министров СССР

Москва, Ж-35, Раушская наб., д. 4/5