Способ распознавания печатного текста и устройство для его осуществления

Иллюстрации

Показать все

Реферат

 

,, № И07и i

Класс 42тп, 14,,1

СССР

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

Подписная группа Л9 174

В. М, Цирлин, В. А...Гармаш и В. С. Переверзев-Орлов

СПОСОБ РАСПОЗНАВАНИЯ ПЕЧАТНОГО ТЕКСТА

И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ

Заявлено 26 октяори 1959 г. за № 642219/26 в Комитет ио делам изобретений и открытий при Совете Министров СССР

Оиупликоваио в «Б1оллетеие иаойр.тсиий» № I6 <а 196() г.

Способы машинного чтения буквепногс гскста, использующие топологические методы, известны.

Однако в этих работах для опознания используется матрица связности. для составления которой применяется цифровая вычислительная машина.

Предлагаемый способ распознавания печатного текста (символов) с определением индекса точек (где индекс — число выходяших цз точки дуг), кроме точек с индексом два, отличается от известных l ем. что вместо матрицы связности составляются кодовые комбинации, получающиеся при последовательном определении индексов точек, что существенно облегчает анализ символов.

Предлагаемый способ дает возможность использовать для анализа текста технически более простые средства: считывающий узел, соединенный со схемой следящей развертки и логпческуIo схему, определя1огцую последовательность индексов.

Работа устройства, реализующего предлагаемый способ, поясняется чертежом.

Сущность описываемого способа состоит в следующем. Устанавливается определенное начало обхода внешнего контура (например, нижняя левая часть буквы в строке) и по ходу слежения определяются точки пересечения отрезков и дуг (точки излома контура), Если дуга одна, точке приписывается индекс единица и ей соответствует код «1». Если в точке сходятся две дуги (индекс два), икая точка не учптываетсч

1-1аконец, точкам с индексом больше двух соответствует код «0», Таким образом, при обходе контура полу ается последовательность двоичных цифр (код печатного знака), позволяюгцая разбить исследуемую совокупйость печатных знаков и;. классы (весь алфазит разбивается на 17 классов), каждый из которых будет содержать одну или несколько букв. Разделение знаков внутри к.iасса можно осуществить IIU известным методом опознавания, например, llo методу минимального описания.

Устройство, реализующее предлагаемый способ, работает следуюим об азом. (На чертежах не приведены те узлы, которые не являючся принципиальными и без которых не затрудняется понимание раооты

Луч с экрана электронно-лучевой трубки 1 (фиг. ) п1 . рх на букву. С помощью устройства следящей развертки, содержащего генератор пар ф

2 парафазного напряжения, ключи 8 и 4, накопительные ячейки 5 и 6 и фотоэлемент 7 с усилителем 8, осуществляется продвижение луча по черно-белому контуру знака. B случае нарушения плавности контура, фазовый детектор 9 с ограничителем 10 вырабатывает сигнал, который: а) прекращает накопление (размыкается ключ 11);

) ве. ичивает амплитуду генератора 2 на время одного период".!

° 12 его работы, что достигается с помощью ки!ш-реле в) направляет импульсы, появляющиеся при пересечении 1 ча, сове шающего, с целью определения индекса точки, круговой обход точки с HP60JIb1IIHM p31IHQcoM, c g I I BMH изображения (чеpP3 KJllo

Задача кодирующей схемы - — выдать импульс «1» в случае точки .. индексом единица, не реагировать на точку с индексом два и выдать HMпульс «О» для точки с индексом более двух. (Это могут быть импульс л! разной полярности на одном выходе или импульсы одной полярности на разных выходах).

Так как время !полного опробывания точки равно периоду генератора 2 (фиг. 1), то длительность импульсной группы всегда гюстояппа и не больше этого периода.

Первый импульс кодовой группы запускает кипп-реле 14 (фиг. 2) и через замкнутые ключи 15 и 16 поступает íà три! гер 17, который к этому моменту находится в «нулевом» состоянии, Под действием импульс» триггер перебрасывается в состояние «1». Триггер 18 находится в «ну1 r левом» состоянии. Таким образом, к концу периода выходы триггеров и 18 характеризуются состояниями: первый — «1», второй — «О».

В случае, если импульсная группа содержит два импульса, то первый из них приведет схему в состояние описанное выше, а второй, пройдя через ключи 15 и 16 на триггер 17, перебросит его в «нулевое» состо- яние. Г1ри этом закроется ключ 15 и откроется ключ 19. Итак, к концу периода схема характеризуется следующими состояниями триггеров 17 и 18: первый — «О», второй — «О». В конце периода кипи-реле 14 приведет состояние ключей к исходному, а триггеров к «нулевому», В случае, если импульсная группа имеет более двух импульсов, то первые два осуществят описанное выше, а третий перебросит триггер 18 в состояние «1», разомкнув при этом ключ 15. Импульсы, следующи< после третьего, не смогут вызвать изменения в состояниях триггеров, когорые в этом случае будут в положениях: первый (17) — «О», второй (18) — «1». Как и прежде, в конце периода произойдет восстановление исходного состояния схемы.

Результаты кодирования поступают в схему (на чертеже нс показана) для определения классов, использующую кодовое дерсво для дек11дирования последовательности значений точек.

Предмет ?!зооретенtlя

1. Способ распознавания печатного текста (символов) с опредег1 он !1-, ех! индекс<1 точек (где !1н IOKc — Iltc, lo вьlходяп!их Н3 точки дм! ), кром № l3071! точек с индексом два, отличающийся тем, что, с целью упропцния анализа символов, составляют кодовые комбинации, получающиеся при последовательном определении индексов точек, лежащих в изломах внешнего контура, при его обходе, начиная с фиксированного района, и точке с индексом единица соответствует код «1», а точке с индексом более двух — код «0». . Устройство для осуществления способа по и 1, о т л и ч а ю щ е е с я 7 А1 тем, что в нем применен считывающий узел, соединенный со схемой следящей развертки, а выход его подключен к логи геской схеме определ;— ния индексов.