2642404 - Способ и устройство для извлечения области изображения

Способ и устройство для извлечения области изображения

Иллюстрации

Показать все

Изобретение относится к средствам выделения области изображения. Технический результат заключается в повышении точности выделения символьной зоны из информационной области. Получают позиции первой информационной области на идентификационном изображении. Определяют вторую информационную область в соответствии с позиционированием первой информационной области. Сегментируют вторую информационную область для получения как минимум одной символьной зоны. 3 н. 8 з.п. ф-лы, 23 ил.

Реферат

[001] По настоящей заявке испрашивается приоритет на основании патентной заявки Китая № 201510726272.4, поданной 30 октября 2015 г., все содержание которой включено в настоящий документ посредством ссылки.

Область техники

[002] Настоящее изобретение в общем смысле относится к технической области обработки изображений, а именно к способу и устройству для извлечения области изображения.

Уровень техники

[003] Автоматическая идентификация удостоверения личности – это технология для распознавания символьной (текстовой) информации на удостоверении личности способами обработки изображений.

[004] Имеющийся уровень техники предлагает способ для автоматической идентификации удостоверения личности, способ предполагает сканирование удостоверения личности при фиксированном расположении сканирующего устройства относительно удостоверения для получения сканированного изображения удостоверения личности; распознавание символов в заранее заданных n областях сканированного изображения, включая, как минимум, имя, пол национальность, дату рождения, адрес и номер гражданского удостоверения личности. Однако все еще имеются сложности в идентификации изображения на удостоверении личности, полученного непосредственно в результате фотографирования.

Раскрытие изобретения

[005] Принимая во внимание предшествующий уровень техники, в изобретении дается описание способа и устройства для извлечения областей. Технические решения заключаются в следующем.

[006] Первый аспект настоящего изобретения представляет собой способ извлечения области изображения, включающий: получение позиции первой информационной области на идентификационном изображении; определение второй информационной области в соответствии с позиционированием первой информационной области; сегментирование второй информационной области для получения как минимум одной символьной зоны.

[007] В альтернативном варианте осуществления изобретения, позиция области представлена координатой вершины, что предполагает определение второй информационной области в соответствии с позицией первой информационной области: вторая информационная область определяется на основе как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций, где под относительным соотношением позиций понимается относительное соотношение позиций между координатами вершин и второй информационной областью.

[008] В альтернативном варианте осуществления изобретения, первой информационной областью является область номера гражданского удостоверения личности на удостоверениях личности (ID) второго поколения, координаты по меньшей мере двух вершин являются координатами двух вершин области номера гражданского удостоверения личности и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения. При этом под определение второй информационной области на основании координата как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций предполагает: определение нижней границы области информации об адресе на основании вертикальной координаты вершины и координат двух вершин, ближайших к области информации об адресе; определение верхней границы области информации об адресе на основании вертикальной координаты ближайшей вершины и предустановленной высоты; определение левой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и первой предустановленной ширины; определение правой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и второй предустановленной ширины и определение области информации об адресе на основании данных о ее нижней границе, верхней границе, левой границе и правой границе

[009] В альтернативном варианте осуществления изобретения сегментирование второй информационной области для получения как минимум одной символьной зоны включает в себя: выполнение бинаризации второй информационной области для получения бинаризированой версии второй информационной области; вычисление первой гистограммы бинаризированной версии второй информационной области в горизонтальном направлении, где первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждой строке; распознавание n строк текстовых областей на основании наборов последовательных рядов в первой гистограмме, причем каждый из наборов последовательных рядов составлен из рядов, в которых суммарное количество пикселей с цветом переднего плана больше, чем первое пороговое значение, а n является положительным целым; вычисление второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей, где n≥i≥1, и i является положительным целым; и распознавание n_iсимвольных зон в соответствии с наборами последовательных столбцов во второй гистограмме, причем каждый и наборов последовательных столбцов состоит из столбцов, у которых суммарное значение цвета переднего плана превышает второе пороговое значение.

[0010] В альтернативном варианте осуществления изобретения, способ может предполагать также: распознавание расстояние между двумя соседними строками текстовой области на основе наборов последовательных рядов первой гистограммы; исключение строки текстовой области, ближайшей к верхнему или нижнему краю второй информационной области, в случае если расстояние между строками превышает третье пороговое значение.

[0011] В альтернативном варианте осуществления изобретения, способ может предполагать также: распознавание межсимвольного расстояния между двумя соседними символьными зонами на основе наборов последовательных колонок во второй гистограмме; распознавание правой из двух соседних символьных зон в качестве первой символьной зоны в текущей строке текстовой области в случае, если две соседние символьные зоны расположены в левой части второй информационной области и межсимвольное расстояние превышает четвертое пороговое значение; а также распознавание левой из двух символьных зон в качестве последней символьной зоны в текущей текстовой области в случае, если две соседние символьные зоны расположены в правой части второй информационной области и межсимвольное расстояние превышает пятое пороговое значение.

[0012] Второй аспект изобретения представляет устройство для извлечения области изображения, включающее: получающий модуль, предназначенный для получения позиции первой информационной области идентификационного изображения; модуль определения, предназначенный для определения второй информационной области на основании позиции первой информационной области; а также модуль распознавания, предназначенный для сегментирования второй информационной области с целью получить как минимум одну символьную зону.

[0013] В альтернативном варианте осуществления изобретения, позиция области представлена координатой вершины, причем модуль определения предназначен для определения второй информационной области на основании координат как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций, где под относительным соотношением позиций понимается относительное соотношений позиций между координатами вершин и второй информационной областью.

[0014] В альтернативном варианте осуществления изобретения, первой информационной областью является область номера гражданского удостоверения личности на удостоверениях личности (ID) второго поколения, координаты по меньшей мере двух вершин являются координатами двух вершин области номера гражданского удостоверения личности, и второй информационной областью является область информации об адресе на удостоверениях личности второго поколения. При этом модуль определения включает: первый субмодуль определения, настроенный на определение нижней границы области информации об адресе на основании вертикальной координаты вершины и координат двух вершин, ближайших к области информации об адресе; второй субмодуль определения, настроенный на определение верхней границы области информации об адресе на основании вертикальной координаты ближайшей вершины и предустановленной высоты; третий субмодуль определения, настроенный на определение левой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и первой предустановленной ширины; четвертый субмодуль определения, настроенный на определение правой границы области информации об адресе на основании горизонтальной координаты любой из двух вершин и второй предустановленной ширины; а также субмодуль сегментации, настроенный на определение области информации об адресе на основании данных о ее нижней границе, верхней границе, левой границе и правой границе.

[0015] В альтернативном варианте осуществления изобретения модуль распознавания предполагает: выполнение бинаризации второй информационной области для получения бинаризированой версии второй информационной области; первый вычислительный субмодуль, настроенный для вычисления первой гистограммы бинаризированной версии второй информационной области в горизонтальном направлении, где первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду; субмодуль распознавания строк, настроенный для распознавания n строк текстовых областей на основании наборов последовательных рядов в первой гистограмме, причем каждый из наборов последовательных рядов составлен из рядов, в которых суммарное количество пикселей с цветом переднего плана превышает первое пороговое значение, а n является положительным целым; второй вычислительный субмодуль, предназначенный для вычисления второй гистограммы для i-й строки текстовой области в вертикальном направлении, причем вторая гистограмма включает: горизонтальную координату каждого столбца пикселей, где n≥i≥1, и i является положительным целым; и распознавание n_iсимвольных зон в соответствии с наборами последовательных столбцов во второй гистограмме, причем каждый и наборов последовательных столбцов состоит из столбцов, у которых суммарное количество пикселей с цветом переднего плана превышает второе пороговое значение.

[0016] В альтернативном варианте осуществления изобретения, устройство может также включать: модуль распознавания рядов, предназначенный для распознавания расстояния между двумя соседними строками текстовой области на основе наборов последовательных рядов первой гистограммы; модуль исключения, предназначенный для исключения из рассмотрения строки текстовой области, ближайшей к верхней или нижней границе второй информационной области, в случае если расстояние между строками превышает третье пороговое значение.

[0017] В альтернативном варианте осуществления изобретения, способ может предполагать также: модуль распознавания межсимвольного расстояния, настроенный для распознавания расстояния между двумя соседними символьными зонами на основе наборов последовательных колонок во второй гистограмме; модуль распознавания текста, настроенный для распознавания правой из двух соседних символьных зон в качестве первой символьной зоны в текущей строке текстовой области в случае, если две соседние символьные зоны расположены в левой части второй информационной области и межсимвольное расстояние превышает четвертое пороговое значение; а также модуль распознавания одиночного символа, настроенный для распознавания левой из двух символьных зон в качестве последней символьной зоны в текущей текстовой области в случае, если две соседние символьные зоны расположены в правой части второй информационной области и межсимвольное расстояние превышает пятое пороговое значение.

[0018] Третий аспект изобретения представляет устройство для извлечения области изображения, включающее: процессор, память для сохранения инструкций, выполняемых процессором; причем процессор настроен для: получения позиции первой информационной области идентификационного изображения; определения позиции второй информационной области на основании позиции первой информационной области и сегментирования второй информационной области с целью получения как минимум одной символьной зоны.

[0019] Технические решения, представленные в осуществлении изобретения, могут включать следующие эффекты:

[0020] Различные варианты осуществления изобретения могут обеспечивать по крайней мере некоторые из следующих положительных эффектов: решаются проблемы, присущие предшествующему уровню техники, связанные с трудностью распознавания информации по изображению удостоверения личности, полученному непосредственно в результате фотографирования, а также связанные с неточным позиционированием первой информационной области на идентификационном изображении; вторая информационная область определяется на основании позиции первой информационной области; вторая информационная область сегментируется до получения по меньшей мере одной символьной зоны. Благодаря определению второй информационной области на основании позиции первой информационной области на идентификационном изображении, а также сегментированию второй информационной области, позиционирование второй информационной области и распознавание символьной зоны в рамках второй информационной области может быть более точным.

[0021] Следует понимать, что как предшествующее общее описание, так и нижеследующее подробное описание являются лишь примерами и не ограничивают настоящее изобретение.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0022] Прилагаемые чертежи, являющиеся частью данной спецификации, иллюстрируют варианты осуществления, соответствующие настоящему изобретению, и, вместе с описаниями, служат для объяснения принципов изобретения.

[0023] ФИГ. 1 представляет собой функциональную схему извлечения области изображения в соответствии с примером осуществления изобретения.

[0024] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0025] ФИГ. 2B представляет собой схему извлечения области изображения в соответствии с иным примером осуществления изобретения.

[0026] ФИГ. 2C представляет собой схематичную диаграмму, иллюстрирующую определение нижней границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0027] ФИГ. 2D представляет собой схематичную диаграмму, иллюстрирующую определение верхней границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0028] ФИГ. 2E представляет собой схематичную диаграмму, иллюстрирующую определение левой границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0029] ФИГ. 2F представляет собой схематичную диаграмму, иллюстрирующую определение правой границы области с информацией об адресе в соответствии с примером осуществления изобретения.

[0030] ФИГ. 2G представляет собой схематичную диаграмму, иллюстрирующую показывает определение области с информацией об адресе в соответствии с примером осуществления изобретения.

[0031] ФИГ. 3A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0032] ФИГ. 3B представляет собой схематичную диаграмму, иллюстрирующую процесс бинаризации второй информационной области в соответствии с примером осуществления изобретения.

[0033] ФИГ. 3C представляет собой схематичную диаграмму, иллюстрирующую расчет первой гистограммы в горизонтальном направлении в соответствии с примером осуществления изобретения.

[0034] ФИГ. 3D представляет собой схематичную диаграмму, иллюстрирующую набор продолжающихся строк в соответствии с примером осуществления изобретения.

[0035] ФИГ. 3C представляет собой схематичную диаграмму, иллюстрирующую расчет второй гистограммы в вертикальном направлении в соответствии с примером осуществления изобретения.

[0036] ФИГ. 3D представляет собой схематичную диаграмму, иллюстрирующую набор продолжающихся столбцов в соответствии с примером осуществления изобретения.

[0037] ФИГ. 4A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0038] ФИГ. 4B представляет собой схематичную диаграмму, иллюстрирующую межстрочный интервал между двумя соседними строками текстовой области в соответствии с примером осуществления изобретения.

[0039] ФИГ. 5A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения.

[0040] ФИГ. 5B представляет собой схематичную диаграмму, иллюстрирующую межстрочный интервал между двумя соседними строками текстовой области в соответствии с иным примером осуществления изобретения.

[0041] ФИГ. 6 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с примером осуществления изобретения.

[0042] ФИГ. 7 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

[0043] ФИГ. 8 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

[0044] ФИГ. 9 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

[0045] ФИГ. 10 представляет собой блок-схему, иллюстрирующую устройство для выделения области изображения в соответствии с иным примером осуществления изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0046] Далее в подробностях будут рассмотрены примерные варианты осуществления изобретения, иллюстрируемые сопровождающими чертежами, со ссылками на сопровождающие чертежи. Дальнейшее описание относится к сопровождающим чертежам, в которых одинаковые номера на разных чертежах обозначают одинаковые или подобные элементы, если не указано иное. Рассмотренные ниже варианты не ограничивают всех возможных вариантов осуществления, соответствующих данному изобретению. Напротив, они представляют собой лишь примеры устройств и способов, соответствующих аспектам, относящимся к настоящему изобретению согласно прилагаемой формуле изобретения.

[0047] ФИГ. 1 представляет собой функциональную схему извлечения области изображения в соответствии с примером осуществления изобретения. Как показано на фиг. 1, способ извлечения области может включать в себя следующие шаги.

[0048] На шаге 101 высчитывается позиция первой информационной области идентификационного изображения.

[0049] Идентификационное изображение – это изображение, полученное непосредственно в результате фотографирования документа, например, изображение удостоверения личности, изображение карточки социального страхования и т. д.

[0050] Под первой информационной областью понимается область, содержащая текстовую информацию, например, область одного из имен, область даты рождения, область информации о поле, область адреса, область идентификационного номера, область органа, выдавшего документ, срока действия и т.д.

[0051] На шаге 102 на основании позиции первой информационной области определяется вторая информационная область.

[0052] Определение позиции второй информационной области трудней, чем позиционирование первой информационной области.

[0053] На шаге 103 вторая информационная область сегментируется до получения как минимум одной символьной зоны.

[0054] Таким образом, способ извлечения области, представленный вариантом осуществления изобретения, предполагающим получение позиции первой информационной области идентификационного изображения, определение позиции второй информационной области в зависимости от позиции первой области и сегментирование второй информационной области до получения как минимум одной символьной зоны, может решить проблемы, характерные для существующего уровня техники и проявляющиеся в сложности распознавания некоторых областей непосредственно сфотографированного идентификационного изображения и неточности позиционирования отдельных информационных областей. Данный способ обеспечивает определение второй информационной области на основе позиции первой информационной области идентификационного изображения и сегментирование второй информационной области, тем самым точно позиционируя вторую информационную область и распознавая символьную зону во второй информационной области.

[0055] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения области изображения в соответствии с иным примером осуществления изобретения. Как показано на фиг. 2A, способ извлечения области может включать в себя следующие шаги.

[0056] На шаге 201 высчитывается позиция первой информационной области на идентификационном изображении, при этом позиция области представлена парой координат вершины.

[0057] Идентификационное изображение – это изображение, полученное непосредственно в результате фотографирования документа, например изображение удостоверения личности, изображение карточки социального страхования и т. д. В других вариантах, при фотографировании документа, в интерфейсе фотографирования используются прямоугольную область наведения. При наведении прямоугольной области на удостоверение личности, пользователь может сфотографировать идентификационное изображение.

[0058] Терминал может принять позицию первой информационной области на идентификационном изображении и получить координаты соответствующих вершин при данной позиции области, в соответствии с позицией первой информационной области. Другими словами, позиция области представлена парой координат вершины.

[0059] Например, приняв в качестве исходной точки верхний левый угол удостоверяющего изображения, верхнюю границу как положительную полуось абсцисс X, левую границу как положительную полуось ординат Y, и, установив, таким образом, систему декартовых координат, можно получить пары координат, относящихся к соответствующим вершинам, а позиция первой информационной области будет также представлена парой координат.

[0060] На шаге 202 на основании как минимум двух вершин первой информационной области и предустановленного относительного соотношения позиций, определяется вторая информационная область, причем под относительным соотношением позиций понимается относительное соотношение координат вершины и второй информационной области.

[0061] Под предустановленным относительным соотношением областей понимается соотношение между координатами вершин первой информационной области и верхней, нижней, левой и правой границами второй информационной области.

[0062] Терминал может определить позицию второй информационной области на основании координат по меньшей мере двух вершин первой информационной области и предустановленного относительного соотношения позиций.

[0063] Альтернативное осуществление предполагает, что первая информационная области включает четыре вершины, при этом здесь не прорабатывается способ выбора конкретных двух вершин из четырех. Альтернативное осуществление предполагает, что чем больше расстояние между двумя вершинами первой информационной области, тем меньше вероятная ошибка при определении второй информационной области.

[0064] На шаге 203 вторая информационная область сегментируется до получения как минимум одной символьной зоны.

[0065] После определения позиции второй информационной области, эта область сегментируется и вычисляется по меньшей мере одна символьная зона. Символьная зона – это зона изображения, содержащая одиночные символы.

[0066] Таким образом, представленный в осуществлении изобретения способ получения позиции первой информационной области, определения на ее основе второй информационной области и ее сегментации до получения как минимум одной символьной зоны может решить проблемы, присущие предшествующему уровню техники, связанные с трудностью распознавания информации по изображению удостоверения личности, полученному непосредственно в результате фотографирования, а также связанные с неточным позиционированием первой информационной области на идентификационном изображении. Благодаря определению второй информационной области на основании позиции первой информационной области на идентификационном изображении, а также сегментированию второй информационной области, позиционирование второй информационной области и распознавание символьной зоны в рамках второй информационной области может быть более точным.

[0067] В альтернативном варианте осуществления, представленном на фиг. 2А, первой информационной областью выступает область номера гражданского удостоверения личности, второй информационной областью является область информации об адресе на удостоверениях личности второго поколения. Вместо шага 202 могут следовать шаги 202а-202е, как показано на фиг. 2B.

[0068] На шаге 202а на основании вертикальной координате вершины, более близкой к области адреса, определяется нижняя граница области адреса.

[0069] Как видно из предустановленного относительного соотношения позиций областей, область информации об адресе находится справа сверху от области номера гражданского удостоверения личности. Таким образом, в соответствии с тем, как используются декартовы координаты, для двух пар координат вершин оказывается, что чем выше вершина, тем меньше вертикальная координата, и при этом более высокая вершина располагается ближе к области информации об адресе. Поэтому горизонтальная линия, которой соответствует вертикальная координата более высокой из двух вершин, служит нижней границей области информации об адресе. Как показано на фиг. 2С, горизонтальная линия, которая соответствует вертикальной координате первой цифры “3” номера гражданского удостоверения личности, выступает нижней границей m1 области информации об адресе.

[0070] На шаге 202b на основании вертикальной координаты ближайшей вершины и предустановленной высоты определяется верхняя граница области адреса.

[0071] Верхняя граница определяется в результате следующих действий: определяется вертикальная координата ближайшей к области адреса вершины, данная вертикальная координата берется в качестве точки отсчета вертикальных координат, производится сдвиг на расстояние, равное предустановленной высоте, и затем горизонтальная линия, проходящая через новое положение вертикальной координаты берется в качестве верхней границы области адреса.

[0072] В альтернативном варианте осуществления предустановленная высота достаточно широка и требует, чтобы область, сдвинутая на расстояние, равное предварительно определенной высоте, закрывала область адреса. Как показано на фиг. 2D, для определения верхней границы, первая цифра “3” номера гражданского удостоверения личности, берется в качестве точки отсчета вертикальных координат, производится движение на высоту h, и горизонтальная линия, соответствующая текущему положению вертикальной координаты, берется в качестве верхней границы m2 области информации об адресе.

[0073] На шаге 202с на основании горизонтальной координаты одной из двух вершин и первой предустановленной ширины определяется левая граница области адреса.

[0074] Левая граница определяется путем выполнения следующих действий: сдвиг влево горизонтальной координаты любой из двух вершин на первую предустановленную ширину, при этом вертикальная линия, на которой в настоящий момент находится горизонтальная координата, берется в качестве ЛЕВОЙ границы области адреса. Как показано на фиг. 2Е, для определения левой границы первая цифра “3” номера гражданского удостоверения личности берется в качестве точки отсчета горизонтальных координат и сдвигается влево на величину r*w, где r – доля в процентах и w – длина области номера гражданского удостоверения личности, после чего вертикальная линия, соответствующая r*m, на которой теперь находится горизонтальная координата, принимается в качестве левой границы m3 области адреса.

[0075] В другом варианте реализации, первая предустановленная ширина отсчитывается от горизонтальной координаты другой вершины. Иными словами, первая предустановленная ширина зависит от того, координаты какой вершины используются.

[0076] В другом варианте осуществления, первая предустановленная ширина является выраженной в процентах долей от длины области номера гражданского удостоверения личности.

[0077] На шаге 202d на основании горизонтальной координаты одной из двух вершин и второй предустановленной ширины определяется правая граница области адреса.

[0078] Правая граница определяется путем выполнения следующих действий: сдвиг горизонтальной координаты любой из двух вершин на вторую предустановленную ширину, при этом вертикальная линия, на которой в настоящий момент находится горизонтальная координата, берется в качестве правой границы области адреса. Как показано на фиг. 2F, для определения правой границы последняя цифра “4” номера гражданского удостоверения личности берется в качестве точки отсчета горизонтальных координат и сдвигается влево на величину d, после чего вертикальная линия, соответствующая r, на которой теперь находится горизонтальная координата, принимается в качестве левой границы m4 области адреса.

[0079] В другом варианте осуществления, вторая предустановленная ширина отсчитывается от горизонтальной координаты другой вершины. Иными словами, первая предустановленная ширина зависит от того, координаты какой вершины используются. Кроме того, при определении правой границы области адреса, горизонтальные координаты некоторых вершин должны быть сдвинуты влево, горизонтальные координаты других вершин должны быть сдвинуты вправо, иными словами, направление сдвига зависит от выбранной вершины, которая определяется описанным выше относительным соотношением позиций.

[0080] В другом варианте осуществления, вторая предустановленная ширина является выраженной в процентах долей от длины области номера гражданского удостоверения личности.

[0081] На шаге 202е, область информации об адресе обрамляется нижней, верхней, правой и левой границами.

[0082] На фиг. 2G показана область адреса, обрамленная нижней, верхней, левой и правой границами, определенными согласно п. 202a-202d.

[0083] Подводя итог, можно сказать, что, определяя верхнюю, нижнюю, левую и правую границы области адреса, в соответствии с координатами вершин в первой информационной области и предустановленным соотношением позиций, способ извлечения области изображения, представленный в осуществлении данного изобретения, может увеличить точность позиционирования при сегментировании по символам во второй информационной области.

[0084] Следует отметить, что получение области номера гражданского удостоверения личности на удостоверениях личности второго поколения, как это показано на фиг. 2B, подробно не описывается, поскольку формат карты гражданского удостоверения достаточно постоянен и соответствующая технология относительно зрелая. В частности, путем извлечения признаков Хаара или других визуальных параметров удостоверения личности второго поколения и последующей обработки полученных данных с помощью алгоритма Adaboost или SVM (Support Vector Machine) получается учебная модель. С помощью учебной модели идентифицируется область номера гражданского удостоверения личности на удостоверениях личности второго поколения, в результате чего определяется позиция этой области.

[0085] В альтернативном варианте осуществления, представленном на фиг. 2А, шаги 203а-203е могут заменять шаг 203, как показано на фиг. 3А.

[0086] На шаге 203а выполняется процесс бинаризации второй информационной области для получения бинаризированной второй информационной области.

[0087] В альтернативном варианте осуществления, берется вторая информационная область, определенная на шаге 202, и выполняется ряд функций предварительной обработки, таких как уменьшение шума, фильтрация, извлечение границ и т. д. Затем на предварительно обработанной второй информационной области проводится процесс бинаризации.

[0088] Под бинаризацией понимаются следующие действия: сравнение значения серого у пикселей во второй информационной области с предустановленным порогом серого; разделение пикселей во второй информационной области на две части: группа пикселей, превышающих предустановленный порог серого и группа пикселей, которые меньше данного порога; преобразование двух групп пикселей в черные и белые и затем получение бинаризированной второй информационной области, как показано на фиг. 3B, текст на фиг. означает: «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле. На фиг. 3B цветной пиксель, расположенный на переднем плане, называется пикселем с цветом переднего плана; а цветной пиксель, расположенный на заднем плане, обозначается как пиксель с цветом заднего плана.

[0089] На шаге 302b производится вычисление первой гистограммы для бинаризованной второй информационной области по горизонтальному направлению, причем первая гистограмма включает: вертикальную координату каждого ряда пикселей и суммарное количество пикселей с цветом переднего плана в каждом ряду пикселей.

[0090] Для расчета первой гистограммы для бинаризированной второй информационной области по горизонтальному направлению, по вертикальной оси гистограммы фиксируется вертикальная координата каждого ряда пикселей, а по горизонтальной оси гистограммы отображается количество пикселей с цветом переднего плана в каждом горизонтальном ряду, как это показано на фиг. 3C, текст на фиг. означает: «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле.

[0091] На шаге 203с распознаются n рядов в текстовой области в соответствии с суммарным количеством пикселей, имеющих цвет переднего плана выше первого порога, где n - положительное целое.

[0092] Ряды текстовой области определяются путем выполнения следующих действий: получение суммарного количества пикселей с цветом переднего плана в каждом ряду пикселей, согласно первой гистограмме; сравнение суммарного количества пикселей с цветом переднего плана в каждом ряду с первым предустановленным порогом и затем определение наборов последовательных рядов в первой гистограмме как рядов текстовой области, где каждый набор последовательных рядов состоит из рядов, в которых суммарное количество пикселей с цветом переднего плана превышает первый порог.

[0093] Последовательным набором рядов называется набор, состоящий из пикселей в m последовательных рядах, в которых суммарное количество пикселей с цветом переднего плана превышает первый порог. Как показано на фиг. 3D, для m рядов пикселей, суммарное количество пикселей с цветом переднего плана, представленное в правой части гистограммы, превышает первый порог, и текстовая область, содержащая m рядов пикселей на удостоверении личности содержит текст ,означающий “ Дадунван №126”, причем текст на фиг. 3D означает «Дадунван №126, поселение Цзиньсин, город Динчжа, район Цзяшань, провинция Чжецзян» и является фактически изображением после процесса бинаризации, а не китайскими символами в общем смысле.

[0094] Каждый набор последовательных рядов распознается как строка текстовой области, и n наборов последовательных рядов

Способ и устройство для извлечения области изображения

Патент 2642404