2644516 - Способ и устройство для выделения признаков

Способ и устройство для выделения признаков

Иллюстрации

Показать все

Изобретение относится к обработке изображений. Технический результат заключается в выделении гистограммы ориентированных градиентов. Способ выделения изображений, включает в себя: разделение изображения на множество блоков, каждый из блоков состоит из множества ячеек; разложение разреженного сигнала по каждой ячейке с использованием предустановленного словаря D для получения разреженного вектора для каждой ячейки, где предустановленный словарь D представляет собой словарь, определенный с применением к опытному изображению итерационного алгоритма. Выделение Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами, при этом выделение Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами включает в себя: расчет величины и направления градиента каждой ячейки в соответствии с разреженными векторами для получения дескриптора каждой ячейки; получение статистики по соответствующим дескрипторам в каждом блоке для получения Гистограммы ориентированных градиентов каждого блока; получение статистики по Гистограмме ориентированных градиентов каждого блока для получения Гистограммы ориентированных градиентов изображения. 3 н. и 10 з.п. ф-лы, 12 ил.

Реферат

[001] По настоящей заявке испрашивается приоритет на основании патентной заявки Китая № 201510829071.7, поданной 25 ноября 2015 г., все содержание которой включено в настоящий документ посредством ссылки.

Область техники, к которой относится изобретение

[002] Настоящее раскрытие в общем смысле относится к технической области обработки изображений, а точнее - к способу и устройству для выделения признаков.

Уровень техники

[003] Идентификация и распознавание изображений является важной областью исследования в машинном распознавании образов. Самый распространенный способ идентификации и распознавания изображений является выделение какого-либо признака изображения для идентификации и распознавания изображения.

[004] В данной области изображение идентифицируется и распознается путем выделения признака Гистограммы ориентированных градиентов изображения. Способ выделения признака Гистограммы ориентированных градиентов состоит в следующем: расчет градиента каждого пикселя изображения; разделение изображения на множество ячеек, где каждая ячейка состоит из множества пикселей, и каждые n смежных ячеек составляют блок; подсчет статистики Гистограммы ориентированных градиентов всех пикселей в каждой ячейке и определение признака Гистограммы ориентированных градиентов каждого блока в соответствии с гистограммой градиента всех клеток каждого блока; и получение статистики признака Гистограммы ориентированных градиентов изображения для получения признака Гистограммы ориентированных градиентов изображения.

Раскрытие изобретения

[005] С учетом данного факта в данной области в данном раскрытии описываются способ и устройство для выделения признаков. Далее раскрываются технические решения:

[006] В соответствии с первым аспектом настоящего изобретения описывается способ выделения признаков, включая: разделение изображения на множество блоков, где каждый блок состоит из множества ячеек; разложение разреженного сигнала каждой ячейки с использованием предопределенного словаря D для получения разреженного вектора для каждой из ячеек соответственно, где предопределенный словарь D - это словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделение признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами.

[007] В альтернативном варианте осуществления изобретения данный способ может также включать в себя: получение опытного изображения, где опытное изображение включает совокупность категорий множеств образов; выполнение итераций для получения оптимального словаря, такого как предопределенный словарь D с использованием следующей формулы:

где R= [r₁, r_{2, …,}r_C] обозначает разреженную матрицу коэффициентов C опытных изображений, Y обозначает все категории опытных изображений, обозначает расчет количества ненулевых элементов в векторе, T₀ означает заданный верхний разреженный предел, а означает расчет суммы квадратов каждого элемента вектора, а затем возведение этой суммы квадратов в квадрат.

[008] В альтернативном варианте осуществления изобретения данный способ может также включать в себя: разложение разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой ячейки соответственно, включая: установку пикселей в каждой ячейке n*1-мерному вектору; и выполнение, с учетом предустановленного словаря D, разложения разреженного сигнала на векторе в каждой ячейке для получения соответствующего разреженного вектора с использованием следующей формулы:

где y означает вектор в каждой ячейке, x означает разреженный вектор, полученный путем разреженной обработки y с использованием предустановленного словаря D, означает сумму абсолютных значений каждого столбца разреженного вектора x, где каждый разреженный вектор представляет собой m*1-мерный вектор, а предустановленный словарь D - матрицу n*m.

[009] В альтернативном варианте осуществления изобретения выделение Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами может включать: расчет, в соответствии с разреженным вектором, величины и направления градиента каждой ячейки для получения признака каждой ячейки; расчет статистики соответствующих признаков в каждом блоке для получения Гистограммы ориентированных градиентов каждого блока; и получение статистики признака Гистограммы ориентированных градиентов каждого блока для получения Гистограммы ориентированных градиентов изображения.

[0010] В альтернативном варианте осуществления изобретения получение статистических данных Гистограммы ориентированных градиентов каждого блока изображения может включать: каскадирование гистограммы ориентированного градиента каждого блока каждого блока на изображении в матрицу для получения Гистограммы ориентированных градиентов изображения, где каждый столбец матрицы представляет собой признак Гистограммы ориентированных градиентов одного из блоков.

[0011] В альтернативном варианте осуществления изобретения получение статистических данных Гистограммы ориентированных градиентов каждого блока изображения для получения признака Гистограммы ориентированных градиентов изображения может включать: установка Гистограммы ориентированных градиентов каждого блока изображения с первоначального L*1-мерного вектора в матрицу M*N, где каждый блок состоит из пикселей M*N, а L=M*N; и получение Гистограммы ориентированных градиентов изображения в соответствии с установленными Гистограммами ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении.

[0012] В альтернативном варианте осуществления изобретения данный способ может также включать: нормализацию изображения для получения изображения предустановленного размера.

[0013] В соответствии со вторым аспектом настоящего изобретения описывается устройство для выделения признаков, включающий: разделительный модуль для разделения изображения на множество блоков, где каждый блок состоит из множества ячеек; модуль разложения для разложения разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой из ячеек соответственно, где предустановленный словарь D представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделительный модуль для выделения признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами.

[0014] В альтернативном варианте осуществления изобретения устройство может также включать в себя: модуль для получения опытного изображения, где опытное изображение включает совокупность категорий множеств образов; и итерационный модуль для осуществления итерации для получения оптимального словаря в качестве предустановленного словаря D с использованием следующей формулы:

[0015] В альтернативном варианте осуществления изобретения модуль разложения может включать в себя: первый установочный подмодуль для установки пикселей в каждой ячейке по n*1-мерному вектору; и подмодулем разложения сигнала для разложения разреженного сигнала с использованием предустановленного словаря D на векторе в каждой ячейке для получения соответствующего разреженного вектора с использованием следующей формулы:

[0016] В альтернативном варианте осуществления изобретения выделительный модуль может включать в себя: расчетный подмодуль для расчета, в соответствии с разреженным вектором, соответствующих величины и направления градиента каждой ячейки для получения дескриптора каждой ячейки; первого статистического подмодуля для получения статистических данных по соответствующим дескрипторам в каждом блоке для получения признака Гистограммы ориентированных градиентов каждого блока; и второго статистического подмодуля для получения статистических данных признака Гистограммы ориентированных градиентов каждого блока изображения для получения признака Гистограммы ориентированных градиентов изображения.

[0017] В альтернативном варианте осуществления изобретения второй статистический подмодуль может быть настроен для каскадирования признака Гистограммы ориентированных градиентов каждого блока изображения в матрицу для получения признака Гистограммы ориентированных градиентов изображения, где каждый столбец матрицы представляет собой признак Гистограммы ориентированных градиентов одного из блоков.

[0018] В альтернативном варианте осуществления изобретения второй статистический подмодуль может включать: второй установочный подмодуль, настроенный на установку Гистограммы ориентированных градиентов каждого блока изображения с первоначального L*1-мерного вектора к матрице M*N, где каждый блок состоит из пикселей M*N, а L=M*N; и модуля выделения признака, настроенного на получение признака Гистограммы ориентированных градиентов изображения в соответствии с выравненными признаками Гистограммы ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении.

[0019] В альтернативном варианте осуществления изобретения устройство может также включать: обрабатывающий модуль для нормализации изображения для получения изображения предустановленного размера.

[0020] В соответствии с третьим аспектом настоящего изобретения описывается устройство для выделения признаков, включающий: процессор и память для хранения команд, выполняемых процессором; где процессор настроен для разделения изображения на множество блоков, где каждый из блоков состоит из множества ячеек; разложения разреженного сигнала в каждой ячейке с использованием предустановленного словаря D для получения разреженного вектора, для каждой ячейки соответственно, где предустановленный словарь D представляет собой словарь, определенный с использованием итерационного алгоритма по отношению к опытному изображению; и выделения признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами.

[0021] В соответствии с техническими решениями вариантов осуществления изобретения могут быть достигнуты, по крайней мере, некоторые из следующих технических результатов.

[0022] Путем разделения изображения на множество блоков, где каждый из блоков состоит из множества ячеек; разложения разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой из ячеек соответственно, где предопределенный словарь D представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделения признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами может быть решена следующая задача: процесс выделения признака Гистограммы ориентированных градиентов рассчитывается непосредственно с учетом пространственной области изображения, относительно снижающей скорость обнаружения и точность в распознавании изображений. Скорость обнаружения и точность могут быть повышены при распознавании изображений путем выделения признака Гистограммы ориентированных градиентов изображения в частотном интервале.

[0023] Следует понимать, что как предшествующее общее раскрытие, так и нижеследующее подробное раскрытие являются лишь примерами, служат лишь для пояснения и не ограничивают настоящее изобретение.

Краткое описание чертежей

[0024] Прилагаемые чертежи, являющиеся частью данной спецификации, иллюстрируют варианты осуществления, соответствующие настоящему изобретению, и, вместе с описаниями, служат для объяснения принципов изобретения.

[0025] ФИГ. 1 представляет собой функциональную схему, иллюстрирующую способ для выделения признаков в соответствии с примерным вариантом осуществления изобретения.

[0026] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения признаков в соответствии с иным примерным вариантом осуществления изобретения.

[0027] ФИГ. 2B представляет схему, изображающую разделение изображения в соответствии с примерным вариантом осуществления изобретения.

[0028] ФИГ. 2C представляет схему, изображающую разделение изображения в соответствии с другим примерным вариантом осуществления изобретения.

[0029] ФИГ. 2D представляет схему, изображающую установку пикселей ячейки в соответствии с примерным вариантом осуществления изобретения.

[0030] ФИГ. 2E представляет схему, изображающую статистические данные признака Гистограммы ориентированных градиентов в блоке в соответствии с примерным вариантом осуществления изобретения.

[0031] ФИГ. 3А представляет собой функциональную схему, иллюстрирующую способ для выделения признаков в соответствии с примерным вариантом осуществления изобретения.

[0032] ФИГ. 3B представляет схему, изображающую статистические данные признака Гистограммы ориентированных градиентов изображения в соответствии с примерным вариантом осуществления изобретения.

[0033] ФИГ. 4 представляет собой блок-схему, иллюстрирующую устройство для выделения признаков в соответствии с примерным вариантом осуществления изобретения.

[0034] ФИГ. 5 представляет собой блок-схему, иллюстрирующую устройство для выделения признаков в соответствии с другим примерным вариантом осуществления изобретения.

[0035] ФИГ. 6 представляет собой блок-схему, иллюстрирующую подмодули устройства для выделения признаков в соответствии с примерным вариантом осуществления изобретения.

[0036] ФИГ. 7 представляет собой блок-схему, иллюстрирующую устройство для выделения признаков в соответствии с другим примерным вариантом осуществления изобретения.

Раскрытие изобретения

[0037] Далее в подробностях будут рассмотрены примерные варианты осуществления изобретения, иллюстрируемые сопровождающими чертежами. Дальнейшее описание относится к сопровождающим чертежам, в которых одинаковые номера на разных чертежах обозначают одинаковые или подобные элементы, если не указано иное. Варианты осуществления, рассмотренные в нижеследующем описании примерных вариантов осуществления изобретения, не представляют собой все возможные варианты осуществления, соответствующие настоящему изобретению. Напротив, они представляют собой лишь примеры устройств и способов, соответствующих аспектам, относящимся к настоящему изобретению согласно прилагаемой формуле изобретения.

[0038] ФИГ. 1 представляет собой функциональную схему, иллюстрирующую способ для выделения признаков в соответствии с примерным вариантом осуществления изобретения. Как показано на ФИГ. 1, вариант осуществления изобретения использует способ, реализуемый с помощью аппаратных средств, для распознавания изображений в качестве примера, при этом данный способ может включать в себя следующие шаги.

[0039] На шаге 102 изображение разделяется на множество блоков, в котором каждый из блоков состоит из множества ячеек.

[0040] На шаге 104 производится разложение разреженного сигнала в отношении каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой из ячеек соответственно.

[0041] Предустановленный словарь представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению.

[0042] Разложение разреженного сигнала относится к конвертации данного наблюдаемого сигнала в разреженный вектор в соответствии с предустановленным словарем D, где множество элементов разреженного вектора нулевое.

[0043] В варианте осуществления изобретения пиксели в каждой ячейке берутся как данный наблюдаемый сигнал, конвертируемый в соответствующий разреженный вектор, в соответствии с предустановленным словарем D, а затем соответственно получается разреженный вектор, соответствующий каждой из ячеек.

[0044] На шаге 106 признак Гистограммы ориентированных градиентов изображения выделяется в соответствии с разреженным вектором.

[0045] признак Гистограммы ориентированных градиентов изображения выделен в соответствии с разреженным вектором, полученным в результате разложения разреженного сигнала.

[0046] Таким образом, путем разделения изображения на множество блоков, где каждый из блоков состоит из множества ячеек; разложения разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектор для каждой из ячеек соответственно, где предопределенный словарь D представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделения Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами, использование способа, описанного в варианте осуществления изобретения может решить проблему, связанную с тем, что скорость обнаружения и точность относительно низки при распознавании изображений в силу того, что процесс выделения Гистограммы ориентированных градиентов рассчитывается непосредственно с учетом пространственной области изображения. Благодаря использованию данного способа скорость обнаружения и точность могут быть повышены при распознавании изображений путем выделения признака Гистограммы ориентированных градиентов изображения в частотном интервале.

[0047] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения признаков в соответствии с иным примерным вариантом осуществления изобретения. Как показано на ФИГ. 2A, вариант осуществления изобретения использует способ, реализуемый с помощью аппаратных средств, для распознавания изображений в качестве примера, при этом данный способ может включать в себя следующие шаги.

[0048] На шаге 201 изображение нормализуется для получения предустановленного размера.

[0049] Распознавание изображений обычно включает в себя выделение признаков множества изображений. Перед выделением признаков изображений терминал может осуществить нормализацию изображений для трансформации изображений разных размеров в изображения предустановленного размера для осуществления унифицированной обработки опытных образцов.

[0050] На шаге 202 получается опытное изображение, где опытное изображение включает в себя совокупность категорий множеств образов.

[0051] Терминал может получить опытное изображение из библиотеки опытных изображений, где опытные изображения включают в себя совокупность категорий настроек изображений, таких как распознавание лиц, тел или транспортных средств, и не дополняются в настоящем изобретении.

[0052] В качестве альтернативы, после получения опытных изображений терминал может осуществить их нормализацию для трансформации изображений разных размеров в изображения предустановленного размера для осуществления унифицированной обработки опытных образцов.

[0053] На шаге 203 может быть получен оптимальный словарь, принятый как предустановленный словарь D, путем итерационного использования следующей формулы:

[0054] Алгоритм K-SVD может обеспечить получение словарем информации в опытных изображениях посредством итерационного процесса, использующего разреженные коэффициенты обозначения для обновления элементов словаря. Посредством непрерывной итерации в итоге получается набор элементов словаря, которые могут отражать признаки изображения, а именно предустановленный словарь D, где элементы относятся к элементам словаря. То есть окончательный предустановленный словарь представляет собой оптимальный словарь, полученный путем получения информации опытными изображениями.

[0055] Итерационный процесс алгоритмов K-SVD следующий: предполагая, что имеется X категорий опытных изображений, для i-й категории даны Ni опытных изображений. Все опытные изображения i-й категории представлены матрицей , и опытные изображения всех категорий представлены . Используя вышеприведенные формулы для получения информации от опытных изображений, в итоге мы получим оптимальный предустановленный словарь D.

[0056] На шаге 204 изображение разделяется на множество блоков, в котором каждый из блоков состоит из множества ячеек.

[0057] В качестве альтернативы, разделение нормализованного изображения терминалом может происходить так: разделение изображения на множество блоков, а затем - разделение каждого из блоков на множество ячеек.

[0058] В качестве альтернативы, разделение нормализованного изображения терминалом может происходить так: разделение изображения на множество ячеек, а затем - объединение смежных ячеек в блоки, состоящие из множества ячеек. Например, блок может состоять из четырех смежных парных ячеек, объединенных в форме китайского иероглифа “”.

[0059] В варианте осуществления изобретения, в процессе разделения изображения, разделение на блоки может производиться перед разделением на ячейки, и наоборот. Порядок выполнения не имеет конкретных ограничений.

[0060] Например, изображение 20 размером 128 пикселей*128 пикселей может быть сначала разделено на непересекающиеся блоки 21 размером 16 пикселей*16 пикселей, затем каждый из блоков 21 размером 16 пикселей*16 пикселей разделяется на ячейки 22 размером 8 пикселей*8 пикселей, таким образом, изображение включает 8*8=64 непересекающихся блоков 21, а каждый из блоков состоит из 2*2=4 ячеек, как показано на ФИГ. 2B.

[0061] Например, изображение 20 размером 128 пикселей*128 пикселей сначала разделяется на пересекающиеся блоки 23 размером 16 пикселей*16 пикселей, а затем каждый из блоков 23 размером 16 пикселей*16 пикселей разделяется на ячейки 24 размером 8 пикселей*8 пикселей, таким образом, изображение включает 16*16=256 пересекающихся блоков 23, а каждый из блоков состоит из 2*2=4 ячеек, как показано на ФИГ. 2С.

[0062] На шаге 205 пиксели в каждой ячейке устанавливаются по n*1-мерному вектору.

[0063] После разделения изображения пиксели в каждой ячейке могут рассматриваться как матрица, и матрица, соответствующая пикселям в каждой ячейке, может быть выровнена по n*1-мерному вектору. В процессе установки матрицы второй столбец K₂27 в матрице 25, соответствующий пикселям, каскадируется так, чтобы располагаться под первым столбцом K₁26, а третий столбец (не показан на ФИГ.) в матрице 25, соответствующий пикселям, располагается каскадом так, чтобы находиться под вторым столбцом K₂27, и так далее. Таким образом, матрица 25, соответствующая пикселям в каждой ячейке, устанавливается по n*1-мерному вектору 28, как показано на ФИГ. 2D.

[0064] На шаге 206 векторы в каждой ячейке зависят от разложения разреженного сигнала для получения соответствующих разреженных векторов с использованием следующей формулы:

где y означает векторы в каждой ячейке, x означает разреженные векторы, полученные путем разреженного разложения в отношении y с использованием предустановленного словаря D, означает сумму абсолютных значений каждого столбца разреженного вектора x, где каждый разреженный вектор представляет собой m*1-мерный вектор, а предустановленный словарь D - матрицу n*m.

[0065] Для каждой ячейки изображения терминал может получить оптимальный предустановленный словарь D путем итерационного расчета и принять векторы в каждой ячейке как данные наблюдаемые сигналы y, а затем определить разреженный вектор x для векторов в каждой ячейке с использованием оптимального предустановленного словаря D с использованием приведенной выше формулы. Поскольку выровненные векторы в каждой ячейке являются n*1-мерными, а предустановленный словарь D, полученный путем итерационного расчета терминалом, представляет собой матрицу n*m, то разреженный вектор, определенный по приведенной выше формуле, соответствующий векторам в каждой ячейке, является m*1-мерным.

[0066] На шаге 207 рассчитываются величина и направление градиента каждой ячейки в соответствии с разреженными векторами для получения дескриптора каждой ячейки.

[0067] Терминал может рассчитать поперечный и продольный градиенты каждого пикселя в каждой ячейке, зависящие от разложения разреженного сигнала с использованием оператора градиента.

[0068] То есть для каждого элемента разреженного вектора, соответствующего каждой ячейке, рассчитываются поперечный и продольный градиенты с использованием оператора градиента.

[0069] Например, типичные операторы градиента представлены в таблице 1 ниже:

Таблица 1

Тип маски	Центральный вектор	Нецентральный вектор	Вектор коррекции внимания	Диагональ	Оператор Собела
оператор	[1 0 -1]	[1 -1]	[1 8 0 -8 -1]

[0070] В варианте осуществления изобретения при расчете градиента пикселей в каждой ячейке может быть выбран любой оператор градиента в Таблице 1 или другие операторы градиента. Выбор оператора градиента не имеет конкретных ограничений в варианте осуществления изобретения.

[0071] Допуская, что поперечный градиент элемента на разреженном векторе представляет собой H(x, y), а продольный градиент - V(x, y), то направление и величина градиента, соответствующие элементу, могут быть рассчитаны по формулам (1) и (2), приведенным ниже:

(1)

(2)

где - направление градиента элемента (x, y) на разреженном векторе, а m(x, y) - величина градиента элемента (x, y).

[0072] Направление градиента варьируется от -90 градусов до 90 градусов. Направление градиента разделяется равномерно на z зон, и все элементы на разреженном векторе, соответствующие каждой ячейке, подсчитываются на основании веса m(x, y) в соответствующей отделенной зоне для получения z-мерного вектора для каждой ячейки в результате, таким образом, получается дескриптор для каждой ячейки.

[0073] Например, направление градиента равномерно разделяется на 9 зон, где угол, соответствующий каждой зоне, составляет 20 градусов; и все элементы в каждой ячейке подсчитываются на основании веса m(x, y) в соответствующих 20 градусах для получения в итоге 9-мерного вектора для каждой ячейки.

[0074] Количество зон, на которые разделяется направление градиента, не имеет конкретных ограничений в варианте осуществления изобретения.

[0075] На шаге 208 подсчитываются соответствующие дескрипторы в каждом блоке для получения Гистограммы ориентированных градиентов каждого блока.

[0076] Терминал определяет статистические данные дескрипторов, полученных для соответствующих ячеек, составляющих каждый блок, для получения Гистограммы ориентированных градиентов каждого блока.

[0077] При подсчете статистических данных всех дескрипторов, полученных для соответствующих клеток, терминал может располагать дескрипторы каскадом по отношению к соответствующим ячейкам, таким образом, Гистограммы ориентированных градиентов может быть вектором, причем размер вектора k-кратен размеру дескриптора, соответствующего ячейкам, составляющим блок.

[0078] Например, дескриптор в соответствующих ячейках представляет собой 9-размерный вектор, а каждый блок включает 4 ячейки. 9-мерные дескрипторы в 4 ячейках располагаются каскадом для образования 36-мерного вектора, представляющего собой гистограмму ориентированного градиента соответствующего блока.

[0079] На шаге 209 определяется Гистограммы ориентированных градиентов соответствующих блоков для получения Гистограммы ориентированных градиентов изображения.

[0080] Терминал определяет Гистограммы ориентированных градиентов соответствующих блоков для получения Гистограммы ориентированных градиентов изображения. Гистограммы ориентированного градиента соответствующих блоков изображения располагаются каскадом для образования матрицы и получения Гистограммы ориентированных градиентов изображения, где каждый столбец матрицы представляет собой Гистограмму ориентированных градиентов одного блока.

[0081] Например, изображение состоит из K блоков, и признак Гистограммы ориентированных градиентов каждого блока - K_i, тогда Гистограммы ориентированных градиентов K_i располагаются каскадом для образования матрицы 250, в которой K₁располагается в первом столбце 26 расположенной каскадом матрицы, K₂располагается во втором столбце 27 расположенной каскадом матрицы, и так далее, как показано на ФИГ. 2E.

[0082] Таким образом, путем получения опытных изображений, обладающих множеством категорий множеств образов; используя формулу итерации для получения оптимального словаря D; разделяя изображение на множество блоков, где каждый из блоков состоит из множества ячеек; устанавливая пиксели в каждой ячейке по n*1-мерному вектору; осуществляя разложение разреженного сигнала каждой ячейки с использованием формулы для получения соответствующего разреженного вектора; рассчитывая величину и направление градиента для каждой ячейки в соответствии с разреженным вектором для получения дескриптора для каждой ячейки; и получая статистические данные по соответствующим дескрипторам в каждом блоке для получения Гистограммы ориентированных градиентов изображения, способ выделения признаков, представленный в варианте осуществления настоящего изобретения, может решить проблему, связанную с тем, что скорость обнаружения и точность относительно низки при распознавании изображений в силу того, что процесс выделения признака Гистограммы ориентированных градиентов рассчитывается непосредственно с учетом пространственной области изображения. Благодаря использованию данного способа скорость обнаружения и точность могут быть повышены при распознавании изображений путем выделения признака Гистограммы ориентированных градиентов изображения в частотном интервале.

[0083] На основании альтернативного варианта осуществления изобретения, показанного на Фиг. 2A, в процессе получения статистических данных Гистограмм ориентированных градиентов соответствующих блоков изображения для получения Гистограммы ориентированных градиентов она может быть расположена с учетом соответствующего положения на изображении. Шаг 209 может быть заменен шагами 209a и 209b, как показано на ФИГ. 3A.

[0084] На шаге 209a Гистограммы ориентированных градиентов каждого блока объединяются в матрицу M*N с первоначального L*1-мерного вектора, при этом каждый блок состоит из M*N пикселей, а L=M*N.

[0085] Гистограмма ориентированных градиентов каждого блока представляет собой L*1-мерный вектор, полученный путем расположения каскадом дескрипторов, соответствующих каждой ячейке. Терминал приводит L*1-мерный вектор в соответствие с матрицей M*N, то есть L*1-мерный вектор в каждом блоке приводится в соответствие с соответствующей матрицей в соответствии с входящими в него ячейками, где каждый столбец соответствующей матрицы является дескриптором ячейки; а затем дескрипторы каждой ячейки устанавливаются в соответствии с пикселями, где каждый столбец выровненной матрицы представляет собой Гистограмму ориентированных градиентов, соответствующую пикселям соответствующего столбца в соответствующем блоке.

[0086] На шаге 209b получаем гистограмму ориентированного градиента изображения в соответствии с выровненными гистограммами ориентированного градиента каждого блока и соответствующим положением каждого блока на изображении.

[0087] В соответствии с выровненными Гистограммами ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении, получаем Гистограмму ориентированных градиентов положения соответствующих пикселей изображения.

[0088] Например, изображение состоит из K блоков, и Гистограммы ориентированных градиентов соответствующих блоков представляют собой K_i, таким образом, Гистограммы ориентированных градиентов K_i объединяются в матрицу M*N. Матрица 31, составленная K₁, помещается на соответствующую позицию первого блока 32 на изображении, матрица 33, составленная из K₂, помещается на соответствующую позицию второго блока 34 на изображении, и так далее; наконец, матрица MN помещается на соответствующую позицию последнего блока MN на изображении, как показано на ФИГ. 3B.

[0089] Резюмируя сказанное, объединяя Гистограммы ориентированных градиентов каждого блока изображения с первоначального L*1-мерного вектора в матрицу M*N, где каждый блок состоит из M*N пикселей, а L=M*N; получая Гистограмму ориентированных градиентов изображения в соответствии с установленными Гистограммами ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении; и обеспечивая, таким образом, соответствие выделенных Гистограмм ориентированных градиентов изображения соответствующим позициям каждого блока на изображении, способ выделения признаков, представленный в данном варианте осуществления изобретения, может

Способ и устройство для выделения признаков

Патент 2644516