Способ и устройство для выделения признаков
Иллюстрации
Показать всеИзобретение относится к обработке изображений. Технический результат заключается в выделении гистограммы ориентированных градиентов. Способ выделения изображений, включает в себя: разделение изображения на множество блоков, каждый из блоков состоит из множества ячеек; разложение разреженного сигнала по каждой ячейке с использованием предустановленного словаря D для получения разреженного вектора для каждой ячейки, где предустановленный словарь D представляет собой словарь, определенный с применением к опытному изображению итерационного алгоритма. Выделение Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами, при этом выделение Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами включает в себя: расчет величины и направления градиента каждой ячейки в соответствии с разреженными векторами для получения дескриптора каждой ячейки; получение статистики по соответствующим дескрипторам в каждом блоке для получения Гистограммы ориентированных градиентов каждого блока; получение статистики по Гистограмме ориентированных градиентов каждого блока для получения Гистограммы ориентированных градиентов изображения. 3 н. и 10 з.п. ф-лы, 12 ил.
Реферат
[001] По настоящей заявке испрашивается приоритет на основании патентной заявки Китая № 201510829071.7, поданной 25 ноября 2015 г., все содержание которой включено в настоящий документ посредством ссылки.
Область техники, к которой относится изобретение
[002] Настоящее раскрытие в общем смысле относится к технической области обработки изображений, а точнее - к способу и устройству для выделения признаков.
Уровень техники
[003] Идентификация и распознавание изображений является важной областью исследования в машинном распознавании образов. Самый распространенный способ идентификации и распознавания изображений является выделение какого-либо признака изображения для идентификации и распознавания изображения.
[004] В данной области изображение идентифицируется и распознается путем выделения признака Гистограммы ориентированных градиентов изображения. Способ выделения признака Гистограммы ориентированных градиентов состоит в следующем: расчет градиента каждого пикселя изображения; разделение изображения на множество ячеек, где каждая ячейка состоит из множества пикселей, и каждые n смежных ячеек составляют блок; подсчет статистики Гистограммы ориентированных градиентов всех пикселей в каждой ячейке и определение признака Гистограммы ориентированных градиентов каждого блока в соответствии с гистограммой градиента всех клеток каждого блока; и получение статистики признака Гистограммы ориентированных градиентов изображения для получения признака Гистограммы ориентированных градиентов изображения.
Раскрытие изобретения
[005] С учетом данного факта в данной области в данном раскрытии описываются способ и устройство для выделения признаков. Далее раскрываются технические решения:
[006] В соответствии с первым аспектом настоящего изобретения описывается способ выделения признаков, включая: разделение изображения на множество блоков, где каждый блок состоит из множества ячеек; разложение разреженного сигнала каждой ячейки с использованием предопределенного словаря D для получения разреженного вектора для каждой из ячеек соответственно, где предопределенный словарь D - это словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделение признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами.
[007] В альтернативном варианте осуществления изобретения данный способ может также включать в себя: получение опытного изображения, где опытное изображение включает совокупность категорий множеств образов; выполнение итераций для получения оптимального словаря, такого как предопределенный словарь D с использованием следующей формулы:
где R= [r1, r2, …, rC] обозначает разреженную матрицу коэффициентов C опытных изображений, Y обозначает все категории опытных изображений, обозначает расчет количества ненулевых элементов в векторе, T0 означает заданный верхний разреженный предел, а означает расчет суммы квадратов каждого элемента вектора, а затем возведение этой суммы квадратов в квадрат.
[008] В альтернативном варианте осуществления изобретения данный способ может также включать в себя: разложение разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой ячейки соответственно, включая: установку пикселей в каждой ячейке n*1-мерному вектору; и выполнение, с учетом предустановленного словаря D, разложения разреженного сигнала на векторе в каждой ячейке для получения соответствующего разреженного вектора с использованием следующей формулы:
где y означает вектор в каждой ячейке, x означает разреженный вектор, полученный путем разреженной обработки y с использованием предустановленного словаря D, означает сумму абсолютных значений каждого столбца разреженного вектора x, где каждый разреженный вектор представляет собой m*1-мерный вектор, а предустановленный словарь D - матрицу n*m.
[009] В альтернативном варианте осуществления изобретения выделение Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами может включать: расчет, в соответствии с разреженным вектором, величины и направления градиента каждой ячейки для получения признака каждой ячейки; расчет статистики соответствующих признаков в каждом блоке для получения Гистограммы ориентированных градиентов каждого блока; и получение статистики признака Гистограммы ориентированных градиентов каждого блока для получения Гистограммы ориентированных градиентов изображения.
[0010] В альтернативном варианте осуществления изобретения получение статистических данных Гистограммы ориентированных градиентов каждого блока изображения может включать: каскадирование гистограммы ориентированного градиента каждого блока каждого блока на изображении в матрицу для получения Гистограммы ориентированных градиентов изображения, где каждый столбец матрицы представляет собой признак Гистограммы ориентированных градиентов одного из блоков.
[0011] В альтернативном варианте осуществления изобретения получение статистических данных Гистограммы ориентированных градиентов каждого блока изображения для получения признака Гистограммы ориентированных градиентов изображения может включать: установка Гистограммы ориентированных градиентов каждого блока изображения с первоначального L*1-мерного вектора в матрицу M*N, где каждый блок состоит из пикселей M*N, а L=M*N; и получение Гистограммы ориентированных градиентов изображения в соответствии с установленными Гистограммами ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении.
[0012] В альтернативном варианте осуществления изобретения данный способ может также включать: нормализацию изображения для получения изображения предустановленного размера.
[0013] В соответствии со вторым аспектом настоящего изобретения описывается устройство для выделения признаков, включающий: разделительный модуль для разделения изображения на множество блоков, где каждый блок состоит из множества ячеек; модуль разложения для разложения разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой из ячеек соответственно, где предустановленный словарь D представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделительный модуль для выделения признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами.
[0014] В альтернативном варианте осуществления изобретения устройство может также включать в себя: модуль для получения опытного изображения, где опытное изображение включает совокупность категорий множеств образов; и итерационный модуль для осуществления итерации для получения оптимального словаря в качестве предустановленного словаря D с использованием следующей формулы:
где R= [r1, r2, …, rC] обозначает разреженную матрицу коэффициентов C опытных изображений, Y обозначает все категории опытных изображений, обозначает расчет количества ненулевых элементов в векторе, T0 означает заданный верхний разреженный предел, а означает расчет суммы квадратов каждого элемента вектора, а затем возведение этой суммы квадратов в квадрат.
[0015] В альтернативном варианте осуществления изобретения модуль разложения может включать в себя: первый установочный подмодуль для установки пикселей в каждой ячейке по n*1-мерному вектору; и подмодулем разложения сигнала для разложения разреженного сигнала с использованием предустановленного словаря D на векторе в каждой ячейке для получения соответствующего разреженного вектора с использованием следующей формулы:
где y означает вектор в каждой ячейке, x означает разреженный вектор, полученный путем разреженной обработки y с использованием предустановленного словаря D, означает сумму абсолютных значений каждого столбца разреженного вектора x, где каждый разреженный вектор представляет собой m*1-мерный вектор, а предустановленный словарь D - матрицу n*m.
[0016] В альтернативном варианте осуществления изобретения выделительный модуль может включать в себя: расчетный подмодуль для расчета, в соответствии с разреженным вектором, соответствующих величины и направления градиента каждой ячейки для получения дескриптора каждой ячейки; первого статистического подмодуля для получения статистических данных по соответствующим дескрипторам в каждом блоке для получения признака Гистограммы ориентированных градиентов каждого блока; и второго статистического подмодуля для получения статистических данных признака Гистограммы ориентированных градиентов каждого блока изображения для получения признака Гистограммы ориентированных градиентов изображения.
[0017] В альтернативном варианте осуществления изобретения второй статистический подмодуль может быть настроен для каскадирования признака Гистограммы ориентированных градиентов каждого блока изображения в матрицу для получения признака Гистограммы ориентированных градиентов изображения, где каждый столбец матрицы представляет собой признак Гистограммы ориентированных градиентов одного из блоков.
[0018] В альтернативном варианте осуществления изобретения второй статистический подмодуль может включать: второй установочный подмодуль, настроенный на установку Гистограммы ориентированных градиентов каждого блока изображения с первоначального L*1-мерного вектора к матрице M*N, где каждый блок состоит из пикселей M*N, а L=M*N; и модуля выделения признака, настроенного на получение признака Гистограммы ориентированных градиентов изображения в соответствии с выравненными признаками Гистограммы ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении.
[0019] В альтернативном варианте осуществления изобретения устройство может также включать: обрабатывающий модуль для нормализации изображения для получения изображения предустановленного размера.
[0020] В соответствии с третьим аспектом настоящего изобретения описывается устройство для выделения признаков, включающий: процессор и память для хранения команд, выполняемых процессором; где процессор настроен для разделения изображения на множество блоков, где каждый из блоков состоит из множества ячеек; разложения разреженного сигнала в каждой ячейке с использованием предустановленного словаря D для получения разреженного вектора, для каждой ячейки соответственно, где предустановленный словарь D представляет собой словарь, определенный с использованием итерационного алгоритма по отношению к опытному изображению; и выделения признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами.
[0021] В соответствии с техническими решениями вариантов осуществления изобретения могут быть достигнуты, по крайней мере, некоторые из следующих технических результатов.
[0022] Путем разделения изображения на множество блоков, где каждый из блоков состоит из множества ячеек; разложения разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой из ячеек соответственно, где предопределенный словарь D представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделения признака Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами может быть решена следующая задача: процесс выделения признака Гистограммы ориентированных градиентов рассчитывается непосредственно с учетом пространственной области изображения, относительно снижающей скорость обнаружения и точность в распознавании изображений. Скорость обнаружения и точность могут быть повышены при распознавании изображений путем выделения признака Гистограммы ориентированных градиентов изображения в частотном интервале.
[0023] Следует понимать, что как предшествующее общее раскрытие, так и нижеследующее подробное раскрытие являются лишь примерами, служат лишь для пояснения и не ограничивают настоящее изобретение.
Краткое описание чертежей
[0024] Прилагаемые чертежи, являющиеся частью данной спецификации, иллюстрируют варианты осуществления, соответствующие настоящему изобретению, и, вместе с описаниями, служат для объяснения принципов изобретения.
[0025] ФИГ. 1 представляет собой функциональную схему, иллюстрирующую способ для выделения признаков в соответствии с примерным вариантом осуществления изобретения.
[0026] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения признаков в соответствии с иным примерным вариантом осуществления изобретения.
[0027] ФИГ. 2B представляет схему, изображающую разделение изображения в соответствии с примерным вариантом осуществления изобретения.
[0028] ФИГ. 2C представляет схему, изображающую разделение изображения в соответствии с другим примерным вариантом осуществления изобретения.
[0029] ФИГ. 2D представляет схему, изображающую установку пикселей ячейки в соответствии с примерным вариантом осуществления изобретения.
[0030] ФИГ. 2E представляет схему, изображающую статистические данные признака Гистограммы ориентированных градиентов в блоке в соответствии с примерным вариантом осуществления изобретения.
[0031] ФИГ. 3А представляет собой функциональную схему, иллюстрирующую способ для выделения признаков в соответствии с примерным вариантом осуществления изобретения.
[0032] ФИГ. 3B представляет схему, изображающую статистические данные признака Гистограммы ориентированных градиентов изображения в соответствии с примерным вариантом осуществления изобретения.
[0033] ФИГ. 4 представляет собой блок-схему, иллюстрирующую устройство для выделения признаков в соответствии с примерным вариантом осуществления изобретения.
[0034] ФИГ. 5 представляет собой блок-схему, иллюстрирующую устройство для выделения признаков в соответствии с другим примерным вариантом осуществления изобретения.
[0035] ФИГ. 6 представляет собой блок-схему, иллюстрирующую подмодули устройства для выделения признаков в соответствии с примерным вариантом осуществления изобретения.
[0036] ФИГ. 7 представляет собой блок-схему, иллюстрирующую устройство для выделения признаков в соответствии с другим примерным вариантом осуществления изобретения.
Раскрытие изобретения
[0037] Далее в подробностях будут рассмотрены примерные варианты осуществления изобретения, иллюстрируемые сопровождающими чертежами. Дальнейшее описание относится к сопровождающим чертежам, в которых одинаковые номера на разных чертежах обозначают одинаковые или подобные элементы, если не указано иное. Варианты осуществления, рассмотренные в нижеследующем описании примерных вариантов осуществления изобретения, не представляют собой все возможные варианты осуществления, соответствующие настоящему изобретению. Напротив, они представляют собой лишь примеры устройств и способов, соответствующих аспектам, относящимся к настоящему изобретению согласно прилагаемой формуле изобретения.
[0038] ФИГ. 1 представляет собой функциональную схему, иллюстрирующую способ для выделения признаков в соответствии с примерным вариантом осуществления изобретения. Как показано на ФИГ. 1, вариант осуществления изобретения использует способ, реализуемый с помощью аппаратных средств, для распознавания изображений в качестве примера, при этом данный способ может включать в себя следующие шаги.
[0039] На шаге 102 изображение разделяется на множество блоков, в котором каждый из блоков состоит из множества ячеек.
[0040] На шаге 104 производится разложение разреженного сигнала в отношении каждой ячейки с использованием предустановленного словаря D для получения разреженного вектора для каждой из ячеек соответственно.
[0041] Предустановленный словарь представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению.
[0042] Разложение разреженного сигнала относится к конвертации данного наблюдаемого сигнала в разреженный вектор в соответствии с предустановленным словарем D, где множество элементов разреженного вектора нулевое.
[0043] В варианте осуществления изобретения пиксели в каждой ячейке берутся как данный наблюдаемый сигнал, конвертируемый в соответствующий разреженный вектор, в соответствии с предустановленным словарем D, а затем соответственно получается разреженный вектор, соответствующий каждой из ячеек.
[0044] На шаге 106 признак Гистограммы ориентированных градиентов изображения выделяется в соответствии с разреженным вектором.
[0045] признак Гистограммы ориентированных градиентов изображения выделен в соответствии с разреженным вектором, полученным в результате разложения разреженного сигнала.
[0046] Таким образом, путем разделения изображения на множество блоков, где каждый из блоков состоит из множества ячеек; разложения разреженного сигнала каждой ячейки с использованием предустановленного словаря D для получения разреженного вектор для каждой из ячеек соответственно, где предопределенный словарь D представляет собой словарь, определенный путем применения итерационного алгоритма к опытному изображению; и выделения Гистограммы ориентированных градиентов изображения в соответствии с разреженными векторами, использование способа, описанного в варианте осуществления изобретения может решить проблему, связанную с тем, что скорость обнаружения и точность относительно низки при распознавании изображений в силу того, что процесс выделения Гистограммы ориентированных градиентов рассчитывается непосредственно с учетом пространственной области изображения. Благодаря использованию данного способа скорость обнаружения и точность могут быть повышены при распознавании изображений путем выделения признака Гистограммы ориентированных градиентов изображения в частотном интервале.
[0047] ФИГ. 2A представляет собой функциональную схему, иллюстрирующую способ выделения признаков в соответствии с иным примерным вариантом осуществления изобретения. Как показано на ФИГ. 2A, вариант осуществления изобретения использует способ, реализуемый с помощью аппаратных средств, для распознавания изображений в качестве примера, при этом данный способ может включать в себя следующие шаги.
[0048] На шаге 201 изображение нормализуется для получения предустановленного размера.
[0049] Распознавание изображений обычно включает в себя выделение признаков множества изображений. Перед выделением признаков изображений терминал может осуществить нормализацию изображений для трансформации изображений разных размеров в изображения предустановленного размера для осуществления унифицированной обработки опытных образцов.
[0050] На шаге 202 получается опытное изображение, где опытное изображение включает в себя совокупность категорий множеств образов.
[0051] Терминал может получить опытное изображение из библиотеки опытных изображений, где опытные изображения включают в себя совокупность категорий настроек изображений, таких как распознавание лиц, тел или транспортных средств, и не дополняются в настоящем изобретении.
[0052] В качестве альтернативы, после получения опытных изображений терминал может осуществить их нормализацию для трансформации изображений разных размеров в изображения предустановленного размера для осуществления унифицированной обработки опытных образцов.
[0053] На шаге 203 может быть получен оптимальный словарь, принятый как предустановленный словарь D, путем итерационного использования следующей формулы:
где R= [r1, r2, …, rC] обозначает разреженную матрицу коэффициентов C опытных изображений, Y обозначает все категории опытных изображений, обозначает расчет количества ненулевых элементов в векторе, T0 означает заданный верхний разреженный предел, а означает расчет суммы квадратов каждого элемента вектора, а затем возведение этой суммы квадратов в квадрат. Вышеприведенная формула представляет собой алгоритм K-SVD (K означает «сингулярная декомпозиция»).
[0054] Алгоритм K-SVD может обеспечить получение словарем информации в опытных изображениях посредством итерационного процесса, использующего разреженные коэффициенты обозначения для обновления элементов словаря. Посредством непрерывной итерации в итоге получается набор элементов словаря, которые могут отражать признаки изображения, а именно предустановленный словарь D, где элементы относятся к элементам словаря. То есть окончательный предустановленный словарь представляет собой оптимальный словарь, полученный путем получения информации опытными изображениями.
[0055] Итерационный процесс алгоритмов K-SVD следующий: предполагая, что имеется X категорий опытных изображений, для i-й категории даны Ni опытных изображений. Все опытные изображения i-й категории представлены матрицей , и опытные изображения всех категорий представлены . Используя вышеприведенные формулы для получения информации от опытных изображений, в итоге мы получим оптимальный предустановленный словарь D.
[0056] На шаге 204 изображение разделяется на множество блоков, в котором каждый из блоков состоит из множества ячеек.
[0057] В качестве альтернативы, разделение нормализованного изображения терминалом может происходить так: разделение изображения на множество блоков, а затем - разделение каждого из блоков на множество ячеек.
[0058] В качестве альтернативы, разделение нормализованного изображения терминалом может происходить так: разделение изображения на множество ячеек, а затем - объединение смежных ячеек в блоки, состоящие из множества ячеек. Например, блок может состоять из четырех смежных парных ячеек, объединенных в форме китайского иероглифа “”.
[0059] В варианте осуществления изобретения, в процессе разделения изображения, разделение на блоки может производиться перед разделением на ячейки, и наоборот. Порядок выполнения не имеет конкретных ограничений.
[0060] Например, изображение 20 размером 128 пикселей*128 пикселей может быть сначала разделено на непересекающиеся блоки 21 размером 16 пикселей*16 пикселей, затем каждый из блоков 21 размером 16 пикселей*16 пикселей разделяется на ячейки 22 размером 8 пикселей*8 пикселей, таким образом, изображение включает 8*8=64 непересекающихся блоков 21, а каждый из блоков состоит из 2*2=4 ячеек, как показано на ФИГ. 2B.
[0061] Например, изображение 20 размером 128 пикселей*128 пикселей сначала разделяется на пересекающиеся блоки 23 размером 16 пикселей*16 пикселей, а затем каждый из блоков 23 размером 16 пикселей*16 пикселей разделяется на ячейки 24 размером 8 пикселей*8 пикселей, таким образом, изображение включает 16*16=256 пересекающихся блоков 23, а каждый из блоков состоит из 2*2=4 ячеек, как показано на ФИГ. 2С.
[0062] На шаге 205 пиксели в каждой ячейке устанавливаются по n*1-мерному вектору.
[0063] После разделения изображения пиксели в каждой ячейке могут рассматриваться как матрица, и матрица, соответствующая пикселям в каждой ячейке, может быть выровнена по n*1-мерному вектору. В процессе установки матрицы второй столбец K227 в матрице 25, соответствующий пикселям, каскадируется так, чтобы располагаться под первым столбцом K126, а третий столбец (не показан на ФИГ.) в матрице 25, соответствующий пикселям, располагается каскадом так, чтобы находиться под вторым столбцом K227, и так далее. Таким образом, матрица 25, соответствующая пикселям в каждой ячейке, устанавливается по n*1-мерному вектору 28, как показано на ФИГ. 2D.
[0064] На шаге 206 векторы в каждой ячейке зависят от разложения разреженного сигнала для получения соответствующих разреженных векторов с использованием следующей формулы:
.
где y означает векторы в каждой ячейке, x означает разреженные векторы, полученные путем разреженного разложения в отношении y с использованием предустановленного словаря D, означает сумму абсолютных значений каждого столбца разреженного вектора x, где каждый разреженный вектор представляет собой m*1-мерный вектор, а предустановленный словарь D - матрицу n*m.
[0065] Для каждой ячейки изображения терминал может получить оптимальный предустановленный словарь D путем итерационного расчета и принять векторы в каждой ячейке как данные наблюдаемые сигналы y, а затем определить разреженный вектор x для векторов в каждой ячейке с использованием оптимального предустановленного словаря D с использованием приведенной выше формулы. Поскольку выровненные векторы в каждой ячейке являются n*1-мерными, а предустановленный словарь D, полученный путем итерационного расчета терминалом, представляет собой матрицу n*m, то разреженный вектор, определенный по приведенной выше формуле, соответствующий векторам в каждой ячейке, является m*1-мерным.
[0066] На шаге 207 рассчитываются величина и направление градиента каждой ячейки в соответствии с разреженными векторами для получения дескриптора каждой ячейки.
[0067] Терминал может рассчитать поперечный и продольный градиенты каждого пикселя в каждой ячейке, зависящие от разложения разреженного сигнала с использованием оператора градиента.
[0068] То есть для каждого элемента разреженного вектора, соответствующего каждой ячейке, рассчитываются поперечный и продольный градиенты с использованием оператора градиента.
[0069] Например, типичные операторы градиента представлены в таблице 1 ниже:
Таблица 1
Тип маски | Центральный вектор | Нецентральный вектор | Вектор коррекции внимания | Диагональ | Оператор Собела |
оператор | [1 0 -1] | [1 -1] | [1 8 0 -8 -1] |
[0070] В варианте осуществления изобретения при расчете градиента пикселей в каждой ячейке может быть выбран любой оператор градиента в Таблице 1 или другие операторы градиента. Выбор оператора градиента не имеет конкретных ограничений в варианте осуществления изобретения.
[0071] Допуская, что поперечный градиент элемента на разреженном векторе представляет собой H(x, y), а продольный градиент - V(x, y), то направление и величина градиента, соответствующие элементу, могут быть рассчитаны по формулам (1) и (2), приведенным ниже:
(1)
(2)
где - направление градиента элемента (x, y) на разреженном векторе, а m(x, y) - величина градиента элемента (x, y).
[0072] Направление градиента варьируется от -90 градусов до 90 градусов. Направление градиента разделяется равномерно на z зон, и все элементы на разреженном векторе, соответствующие каждой ячейке, подсчитываются на основании веса m(x, y) в соответствующей отделенной зоне для получения z-мерного вектора для каждой ячейки в результате, таким образом, получается дескриптор для каждой ячейки.
[0073] Например, направление градиента равномерно разделяется на 9 зон, где угол, соответствующий каждой зоне, составляет 20 градусов; и все элементы в каждой ячейке подсчитываются на основании веса m(x, y) в соответствующих 20 градусах для получения в итоге 9-мерного вектора для каждой ячейки.
[0074] Количество зон, на которые разделяется направление градиента, не имеет конкретных ограничений в варианте осуществления изобретения.
[0075] На шаге 208 подсчитываются соответствующие дескрипторы в каждом блоке для получения Гистограммы ориентированных градиентов каждого блока.
[0076] Терминал определяет статистические данные дескрипторов, полученных для соответствующих ячеек, составляющих каждый блок, для получения Гистограммы ориентированных градиентов каждого блока.
[0077] При подсчете статистических данных всех дескрипторов, полученных для соответствующих клеток, терминал может располагать дескрипторы каскадом по отношению к соответствующим ячейкам, таким образом, Гистограммы ориентированных градиентов может быть вектором, причем размер вектора k-кратен размеру дескриптора, соответствующего ячейкам, составляющим блок.
[0078] Например, дескриптор в соответствующих ячейках представляет собой 9-размерный вектор, а каждый блок включает 4 ячейки. 9-мерные дескрипторы в 4 ячейках располагаются каскадом для образования 36-мерного вектора, представляющего собой гистограмму ориентированного градиента соответствующего блока.
[0079] На шаге 209 определяется Гистограммы ориентированных градиентов соответствующих блоков для получения Гистограммы ориентированных градиентов изображения.
[0080] Терминал определяет Гистограммы ориентированных градиентов соответствующих блоков для получения Гистограммы ориентированных градиентов изображения. Гистограммы ориентированного градиента соответствующих блоков изображения располагаются каскадом для образования матрицы и получения Гистограммы ориентированных градиентов изображения, где каждый столбец матрицы представляет собой Гистограмму ориентированных градиентов одного блока.
[0081] Например, изображение состоит из K блоков, и признак Гистограммы ориентированных градиентов каждого блока - Ki, тогда Гистограммы ориентированных градиентов Ki располагаются каскадом для образования матрицы 250, в которой K1 располагается в первом столбце 26 расположенной каскадом матрицы, K2 располагается во втором столбце 27 расположенной каскадом матрицы, и так далее, как показано на ФИГ. 2E.
[0082] Таким образом, путем получения опытных изображений, обладающих множеством категорий множеств образов; используя формулу итерации для получения оптимального словаря D; разделяя изображение на множество блоков, где каждый из блоков состоит из множества ячеек; устанавливая пиксели в каждой ячейке по n*1-мерному вектору; осуществляя разложение разреженного сигнала каждой ячейки с использованием формулы для получения соответствующего разреженного вектора; рассчитывая величину и направление градиента для каждой ячейки в соответствии с разреженным вектором для получения дескриптора для каждой ячейки; и получая статистические данные по соответствующим дескрипторам в каждом блоке для получения Гистограммы ориентированных градиентов изображения, способ выделения признаков, представленный в варианте осуществления настоящего изобретения, может решить проблему, связанную с тем, что скорость обнаружения и точность относительно низки при распознавании изображений в силу того, что процесс выделения признака Гистограммы ориентированных градиентов рассчитывается непосредственно с учетом пространственной области изображения. Благодаря использованию данного способа скорость обнаружения и точность могут быть повышены при распознавании изображений путем выделения признака Гистограммы ориентированных градиентов изображения в частотном интервале.
[0083] На основании альтернативного варианта осуществления изобретения, показанного на Фиг. 2A, в процессе получения статистических данных Гистограмм ориентированных градиентов соответствующих блоков изображения для получения Гистограммы ориентированных градиентов она может быть расположена с учетом соответствующего положения на изображении. Шаг 209 может быть заменен шагами 209a и 209b, как показано на ФИГ. 3A.
[0084] На шаге 209a Гистограммы ориентированных градиентов каждого блока объединяются в матрицу M*N с первоначального L*1-мерного вектора, при этом каждый блок состоит из M*N пикселей, а L=M*N.
[0085] Гистограмма ориентированных градиентов каждого блока представляет собой L*1-мерный вектор, полученный путем расположения каскадом дескрипторов, соответствующих каждой ячейке. Терминал приводит L*1-мерный вектор в соответствие с матрицей M*N, то есть L*1-мерный вектор в каждом блоке приводится в соответствие с соответствующей матрицей в соответствии с входящими в него ячейками, где каждый столбец соответствующей матрицы является дескриптором ячейки; а затем дескрипторы каждой ячейки устанавливаются в соответствии с пикселями, где каждый столбец выровненной матрицы представляет собой Гистограмму ориентированных градиентов, соответствующую пикселям соответствующего столбца в соответствующем блоке.
[0086] На шаге 209b получаем гистограмму ориентированного градиента изображения в соответствии с выровненными гистограммами ориентированного градиента каждого блока и соответствующим положением каждого блока на изображении.
[0087] В соответствии с выровненными Гистограммами ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении, получаем Гистограмму ориентированных градиентов положения соответствующих пикселей изображения.
[0088] Например, изображение состоит из K блоков, и Гистограммы ориентированных градиентов соответствующих блоков представляют собой Ki, таким образом, Гистограммы ориентированных градиентов Ki объединяются в матрицу M*N. Матрица 31, составленная K1, помещается на соответствующую позицию первого блока 32 на изображении, матрица 33, составленная из K2, помещается на соответствующую позицию второго блока 34 на изображении, и так далее; наконец, матрица MN помещается на соответствующую позицию последнего блока MN на изображении, как показано на ФИГ. 3B.
[0089] Резюмируя сказанное, объединяя Гистограммы ориентированных градиентов каждого блока изображения с первоначального L*1-мерного вектора в матрицу M*N, где каждый блок состоит из M*N пикселей, а L=M*N; получая Гистограмму ориентированных градиентов изображения в соответствии с установленными Гистограммами ориентированных градиентов каждого блока и соответствующим положением каждого блока на изображении; и обеспечивая, таким образом, соответствие выделенных Гистограмм ориентированных градиентов изображения соответствующим позициям каждого блока на изображении, способ выделения признаков, представленный в данном варианте осуществления изобретения, может