2304306 - Способ идентификации цифрового изображения, содержащего цифровой водяной знак

Способ идентификации цифрового изображения, содержащего цифровой водяной знак

Иллюстрации

Показать все

Изобретение относится к области стеганографии, а именно к способам идентификации цифровых изображений (ЦИ), содержащих цифровой водяной знак (ЦВЗ). Технический результат заявленного изобретения состоит в возможности идентификации ЦИ, содержащих ЦВЗ в условиях отсутствия априорных сведений о наличии ЦВЗ в данном изображении и о законе встраивания ЦВЗ. Технический результат достигается за счет построения собственных характеристических векторов изображений из обучающей выборки, включающих в себя статистические характеристики, вычисленные из распределений вейвлет-коэффициентов и из распределений ошибки предсказания величин вейвлет-коэффициентов на различных поддиапазонах. В обучающую выборку включаются два класса изображений: ЦИ, содержащие ЦВЗ и ЦИ, не содержащие ЦВЗ. После обучения классификатора, основанного на дискриминантном анализе, производится классифицирование анализируемого изображения, т.е. отнесение его к одному из классов. Благодаря этому существует возможность идентификации ЦИ, содержащего ЦВЗ, т.е. различения изображения-оригинала, защищенного авторскими правами от его копий, полученных путем распечатки и сканирования. 3 ил., 1 табл.

Реферат

Изобретение относится к области стеганографии, а именно к способам идентификации цифровых изображений (ЦИ), содержащих цифровой водяной знак (ЦВЗ), и может быть использовано для различения оригинального ЦИ, защищенного авторскими правами с помощью внедренного в него ЦВЗ, от его копий, а также для поиска ЦИ различных форматов, содержащих дополнительную цифровую информацию в условиях отсутствия априорных сведений о законе ее встраивания и присутствии в изображении.

Известен способ декодирования ЦВЗ, содержащегося в изображении формата JPEG (см. Patent US №0040001626, МПК G06K 009/00, 2004 г.) [1], основанный на оценке местных геометрических искажений, произошедших в изображении из-за встраивания эталонного сообщения X, и включающий следующие шаги: моделирование локальных искажений посредством индексной переменной J, позволяющей определить отличия искаженных данных от исходных, оценивание геометрических искажений с помощью эталонного сообщения X, модели локальных искажений и модели искаженных данных.

Также известен способ для идентификации данных изображения JPEG (см. Patent US №0040015697, МПК G06K 009/00, 2004 г.) [2], позволяющий установить, действительно ли полученное изображение отправлено известным источником и не было ли содержимое файла незначительно модифицировано во время передачи. Для кодирования проверочной информации уникальная хеш-функция получается из первой части данных изображения, содержащихся в сжатом изображении JPEG таким образом, что любые искажения указанной части данных изображения в дальнейшем были бы отражены в иной хеш-функции, полученной на основе принятого файла. Хеш-функция дает значение проверки целостности, записываемое в первую часть данных изображения. Далее это значение шифруется в строку подписи. Строка подписи встраивается в следующую часть данных изображения. Процесс повторяется до тех пор, пока все части данных изображения не будут обработаны. Строка подписи, соответствующая последней части данных, встраивается в эту часть. Так как внедрение значения проверки целостности не изменяет последовательности данных файла JPEG, любой декодер после этого может декодировать изображение. Далее файл изображения передается предназначенному получателю. Для декодирования получателем внедренной проверочной информации относительно подлинности отправителя файла JPEG хеш-функция вычисляется на основе первой части данных принятого изображения. Вторая часть данных характеризует местоположение, где была внедрена строка подписи для первой части данных. В этом случае подпись извлекается из данных. После чего строка подписи дешифруется в виде результата хеш-функции (проверки целостности), содержащейся в самих данных. Эти два числа сравниваются друг с другом. Если первое проверочное число соответствует числу, содержащемуся в найденной строке подписи, которая была ранее внедрена автором, то принимается решение, что данные первой части изображения подлинны. Процесс повторяется для каждой последующей части данных, пока не будут обработаны все части данных изображения.

Приведенные выше аналоги применяются в области защиты авторских прав для поиска изображений формата JPEG, содержащих ЦВЗ, которые могут быть искаженны в результате попыток их удаления из изображения, однако они применимы только в случае априорного знания о присутствии ЦВЗ в анализируемом изображении формата JPEG и о законе его встраивания, при этом способы применимы только для ЦИ формата JPEG.

Наиболее близким по своей сущности к заявляемому способу (прототипом) является известный способ идентификации изображения, содержащего многократный ЦВЗ (см. Patent US №20050058320, МПК G06K 009/00, 2005 г.) [3], включающий этап встраивания в документ (изображение) дополнительной информации, состоящей из двух типов ЦВЗ, соединенный с этапом считывания встроенных ЦВЗ из идентифицируемого документа (изображения), который в свою очередь соединен с этапом сравнения полученных энергетических характеристик считанных ЦВЗ двух типов с образцом, соединенным с этапом принятия решения о несанкционированном копировании идентифицируемого документа (изображения).

Такой способ используется в области защиты авторских прав и обеспечивает различение документов-оригиналов (изображений-оригиналов) от их копий, полученных путем распечатки и сканирования, однако недостатком способа является то, что он применяется только в условиях присутствия априорных сведений о законе встраивания ЦВЗ, в противном случае способ становится неэффективным и различить, является ли идентифицируемый документ (изображение) копией или оригиналом, не представляется возможным.

Целью изобретения является разработка способа идентификации цифровых изображений, содержащих цифровой водяной знак, обеспечивающего работу в условиях отсутствия априорных сведений о законе встраивания ЦВЗ, при этом способ должен быть применим для анализа изображений разных форматов (BMP, JPEG, GIF, PNG).

Поставленная цель достигается за счет того, что в известный способ идентификации документа (изображения), содержащего многократный ЦВЗ, включающий этап встраивания в документ (изображение) дополнительной информации, состоящей из двух типов ЦВЗ, соединенный с этапом считывания встроенных ЦВЗ из идентифицируемого документа (изображения), который в свою очередь соединен с этапом сравнения полученных энергетических характеристик считанных ЦВЗ двух типов с образцом, соединенным с этапом принятия решения о несанкционированном копировании идентифицируемого документа (изображения), после этапа встраивания вместо этапа считывания встроенных ЦВЗ из идентифицируемого документа (изображения) и последующих за ним этапов сравнения и принятия решения введены этап формирования трехмерного массива значений интенсивности точек изображения, этап формирования массива значений интенсивности точек красной цветовой составляющей изображения, этап формирования массива значений интенсивности точек зеленой цветовой составляющей изображения, этап формирования массива значений интенсивности точек синей цветовой составляющей изображения, этап многоуровневого дискретного двумерного вейвлет-преобразования, этап вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на отдельных поддиапазонах вейвлет-преобразования, этап вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования, этап вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования, этап формирования собственного характеристического вектора изображения, этап формирования массива собственных характеристических векторов цифровых изображений из обучающей выборки, этап обучения классификатора и этап классифицирования цифрового изображения.

Введение новых этапов позволяет идентифицировать цифровое изображение, содержащее ЦВЗ в условиях отсутствия априорных сведений о законе и месте встраивания ЦВЗ, при этом за счет введения этапов формирования трех массивов значений интенсивности точек трех цветовых составляющих изображения возникает возможность анализировать ЦИ различных форматов (BMP, JPEG, GIF, PNG).

Заявленный способ поясняется чертежами, на которых на фиг.1 представлена общая схема реализации способа идентификации цифрового изображения, содержащего цифровой водяной знак; на фиг.2 - выбор положения коэффициентов "соседей" относительно анализируемого коэффициента "А" (зачерненные квадраты) вейвлет-преобразования для формулы линейного предсказателя значений вейвлет-коэффициентов для: (А) - вертикальных поддиапазонов, (Б) - горизонтальных поддиапазонов, (В) - диагональных поддиапазонов; на фиг.3. представлен график вероятности правильной идентификации изображений различных форматов, содержащих ЦВЗ, в результате работы известного способа и заявляемого.

Заявленный способ, схема которого представлена на фиг.1, состоит из блока встраивания в изображение дополнительной информации 1, блока формирования трехмерного массива значений интенсивности точек изображения 2, который соединен с блоком формирования массива значений интенсивности точек красной цветовой составляющей изображения 3, с блоком формирования массива значений интенсивности точек зеленой цветовой составляющей изображения 4 и с блоком формирования массива значений интенсивности точек синей цветовой составляющей изображения 5, которые в свою очередь соединены с блоком многоуровневого дискретного двумерного вейвлет-преобразования 6, выход которого соединен с входом блока вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 7 и входом блока вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования 8, соединенного в свою очередь с блоком вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 9, выходы блоков 7 и 9 соединяются с входом блока формирования собственного характеристического вектора изображения 10, соединенного в свою очередь с блоком классифицирования изображения 13 и с блоком формирования массива собственных характеристических векторов изображений из обучающей выборки 11, который обратной связью соединен с блоком формирования трехмерного массива значений интенсивности точек изображения 2 и прямой связью с блоком обучения классификатора 12, выход которого соединен с входом блока классифицирования изображения 13.

Способ осуществляют в два этапа, называемых "обучение" и "анализ". Этап "обучение" реализуется за счет того, что сначала с помощью блока 1 формируют обучающую выборку, включающую изображения, содержащие встроенные случайным образом ЦВЗ, затем с помощью блоков 2, 3, 4, 5 формируют три двумерных массива значений интенсивности точек цифрового изображения для каждой из трех цветовых составляющих в виде карты пикселей цветовой схемы RGB (красной, зеленой, синей) [4].

Далее в блоке многоуровневого дискретного двумерного вейвлет-преобразования 6 каждый массив интенсивностей точек трех цветовых составляющих в отдельности подвергается многоуровневому двумерному дискретному вейвлет-преобразованию (необходимо не менее трех уровней вейвлет-преобразования) с использованием биортогональных низкочастотного (НЧ) и высокочастотного (ВЧ) фильтров [5]. Рекомендуется использовать фильтры с коэффициентами согласно таблице 1.

Таблица 1Значения коэффициентов блока биортогональных вейвлет-фильтров 7/9
№ п/п	Значение коэффициентов НЧ фильтра	№ п/п	Значение коэффициентов ВЧ фильтра
0	0.852699	0	0.788485
1	0.377403	1	-0.418092
2	-0.110624	2	- 0.040690
3	- 0.023849	3	0.064539
4	0.037829

Затем в блоке вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 7 производится вычисление статистических характеристик высоких порядков из распределений вейвлет-коэффициентов каждого поддиапазона всех уровней вейвлет-преобразования, исключая три поддиапазона последнего уровня, для каждой цветовой составляющей изображения. Данными статистическими характеристиками являются выборочное среднее, выборочная дисперсия, асимметрия и эксцесс [6] согласно формулам (1, 2, 3, 4) соответственно.

где - выборочное среднее;

n - количество коэффициентов данного поддиапазона вейвлет-преобразования;

где D_B - выборочная дисперсия;

n - количество коэффициентов данного поддиапазона вейвлет-преобразования;

где A_S - асимметрия теоретического распределения;

μ₃ - центральный момент третьего порядка;

σ³ - куб выборочного среднего квадратического отклонения;

где E_k - эксцесс теоретического распределения;

μ₄ - центральный момент четвертого порядка;

σ⁴ - выборочное среднее квадратическое отклонение в четвертой степени.

Одновременно с процедурой вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования в блоке вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования 8 вычисляется ошибка предсказания значений вейвлет-коэффициентов на разных поддиапазонах n-го уровня вейвлет-преобразования, а также на поддиапазонах последующего n+1-го уровня вейвлет-преобразования согласно фиг.3 и формулам линейного предсказателя значений вейвлет-коэффициентов (5, 6, 7) для вертикального, горизонтального и диагонального поддиапазонов соответственно [7].

где |·| означает, что значения коэффициентов взяты по модулю;

V_i, H_i, D_i указывают, на каком поддиапазоне и каком уровне вейвлет-преобразования вычисляется формула линейного предсказателя (соответственно вертикальный, горизонтальный, диагональный поддиапазон);

i - уровень вейвлет-преобразования;

x - координата вейвлет-коэффициента по горизонтали;

у - координата вейвлет-коэффициента по вертикали;

ω_k - скалярные весовые коэффициенты линейного предсказателя.

Формулы (5, 6, 7) могут быть представлены в векторном виде:

где - вектор-строка, содержащая весовые коэффициенты;

- вектор-строка, включающая значения анализируемых коэффициентов А_i;

Q - матрица, столбцы которой содержат значения так называемых коэффициентов "соседей" для анализируемых коэффициентов А_i (зачерненные квадраты на фиг.2).

Коэффициенты линейного предсказателя ω_i определяются путем минимизации функции квадрата ошибки:

Затем производится дифференцирование по :

получаемый результат приравнивается к нулю, а нахождение производится по следующей формуле:

После определения значений коэффициентов линейного предсказателя логарифмическая погрешность между фактическими коэффициентами и предсказанными вычисляется по формуле:

Из полученных на каждом поддиапазоне распределений векторов ошибки в блоке вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования 9 вычисляются выборочное среднее, выборочная дисперсия, асимметрия и эксцесс согласно формулам (1, 2, 3, 4) соответственно.

В блоке формирования собственного характеристического вектора (СХВ) изображения 10 все вычисленные значения статистических характеристик включаются в вектор, называемый собственным характеристическим вектором изображения (13).

где N=24(n-1), n - число уровней вейвлет-преобразования.

Таким образом, размерность такого вектора зависит от количества уровней вейвлет-преобразования n и равна 72(n-1).

Далее в блоке формирования массива собственных характеристических векторов изображений из обучающей выборки 11 производится формирование массива СХВ всех изображений из обучающей выборки, для этого блок 11 соединен с блоком 2 обратной связью, указывающей на то, что все вышеописанные процедуры выполняются с каждым изображением из обучающей выборки отдельно (обучающая выборка должна содержать не менее 200 ЦИ, не содержащих ЦВЗ, и не менее 200 ЦИ, содержащих ЦВЗ, причем все ЦИ данной обучающей выборки должны быть одного формата и ЦВЗ должны встраиваться по различным законам).

После формирования массива СХВ всех изображений из обучающей выборки в блоке 11 полученный массив подается на вход блока обучения классификатора 12, построенного на основе дискриминантного анализа для линейной дискриминации изображений из обучающей выборки на два класса: ЦИ, содержащие ЦВЗ, и ЦИ, не содержащие ЦВЗ. После этого этап "обучение" заканчивается и начинается второй этап - "анализ".

На этапе "анализ" с выбранным для анализа ЦИ (оно должно быть одного формата с цифровыми изображениями из обучающей выборки) производятся все процедуры, производящиеся в блоках 2-10 и описанные выше, только теперь после блока формирования собственного характеристического вектора анализируемого изображения 10 сформированный СХВ подается на вход блока классифицирования изображения 13, на который одновременно с этим с блока обучения классификатора 12 подаются результаты дискриминации всех СХВ, полученных от ЦИ из обучающей выборки на этапе "обучение".

В блоке классифицирования изображения 13 на основании вычисленного расстояния Махаланобиса (согласно формуле 14) принимается решение о принадлежности анализируемого изображения к одному из классов, либо к классу ЦИ, содержащих ЦВЗ, либо к классу ЦИ, не содержащих ЦВЗ:

где d_M(x_i, x_j) - расстояние Махаланобиса,

К^-1=С - матрица, обратная ковариационной матрице К, вычисленной по выборке х,

с_pq - элементы матрицы С [8].

Обоснование положительного эффекта предлагаемого способа осуществлено следующим образом.

Показателем эффективности способов идентификации ЦИ, содержащих ЦВЗ, является вероятность правильной идентификации Р_идент..

Задача состоит в том, чтобы достигнуть максимальной вероятности правильной идентификации при условии, что закон встраивания ЦВЗ и его присутствие в анализируемом изображении априорно неизвестны. Это позволит отличить изображение-оригинал от его копий, полученных с помощью распечатки и сканирования.

Для проверки заявляемого способа классификатор, основанный на дискриминантном анализе, был обучен на выборке из 1000 изображений различных форматов, 500 из которых содержали ЦВЗ. С помощью набора из 1650 изображений, не принадлежащих обучающей выборке, 150 из которых содержали встроенный по неизвестному закону ЦВЗ (по 50 изображений форматов JPEG, BMP, GIF), прототип и заявляемый способ были протестированы. Результаты, представленные на фиг.3, показали, что в условиях отсутствия априорных сведений о законе встраивания ЦВЗ известный способ правильно идентифицировал 11 изображений-оригиналов из 150, а с помощью предлагаемого способа удалось правильно отличить 144 изображения-оригинала из 150 от их высококачественных копий. Это подтверждает существенный положительный эффект от внедрения нового способа.

Следовательно, заявленный способ может обеспечить идентификацию ЦИ, содержащих ЦВЗ в условиях отсутствия априорных сведений о законе его встраивания в анализируемое изображение, при этом способ может быть применен для идентификации изображений различного формата.

Источники информации

1. Patent US №0040001626, кл. МПК G06K 009/00, 2004 г.

2. Patent US №0040015697, кл. МПК G06K 009/00, 2004 г.

3. Patent US №20050058320, кл. МПК G06K 009/00, 2005 г.

4. Миано Д. Форматы и алгоритмы сжатия изображений в действии. - М.: Триумф, 2003.

5. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. - С.-Петербург: Военный университет связи, 1999.

6. Гурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 1972.

7. Portilla J., Simoncelli Е. A. Parametric texture model based on joint statistics of complex wavelet coefficients. - International Journal of Computer Vision, 2000.

8. Калугина Т.Ф., Киселев В.Ю. Математическая статистика. Учебное пособие / Иван. гос. энерг. ун-т. - Иваново, 2001.

Способ идентификации документа (изображения), содержащего многократный цифровой водяной знак (ЦВЗ), включающий этап встраивания в документ (изображение) дополнительной информации, состоящей из двух типов ЦВЗ, отличающийся тем, что этап встраивания соединен с этапом формирования трехмерного массива значений интенсивности точек изображения, соединенный с этапом формирования массива значений интенсивности точек красной цветовой составляющей изображения, с этапом формирования массива значений интенсивности точек зеленой цветовой составляющей изображения и с этапом формирования массива значений интенсивности точек синей цветовой составляющей изображения, которые в свою очередь соединены с этапом многоуровневого дискретного двумерного вейвлет-преобразования, соединенного с этапом вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования и этапом вычисления ошибки предсказания значений коэффициентов на разных поддиапазонах вейвлет-преобразования, соединенного в свою очередь с этапом вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования, этап вычисления статистических характеристик высоких порядков из распределения вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования и этап вычисления статистических характеристик высоких порядков из распределения ошибки предсказания значений вейвлет-коэффициентов на разных поддиапазонах вейвлет-преобразования соединены с этапом формирования собственного характеристического вектора изображения, соединенного в свою очередь с этапом классифицирования изображения и с этапом формирования массива собственных характеристических векторов изображений из обучающей выборки, который обратной связью соединен с этапом формирования трехмерного массива значений интенсивности точек изображения и прямой связью с этапом обучения классификатора, соединенного в свою очередь с этапом классифицирования изображения.

Способ идентификации цифрового изображения, содержащего цифровой водяной знак

Патент 2304306