Способ повышения качества цифрового фотоизображения
Иллюстрации
Показать всеИзобретение относится к системам автоматизированной цифровой фотопечати. Техническим результатом является повышение качества изображения. Предложено использовать модель формирования изображения с разделением эффектов, связанных с отражательной способностью поверхности R, и эффектов, связанных с характеристиками освещения сцены L, при котором: вычисляют оценку качества зарегистрированного изображения и при решении о необходимости коррекции изображения фильтруют шум изображения; создают уменьшенную копию изображения; определяют из уменьшенной копии изображения пределы для последующего контрастирования на этапе коррекции; выделяют и фильтруют канал яркости исходного изображения; корректируют изображение в соответствии с эмпирически найденным уравнением LR-модели формирования изображения:
где А - нижняя граница диапазона контрастирования уменьшенной копии изображения; Ф и Ψ - нижняя и верхняя границы контрастирования преобразованного изображения; JB - компонента яркости исходного изображения после билатеральной фильтрации; γ - параметр нелинейного преобразования и JF - компонента яркости улучшенного изображения; и преобразуют результирующее изображение в цветовое пространство RGB. 6 з.п. ф-лы, 19 ил., 2 табл.
Реферат
Изобретение относится к фототехнике и может применяться в процессах автоматизированной цифровой фотопечати для улучшения качества изображений.
Вследствие применения цифровых технологий современные фотокамеры обеспечивают не только удобный способ для регистрации и записи цифровых фотографий, но также и возможность редактирования, ретуширования и улучшения получаемых цифровых фото, как в самой фотокамере, так и с использованием персонального компьютера.
Последние технические решения типа «SoC» («System on Chip») дают основания утверждать, что в этой части фотопроцесса возможно полное устранение компьютера. Так, разработанный ассоциацией производителей фотокамер и устройств отображения CIPA (Camera & Imaging Products Association) стандарт "CIPA DC-001", известный под названием PictBridge (см. например, http://www.cipa.jp/pictbridge), уже сейчас обеспечивает унификацию процесса передачи и обработки данных входного и выходного устройств фотографического процесса, в частности фотокамеры и принтера.
Несмотря на то, что цифровые камеры предоставляют широкие возможности для интерактивных манипуляций с выбранными изображениями с учетом предпочтений фотографа или дизайнерских решений специалиста по обработке изображений, проблема улучшения изображений в автоматическом режиме представляет собой актуальную и содержательную техническую задачу.
В большинстве случаев финальные изображения характеризуются видимыми отличиями в передаче и восприятии динамических характеристик регистрируемых сцен. Это объясняется тем, что оптические сенсоры фотокамеры регистрируют физические характеристики светового потока, в то время как восприятие пользователя есть результат комплексных процессов, происходящих в его зрительной системе в процессе фоторецепции и анализа световых раздражений. Эти процессы описываются сложным нелинейным механизмом, который корректирует воспринимаемую локальную яркость и хроматическую компоненту в зависимости от уровня освещенности и цветового тона всей сцены. Последние экспериментальные результаты показывают, что зрительная система человека способна регистрировать яркость от 10-6 до 108 кд/м2 или в абсолютном диапазоне 1014:1 (на самом деле зрительная система человека не может регистрировать световой поток во всем световом диапазоне одновременно; максимальный диапазон покрытия составляет от 10000 до 30000 к 1).
Результаты фотометрических измерений демонстрируют широкий динамический диапазон многих повседневных сцен: от теней во внутренних помещениях (1 кд/м2) до границы насыщения - белые облака при ярком солнечном свете (49000 кд/м2). Сравнительные фотометрические данные представлены в Табл.1.
Таблица 1. | ||
Фотометрия сцен (выдержка из Jobson et al. A multiscale Retinex for bridging the gap between color images and the human observation of scenes, IEEE Transactions on Image Processing, vol.6, No.7, 1997, pp. 965-976. [1]) | ||
Характеристики сцены | кд/м2 | |
Визуальное насыщение (белые облака вблизи от солнца) | 49000 | |
Вблизи насыщения (облака в удалении от | 18000-37000 | |
солнца) | ||
Наружные фасады зданий - яркое солнце | 7000-13000 | |
Голубое небо - утром | 4600 | |
Бетонный тротуар | ||
На солнце | 3200 | |
В тени | 570 | |
В глубокой тени | 290 | |
Внутренняя часть помещения - | ||
флуоресцентное освещение | ||
Пол | 36-140 | |
Области тени | 4-18 | |
Внутренняя часть помещения | ||
Стены | 29 | |
Области тени | 1-6 |
Как видно из Табл.1, видимость в помещении, на нижней границе диапазона, крайне низкая - порядка нескольких единиц кд/м2, при этом снаружи достигаются несравнимо более высокие значения - 10000 кд/м2 и выше. С точки зрения фотографической широты регистрирующего устройства такие сцены характеризуются расширенным динамическим диапазоном (HDRI - "high dynamic range images"): разница между самой темной и самой яркой точкой сцены оказывается большей, чем диапазон между самым светлым и самым темным пикселом, который в состоянии зафиксировать фотоаппарат.
Зрительная система человека оперирует HDR-изображениями посредством локальной адаптации к отдельным участкам сцены, что обеспечивает способность выделять детали как в теневых областях, так и в областях, характеризуемых высокой освещенностью.
Реализация такой адаптации в цифровых камерах является затруднительной. Устройства, в основе которых лежит технология изготовления сенсорных элементов в виде приборов с зарядовой связью (ПЗС-матрицы), обеспечивает адекватное воспроизведение HDR-сцен в диапазоне 2500:1. С технической точки зрения, часть градаций яркости изображения не будет зафиксирована матрицей цифрового фотоаппарата и будет потеряна. Тем не менее, этого диапазона оказывается в общем случае достаточно для того, чтобы вместить вариации освещенности внутри отдельной сцены, а изменение диапазона от сцены к сцене может быть достигнуто дополнительной подстройкой апертуры объектива.
Понятно, что передача динамического диапазона значений тонов, которые могут содержаться в электронном файле, от самого светлого до максимально темного, является актуальной проблемой и современной цифровой печати, поскольку динамический диапазон принтера характеризуется во многих случаях величиной 100:1.
Таким образом, утрата деталей в областях тени, а также в областях, отличающихся высокой освещенностью, объясняется, в частности, неадекватной компрессией (отображением) динамического диапазона сцены в процессе печати.
Способы компрессии динамического диапазона, известные из уровня техники, можно, согласно R.Fattal, D.Lischinski, M.Werman Gradient domain high dynamic range compression, ACM Transaction on Graphics (TOG), vol.21 (3), 2002, pp.249-256 [2], подразделить на две группы:
- глобальные, т.е. пространственно инвариантные, отображения и
- локальные, т.е. пространственно зависимые, отображения.
Глобальные преобразуют яркость каждого пикселя, используя фиксированную кривую тоновоспроизведения TRC («Tone Reproduction Curve»), которая строится, используя некоторые усредненные характеристики всего изображения. Наиболее часто в качестве такой характеристики применяется средняя логарифмическая яркость. Простота этих алгоритмов очень притягательна, но детали изображений часто теряются в особо ярких или очень темных областях изображения, где динамический диапазон особенно велик.
В локальных отображениях преобразование яркости в каждом пикселе зависит от средней яркости окрестности преобразуемого пикселя. Наиболее трудной и вычислительно дорогостоящей проблемой алгоритмов такого типа является правильное определение размера локальной окрестности для каждой точки. В случаях, когда это сделано не совсем корректно, могут возникать разнообразные артефакты.
Воспроизведение сцены, отличающейся высоким динамическим диапазоном, можно также осуществить посредством регистрации набора изображений интересующей сцены с различными временами экспозиции. При этом на недоэкспонированном изображении будут проработаны тени, а на переэкспонированном - детали в светлых областях. Динамический диапазон итогового снимка расширяется за счет специального смешивания («blending») «недодержанной» и «передержанной» версий.
Одним из наиболее эффективных методов реализации технологии локальных (т.е. пространственно зависимых) отображений является предложенная Лэндом ретинекс-теория цветового зрения. Термин Ретинекс («Retinex») - неологизм, образованный от латинских слов «Retina» (сетчатка) и «Cortex» (кора головного мозга). Эдвин Лэнд формулировал название данной теории, комбинируя название сетчатки глаза и коры головного мозга, с целью создания информационной модели цветового зрения, основанной на вполне определенных допущениях о свойствах реального мира. В техническом плане речь идет о методе обработке изображения, придающем ему зрительный реализм по двум аспектам: согласование динамического диапазона и обеспечение цветового постоянства (см. Е.Н.Land and J.J.McCann Lightness and Retinex theory, Journal of the Optical Society of America, vol.61, 1971, pp.1-11. [3], Е.Н.Land The Retinex theory of color vision, Scientific American, vol.237, 1977, pp.108-128. [4], Е.Н.Land An Alternative Technique for the Computation of the Designator in the Retinex Theory of Color Vision, Proceedings of the National Academy of Science, Volume 83, pp.3078-3080, 1986. [5]).
Реализация подхода Лэнда к цветовому зрению применительно к области обработки цифровых изображений раскрывается в целом ряде технических решений.
Первоначальный вариант алгоритма, построенного на основе ретинекс-теории, изложен в U.S. Pat. No. 4,384,336 [6].
Последующие алгоритмические модификации, имеющие отношение к предмету настоящего изобретения, раскрыты в U.S. Pat. No. 5,991,456 [7], U.S. Pat. No. 6,760,484 [8], U.S. Pat. No. 6,804,409 [9], U.S. Pat. No. 6,807,299 [10], U.S. Patent Application No. 2004/0091164 [11]. В этих патентных документах описываются варианты реализации ретинекс-обработки исходного изображения I в форме Single-scale Retinex (SSR) и Multi-scale Retinex (MSR).
Операция SSR над исходным изображением I(х,у) представляется в виде
,
где Ii(x,y), i=1,…,3 - значение яркости i-й спектральной компоненты в произвольной точке (х,у); символ ⊗ означает операцию свертки. При этом F(x,y) - функция «окружения» («surrounding function») (в терминах ретинекс-теории), действующая на каждый пиксел преобразуемого изображения и s - гауссова константа окружения, аналогичная величине σ, применяемой для обозначения стандартного отклонения. Гауссова константа окружения s представляет собой величину, которая характеризует масштаб («scale») ретинекса. Член Ii(x,y)⊗F(x,y) эквивалентен взвешенному среднему значению интенсивности окружающих точек пикселов относительно рассматриваемого пиксела изображения. Таким образом, применение функции окружения F(x,y) означает учет вклада соседних элементов изображения в зрительное восприятии текущего пиксела.
Результат операция SSR сильно зависит от значения константы окружения s, выбор которой определяется, в свою очередь, как динамическим диапазоном изображения в целом, так и его отдельных областей.
Операция MSR (см. U.S. Pat. No. 6,834,125 [12]) разработана для преодоления указанной сложности, а также с целью сделать SSR решение более приспособленным для обработки произвольного изображения.
Операция MSR представима в виде:
,
где n обозначает номер ретинекс-маски, ωn весовой коэффициент, характеризующий вклад операции SSR с маской s. Следовательно итоговое значение MSR рассчитывается как взвешенная сумма нескольких SSR операций над исходным изображением, осуществляемых с разными ретинекс-масками. Моделирование MSR показывает, что оптимальный выбор размера маски, а также количества масок позволяют достичь существенного прогресса при решении задачи согласования динамических диапазонов устройств регистрации и отображения (см. Zia-ur Rahman, D.J.Jobson, G.A.Woodell, Retinex processing for automatic image enhancement, Journal of Electronic Imaging 13(1), January 2004 [13]).
В частности, установлено, что использование масок с малым числом элементов обеспечивает хорошую компрессию динамического диапазона, достигаемую, однако, ценою утраты корректной цветопередачи в однородных цветовых областях. Данное обстоятельство является объяснимым, поскольку в этих областях нарушается предположение о «сером мире», на котором базируется ретинекс: «Сумма всех цветов на изображении естественной сцены дает серый цвет». С другой стороны, протяженные маски обеспечивают более качественное цветовоспроизведение ценою потери качества компрессии динамического диапазона.
Суммируя вышесказанное, MSR нацелен на достижение компромисса между компрессией динамического диапазона и цветопередачей посредством комбинации нескольких SSR с набором масок. Наиболее часто упоминаемым в прототипах являются набор масок размерности 15, 80 и 250 пикселов. Использование других значений также имеет место в статье Т.Watanabe, Y.Kuwahara, A.Kojima, T.Kurosava An adaptive multi-scale Retinex algorithm realizing high color quality and high-speed processing, Journal of Imaging Science and Technology, vol.49, No.5, 2005, pp.486-497 [14], при этом минимальное и максимальное значение размерности маски рассчитываются исходя из размерности и характеристических особенностей изображения.
Нетрудно увидеть, что непосредственное применение ретинекс-технологии соответствует выполнению операций свертки, что сопряжено со значительными вычислительными затратами. В выложенной заявке США No. 2006/0078222 [15] изложены методы, направленные на оптимизацию алгоритмических решений, основанных на ретинекс-технологии.
В подходе [8]-[10] для гауссова размытия используется ускоренная схема вычислений, в которую дополнительно вводится ряд пороговых значений. Описанный способ используется в технологии HP "Adaptive Lighting". Основная идея метода заключается в применении модифицированного MSR к каналу яркости, которая рассчитывается как max (R, G, В). Результат модифицированного MSR рассматривается в дальнейшем в форме маски, добавляемой к R, G и В каналам. Современный подход к проблеме расчета MSR, оптимизированный по времени и по объему требуемой памяти, отражен в опубликованной заявке США US Pat. No. 6,947,176 [18].
Проблема обеспечения локального контраста как для стандартных цифровых изображений, так и для изображений с расширенным динамическим диапазоном непосредственно связана с проблемой выделения отражательной способности R(x,y) (reflectance или albedo). Исходное изображение I(х,у) рассматривается при этом как произведение отражательной способности R(x,y) и освещенности (luminance) L(x,y) в каждой точке (х,у), т.е.,
I(x,y)=L(x,y)·R(x,y).
В рамках данной модели изменения, связанные с освещением, имеют в целом постепенный характер, проявляясь обычно в виде гладких градиентов освещенности, в то время как изменения, связанные с вариациями отражательной способности, проявляют тенденцию к резкости. При этом отражательная способность реальных сцен не создает более высокий контраст, чем 100:1 (см. R.Fattal, D.Lischinski, М.Werman Gradient domain high dynamic range compression, ACM Transaction on Graphics, vol.21, No.3, 2002, pp.249-256 [16]).
Таким образом, улучшение зрительного восприятия воспроизводимого изображения может быть достигнуто разделением эффектов, связанных с изменением освещения, и эффектов, связанных с изменениями отражательной способности, т.е. L и R компонент, получением скорректированной оценки функции освещенности и последующим смешиванием и R, например, посредством умножения
.
Эта операция уменьшает контраст между ярко освещенными областями и тенями, не изменяя при этом контраста текстуры и отражательных характеристик поверхности.
Система и способ раздельного определения L и R компонент раскрыты, в частности, в патенте US No. 6,941,028 [17], который выбран в качестве прототипа заявляемого изобретения. В [17] решается задача определения экстремума функционала по L, в предположении, что минимум этого функционала соответствует наилучшей аппроксимации L. Отыскание экстремума функционала выражается в форме вариационной задачи с ограничениями следующего вида: 1) функция освещенности L ищется в классе гладких функций; 2) значения альбедо, т.е. отношение количества рассеянного во все стороны излучения к величине падающего на поверхность полного его потока (от лат. albedo - белизна), находятся в интервале [0,1] - соответственно, при разложении изображения I на образующие его компоненты искомое решение должно удовлетворять неравенству L>I; 3) среди континуума возможных решений оценка освещенности L должна быть насколько возможно близкой к I, чтобы контраст R принимал максимальное значение; 4) вид функции R соответствует поведению типичной естественной сцены (т.е., отражательная способность R(x,y) описывается кусочно-гладкой функцией).
Достигнутый уровень технологии производства приборов с зарядовой связью, в частности ПЗС-матриц, а также комплементарных металло-оксидных полупроводников, составляющих основу сенсорных элементов современных цифровых фотокамер, обеспечил существенное повышение размерности исходных изображений, подвергающихся обработке разнообразными процедурами улучшения их качества. В частности, получают широкое распространение профессиональные камеры с 16 Мп ПЗС-матрицей. Аналогичные параметры имеют и устройства, базирующиеся на более дешевой в производстве КМОП-технологии. Объявленный в последнее время размер КМОП-матрицы в 16,8 Мп ставит базирующиеся на их основе цифровые устройства в один ряд с приборами, основанными на применении получивших широкое распространение ПЗС-матриц, имеющими более чем 30-летнюю историю. Например, профессиональная камера Canon EOS D30, представляющая новое поколение цифровых зеркальных фотокамер с полнокадровым CMOS-датчиком, демонстрирует вполне конкурентные результаты, позволяя снимать в широком динамическом диапазоне и передавать мельчайшие градации цвета в тени, а также полутона и светлые области.
Таким образом, оптимизация алгоритма обработки изображения, используемого в программно-аппаратных средствах, представляет собой важную задачу, в особенности, если алгоритм обрабатывает изображение в целом.
Основные недостатки всех известных решений заключаются в том, что большинство из указанных методов требуют для их реализации значительных вычислительных затрат, что существенно ограничивает область их применимости.
Кроме того, после корректировки в той или иной мере проявляются следующие дефекты:
- возникновение ореола («halo» эффект) вдоль резких перепадов яркости на изображении;
- цветовые искажения;
- усиление уровня шума во всем тоновом диапазоне или отдельно в области теней;
- чрезмерное усиление темных областей (черный цвет приобретает неприятный грязный оттенок);
- чрезмерное усиление средних и светлых тоновых областей;
- постеризация изображения (огрубление плавных градиентов интенсивности, выражающееся в заметных скачках тона при переходе от одного уровня к другому).
Несмотря на существенный прогресс в данной технической области, существующие методы регистрации, улучшения и воспроизведения изображений пока не в состоянии обеспечить такое высокое качество цифровых изображений, которое было бы полностью адекватно процессу обработки в зрительной системе человека. Применительно к области цифровой печати, алгоритмическое и программное обеспечение ретинекс-технологии также отсутствует.
Задача, на решение которой направлено заявляемое изобретение, состоит в том, чтобы повысить качество изображения, сохранить и, по возможности, улучшить цветовую информацию, повысить резкость во всех тоновых диапазонах, устранить эффект постеризации изображения, обеспечить коррекцию крайне темных тонов изображения и, наконец, снизить уровень шума скорректированного изображения.
Поставленная задача решена путем разработки и применения усовершенствованного способа (метода) улучшения цифровых изображений, основанного на использовании модели формирования изображения, в которой производится разделение эффектов, связанных с отражательной способностью поверхности, и эффектов, связанных с характеристиками освещения сцены, который, в конечном итоге, включает в себя глобальное контрастирование, локальную коррекцию темных и светлых тонов, коррекцию шума изображения, а также увеличение резкости изображения. Метод не приводит к возникновению заметных ореолов, обеспечивает значительное повышение резкости во всех тоновых диапазонах, снижение постеризации и шума, коррекцию крайне темных тонов изображения.
Заявляемый способ улучшения цифрового изображения основан на использовании модели формирования изображения, в которой производится разделение эффектов, связанных с отражательной способностью поверхности R, и эффектов, связанных с характеристиками освещения сцены L, и состоит из следующих этапов:
- регистрируют изображение;
- вычисляют оценку качества изображения и принимают решение о необходимости коррекции изображения;
- осуществляют фильтрацию шума изображения;
- создают уменьшенную копию изображения;
- определяют из уменьшенной копии изображения пределы для последующего контрастирования на этапе коррекции;
- выделяют канал яркости исходного изображения;
- фильтруют канал яркости исходного изображения с использованием билатерального фильтра;
- корректируют изображение в соответствии с эмпирически найденным уравнением, основу которого составляет LR-модель формирования изображения:
где А - нижняя граница диапазона контрастирования уменьшенной копии изображения; Ф и Ψ - нижняя и верхняя границы контрастирования преобразованного изображения; JB - компонента яркости исходного изображения после билатеральной фильтрации; γ - параметр нелинейного преобразования и JF - компонента яркости улучшенного изображения;
- преобразуют результирующее изображение в цветовое пространство RGB.
При этом при реализации заявляемого способа целесообразно использовать билатеральный фильтр для фильтрации шумов. Предпочтительно, чтобы для фильтрации использовали такой билатеральный фильтр, в котором фильтрация осуществляется сначала по строкам, а затем по столбцам изображения:
где Ir(r,c) - результат фильтрации исходного изображения I для всех пикселов (r,с) по строкам; If(r,с) - результат фильтрации исходного изображения I для всех пикселов (r,с) по столбцам; u и w - гауссовские функции, применяемые для фильтрации по пространству и градациям яркости (стоп-функция) соответственно.
Для реализации заявляемого способа важно, чтобы создание уменьшенной копии изображения, осуществляемое посредством интерполяционного изменения частоты дискретизации исходного изображения, т.е. расчета яркости в точках, не принадлежащих исходному множеству точек изображения, в которых значения яркости известны, состояло из следующих этапов:
- вычисляют множество координат, в которых необходимо вычислить значения яркости;
- для каждой пары координат исходного изображения определяют координаты 16 ближайших соседей и рассчитывают значения элементов карты направлений краев, которые могут принимать значения от 1 до 8, в зависимости от значений частных производных в восьми направлениях;
- выполняют морфологические операции над картой направлений краев;
- для каждой пары рассчитанных координат выполняют одномерную интерполяцию в направлении, определяемом значением соответствующего элемента в карте направлений краев, при этом повторяют данный шаг для каждой цветовой компоненты;
- подчеркивают края на изображении для улучшения визуального восприятия изображения.
Для реализации заявляемого способа важно, чтобы оценка качества изображения, основанная на разбиении матрицы изображения на блоки и последующем анализе гистограмм блоков, составляющих изображение, с целью выявления и классификации дефектов экспозиции исходного цифрового изображения, включала в себя выполнение следующих операций:
- разбивают изображение на отдельные не перекрывающиеся между собой блоки;
- рассчитывают яркостную гистограмму каждого блока;
- проводят анализ яркостной гистограммы каждого блока;
- присваивают классификационный признак каждому блоку;
- изображение классифицируют как Нормальное, Темное, Светлое и Низкоконтрастное.
Для реализации заявляемого способа важно, чтобы на этапе коррекции предварительно вычисляли двумерную таблицу перекодировки, которая хранит скорректированные значения яркости в зависимости от исходной яркости (номер строки таблицы) и результата билатеральной фильтрации (номер столбца таблицы), что приводит к уменьшению времени коррекции.
Для реализации заявляемого способа важно, чтобы коррекция цифрового изображения, основанная на использовании модели формирования изображения, в которой производится разделение эффектов, связанных с отражательной способностью поверхности R, и эффектов, связанных с характеристиками освещения сцены L, производилась в устройстве фотопечати (фотопринтере), причем чтобы одновременно осуществлялось улучшение уменьшенной копии изображения, используемой в настоящее время во многих моделях принтеров для отображения на ЖК-мониторе, посредством применения билатеральной фильтрации и обработки фильтрованного изображения в соответствии с формулой
,
где TB - преобразованное изображение уменьшенной копии после билатеральной фильтрации; TF - результирующее изображение после «блендирования», т.е. специального смешивания уменьшенной копии и результата ее билатеральной фильтрации; γ - параметр, определяемый эмпирически.
Сущность заявляемого изобретения поясняется далее с привлечением чертежей.
Фиг.1. Схема базовых компонентов системы для реализации процедуры улучшения изображений, основанной на использовании LR-модели их формирования.
Фиг.2. Общая блок-схема алгоритма улучшения изображений, основанного на использовании LR-модели их формирования.
Фиг.3. Блок-схема этапов процесса построения карты направлений краев.
Фиг.4. Блок-схема этапов процесса обработки карты направлений краев.
Фиг.5. Блок-схема этапов процесса интерполяции изображения.
Фиг.6. Интерполяционная схема в случае, когда значения карты направлений краев принимают значения от 1 до 4.
Фиг.7. Интерполяционная схема в случае, когда значения карты направлений краев принимают значения от 5 до 8.
Фиг.8. Блок-схема этапов постобработки.
Фиг.9. Примеры кривых преобразования яркости для разных значений контролирующего параметра n.
Фиг.10. Блок-схема коррекции глобального контраста.
Фиг.11. Деление изображения на 2×2 и 3×3 частей.
Фиг.12. Блок-схема глобального и локального анализа цифровых изображений и классификации дефектов экспозиции.
Фиг.13. Блок-схема процесса выбора возможной техники коррекции изображения.
Фиг.14. Результаты классификации и соответствующие гистограммы.
Фиг.15. Результаты глобальной и локальной классификации недоэкспонированного изображения.
Фиг.16. Результаты глобальной и локальной классификации переэкспонированного изображения.
Фиг.17. Блок-схема алгоритма улучшения цифрового изображения, основанного на использовании LR-модели его формирования.
Фиг.18. Определение пороговых значений диапазона контрастирования А, Ф и Ψ из гистограммы уменьшенной копии изображения («thumbnail»).
Фиг.19. Пример улучшения изображения, зарегистрированного в сложных условиях освещения, с использованием LR-алгоритма.
Фиг.1 показывает схему взаимодействия основных компонентов системы в форме, достаточной для реализации предложенного метода улучшения изображения. Цифровое фотоизображение получают от одного или более входных устройств 101 или загружают с носителя 102. Цветные изображения сохраняют в цветовом пространстве RGB, при этом они имеют размерность N×М и глубину цвета d (n=d/3 - битов на цветовой канал). Полутоновые изображения имеют размерность N×М и глубину цвета n битов на пиксел. В том случае, если цветовое пространство исходного изображения отличается от RGB, возможно соответствующее преобразование цветового пространства. Носитель 102, в свою очередь, выполняют в форме съемного или стационарного устройства, которое включает магнитные диски, магнитные ленты или кассеты, CD-ROM, CD-RW, DVD, или произвольного устройства, которое может хранить изображение, содержащее информацию, или с которого цифровое изображение может быть считано. Носитель 102 может также содержать команды, используемые программным модулем 105 для автоматического анализа и коррекции цифровых изображений. Процесс анализа и оценки изображений осуществляют реальным или виртуальным процессором 106, который выполняет программу, записанную в блоке памяти 103. В мультипроцессорной системе программный код выполняется несколькими процессорами с целью увеличения производительности. Информационный обмен осуществляют через шину 104 данных. После обработки изображение посылают на одно или более выводных устройств 107, либо выгружают на носитель 102. Метаданные, соответствующие коррекции изображения, генерируют и записывают в файл цифрового изображения, содержащий улучшенное изображение, для предотвращения многократной оценки или коррекции изображения.
Фиг.2 демонстрирует этапы предварительной обработки исходного изображения, целесообразные с точки зрения последующего эффективного применения процедуры улучшения, основанной на использовании LR-модели. Первоначально осуществляется считывание (загрузка) исходного изображения 201 и проверяется выполнение условия 202: соответствует ли размерность исходного изображения размерности итогового изображения? Если условие не выполняется, производится необходимое изменение для согласования размеров цифрового изображения 203.
Во многих случаях современные камеры обеспечивают высокое качество исходных изображений, так что их последующая коррекция не требуется. Поэтому на шаге 204 проверятся условие: требуется ли исходному изображению дополнительная коррекция экспозиции? Если условие не выполняется, применяется процедура улучшения, основанная на использовании LR-модели 205. В большинстве случаев применение алгоритма не требует предварительной сортировки изображений по признакам качества экспозиции; предлагаемый алгоритм является достаточно стабильным: его влияние на восприятие нормально экспонированного изображения незначительно.
В результате выполнения предыдущих операций производится печать или сохранение обработанных изображений.
Далее последовательность операций, определенных блок-схемой на Фиг.2, описывается шаг за шагом поблочно.
Один из возможных методов интерполяции изображения 203, то есть расчета яркости в точках, не принадлежащих исходному множеству точек изображения, в которых значения яркости известны, состоит из следующих этапов:
- предварительная обработка изображения с целью удаления артефактов сжатия с потерями, если необходимо;
- для каждой пары координат исходного изображения определение координат пятнадцати ближайших соседей и расчет значений элементов карты направлений краев, которые могут принимать значения от одного до восьми, в зависимости от значений частных производных в восьми направлениях;
- выполнение морфологических операций над картой направлений краев;
- вычисление множества координат, в которых необходимо вычислить значения яркости;
- для каждой пары рассчитанных координат выполнение одномерной интерполяции в направлении, определяемом значением соответствующего элемента в карте направлений краев;
- повторение предыдущего шага для каждой цветовой компоненты;
- последующая обработка изображения для уменьшения артефактов и улучшения границ (т.е. подчеркивания краев).
Отметим, что шаг 203 является существенным этапом в последовательности алгоритмических действий (Фиг.2), поскольку размер обрабатываемого изображения оказывает непосредственное влияние на значения параметров последующей LR-коррекции.
Метод может быть применен как к цветным, так и к черно-белым (в оттенках серого) изображениям, и обеспечивает получение качественных и резких изображений высокого разрешения.
На Фиг.3 приведена блок-схема этапов реализации способа. Пусть I - исходное изображение, размер которого больше, чем четыре на четыре пиксела. Для каждого элемента исходного изображения производят следующую процедуру. Выделяют пятнадцать ближайших соседей обрабатываемой точки 302, т.е. для каждой пары координат i, j исходного изображения выделяют точки с координатами i+k, j+l, для всевозможных k и l, таких что -1<k<2, -1<l<2. Затем вычисляют абсолютные значения производных в четырех направлениях (шаг 303). В качестве приближения производных используют соответствующие конечные разности, вычисляемые по следующим правилам. Для каждой пары координат i, j исходного изображения
где Ix, Iy, Id1, Id2, Ixxy, Iyxx, Ixyy, Iyyx являются абсолютными значениями производных по восьми направлениям. На шаге 304 выбирают минимальное среди этих восьми производных по направлению. Индекс минимальной по направлению производной заносят в массив - карту направлений краев (шаг 305). Индекс для величин [Ix, Iy, Id1, Id2, Ixxy, Iyxx, Ixyy, Iyyx] выбирают как [1, 2, 3, 4, 5, 6, 7, 8] соответственно.
Фиг.4 иллюстрирует процесс обработки карты направлений краев в блоке интерполяции 203. Сначала к карте направлений краев применяют операцию удаления резких вариаций: для этого используют окно размером три на три элемента, выделяют восемь ближайших соседей (шаг 401). Если внутри окна существует, по крайней мере, три разных значения карты направлений краев со значениями, больше или равными пяти, то значение карты направлений краев в центральной части окна заменяют по следующему правилу: 5 и 6 заменяют на 1; 7 и 8 заменяют на 2 (шаг 402). Когда достигается последний элемент карты направлений краев (шаг 403), процесс обработки карты направлений краев переходит к следующему этапу. На последующих этапах (шаги 404-407) небольшие изолированные края (с индексами в карте направлений краев, большими или равными пяти), которые могут быть проявлениями шума в изображении, удаляют с помощью морфологических операций эрозии, с последующей дилатацией. Морфологическая операция эрозии помечает центральный пиксель как ненулевой, если все ненулевые элементы структурного элемента совпадают с ненулевыми элементами обрабатываемого массива (изображения). Морфологическая операция эрозии помечает центральный пиксель как ненулевой, если по крайней мере один ненулевой элемент структурного элемента совпадает с ненулевыми элементами обрабатываемого массива (изображения). Структурный элемент выбирают в зависимости от обрабатываемого значения карты направлений краев следующим образом:
Значение КНК | Структурный элемент | Значение КНК | Структурный элемент | ||||
5 | 7 | ||||||
1 | 1 | 0 | 1 | 0 | |||
0 | 1 | 1 | 1 | 1 | |||
0 | 1 | ||||||
6 | 8 | ||||||
0 | 1 | 1 | 0 | 1 | |||
1 | 1 | 0 | 1 | 1 | |||
1 | 0 |
Фиг.5 иллюстрирует интерполяционную процедуру в ее наиболее предпочтительном применительно к целям настоящего изобретения варианте. Сначала строят множество точек, в которых необходимо вычислить значения яркости (шаг 501), и для каждой точки построенного множества производят следующую процедуру. Определяют координаты точки А (шаг 502), поскольку координаты этой точки в общем случае не совпадают с какими-либо координатами точек исходного изображения. Затем находят координаты шестнадцати ближайших соседей, принадлежащих исходному изображению (шаг 502), и соответствующее направление края считывают из карты направлений краев (шаг 504). Интерполяцию производят в соответствии со считанным значением из карты направлений краев. Этот процесс (шаг 505) будет далее описан подробней. Как только считано последнее значение из множества точек, в которых необходимо вычислить значения яркости, условие 505 считают удовлетворенным. О