Многоуровневое сжатие видеоизображения с расширенным динамическим диапазоном, визуальным динамическим диапазоном и широкой цветовой гаммой
Иллюстрации
Показать всеИзобретение относится к средствам многоуровневого сжатия видеоизображения. Технический результат заключается в увеличение эффективности кодирования. Получают в многоуровневом кодеке первого потока изображения с первым динамическим диапазоном и первым цветовым пространством, и второго потока изображения со вторым динамическим диапазоном. Первый поток изображения получают путем выполнения локального тонального отображения на втором потоке изображения, используя функциональную форму, отображающую семейство кривых тонального отображения, параметризованное посредством одного параметра, причем первый динамический диапазон меньше второго динамического диапазона, и первый поток изображения находится в базовом слое, и второй поток изображения находится в слое расширения. Многоуровневый кодек включает декодер и кодер. Кодируют первый поток изображения в базовом слое с использованием кодера для получения кодированного первого потока изображения. Декодируют кодированный первый поток изображения с использованием декодера для получения декодированного первого потока изображения. Конвертируют декодированный первый поток изображения из первого цветового пространства во второе цветовое пространство второго потока изображения для получения конвертированного цветового первого потока изображения. Генерируют параметры обратного тонального отображения на основе конвертированного цветового потока изображения и второго потока изображения, где параметры обратного тонального отображения дают приближение второго потока изображения при применении к конвертированному цветовому потоку изображения. 3 н. и 17 з.п. ф-лы, 15 ил.
Реферат
ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ
[0001] Данная заявка заявляет приоритет предварительной заявки на патент США №61/159964, поданной 13 марта 2009 г., описание которой ссылкой полностью включается в настоящее описание.
ОБЛАСТЬ ТЕХНИЧЕСКОГО ПРИМЕНЕНИЯ
[0002] Данное раскрытие в целом относится к видеотехнике и, в частности, к кодированию, обработке и/или сжатию видеоизображения.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
[0003] Изображения, отображаемые современными видеодисплеями, такими как CRT-, LCD- и плазменные дисплеи, стремятся к тому, чтобы иметь определенную цветовую гамму и динамический диапазон в пределах области узкого динамического диапазона (LDR).
[0004] Термин «динамический диапазон» для любого изображения может относиться к диапазону характеристик изображения (например, яркости, светимости) или отношению самого сильного критерия, или интенсивности, данной характеристики изображения к самому слабому критерию, или интенсивности, этой характеристики. В некоторых случаях самым слабым критерием характеристики изображения может являться шум. В некоторых случаях характеристикой изображения может являться светимость, цвет, комбинация светимости и цвета или функция светимости и/или цвета.
Динамическим диапазоном также может именоваться соотношение между максимально яркими и максимально тусклыми, но не черными, пикселами на изображении. Это соотношение может мало отличаться от контрастности, которой может именоваться соотношение между самыми яркими и черными (например, выключенными) пикселами. Зрительная система человека способна распознавать до десяти порядков величины полного динамического диапазона, и может содержать одновременно видимый динамическим диапазоном в, около 5-6 порядков величины. Видеодисплеи могут иметь динамический диапазон в 2-3 порядка величины.
[0005] Цветовой гаммой может именоваться пространство всех цветов, которые могут захватываться или отображаться конкретным устройством. Видео- и компьютерные дисплеи могут представлять цвета внутри треугольника, вершины которого представляют собой цветность красного, зеленого и синего первичных цветов на любой из цветовых диаграмм согласно стандарту CIE.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[0006] ФИГ.1А - диаграмма с примером проведения различий между расширенным динамическим диапазоном (HDR), узким динамическим диапазоном (LDR) и визуальным динамическим диапазоном (VDR).
[0007] ФИГ.1В - диаграмма для этапов изготовления и распространения на примере кинокартины.
[0008] ФИГ.2 - диаграмма примера преобразования координат R'G'B' с гамма-коррекцией в VDR-формат.
[0009] ФИГ.3 - диаграмма примера глобального тонального отображения.
[0010] ФИГ.4 - примеры изображений, иллюстрирующие потерю деталей для высокой и низкой светимости при тональном отображении HDR в LDR.
[0011] ФИГ.5 - пример параметризованного семейства операторов тонального отображения.
[0012] ФИГ.6 - пример совместимого кодека.
[0013] ФИГ.7 - блок-схема примера совместимого кодека.
[0014] ФИГ.8 - пример архитектуры глобального тонального отображения.
[0015] ФИГ.9 - пример архитектуры локального тонального отображения.
[0016] ФИГ.10 - пример параметризованного обратного тонального отображения второго порядка.
[0017] ФИГ.11 - пример обработки остаточного сигнала.
[0018] ФИГ.12А - пример изображения с тонально отображенным HDR.
[0019] ФИГ.12В - пример остаточного изображения, полученного посредством раскрытых технологий.
[0020] ФИГ.13 - пример системы.
[0021] Сходные ссылочные позиции и обозначения на разных иллюстрациях указывают на сходные элементы.
ОПИСАНИЕ ИЛЛЮСТРАТИВНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
[0022] Здесь описываются иллюстративные варианты осуществления изобретения, относящиеся к сжатию видеоизображения и кодированию видеоизображения. В нижеследующем описании для разъяснения излагается множество конкретных подробностей с целью обеспечения исчерпывающего понимания различных вариантов осуществления изобретения. Однако, как станет ясно, эти варианты осуществления изобретения могут быть использованы на практике без этих конкретных подробностей. В других случаях конструкции и устройства показываются в виде блок-схем во избежание не являющегося необходимым затруднения понимания других особенностей. Подробности одного или больше вариантов осуществления изобретения изложены в сопроводительных графических материалах и приведенном ниже описании. Другие особенности, цели и аспекты станут ясны из описания и иллюстраций, а также из формулы изобретения.
ОБЩИЙ ОБЗОР
[0023] Некоторые варианты осуществления раскрываемых технологий включают способ кодирования видеоизображения. Способ включает генерирование видеокодером кодированного видеопотока, где кодированный видеопоток имеет динамический диапазон в 5-6 порядков величины (105-106) светимости.
[0024] Эти и другие варианты осуществления изобретения могут, необязательно, включать одну или больше из перечисленных ниже особенностей. Генерирование кодированного видеопотока может включать генерирование кодированного видеопотока в формате визуального динамического диапазона (VDR) для видеоизображения, где VDR-формат может охватывать диапазон светимости и визуальную цветовую гамму (VCG), которые зрительная система человека может воспринимать одновременно. VCG может включать все цвета, которые одновременно может воспринимать зрительная система человека, где диапазон светимости может включать динамический диапазон восприятия светимости человеческим глазом, а VCG может включать широкую цветовую гамму (WCG). VDR-формат видеоизображения может содержать 32 бит на пиксел, где 32 бит на пиксел могут включать 12 бит светимости и по 10 бит на каждый цветовой канал.
[0025] В других общих аспектах технология включает способ кодирования видеопотока видеокодером с использованием 32 бит на пиксел, где 32 бит на пиксел включают 12 бит светимости и по 10 бит на каждый цветовой канал.
[0026] Эти и другие варианты осуществления изобретения могут, необязательно, включать одну или больше следующих особенностей. Кодированный видеопоток может включать данные для видеоизображения, имеющего визуальный динамический диапазон (VDR). Динамический диапазон VDR может составлять 5-6 порядков величины светимости. Динамический диапазон VDR может включать динамический диапазон восприятия светимости человеческим глазом. VDR может конфигурироваться для форматов видеоизображения, включая форматы захвата, распространения и потребления, или широкой цветовой гаммы (WCG). VDR может быть представлен в цветовых координатах XYZ согласно стандарту CIE, координатах гамма-кодирования, логарифмического кодирования, или менее чем единицей едва заметного различия (JND). Способ может включать вычисление логарифмической светимости LD с фиксированной точкой из физической светимости Y в кд/м2 с использованием параметра S масштаба и параметра В смещения. Согласно способу, вычисление логарифмической светимости LD с фиксированной точкой может включать вычисление
LD=[S(log2Y+B)]
и
Способ может включать использование параметра В смещения для определения диапазона полной светимости в кд/м2. Способ может включать определение динамического диапазона DR с использованием параметра S масштаба и количества бит N. Определение динамического диапазона DR может включать определение
Способ может включать вычисление координат (u', v') для цветовых каналов путем определения проективного преобразования на цветовых координатах XYZ. Способ может включать преобразование координат R'G'B' с гамма-коррекцией в VDR. Процесс преобразования координат R'G'B' с гамма-коррекцией может включать: конверсию координат R'G'B' с гамма-коррекцией для генерирования координат RGB путем отмены гамма-коррекции; выполнение матричного преобразования на координатах RGB для генерирования цветовых координат XYZ; конверсию цветовой координаты Y в логарифмическую светимость LD с фиксированной точкой с использованием логарифмической функции и первичного квантования; и конверсию цветовых координат Х и Z в цветовые координаты u'D и v'D путем проективного преобразования и вторичного квантования. Способ может включать выбор динамического диапазона на основе диапазона светимости и цветов, которые зрительная система человека может распознавать одновременно. Кодированный видеопоток может включать данные для видеоизображения, имеющего визуальный динамический диапазон (VDR), в котором динамический диапазон VDR-видеоизображения имеет 5-6 порядков величины светимости.
[0027] В других аспектах технология включает способ сжатия видеоизображения с визуальным динамическим диапазоном (VDR). Способ включает прием многоуровневым кодеком битового потока с узким динамическим диапазоном (LDR) и битового потока VDR, где многоуровневый кодек включает, по меньшей мере, один кодер, первый декодер и второй декодер. Способ включает обработку битового потока LDR в базовом слое, где обработка битового потока LDR включает, по меньшей мере, одну операцию в первом декодере. Способ включает обработку битового потока VDR в слое расширения, где обработка битового потока VDR включает, по меньшей мере, одну операцию во втором декодере, и битовый поток VDR включает информацию, которая игнорируется первым декодером.
[0028] Эти и другие варианты осуществления изобретения могут, необязательно, включать одну или больше из нижеследующих особенностей. VDR-видеоизображение может представлять собой видеоизображение 32 бит на пиксел, где 32 бит на пиксел могут включать 12 бит светимости и по 10 бит на каждый из двух цветовых каналов. Динамический диапазон VDR-видеоизображения может содержать 5-6 порядков величины светимости, где динамический диапазон VDR-видеоизображения больше, чем динамический диапазон LDR-видеоизображения, и где динамический диапазон VDR-видеоизображения меньше, чем динамический диапазон видеоизображения с расширенным динамическим диапазоном (HDR). Многоуровневый кодек может включать тип кодера, который совместим с форматом Н.264 или форматом AVC. Кодек может представлять собой кодек без дрейфа. Способ может включать вставку в битовый поток VDR данных для одной или больше деталей оригинального изображения, которые были потеряны в результате создания битового потока LDR из оригинального изображения.
[0029] Способ может включать применение к данным с узким динамическим диапазоном по меньшей мере одной операции деконтурирования, обратного тонального отображения деконтурированных данных с узким динамическим диапазоном, генерирующего остаточный сигнал посредством данных с расширенным динамическим диапазоном или данных с визуальным динамическим диапазоном, и обработку этого остаточного сигнала. Остаточный сигнал может включать разность между изображением с расширенным динамическим диапазоном и предсказанием на основе изображения с узким динамическим диапазоном, или разность между изображением с визуальным динамическим диапазоном и предсказанием на основе изображения с узким динамическим диапазоном.
[0030] В других аспектах технология включает способ кодирования и декодирования в кодеке. Способ включает генерирование сжатого битового потока в кодере кодека, где генерирование сжатого битового потока включает: прием кодером входного потока изображения с узким динамическим диапазоном (LDR); кодирование и декодирование входного потока LDR-изображения для получения первого внутреннего битового потока LDR и декодированного потока LDR-изображения; и преобразование декодированного потока LDR-изображения в пространство визуального динамического диапазона (VDR) с использованием блока преобразования внутри кодера.
[0031] Эти и другие варианты осуществления изобретения могут, необязательно, включать одну или больше нижеследующих особенностей. Сжатый битовый поток может включать информацию с узким динамическим диапазоном (LDR) в базовом слое сжатого битового потока и информацию с визуальным динамическим диапазоном (VDR) - в слое расширения сжатого битового потока. VDR-видеоизображение может включать 32 бит на пиксел, где 32 бит на пиксел могут включать 12 бит светимости и по 10 бит на каждый из двух цветовых каналов. Динамический диапазон VDR-видеоизображения может включать 5-6 порядков величины светимости. Динамический диапазон VDR-видеоизображения может быть больше, чем динамический диапазон LDR-видеоизображения, и динамический диапазон VDR-видеоизображения может быть меньше, чем динамический диапазон видеоизображения с расширенным динамическим диапазоном (HDR). Преобразование может включать генерирование логарифмической светимости LD с фиксированной точкой и цветовых координат (u'D, v'D). Генерирование сжатого битового потока в кодере также может включать подавление артефактов квантования в преобразованном LDR посредством блока деконтурирования для получения первого деконтурированного битового потока LDR. Преобразование декодированного потока LDR-изображения в пространство визуального динамического диапазона (VDR) с использованием блока преобразования в кодере может включать: выполнение анализа тонального отображения (ТМ) на первом деконтурированном битовом потоке LDR для генерирования параметров тонального отображения; выполнение обратного тонального отображения (ITM) на первом деконтурированном битовом потоке LDR; и генерирование остаточного сигнала, который зависит от результата обратного тонального отображения входного битового потока с визуальным динамическим диапазоном (VDR). Способ также может включать: обработку остаточного сигнала; кодирование обработанного остаточного сигнала; получение первого остаточного битового потока; прием блоком форматтера первого остаточного битового потока, первого внутреннего битового потока LDR и параметров тонального отображения; и получение на выходе кодера сжатого битового потока. Способ может включать кодирование параметров тонального отображения в блоке кодирования тонального отображения. Способ может включать генерирование выходного битового потока VDR в декодере кодека, который декодирует сжатый битовый поток. Генерирование декодером выходного битового потока VDR может включать: прием декодером сжатого битового потока; синтаксический анализ сжатого битового потока во второй битовый поток LDR, битовый поток тонального отображения и второй внутренний остаточный битовый поток; декодирование второго внутреннего битового потока LDR; и преобразование декодированного второго внутреннего битового потока LDR в пространство визуального динамического диапазона (VDR) в декодере путем использования блока преобразования внутри декодера. Генерирование декодером выходного битового потока VDR может включать: подавление артефактов квантования в преобразованном декодированном втором битовом потоке LDR посредством блока деконтурирования для получения второго деконтурированного битового потока LDR; выполнение анализа обратного тонального отображения на втором деконтурированном битовом потоке LDR и битовом потоке тонального отображения; декодирование и обработку второго остаточного битового потока; и генерирование декодером выходного битового потока, который зависит от декодированного и обработанного второго остаточного битового потока и от результата анализа обратного тонального отображения. Анализ обратного тонального отображения может включать вычисления с использованием параметров тонального отображения. Любое тональное отображение, или обратное тональное отображение, выполняемое в кодеке, может включать функцию параметризованного оператора глобального тонального отображения, функцию параметризованного оператора локального тонального отображения, функцию параметризованного оператора обратного глобального тонального отображения или функцию параметризованного оператора обратного локального тонального отображения. Любой параметризованный оператор локального тонального отображения или параметризованный оператор обратного локального тонального отображения может включать функцию с множеством кривых второго порядка. Остаточный сигнал может включать размер, который приводит к невидимому остаточному изображению. Генерирование в кодере сжатого битового потока также может включать: понижающую дискретизацию остаточного сигнала; и сжатие подвергнутого понижающей дискретизации остаточного сигнала. Кодек может представлять собой кодек без дрейфа. VDR-видеоизображение может включать динамический диапазон с диапазоном в 5-6 порядков величины светимости видеоизображения.
[0032] В другом аспекте технология включает способ обработки видеоизображения, который включает, в устройстве кодирования видеоизображения, декодирование первого видеопотока, имеющего первый динамический диапазон, для получения первого декодированного потока. Способ включает применение оператора обратного тонального отображения к декодированному первому потоку для предсказания второго видеопотока, где второй видеопоток имеет второй динамический диапазон более широкий, чем первый динамический диапазон, и получение из второго видеопотока выходного видеопотока.
[0033] Эти и другие варианты осуществления изобретения могут, необязательно, включать одну или больше следующих особенностей. Первый динамический диапазон может представлять собой видеоизображение с узким динамическим диапазоном (LDR), второй динамический диапазон может представлять собой видеоизображение с визуальным динамическим диапазоном (VDR). Оператор обратного тонального отображения может включать оператор глобального тонального отображения. Обратное глобальное тональное отображение может включать преобразование LDR-светимости в VDR-светимость, которое включает общее преобразование для множества пикселов видеоданных изображения. Способ может включать вычисление вектора параметров для обратного глобального тонального отображения. Вычисление вектора параметров может включать вычисление оценки методом наименьших квадратов или оценки метрики погрешности для подбора полиномиальной функции. Оператор обратного тонального отображения может являться монотонным. Оператор обратного тонального отображения может включать оператор обратного локального тонального отображения, где оператор обратного локального тонального отображения может включать преобразование, включающее отображение LDR-светимости в VDR-светимость, и это преобразование может быть варьируемым для множества пикселов видеоданных изображения. Оператор обратного локального тонального отображения может включать параметры для локальных изменений. Оператор обратного локального тонального отображения может включать функцию, которая содержит множество кривых второго порядка. Оператор обратного локального тонального отображения может включать параметры, которые соответствуют операциям увеличения контрастности или уменьшения контрастности, или сходны с этими операциями. Динамический диапазон VDR-видеоизображения может составлять 5-6 порядков величины светимости, а динамический диапазон LDR может составлять 2-3 порядка величины светимости. Динамический диапазон VDR-видеоизображения меньше, чем динамический диапазон видеоизображения с расширенным динамическим диапазоном (HDR). Динамический диапазон видеоизображения с расширенным динамическим диапазоном (HDR) может составлять 10-14 порядков величины светимости. Способ может включать вычисление остаточного сигнала, где остаточный сигнал может представлять собой разность между изображением с расширенным динамическим диапазоном и предсказанием на основе изображения с узким динамическим диапазоном, или разность между изображением с визуальным динамическим диапазоном и предсказанием на основе изображения с узким динамическим диапазоном. Размер остаточного сигнала может быть нулевым, и тогда изображение, получаемое из остаточного сигнала, представляет собой невидимое изображение. Размер остаточного сигнала может быть приблизительно нулевым, и тогда изображение, получаемое из остаточного сигнала, представляет собой невидимое изображение или в значительной степени невидимое изображение. Способ может включать операции с данными VDR-видеоизображения в слое расширения и операции с данными LDR-видеоизображения в базовом слое.
[0034] В другом аспекте технология включает способ предсказания динамического диапазона видеоизображения. Способ включает, посредством устройства обработки видеоизображения, предсказание первого динамического диапазона видеоизображения путем применения оператора обратного глобального тонального отображения к изображению, включающему второй динамический диапазон, или предсказание третьего динамического диапазона видеоизображения путем применения оператора обратного глобального тонального отображения к изображению, включающему второй динамический диапазон. Способ включает получение выходного видеоизображения, включающего первый динамический диапазон и третий динамический диапазон.
[0035] Эти и другие варианты осуществления изобретения могут, необязательно, включать одну или больше следующих особенностей. Первый динамический диапазон видеоизображения может представлять собой расширенный динамический диапазон (HDR), второй динамический диапазон видеоизображения может представлять собой узкий динамический диапазон (LDR), и третий динамический диапазон видеоизображения может представлять собой визуальный динамический диапазон (VDR). Динамический диапазон HDR-видеоизображения может составлять 10-14 порядков величины светимости, динамический диапазон VDR-видеоизображения может составлять 5-6 порядков величины светимости, и динамический диапазон LDR-видеоизображения может составлять 2-3 порядка величины светимости. Обратное глобальное тональное отображение может представлять собой преобразование LDR-светимости в HDR-светимость, которое может включать общее преобразование для множества пикселов изображения. Способ может включать вычисление вектора параметров для обратного глобального тонального отображения, где вычисление вектора параметров может включать вычисление оценки методом наименьших квадратов или оценки метрики погрешности для подбора полиномиальной функции. Оператор обратного тонального отображения может включать оператор обратного локального тонального отображения, где оператор обратного локального тонального отображения может содержать преобразование, включающее отображение LDR-светимости в HDR-светимость. Преобразование может быть варьируемым для множества пикселов изображения. Способ может включать определение параметра для каждого из этих пикселов. Способ может включать генерирование изображения параметров с использованием параметров для каждого пиксела. Оператор обратного локального тонального отображения может включать параметры для локальных изменений. Оператор обратного локального тонального отображения может включать параметризованный оператор обратного локального тонального отображения, включающий, по меньшей мере, одну функцию, содержащую множество кривых второго порядка. Оператор обратного локального тонального отображения, или оператор обратного глобального тонального отображения, может включать параметры, соответствующие операциям увеличения контрастности или уменьшения контрастности или сходные с этими операциями. Способ может включать получение остаточного сигнала, где остаточный сигнал может представлять собой разность между изображением с расширенным динамическим диапазоном и предсказанием на основе изображения с узким динамическим диапазоном, или разность между изображением с визуальным динамическим диапазоном и предсказанием на основе изображения с узким динамическим диапазоном. Размер остаточного сигнала может быть нулевым, и тогда изображение, получаемое из остаточного сигнала, представляет собой невидимое изображение. Размер остаточного сигнала может быть приблизительно нулевым, и тогда изображение, получаемое из остаточного сигнала, представляет собой невидимое изображение или в значительной степени невидимое изображение. Оператор тонального отображения, соответствующий оператору обратного локального тонального отображения, или оператору обратного глобального тонального отображения, может являться монотонным, и оператор обратного локального тонального отображения, или оператор обратного глобального тонального отображения, может являться параметризованным. Третий динамический диапазон видеоизображения может представлять собой визуальный динамический диапазон (VDR) видеоизображения, где динамический диапазон VDR-видеоизображения может составлять 5-6 порядков величины светимости.
[0036] В других аспектах технология включает способ выполнения остаточной обработки видеоданных в кодеке, который включает кодер и декодер. Посредством кодера, способ включает фильтрацию нижних частот входного остаточного сигнала, понижающую дискретизацию фильтрованного остаточного сигнала, кодирование подвергнутого понижающей дискретизации остаточного сигнала и получение выходного остаточного битового потока. Посредством декодера, способ включает декодирование выходного остаточного битового потока, повышающую дискретизацию декодированного остаточного битового потока, реконструкцию частотного диапазона в подвергнутом повышающей дискретизации остаточном битовом потоке и получение выходного остаточного сигнала.
[0037] Эти и другие варианты осуществления изобретения могут, необязательно, включать одну или больше следующих особенностей. Видеоданные могут включать VDR-видеоизображение, где VDR-видеоизображение может содержать 32 бит на пиксел, и 32 бит на пиксел могут включать 12 бит светимости и по 10 бит на каждый из двух цветовых каналов. Динамический диапазон VDR-видеоизображения может составлять 5-6 порядков величины светимости, где динамический диапазон VDR-видеоизображения больше, чем динамический диапазон LDR-видеоизображения, и динамический диапазон VDR-видеоизображения меньше, чем динамический диапазон видеоизображения с расширенным динамическим диапазоном (HDR). Способ может включать прием входного остаточного сигнала или передачу выходного остаточного сигнала внутри слоя расширения битового видеопотока. Кодек может являться кодеком без дрейфа. Остаточный сигнал может быть результатом действия параметризованного оператора обратного тонального отображения. Параметризованный оператор обратного тонального отображения может включать первый нелинейный участок высокой светимости, второй нелинейный участок низкой светимости и линейный участок между первым и вторым нелинейными участками.
[0038] Любой из способов и технологий, описанных в данном описании, также может реализовываться в системе из одного или больше компонентов, в аппарате или устройстве, машине, компьютерном программном продукте, программном обеспечении, аппаратном обеспечении или в любой их комбинации. Например, компьютерный программный продукт может кодироваться на машиночитаемом носителе и может включать машинные команды, приводящие к выполнению устройством обработки данных (например, процессором данных) одной или больше операций для любого из описанных в данном описании способов.
[0039] Технологии с менее видимыми остаточными изображениями могут представлять собой технологии с более высокой эффективностью кодирования и сжатия. Для иллюстрации того, как эти технологии могут реализовываться, будет проиллюстрировано и описано несколько иллюстративных вариантов осуществления изобретения.
РАСШИРЕННЫЙ ДИНАМИЧЕСКИЙ ДИАПАЗОН (HDR), УЗКИЙ ДИНАМИЧЕСКИЙ ДИАПАЗОН (LDR) И ВИЗУАЛЬНЫЙ ДИНАМИЧЕСКИЙ ДИАПАЗОН (VDR)
[0040] Различные способы, которые используются для захвата, отображения и представления изображений и видеоизображений, могут иметь различные динамические диапазоны. Например, фотографические негативы могут иметь относительно широкий динамический диапазон по сравнению с динамическим диапазоном фотографических снимков. Сходным образом, телевизионные и компьютерные мониторы могут иметь относительно узкий динамический диапазон по сравнению с фотографическими негативами. Формирование изображений с расширенным динамическим диапазоном может обеспечить улучшенное качество изображений и точность передачи информации.
[0041] Изображения с расширенным динамическим диапазоном (HDR) (например, изображения, «направленные на объекты съемки») стремятся к тому, чтобы вместить весь динамический диапазон, имеющийся в оригинальном объекте съемки. С другой стороны, изображения с узким динамическим диапазоном (LDR) (например, изображения, «направленные на вывод», или изображения, «направленные на демонстрацию») имеют значительно менее широкий динамический диапазон и могут показываться, например, на 8-битных дисплеях (например, на LDR-дисплеях).
[0042] Существует большое количество приложений, в особенности сжатия, для распространения и демонстрации, которые в наибольшей степени пригодны для динамического диапазона, находящегося между HDR и LDR. Эти приложения могут использовать визуальный динамический диапазон (VDR). VDR может охватывать светимость и цвет, которые зрительная система человека может воспринимать одновременно. VDR-системы могут включать системы формирования изображений, которые функционируют в видимых пределах восприятия зрительной системы человека и, в некоторых случаях, могут охватывать всю светимость и цвета, которые зрительная система человека может воспринимать одновременно. VDR может представлять собой идеальный целевой динамический диапазон для распространения и потребления движущихся изображений.
[0043] На ФИГ.1А изображена диаграмма с примером проведения различий между динамическими диапазонами для расширенного динамического диапазона (HDR) 103, узкого динамического диапазона (LDR) 101 и визуального динамического диапазона (VDR) 102. Диаграмма на ФИГ.1А сопоставляет диапазоны 100, включающие полный диапазон видимой светимости (например, HDR), с диапазоном светимости, которая является видимой одновременно, и диапазоном 8-битного дисплея с гамма-отображением (например, LDR). Одновременно видимый динамический диапазон может представлять собой динамический диапазон для VDR. Динамический диапазон для VDR может быть меньше, чем динамический диапазон для HDR, но больше, чем динамический диапазон для LDR. В некоторых случаях, VDR может иметь диапазон HDR за вычетом диапазона, связанного с адаптацией.
[0044] Количественно динамический диапазон HDR может составлять, приблизительно, 10-14 порядков величины, динамический диапазон VDR может составлять, приблизительно, 5-6 порядков величины и динамический диапазон LDR может составлять, приблизительно, 2-3 порядка величины. Человеческий глаз обычно может воспринимать динамический диапазон светимости, приблизительно около 5 порядков величины (105), что сходно с VDR-диапазоном. HDR может иметь динамический диапазон за пределами того, который человеческий глаз способен воспринимать одномоментно.
[0045] Требования к динамическому диапазону для форматов захвата, распространения и потребления могут варьироваться между HDR и VDR. Формирование HDR-изображений может включать захват и отображение изображений с полным динамическим диапазоном и цветовым спектром, которые являются видимыми для человеческого глаза. Главным образом, HDR может представлять собой формат захвата. VDR, помимо того, что он является потенциальным форматом захвата, также может быть пригоден для форматов распространения и потребления. Например, VDR-формат может допускать сжатие и широкое распространение изображений с расширенным динамическим диапазоном как через широковещательную сеть (например, беспроводную, кабельную и спутниковую), упакованные носители (например, диски DVD, Blu-Ray, другие носители данных), так и/или посредством загрузок через Интернет. VDR-формат также позволяет беспрепятственно осуществлять перевод изображений с расширенным динамическим диапазоном и широкой цветовой гаммой в текущие и перспективные дисплеи и их форматы изображений.
[0046] Некоторые варианты осуществления сжатия, связанные с VDR, могут включать совместимое сжатие. Совместимое сжатие может включать создание сжатого цифрового потока, который проявляется как действующий для существующих устройств форматы MPEG-2 или MPEG-4/AVC (Н.264) (например, проявляется как действующий формат типа MPEG), а также несет информацию для получения изображений с расширенным динамическим диапазоном и широкой цветовой гаммой на устройствах, обладающих такой способностью. Сжатие может включать все, что зрительная система человека могла бы воспринимать, и, в некоторых вариантах осуществления изобретения, может представлять собой последний переход, требуемый в отношении динамического диапазона и возможных цветов, для достижения этих результатов.
[0047] На ФИГ.1В изображена диаграмма этапов 105 производства и распространения на примере кинокартины. На этапе 106 производства данных HDR-изображения оригинальный объект съемки захватывается цифровой HDR-камерой 120 или пленочной камерой, а затем подвергается цифровому сканированию 130. Реальный захват событий в реальном времени может комбинироваться с компьютерной анимацией (CGI) 140 в процессе завершающего этапа обработки. Реальный захват и завершающий этап обработки могут происходить в области HDR. После окончания завершающего этапа обработки выходной сигнал может быть полностью представлен как поток 160 VDR-изображения, из которого может быть получен поток 165 LDR-изображения. На этапе 108 распространения поток 160 VDR-изображения, или поток 165 LDR-изображения, может распространяться по цифровым кинотеатрам 170, на цифровых носителях, таких как оптические диски 180, или через широковещательные сети 190 (например, через широковещательные сети с беспроводной доставкой или доставкой через Интернет).
[0048] Любой динамический диапазон за переделами VDR может быть невидимым без дополнительной обработки (например, тонального отображения). VDR может включать динамический диапазон отклика сетчатки человеческого глаза. VDR может предусматривать разумный целевой динамический диапазон для дисплеев.
[0049] VDR может включать полную цветовую гамму. VDR может рассматриваться как формат широкой цветовой гаммы (WCG). В некоторых вариантах осуществления изобретения WCG-формат можно рассматривать как цветовую гамму, которая является более широкой, чем цветовой стандарт цифрового телевидения, который может в значительной мере соответствовать стандарту рекомендации 709 Международного союза телекоммуникаций (ITU Rec. 709). В одном из примеров VDR, VDR может отбражаться чрезвычайно эффективно: почти до ¼JND (едва заметного различия) по светимости и цвету при 32 бит на пиксел. VDR может использовать 32 бит на пиксел для того, чтобы вместить 12 бит светимости и по 10 бит на каждый из двух цветовых каналов. Количество бит, используемое для светимости, должно быть больше количества бит, используемого для каждого из цветовых каналов, поскольку человеческий глаз может быть более чувствителен к восприятию светимости, чем к восприятию цвета. 32 бит на пиксел может быть применимо в компьютерах для обработки и передачи информации (например, в 32- и 64-битных машинах). В отношении эффективности количество бит на пиксел для VDR может быть меньше, чем количество бит, используемое в цифровой кинематографии, где может использоваться 36 бит на пиксел.
[0050] В некоторых вариантах осуществления изобретения данные VDR могут отображаться посредством цветовых координат XYZ согласно стандарту CIE (например, координат в цветовом пространстве (XYZ), которые могут представлять элементарные стимулы в трехкомпонентной аддитивной цветовой модели, которая совпадает с образцом цвета), преобразовываемых в область, которая до квантования в цифровые значения довольно однородна для восприятия. Процесс преобразования может начинаться с координат R'G'B' с гамма-коррекцией, где координаты R'G'B' могут в первую очередь преобразовываться в область линейного света, RGB, путем обращения/отмены гамма-коррекции. Результирующие RGB-координаты могут преобраз