2619886 - Кодирование перцепционно-квантованного видеоконтента в многоуровневом кодировании vdr

Кодирование перцепционно-квантованного видеоконтента в многоуровневом кодировании vdr

Иллюстрации

Показать все

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности кодирования. Способ обработки изображений включает прием последовательности входных изображений; выбор подходящего набора значений параметра функции для функции отображения из множества подходящих наборов значений параметра функции; разделение каждого входного изображения на блоки изображения; составление набора блоков изображения из указанных блоков изображения, имеющих отличное от нуля среднеквадратическое отклонение в значениях пикселя для входного изображения в последовательности входных изображений; генерирование отображенных блоков изображения посредством применения функции отображения с подходящим набором значений параметра функции к значениям пикселя в наборе блоков изображения во входном изображении; определение для каждого отображенного блока изображения среднеквадратического отклонения значений пикселя в этом блоке; определение на основе сравнения между количеством отображенных блоков изображения с отличными от нуля среднеквадратическими отклонениями и количеством блоков изображения в указанном наборе, является ли подходящий набор значений параметра функции оптимальным для функции отображения для отображения входного изображения. 2 н. и 19 з.п. ф-лы, 9 ил., 2 табл.

Реферат

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

[0001] Данная заявка заявляет приоритет предварительных заявок на патент США № 61/805388, поданной 26 марта 2013 г., и № 61/861555, поданной 2 августа 2013 г., каждая из которых полностью включается в данную заявку посредством ссылки.

ТЕХНОЛОГИЯ

[0002] Настоящее изобретение в общем относится к обработке изображений и, в частности, кодированию, декодированию и представлению перцепционно-квантованного видео.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

[0003] Множество уровней может быть использовано для передачи видеоданных с устройства восходящего потока данных, такого как многоуровневый видеокодер, на устройства нисходящего потока данных. Например, видеоданные визуального динамического диапазона (VDR) содержатся в сочетании базового уровня и уровня (EL) улучшения множества уровней для визуального восприятия дисплеев VDR.

[0004] Данные изображения BL могут быть кодированы посредством данных изображения низкого или частичного динамического диапазона, полученных из изображений VDR. В данных изображения низкого или частичного динамического диапазона недоступные кодовые слова, составляемые из изображений VDR, могут быть ограничены целевым представленным диапазоном. Текстовые изменения и детали изображения, представленные в изображениях VDR, могут быть потеряны в данных изображения низкого или частичного динамического диапазона.

[0005] Подходы, описанные в данном разделе, являются подходами, которые могут быть выполнены, но необязательно подходами, которые были ранее предложены или выполнены. Следовательно, если не указано иное, не следует исходить из того, что любые из подходов, описанных в данном разделе, относятся к известному уровню техники исключительно благодаря их включению в данный раздел. Подобным образом, не следует исходить из того, что недостатки, определенные относительно одного или нескольких подходов, были учтены в известном уровне техники на основе данного раздела, если не указано иное.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

[0006] Настоящее изобретение проиллюстрировано для примера, а не для ограничения, на фигурах прилагаемых графических материалов, на которых подобные позиционные обозначения относятся к одинаковым элементам, и на которых:

[0007] на фиг. 1A проиллюстрирован многоуровневый видеокодер в соответствии с вариантом осуществления изобретения;

[0008] на фиг. 1B проиллюстрирован многоуровневый видеодекодер в соответствии с вариантом осуществления изобретения;

[0009] на фиг. 1C и 1D проиллюстрированы реализации с фиксированной точкой блока формирования в декодере, реализованном в соответствии с вариантами осуществления изобретения;

[00010] на фиг. 2A и 2B проиллюстрированы приведенные в качестве примера алгоритмы для поиска оптимальных значений параметра отображения в соответствии с вариантом осуществления изобретения;

[00011] на фиг. 3A и 3B проиллюстрированы приведенные в качестве примера потоки процесса в соответствии с вариантом осуществления изобретения; и

[0010] на фиг. 4 проиллюстрирована приведенная в качестве примера аппаратная платформа, на которой может быть реализован компьютер или вычислительное устройство, как описано в данной заявке.

ОПИСАНИЕ ПРИВЕДЕННЫХ В КАЧЕСТВЕ ПРИМЕРА ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0011] В данной заявке описаны приведенные в качестве примера варианты осуществления, которые относятся к кодированию, декодированию и представлению изображений переменного динамического диапазона, включающих перцепционно квантованные данные изображения базового уровня, с использованием многоуровневого кодека. В следующем описании в целях пояснения изложены многочисленные конкретные подробности для предоставления полного понимания настоящего изобретения. Однако очевидно, что настоящее изобретение может быть применено на практике без данных конкретных подробностей. В других примерах широко известные структуры и устройства не описаны в мельчайших подробностях для предотвращения излишнего усложнения, запутывания или затруднения понимания настоящего изобретения.

[0012] Приведенные в качестве примера варианты осуществления описаны в данной заявке в соответствии со следующим планом:

1. ОБЩИЙ ОБЗОР

2. КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ВИДЕОКОНТЕНТА

3. ПРИСВАИВАНИЕ ДОСТУПНЫХ КОДОВЫХ СЛОВ НА ОСНОВЕ СОДЕРЖИМОГО ИЗОБРАЖЕНИЯ

4. МНОГОУРОВНЕВОЕ КОДИРОВАНИЕ ВИДЕО

5. МНОГОУРОВНЕВОЕ ДЕКОДИРОВАНИЕ ВИДЕО

6. СОХРАНЕНИЕ ВИЗУАЛЬНЫХ ДЕТАЛЕЙ В ДАННЫХ ИЗОБРАЖЕНИЯ BL

7. ПРИВЕДЕННОЕ В КАЧЕСТВЕ ПРИМЕРА ОПРЕДЕЛЕНИЕ ЗНАЧЕНИЯ ЭКСПОНЕНТЫ В СТЕПЕННОЙ ФУНКЦИИ

8. ПРИВЕДЕННОЕ В КАЧЕСТВЕ ПРИМЕРА ОПРЕДЕЛЕНИЕ ЗНАЧЕНИЙ ПАРАМЕТРА В ЛИНЕЙНОМ КВАНТОВАНИИ, ВКЛЮЧАЮЩЕМ КУСОЧНО-ЛИНЕЙНОЕ КВАНТОВАНИЕ

9. ПРИВЕДЕННЫЕ В КАЧЕСТВЕ ПРИМЕРА ПОТОКИ ПРОЦЕССА

10 МЕХАНИЗМЫ РЕАЛИЗАЦИИ – ОБЗОР АППАРАТНОГО ОБЕСПЕЧЕНИЯ

11. ЭКВИВАЛЕНТЫ, РАСШИРЕНИЯ, АЛЬТЕРНАТИВЫ И ПРОЧЕЕ

1. ОБЩИЙ ОБЗОР

[0013] Данный обзор представляет базовое описание некоторых аспектов приведенного в качестве примера варианта осуществления настоящего изобретения. Следует отметить, что данный обзор не является подробным или полным изложением аспектов приведенного в качестве примера варианта осуществления. Более того, следует отметить, что данный обзор не следует понимать, как определение каких-либо конкретных существенных аспектов или элементов приведенного в качестве примера варианта осуществления, а также ограничение какого-либо объема приведенного в качестве примера варианта осуществления в частности или изобретения в целом. Данный обзор представляет лишь некоторые идеи, которые относятся к приведенному в качестве примера варианту осуществления, в сокращенной и упрощенной форме и оно должен рассматриваться лишь как вводная часть для более подробного описания приведенных в качестве примера вариантов осуществления, которые следуют далее.

[0014] В некоторых вариантах осуществления многоуровневые кодеки могут быть использованы для генерирования или обработки медиасигнала, содержащего сжатые изображения (например, видеоизображения) для широкого разнообразия дисплеев (например, дисплеев VDR и т. д.). Для предоставления превосходного визуального качества на широком разнообразии дисплеев широкого и узкого динамических диапазонов видеоконтент, который должен быть передан на устройства нисходящего потока данных, может быть квантован и кодирован многоуровневым кодеком, реализующим методы перцепционного квантования (PQ), как описано в данной заявке. Данный видеоконтент после визуализации посредством устройств нисходящего потока данных имеет кардинально отличные визуальные характеристики от тех, что демонстрируются другими методами.

[0015] В данном контексте термин «многоуровневый кодек» может относиться к многоуровневому кодеру или декодеру, который реализует структуру множества уровней в аудиовизуальном сигнале (например, битовый поток, широковещательный сигнал, медиафайл и т. д.). Множество уровней включает базовый уровень и один или несколько уровней улучшения. Базовый уровень и уровни улучшения содержат данные изображения, полученные из одних (например, перцепционно-кодированных) исходных изображений. Данные изображения в базовом уровне содержат данные сжатого изображения низкого или частичного динамического диапазона, которые не могут быть оптимизированы для визуализации на дисплеях относительно узкого динамического диапазона, такого как стандартный динамический диапазон или SDR. Данные изображения во множестве уровней в сочетании содержат сжатые изображения широкого динамического диапазона, которые могут быть декодированы и просмотрены на дисплеях относительно широкого динамического диапазона, такого как визуальный динамический диапазон или VDR. Термин «VDR» или «визуальный динамический диапазон» в данном контексте может относиться к более широкому динамическому диапазону, чем стандартный динамический диапазон, и может включать, помимо всего прочего, широкий динамический диапазон до мгновенно воспринимаемого динамического диапазона и цветовую гамму, которую может мгновенно воспринимать человеческое зрение.

[0016] Многоуровневый кодек, как описано в данной заявке, может быть реализован посредством двух или более кодеков (например, гамма-доменных кодеков и т. д.) более низкой битовой глубины (например, 8 бит и т. д.) во множестве уровней для поддержки изображений более высокой битовой глубины (например, 12+ бит и т. д.) во множестве уровней в целом и для поддержки изображений более низкой битовой глубины (например, 8 бит и т. д.) в базовом уровне. Например, один или несколько гамма-доменных кодеров может быть установлено в канале обработки сигнала BL и/или в одном или нескольких каналах обработки сигнала EL многоуровневого кодера, как описано в данной заявке. В некоторых вариантах осуществления по меньшей мере один гамма-доменный декодер может быть установлен в канале обработки сигнала BL устройства нисходящего потока данных, которое является декодером исключительно базового уровня.

[0017] Методы PQ, как описано в данной заявке, могут быть использованы для предоставления гамма-доменным кодекам возможности сохранять визуальные детали первоначального перцепционно-кодированного видеоконтента. Вместо необходимости применения преобразователя формата из PQ в гамму на стороне видеокодера и преобразователя формата из гаммы в PQ на стороне декодера, методы, как описано в данной заявке, предоставляют гамма-доменные кодеры в многоуровневом кодере, многоуровневом декодере, декодере базового уровня и т. д. для непосредственного сохранения визуальных деталей перцепционно-кодированного видеоконтента без данных преобразователей формата. Перцепционно-квантованные видеосигналы, которые сохраняют данные визуальные детали как в широком, так и узком динамических диапазонах, могут быть непосредственно предоставлены многоуровневым кодером на устройства нисходящего потока данных без использования преобразования формата из PQ в гамму. Подобным образом, перцепционно-квантованные видеосигналы после получения устройством нисходящего потока данных могут быть непосредственно декодированы и/или визуализированы с использованием сохраненных визуальных деталей посредством устройства нисходящего потока данных без использования преобразования формата из гаммы в PQ. Следовательно, сложность вычисления, эффективность кодирования и качество восприятия могут быть значительно улучшены в соответствии с методами, описанными в данной заявке.

[0018] Кодеки, реализующие методы, как описано в данной заявке, могут быть дополнительно выполнены с возможностью включения возможностей межуровневого прогнозирования для полного использования статистической избыточности между данными изображения базового уровня (BL) и первоначальными входными данными изображения. Данные изображения EL могут (возможно исключительно) содержать остаточные (или дифференциальные) данные изображения вместо содержания большого количества данных изображения широкого динамического диапазона без использования корреляций и статистической избыточности в данных изображения различных уровней.

[0019] В некоторых приведенных в качестве примера вариантах осуществления данные, необходимые для других применений (включая, помимо всего прочего, те, что не относятся к операциям перцепционного кодирования и т. д.), могут быть также включены в данные изображения базового уровня и уровня улучшения для передачи с устройства восходящего потока данных на устройство нисходящего потока данных. В некоторых приведенных в качестве примера вариантах осуществления дополнительные особенности и/или ортогональные особенности могут поддерживаться базовым уровнем и уровнями улучшения, как описано в данной заявке.

[0020] В некоторых приведенных в качестве примера вариантах осуществления механизмы, как описано в данной заявке, формируют часть системы медиаобработки, включая, помимо всего прочего, любое из следующего: карманное устройство, игровой автомат, телевизор, портативный компьютер, нетбук, планшетный компьютер, сотовый радиотелефон, электронную книгу, торговый терминал, настольный компьютер, компьютерную рабочую станцию, компьютерный киоск или различные другие типы терминалов и блоков медиаобработки.

[0021] Различные модификации предпочтительных вариантов осуществления и общие принципы и особенности, описанные в данной заявке, будут очевидны специалистам в данной области техники. Таким образом, раскрытие не должно быть ограничено показанными вариантами осуществления, но должно соответствовать наиболее широкому объему в соответствии с принципами и особенностями, описанными в данной заявке.

КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ВИДЕОКОНТЕНТА

[0022] Человеческое зрение не воспринимает разницу между двумя уровнями яркости, если два уровня яркости не являются достаточно отличными друг от друга. Напротив, человеческое зрение воспринимает разницу, только если уровни яркости имеют не менее чем едва заметную разницу (JND). Вследствие перцепционной нелинейности человеческого зрения величины отдельных JND не имеют постоянного размера или масштаба в диапазоне уровней яркости, а скорее изменяются с различными отдельными уровнями яркости.

[0023] Методы (например, алгоритмы и т. д.), как описано в данной заявке, могут быть использованы многоуровневым кодером для кодирования исходного видеоконтента в многоуровневый видеосигнал, который сохраняет визуальные детали исходного видеоконтента в данных изображения BL, а также в сочетании данных изображения BL и EL. В некоторых вариантах осуществления исходный видеоконтент сначала кодируется посредством исходных кодовых слов в исходном формате кодирования (например, как определено спецификацией VDR и т. д.) на основе методов перцепционного кодирования (например, методов кодирования VDR, разработанных Dolby Laboratories, Inc., Сан-Франциско, Калифорния, и т. д.). В некоторых вариантах осуществления исходные кодовые слова в исходном формате кодирования представляют уровни яркости, распределенные таким образом, что уровни яркости оптимально расположены на расстоянии друг от друга или квантованы для соответствия перцепционной нелинейности человеческого зрения.

[0024] Многоуровневый видеосигнал, сгенерированный многоуровневым кодером, как описано в данной заявке, может быть передан непосредственно или опосредованно на или принят от широкого разнообразия устройств нисходящего потока данных, включая, помимо всего прочего, любое из следующего: дисплейные системы отображения с многоуровневыми декодерами, дисплейные системы с декодерами базового уровня и т. д.

[0025] Устройство нисходящего потока данных (например, многоуровневый декодер и т. д.), которое поддерживает операции отображения относительно широкого динамического диапазона, может получить и/или визуализировать версию с широким динамическим диапазоном исходного видеоконтента на основе принятого многоуровневого видеосигнала. Декодированная версия с широким динамическим диапазоном исходного видеоконтента представляет целевые уровни яркости (например, зависящие от устройства уровни яркости и т. д.), которые приблизительно соответствуют уровням яркости, представленным исходными кодовыми словами в исходном видеоконтенте.

[0026] Устройство нисходящего потока данных (например, декодер BL и т. д.), которое поддерживает операции отображения относительно узкого динамического диапазона, может получить и/или визуализировать декодированную версию с узким динамическим диапазоном с визуальными деталями исходного видеоконтента на основе данных изображения BL принятого многоуровневого видеосигнала. Декодированная версия с узким динамическим диапазоном исходного видеоконтента представляет целевые уровни яркости (например, зависящие от устройства уровни яркости и т. д.), которые отображены из уровней яркости, представленных исходными кодовыми словами в исходном видеоконтенте, хоть и в относительно узком динамическом диапазоне, поддерживаемом устройством нисходящего потока данных.

[0027] Несмотря на то, что как декодированная версия с узким динамическим диапазоном, так и декодированная версия с широким динамическим диапазоном исходного видеоконтента представляют целевые уровни яркости (например, зависящие от устройства уровни яркости и т. д.), которые отображены из уровней яркости, представленных исходными кодовыми словами в исходном видеоконтенте, декодированная версия с узким динамическим диапазоном исходного видеоконтента может содержать большее количество ошибок (например, ошибок квантования вследствие относительно низкой битовой глубины, ограничений при низких или высоких уровнях яркости и т. д.), чем декодированная версия с широким динамическим диапазоном исходного видеоконтента, по сравнению с уровнями яркости, представленными исходными кодовыми словами в исходном видеоконтенте.

ПРИСВАИВАНИЕ ДОСТУПНЫХ КОДОВЫХ СЛОВ НА ОСНОВЕ СОДЕРЖИМОГО ИЗОБРАЖЕНИЯ

[0028] Видеокодек без использования методов, как описано в данной заявке, присваивает доступные кодовые слова при конкретной битовой глубине (например, 8 бит и т. д.) таким образом, что не сохраняет визуальные детали первоначально перцепционно-кодированного исходного видеоконтента. Например, медиаустройство, содержащее гамма-доменный кодек без использования методов, как описано в данной заявке, может переприсвоить кодовые слова поддиапазонам высокой яркости (например, ярким частям, световым эффектам и т. д.) в зависящем от устройства динамическом диапазоне и недоприсвоить кодовые слова поддиапазону низкой яркости (например, темным частям, темным участкам и т. д.) в зависящем от устройства динамическом диапазоне. В результате, визуальные детали перцепционно-кодированного исходного видеоконтента часто теряются при использовании данных других методов.

[0029] Видеокодек в многоуровневом кодеке при использовании методов, как описано в данной заявке, присваивает доступные кодовые слова при конкретной битовой глубине (например, 8 бит и т. д.) таким образом, что сохраняет визуальные детали перцепционно-кодированного исходного видеоконтента, по сравнению с видеокодеком без использования данных методов. В результате, перцепционные детали в исходном видеоконтенте лучше сохраняются в многоуровневом кодеке, как описано в данной заявке, чем другие видеокодеки без использования данных методов.

[0030] При использовании методов, как описано в данной заявке, многоуровневый кодек выбирает/определяет конкретные значения параметра (например, значения экспоненты в степенных функциях, наклоны в линейном квантовании, повороты в кусочно-линейном квантовании и т. д.) на основе содержимого изображения, передаваемого кадрами изображения (например, в сцене и т. д.) в исходном видеоконтенте. Если содержимое изображения содержит большее количество светлых частей или большее количество уровней яркости, значения параметра могут быть выбраны/определены для того, чтобы большее количество представленных уровней яркости в поддиапазоне высокой яркости было доступно для операций кодирования или декодирования. Если содержимое изображения содержит меньшее количество светлых частей или меньшее количество уровней яркости, значения параметра могут быть выбраны/определены для того, чтобы меньшее количество представленных уровней яркости в поддиапазоне высокой яркости было доступно для операций кодирования или декодирования. Подобным образом, если содержимое изображения содержит большее количество темных частей или большее количество уровней яркости, параметр может быть выбран/определен для того, чтобы большее количество представленных уровней яркости в поддиапазоне низкой яркости было доступно для операций кодирования или декодирования. Если содержимое изображения содержит меньшее количество темных частей или меньшее количество уровней яркости, значения параметра могут быть выбраны/определены для того, чтобы меньшее количество представленных уровней яркости в поддиапазоне низкой яркости было доступно для операций кодирования или декодирования.

МНОГОУРОВНЕВОЕ КОДИРОВАНИЕ ВИДЕО

[0031] Как указано ранее, многоуровневый видеосигнал (например, кодированный битовый поток и т. д.), содержащий базовый уровень и один или несколько уровней улучшения, может быть использован устройством восходящего потока данных (например, многоуровневым кодером 102, показанным на фиг. 1A) для передачи кодированного видеоконтента на устройства нисходящего потока данных (одним из которых может являться, например, многоуровневый декодер 152, показанный на фиг. 1B, и т. д.). В некоторых вариантах осуществления видеоконтент, переданный посредством множества уровней, содержит данные изображения BL (например, 106, как показано на фиг. 1A и фиг. 1B, и т. д.) относительно низкой битовой глубины и данные изображения EL (например, 108, как показано на фиг. 1A и фиг. 1B, и т. д.) в дополнение к данным изображения BL. Как данные (106) изображения BL, так и данные (108) изображения EL получаются/квантуются из исходного видеоконтента (104) относительно высокой битовой глубины (например, 12+ бит VDR и т. д.)

[0032] В некоторых вариантах осуществления данные (106) изображения BL расположены в контейнере базового уровня (например, 8-битовом контейнере YCbCr 4:2:0 и т. д.). В некоторых вариантах осуществления данные (108) изображения EL содержат остаточные данные изображения (например, VDR и т. д.) исходного видеоконтента (104) относительно спрогнозированных данных изображения, сгенерированных из данных (106) изображения BL. В некоторых вариантах осуществления данные (108) изображения EL расположены в одном или нескольких контейнерах уровня улучшения (например, одном или нескольких 8-битовых контейнерах остаточных данных и т. д.). Данные (106) изображения BL и данные (108) изображения EL могут быть приняты и использованы устройствами нисходящего потока данных (например, 152, как показано на фиг. 1B, и т. д.) для восстановления декодированной версии (например, перцепционно-декодированной версии VDR и т. д.) относительно высокой битовой глубины (например, 12+ бит и т. д.) исходного видеоконтента (104) (например, VDR и т. д.).

[0033] В данном контексте термин «битовая глубина» относится к количеству битов, предоставленных в кодовом пространстве, которое предоставляет доступные кодовые слова для кодирования или квантования данных изображения; примером низкой битовой глубины являются 8 бит; примером высокой битовой глубины являются 12 бит или более. В частности, термин «низкая битовая глубина» или «высокая битовая глубины» не относится к самым младшим битам или самым старшим битам кодового слова.

[0034] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выполнен с возможностью приема исходного видеоконтента (104) (например, VDR и т. д.), содержащего последовательность входных изображений VDR. Последовательность входных изображений VDR представляет одну или несколько сцен, каждая из которых содержит множество входных изображений в последовательности изображений VDR. В данном контексте термин «входное изображение VDR» в общем относится к данным изображения широкого или высокого динамического диапазона, которые могут быть использованы для получения версии VDR исходного изображения (например, относящегося к сцене изображения, захваченного профессиональным устройством захвата изображения и т. д.). Входное изображение VDR может находиться в любом цветовом пространстве, которое поддерживает цветовую гамму высокого динамического диапазона. В некоторых вариантах осуществления входное изображение VDR является исключительно входным относительно исходного изображения, которое предоставляет данные изображения для кодирования кодером (102) изображения VDR; входные данные изображения относительно исходного изображения для обработки на базовом уровне с использованием методов, как описано в данной заявке, могут быть сгенерированы на основе входного изображения VDR с использованием методов перцепционного квантования.

[0035] В приведенном в качестве примера варианте осуществления входное изображение VDR, декодированное из исходного видеоконтента (104) (например, VDR и т. д.), является 12+ битным изображением YCbCr в цветовом пространстве YCbCr. В примере каждый пиксель, представленный в изображении VDR, содержит кодовые слова для всех каналов (например, канал яркости Y, каналы цветности Cb и Cr и т. д.), определенных для цветового пространства (например, цветового пространства YCbCr). Каждое кодовое слово содержит кодовые слова, подвергнутые повышающей дискретизации или понижающей дискретизации, для одного или нескольких каналов в цветовом пространстве.

[0036] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выполнен с возможностью преобразования кодовых слов входного изображения VDR из первого цветового пространства (например, цветового пространства RGB и т. д.) во второе отличное цветовое пространство (например, цветовое пространство YCbCr и т. д.).

[0037] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выполнен с возможностью понижения дискретизации или повышения дискретизации входного изображения VDR в первом формате дискретизации (например, в формате дискретизации 4:4:4 и т. д.) до второго отличного формата дискретизации (например, формата дискретизации 4:2:0 и т. д.).

[0038] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выполнен с возможностью выполнения операций, относящихся к перцепционному квантованию, относительно исходного видеоконтента (104) для генерирования данных (106) (например, 8-битного и т. д.) изображения BL. Операции, относящиеся к перцепционному квантованию, включают, помимо всего прочего, одно или несколько из следующего: операции (114) отображения, операции (116) ограничения, операции (118) кодирования BL и т. д.

[0039] Во время операций (114) отображения многоуровневый кодер (102) выполнен с возможностью использования функции отображения для отображения (например, 12+ битных и т. д.) входных кодовых слов VDR (например, кодовых слов яркости v^Y VDR, кодовых слов цветности v^C VDR и т. д.) в одном или нескольких входных изображениях VDR в исходном видеоконтенте (104) (например, VDR и т. д.) в отображенные кодовые слова (например, отображенные кодовые слова яркости c^Y, отображенные кодовые слова цветности c^C и т. д.) в одном или нескольких отображенных изображениях в соответствии с одним или несколькими изображениями VDR.

[0040] Во время операций (116) ограничения многоуровневый кодер (102) выполнен с возможностью ограничения отображенных кодовых слов, которые находятся либо ниже минимального значения, либо выше максимального значения. Количество (например, <= 256 при битовой глубине 8 бит и т. д.) доступных кодовых слов при битовой глубине данных (106) изображения BL не должно быть достаточно высоким, чтобы соответствовать полному диапазону числовых значений неограниченных отображенных кодовых слов. Таким образом, некоторые из самых старших отображенных кодовых слов и/или самых младших отображенных кодовых слов в одном или нескольких отображенных изображениях могут быть ограничены максимальным значением и/или минимальным значением в результате операции (116) ограничения. Многоуровневый кодер (102) выполнен с возможностью определения/выбора оптимальных минимального и максимального значений на основе одного или нескольких отображенных изображений и одного или нескольких факторов. Один или несколько факторов включает, помимо прочего: минимизацию количества отображенных кодовых слов, которые должны быть ограничены, максимизацию представленных/перцепционных деталей одной или нескольких (например, характерных, центральных и т. д.) частей одного или нескольких отображенных изображений после операций ограничения и т. д.

[0041] Во время операций (118) кодирования BL многоуровневый кодер (102) выполнен с возможностью определения оптимального значения экспоненты степенной функции, используемой кодеком BL в многоуровневом кодере (102) для отображения исходных кодовых слов (например, v^Y и т. д.) в соответствующие отображенные кодовые слова (например, c^Y и т. д.) в конкретном канале (например, канале яркости или канале Y и т. д.) цветового пространства (например, цветового пространства YCbCr и т. д.). В некоторых вариантах осуществления многоуровневый кодер (102) выполнен с возможностью определения значений параметра кусочно-линейных (PWL) функций отображения, используемых кодеком BL для отображения исходных кодовых слов (например, v^C и т. д.) в соответствующие отображенные кодовые слова (например, c^C и т. д.) в конкретном канале (например, канале цветности или канале Cb/Cr и т. д.) цветового пространства (например, цветового пространства YCbCr и т. д.).

[0042] Во время операций (118) кодирования BL многоуровневый кодер (102) выполнен с возможностью отображения/сжатия на основе значения экспоненты степенной функции и/или значений параметра PWL функций отображения исходных кодовых слов, декодированных из исходного видеоконтента (104), до отображенных кодовых слов и форматирования отображенных кодовых слов. Некоторые из отображенных кодовых слов являются ограниченными. Некоторые или все отображенные кодовые слова содержат ошибки квантования, вызванные отображением кодовых слов VDR высокой битовой глубины в отображенные кодовые слова низкой битовой глубины. Многоуровневый кодер (102) дополнительно выполнен с возможностью форматирования данных (106) (например, 8-битного и т. д.) изображения BL в один или несколько контейнеров (например, 8-битного и т. д.) изображения BL в формате дискретизации (например, 4:2:0 и т. д.).

[0043] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выводит данные (106) изображения BL в контейнерах изображения BL в качестве части многоуровневого видеосигнала на устройство нисходящего потока данных (например, многоуровневый декодер 152, показанный на фиг. 1B, и т. д.).

[0044] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выполнен с возможностью выполнения одной или нескольких операций EL. Одна или несколько операций EL включает, помимо прочего, любое из следующего: операции (120) декодирования BL, операции (122) обратного отображения, операции (124) вычитания, операции (126) нелинейного квантования, операции (128) кодирования EL и т. д.

[0045] Во время операций (120) декодирования BL многоуровневый кодер (102) выполнен с возможностью декодирования данных (106) (например, 8-битного и т. д.) изображения BL в контейнерах (например, 8-битного и т. д.) изображения BL обратно в отображенные кодовые слова в одном или нескольких отображенных изображениях, которые соответствуют одному или нескольким входным изображениям VDR.

[0046] Во время операций (122) обратного отображения многоуровневый кодер (102) выполнен с возможностью обратного отображения на основе одной или нескольких таблиц (LUT) поиска отображенных кодовых слов в кодовые слова VDR. LUT, используемые для обратного отображения, могут быть аналитически или численно получены из степенной функции с ранее определенными значениями экспоненты и/или PWL функций отображения с ранее определенными значениями параметра.

[0047] В некоторых вариантах осуществления некоторые или все из этих LUT содержат ключи поиска (например, отображенные кодовые слова и т. д.) и значения поиска (например, кодовые слова VDR и т. д.), соответствующие ключам поиска. Например, исключительно с целью иллюстрации обратная LUT 1D, которая может быть использована для обратного отображения отображенных кодовых слов в кодовые слова VDR, может быть составлена посредством замены s_i = [0, 1, 2, ...255] на следующее выражение:

(1)

где c_L и c_H – минимальное и максимальное значения соответственно отображенных кодовых слов в канале яркости, как определено во время операций отображения и/или операций ограничения; v_L и v_H – минимальное и максимальное значения соответственно кодовых слов VDR в канале яркости, как определено во время операций отображения и/или операций ограничения; и clip(…) – функция ограничения для гарантирования того, что любое кодовое слово вне диапазона (например, вне диапазона [cL, cH] и т. д.) после сжатия с потерями (которое может произойти, например, во время операций кодирования BL и т. д.) все еще может быть обратно отображено в ближайшее действительное кодовое слово VDR.

[0048] Другие типы LUT (например, на основе PWL и т. д.) могут быть также численно составлены подобным образом. Каждая из LUT, как описано в данной заявке, может быть использована для обратного отображения отображенных кодовых слов, декодированных из данных (106) изображения BL, в соответствующие кодовые слова VDR в одном или нескольких конкретных каналах применимого цветового пространства.

[0049] В некоторых вариантах осуществления многоуровневый кодер (102) выполнен с возможностью реализации прогнозирования из BL в EL (например, внутреннего и/или промежуточного прогнозирования и т. д.) для снижения количества данных изображения EL, которые должны содержаться в уровнях EL для восстановления изображений VDR устройством нисходящего потока данных (например, многоуровневым декодером 152, показанным на фиг. 1B, и т. д.). Многоуровневый кодер (102) может генерировать на основе по меньшей мере частично кодовых слов VDR, полученных посредством операций (122) обратного отображения, данные изображения прогнозирования.

[0050] Во время операций (124) вычитания многоуровневый кодер (102) выполнен с возможностью генерирования остаточных значений между кодовыми словами VDR, декодированными из исходного видеоконтента (104), и кодовыми словами VDR, представленными в данных изображения прогнозирования. Остаточные значения в конкретном канале (например, канале яркости, канале Y и т. д.) могут являться разницами, полученными в результате операций (124) вычитания в логарифмическом домене или в линейном домене.

[0051] Во время операций (126) нелинейного квантования многоуровневый кодер (102) выполнен с возможностью квантования остаточных значений в первом цифровом представлении (например, 12+ битном и т. д.) во второе цифровое представление (например, 8-битное и т. д.) в цветовом пространстве (например, YCbCr и т. д.) с использованием одного или нескольких параметров NLQ.

[0052] Во время операций (128) кодирования EL многоуровневый кодер (102) выполнен с возможностью кодирования (например, 8-битных и т. д.) остаточных значений, сгенерированных в результате операций нелинейного квантования, в данные (108) изображения EL в (8-битном и т. д.) контейнере изображения EL в формате дискретизации (например, 4:2:0 и т. д.). Контейнер изображения EL в уровне улучшения может быть логически отделен от контейнера изображения BL в базовом уровне, даже несмотря на то, что оба контейнера изображения могут одновременно содержаться в одном цифровом видеосигнале (например, одном кодированном битовом потоке, одном медиафайле, одном широковещательном сигнале и т. д.).

[0053] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выводит данные (108) изображения EL в контейнерах изображения EL в качестве части многоуровневого видеосигнала на устройство нисходящего потока данных (например, многоуровневый декодер 152, показанный на фиг. 1B, и т. д.).

[0054] В приведенном в качестве примера варианте осуществления многоуровневый кодер (102) выводит метаданные (130), содержащие некоторые или все из рабочих параметров, используемых во время операций многоуровневого кодера (102), в качестве части многоуровневого видеосигнала на устройство нисходящего потока данных (например, многоуровневый декодер 152, показанный на фиг. 1B, и т. д.). Рабочие параметры в метаданных (130), переданных на устройства нисходящего потока данных, включают, помимо прочего, любое из следующ

Кодирование перцепционно-квантованного видеоконтента в многоуровневом кодировании vdr

Патент 2619886