Устройство декодирования изображений, устройство кодирования изображений и структура данных кодированных данных
Иллюстрации
Показать всеИзобретение относится к области кодирования/декодирования изображений. Технический результат – обеспечение снижения объема вычислений в процессе кодирования/декодирования изображений. Устройство декодирования изображений для декодирования коэффициентов преобразования из кодированных данных, полученных путем кодирования коэффициентов преобразования, полученных путем частотного преобразования пиксельных значений целевого изображения для каждой единицы преобразования, состоящей из множества подъединиц, каждая из множества подъединиц представляет собой прямоугольный блок, причем устройство декодирования изображений содержит: средство декодирования коэффициентов преобразования для сканирования множества подъединиц единицы преобразования в порядке от одной из множества подъединиц, которая включает в себя высшую частотную составляющую, к другой из множества подъединиц, которая включает в себя низшую частотную составляющую, и декодирования коэффициента преобразования в каждой из множества подъединиц со ссылкой на флаг, указывающий наличие или отсутствие ненулевого коэффициента, причем флаг назначается каждой из множества подъединиц. 6 н.п. ф-лы, 38 ил.
Реферат
Область техники
Настоящее изобретение относится к устройству декодирования изображений для декодирования коэффициентов преобразования, устройству кодирования изображений для кодирования коэффициентов преобразования и к структуре данных кодированных данных, генерируемой путем кодирования коэффициентов преобразования.
Уровень техники
Устройство кодирования движущихся изображений для генерации кодированных данных путем кодирования движущегося изображения и устройство декодирования движущихся изображений для генерации декодированного изображения путем декодирования кодированных данных используются для эффективной передачи или записи движущегося изображения.
Конкретная система кодирования движущихся изображений представлена (i) системами, применяемыми в H.264/MPEG-4.AVC и программном обеспечении KTA, которое является кодеком для совместной разработки в Video Coding Expert Group (VCEG), (ii) системой, применяемой в программном обеспечении Test Model under Consideration (TMuC), и (iii) системой, предложенной в High-Efficiency Video Coding (HEVC), которое является кодеком следующего поколения (непатентные источники 1 и 2).
Согласно вышеупомянутым системам кодирования движущихся изображений, (i) изображение обычно делится на блоки заранее определенного размера, (ii) коэффициент преобразования получается путем осуществления преобразования частоты по отношению к пиксельному значению для каждого из блоков, и (iii) процесс кодирования осуществляется в отношении полученного таким образом коэффициента преобразования. Большие и малые размеры по-разному задаются для блока, который нужно подвергнуть процессу кодирования (целевого блока кодирования). Чем больше размер целевого блока кодирования, тем больше количество кодированных коэффициентов преобразования.
В HEVC TestModel (HM) 2.0 предложен метод достижения снижения объема кодированных данных путем кодирования только не более 64 коэффициентов в блоке, имеющем размер не менее 16×16 пикселей. Например, был предложен метод, в котором только область на стороне низкочастотной составляющей, причем область имеет размер не более 8×8, кодируется для целевого блока кодирования, имеющего размер не менее 8×8 (непатентный источник 3).
Однако известно, что использование вышеупомянутого метода для пропуска кодирования коэффициентов, расположенных на стороне высокочастотной составляющей, может приводить к снижению качества изображения при кодировании коэффициентов в блоке большого размера.
При этом был предложен метод снижения объема кодированных данных путем получения, путем вычисления значения, указывающего комбинацию {'run', 'level'} для блока, имеющего размер не менее 8×8 пикселей (непатентный источник 4). Термин 'run' относится к количеству последовательных нулевых коэффициентов (серия 0) в порядке сканирования, и термин 'level' относится к абсолютному значению коэффициента.
В отличие от вышеизложенных предпосылок изобретения, согласно HM3.0, который является наследником HM2.0, предложение непатентного источника 4 применялось для снижения объема кодированных данных, и все коэффициенты преобразования кодируются также в блоке (единица преобразования) размером не менее 16×16.
Список библиографических ссылок
Непатентные источники
Непатентный источник 1
"WD2: Working Draft 2 of High-Efficiency Video Coding (JCTV C-D503)", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 4th Meeting: Daegu, KR, 1/2011 (опубликовано в январе 2011)
Непатентный источник 2
"WD3: Working Draft 3 of High-Efficiency Video Coding (JCTV C-E603)", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, CH, 3/2011 (опубликовано в марте 2011)
Непатентный источник 3
"Samsung's Response to the Call for Proposals on Video Compression Technology (JCTV C-A124)", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 1st Meeting: Dresden, DE, 4/2010 (опубликовано в апреле 2010)
Непатентный источник 4
"CE5: coefficient coding with LCEC for large blocks (JCTV C-E383)", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting: Geneva, CH, 3/2011 (опубликовано в марте 2011)
Сущность изобретения
Техническая проблема
В случае, когда процесс кодирования осуществляется в отношении блока большого размера, например, не менее 16×16 пикселей, к сожалению, возникают проблемы (i) увеличения размера таблицы для кодирования коэффициента и (ii) увеличения объема вычислений для нахождение значения таблицы.
Например, в блоке размером 16×16 пикселей, наибольшее количество коэффициентов равно 256. При этом в блоке 32×32 пикселя, наибольшее количество коэффициентов равно 1024.
В случае, когда процесс кодирования осуществляется в отношении большого блока, таблица, имеющая тенденцию к увеличению в размере, представляется таблицей сканирования, которая указывает порядок сканирования, и таблицей VLC для серийно-уровневого кодирования.
В частности, размер таблицы сканирования должен быть пропорционален количеству коэффициентов, и размер таблицы VLC для серийно-уровневого кодирования должен соответствовать длине наибольшей серии.
Настоящее изобретение было сделано ввиду указанных проблем, и задачей настоящего изобретения является обеспечение (a) устройства декодирования изображений, способного снижать (i) объем информации декодирования для получения коэффициента преобразования из кодированных данных и (ii) объем вычислений на основании информации декодирования, (b) устройства кодирования изображений и (c) структуры данных кодированных данных.
Решение проблемы
В нижеприведенном описании раскрыт аспект настоящего изобретения. Для решения вышеописанной проблемы, устройство декодирования изображений настоящего изобретения является устройством декодирования изображений для декодирования коэффициентов преобразования из кодированных данных, причем кодированные данные получаются путем кодирования коэффициентов преобразования, причем коэффициенты преобразования получаются путем преобразования частоты пиксельных значений целевого изображения для каждой единицы преобразования, причем устройство декодирования изображений включает в себя: средство разбиения единицы преобразования для разбиения единицы преобразования на множество подъединиц; и средство декодирования коэффициентов преобразования для декодирования коэффициента преобразования в каждой из множества подъединиц со ссылкой на информацию декодирования для использования при получении коэффициентов преобразования из кодированных данных, причем информация декодирования назначается подъединице.
Для решения вышеописанной проблемы, устройство кодирования изображений настоящего изобретения является устройством кодирования изображений для кодирования коэффициентов преобразования, полученных путем преобразования частоты пиксельных значений целевого изображения для каждой единицы преобразования, причем устройство кодирования изображений включает в себя: средство разбиения единицы преобразования для разбиения единицы преобразования на множество подъединиц; и средство кодирования коэффициентов преобразования для кодирования коэффициентов преобразования в единице преобразования со ссылкой на информацию кодирования для использования при кодировании коэффициентов преобразования, причем информация кодирования назначается подъединице.
Для решения вышеописанной проблемы, структура данных кодированных данных по настоящему изобретению является структурой данных кодированных данных, генерируемых путем кодирования коэффициентов преобразования, полученных путем преобразования частоты пиксельных значений целевого изображения для каждой единицы преобразования, причем структура данных указывает относительную позицию коэффициента преобразования в качестве цели кодирования по отношению к непосредственно ранее кодированному коэффициенту преобразования, устройство декодирования изображений для декодирования кодированных данных, указывающих позицию коэффициента преобразования в качестве цели декодирования, на основании (i) позиции непосредственно ранее декодированного коэффициента преобразования в единице преобразования и (ii) относительной позиции.
Вышеописанная компоновка сначала разбивает единицу преобразования в качестве цели декодирования на множество подъединиц в процессе декодирования.
Единица преобразования это единица, лежащая в основе преобразования пиксельных значений в частотную область. Единица преобразования имеет размер, например, 64×64 пикселя, 32×32 пикселя или 16×16 пикселей.
Каждая из множества подъединиц может быть, например, областью размером 8×8 в случае, когда единица преобразования имеет размер 16×16.
Вышеописанная компоновка задает множество подъединиц, полученных путем разбиения, в качестве цели обработки, одну за другой, и, таким образом, декодирует коэффициенты преобразования, включенные в каждую из множества подъединиц. Порядок подъединиц декодирования не имеет конкретных ограничений: процесс декодирования может осуществляться в любом порядке.
Вышеописанная компоновка, при декодировании коэффициентов преобразования, обращается к информации декодирования, назначенной каждой из множества подъединиц.
Информация декодирования относится к информации для использования при воспроизведении заранее определенного значения параметра для коэффициента преобразования из кода (битовой последовательности) в кодированных данных. Информация декодирования является, например, таблицей, указывающей связь для воспроизведения заранее определенного значения параметра для коэффициента преобразования из кода в кодированных данных. Другим примером информации декодирования является математическая формула для получения заранее определенного значения параметра для коэффициента преобразования из кода в кодированных данных.
Вышеописанная компоновка, другими словами, декодирует коэффициенты преобразования с использованием информации декодирования, заданной для подъединиц, каждая из которых меньше по размеру, чем единица преобразования, состоящая из подъединиц.
Таким образом, по сравнению с компоновкой осуществления процесса декодирования на основании информации декодирования, заданной для размера единицы преобразования, состоящей из множества подъединиц, вышеописанная компоновка может преимущественно снижать, например, объем информации декодирования и объем вычислений на основании информации декодирования.
Кроме того, вышеописанная компоновка, которая может снижать количество коэффициентов преобразования в качестве цели в процессе декодирования, может дополнительно снижать размер таблицы сканирования, которая задает последовательность сканирования коэффициентов преобразования.
Кроме того, вышеописанная компоновка также может снижать, например, объем памяти и мощность обработки, необходимые для процесса декодирования.
Подъединица может быть идентична единице кодирования, используемой в любом из соответствующих методов непатентных источников 1 и 2. Настоящее изобретение может, в этом случае, непосредственно использовать таблицу VLC (информацию декодирования), заранее заданную для единицы кодирования.
Устройство кодирования изображений, сконфигурированное вышеописанным образом, и структура данных, сконфигурированная вышеописанным образом из кодированных данных, достигают преимуществ, аналогичных тем, которые достигаются устройством декодирования изображений настоящего изобретения.
Нижеприведенное описание раскрывает другой аспект настоящего изобретения. Для решения вышеописанной проблемы, устройство декодирования изображений настоящего изобретения является устройством декодирования изображений для декодирования коэффициентов преобразования из кодированных данных, причем кодированные данные получаются путем кодирования коэффициентов преобразования, причем коэффициенты преобразования получаются путем преобразования частоты пиксельных значений целевого изображения для каждой единицы преобразования, причем устройство декодирования изображений включает в себя: средство декодирования относительной позиции для декодирования относительной позиции коэффициента преобразования в качестве цели декодирования по отношению к непосредственно ранее декодированному коэффициенту преобразования; и средство указания позиции для указания позиции коэффициента преобразования в качестве цели декодирования на основании (i) позиции непосредственно ранее декодированного коэффициента преобразования в единице преобразования и (ii) относительной позиции.
Для решения вышеописанной проблемы, устройство кодирования изображений настоящего изобретения является устройством кодирования изображений для кодирования коэффициентов преобразования, полученных путем преобразования частоты пиксельных значений целевого изображения для каждой единицы преобразования, причем устройство кодирования изображений включает в себя средство кодирования относительной позиции для кодирования относительной позиции коэффициента преобразования в качестве цели кодирования по отношению к непосредственно ранее кодированному коэффициенту преобразования.
Для решения вышеописанной проблемы, структура данных кодированных данных настоящего изобретения является структурой данных кодированных данных, генерируемых путем кодирования коэффициентов преобразования, полученных путем преобразования частоты пиксельных значений целевого изображения для каждой единицы преобразования, причем структура данных указывает относительную позицию коэффициента преобразования в качестве цели кодирования по отношению к непосредственно ранее кодированному коэффициенту преобразования, устройство декодирования изображений для декодирования кодированных данных, указывающих позицию коэффициента преобразования в качестве цели декодирования, на основании (i) позиции непосредственно ранее декодированного коэффициента преобразования в единице преобразования и (ii) относительной позиции.
Вышеописанная компоновка указывает позицию коэффициента преобразования в качестве цели декодирования на основании (i) позиции непосредственно ранее декодированного коэффициента преобразования в единице преобразования и (ii) относительной позиции. Вышеописанная компоновка может, таким образом, последовательно указывать позицию каждого коэффициента преобразования на основании относительной позиции. Единица преобразования является заранее определенной единицей для преобразования.
Вышеупомянутое кодирование 'run' предусматривает определение длины 'run' в соответствии с заранее определенной последовательностью сканирования. Таким образом, даже в случае, когда ненулевой коэффициент в качестве ссылки имеет двухмерные координаты, которые, в отношении относительной позиции в единице преобразования, близки к координатам следующего ненулевого коэффициента, 'run', в результате, может быть длинной. Это может увеличивать объем кодированных данных.
Вышеупомянутая тенденция примечательна в области для высокочастотной составляющей, для которой свойственен разброс коэффициентов преобразования области. Кроме того, более длинная 'run' означает необходимость подготовки, соответственно, таблицы большего размера.
Напротив, последовательное указание позиции коэффициента преобразования на основании относительной позиции может снижать объем кодированных данных в вышеописанном случае.
Вышеописанная компоновка, которая последовательно указывает позицию коэффициента преобразования на основании относительной позиции, может снижать объем кодированных данных, подлежащих декодированию.
Следовательно, вышеописанная компоновка может преимущественно снижать, например, объем информации декодирования и объем вычислений на основании информации декодирования.
Кроме того, вышеописанная конфигурация также может снижать, например, объем памяти и мощность обработки, необходимые для процесса декодирования.
Устройство кодирования изображений, сконфигурированное вышеописанным образом, и структура данных, сконфигурированная вышеописанным образом из кодированных данных, достигают преимуществ, аналогичных тем, которые достигаются устройством декодирования изображений настоящего изобретения.
Преимущества изобретения
Устройство декодирования изображений настоящего изобретения выполнено c возможностью включать в себя средство разбиения единицы преобразования для разбиения единицы преобразования на множество подъединиц; и средство декодирования коэффициентов преобразования для декодирования коэффициента преобразования в каждой из множества подъединиц со ссылкой на информацию декодирования для использования при получении коэффициентов преобразования из кодированных данных, причем информация декодирования назначается подъединице.
Устройство кодирования изображений настоящего изобретения выполнено c возможностью включать в себя средство разбиения единицы преобразования для разбиения единицы преобразования на множество подъединиц; и средство кодирования коэффициентов преобразования для кодирования коэффициентов преобразования в единице преобразования со ссылкой на информацию кодирования для использования при кодировании коэффициентов преобразования, причем информация кодирования назначается подъединице.
Структура данных кодированных данных настоящего изобретения указывает относительную позицию коэффициента преобразования в качестве цели кодирования по отношению к непосредственно ранее кодированному коэффициенту преобразования, устройство декодирования изображений для декодирования кодированных данных, указывающих позицию коэффициента преобразования в качестве цели декодирования, на основании (i) позиции непосредственно ранее декодированного коэффициента преобразования в единице преобразования и (ii) относительной позиции.
Устройство декодирования изображений настоящего изобретения выполнено c возможностью включать в себя средство декодирования относительной позиции для декодирования относительной позиции коэффициента преобразования в качестве цели декодирования по отношению к непосредственно ранее декодированному коэффициенту преобразования; и средство указания позиции для указания позиции коэффициента преобразования в качестве цели декодирования на основании (i) позиции непосредственно ранее декодированного коэффициента преобразования в единице преобразования и (ii) относительной позиции.
Устройство кодирования изображений настоящего изобретения выполнено c возможностью включать в себя средство кодирования относительной позиции для кодирования относительной позиции коэффициента преобразования в качестве цели кодирования по отношению к непосредственно ранее кодированному коэффициенту преобразования.
Структура данных кодированных данных настоящего изобретения указывает относительную позицию коэффициента преобразования в качестве цели кодирования по отношению к непосредственно ранее кодированному коэффициенту преобразования, устройство декодирования изображений для декодирования кодированных данных, указывающих позицию коэффициента преобразования в качестве цели декодирования, на основании (i) позиции непосредственно ранее декодированного коэффициента преобразования в единице преобразования и (ii) относительной позиции.
Вышеописанное устройство декодирования изображений может преимущественно снижать, например, (i) объем информации декодирования для использования при получении коэффициентов преобразования из кодированных данных и (ii) объем вычислений на основании информации декодирования. Дополнительно, вышеописанное устройство кодирования изображений и вышеописанная структура данных из кодированных данных, достигают преимуществ, аналогичных тем, которые достигаются устройством декодирования изображений.
Краткое описание чертежей
Фиг.1 – функциональная блок-схема, демонстрирующая примерную конфигурацию секции декодирования информации TU, включенной в устройство декодирования движущихся изображений одного варианта осуществления настоящего изобретения.
Фиг.2 – функциональная блок-схема, демонстрирующая общую конфигурацию устройства декодирования движущихся изображений.
Фиг.3 – схемы, демонстрирующие структуру данных кодированных данных, генерируемых устройством кодирования движущихся изображений одного варианта осуществления настоящего изобретения и декодируемых устройством декодирования движущихся изображений, где (a)-(d) – схемы, демонстрирующие слой изображения, слой среза, слой блока дерева и слой CU, соответственно.
Фиг.4 – блок-схема алгоритма, демонстрирующая примерную последовательность операций процесса разбиения целевого блока на области и кодирования/декодирования коэффициентов.
Фиг.5 – схема, демонстрирующая пример разбиения целевого блока размером 16×16.
Фиг.6 – схема, демонстрирующая примерный случай разбиения целевого блока на четыре области размером 8×8 для процесса декодирования.
Фиг.7 – схема, демонстрирующая примерный процесс декодирования, осуществляемый в случае, когда (i) ненулевой коэффициент существует в трех из четырех областей декодирования, включенных в целевой блок, и (ii) не существует ненулевого коэффициента в оставшейся одной из четырех областей декодирования.
Фиг.8 – схема, демонстрирующая пример изменения способа сканирования в соответствии с позицией каждой области декодирования.
Фиг.9 – схема, демонстрирующая пример разбиения целевого блока на неквадратные области.
Фиг.10 – функциональная блок-схема, демонстрирующая примерную конфигурацию устройства кодирования движущихся изображений одного варианта осуществления настоящего изобретения.
Фиг.11 – блок-схема, демонстрирующая примерную конфигурацию секции кодирования с переменной длиной слова, включенной в устройство кодирования движущихся изображений.
Фиг.12 – схемы, каждая из которых демонстрирует пример таблицы VLC для использования в преобразовании пары параметров {'run', 'level'} в кодовое число (битовую последовательность).
Фиг.13 – схема, демонстрирующая примерный случай связывания таблиц VLC с отдельными областями декодирования.
Фиг.14 – схема, демонстрирующая пример динамической оптимизации.
Фиг.15 – функциональная блок-схема, демонстрирующая примерную конфигурацию секции декодирования информации TU второго варианта осуществления настоящего изобретения.
Фиг.16 – блок-схема алгоритма, демонстрирующая последовательность операций процесса, в котором ненулевой коэффициент кодируется/декодируется путем указания относительной позиции.
Фиг.17 – пример, в котором секция декодирования информации TU осуществляет процесс декодирования.
Фиг.18 – функциональная блок-схема, демонстрирующая примерную конфигурацию секции декодирования информации TU третьего варианта осуществления настоящего изобретения.
Фиг.19 – пример кодирования ненулевых коэффициентов путем указания относительной позиции.
Фиг.20 – примерная конфигурация таблицы режима относительной позиции секции декодирования информации TU.
Фиг.21 – пример, в котором область на стороне высокочастотной составляющей целевого блока, представленного на фиг. 17 или фиг. 19 дополнительно подразделяется на три области.
Фиг.22 – пример таблиц VLC, которые связаны с каждой из трех областей, где (a) иллюстрирует таблицу VLC, к которой осуществляется обращение в случае, когда x или y не имеют значения, которое не меньше заранее определенного положительного значения, и (b) иллюстрирует таблицу VLC, к которой осуществляется обращение в случае, когда x или y не имеют значения, которое не больше заранее определенного отрицательного значения.
Фиг.23 – блок-схема алгоритма, демонстрирующая пример процесса кодирования/процесса декодирования, осуществляемого при переключении двух процессов.
Фиг.24 иллюстрирует процесс для кодирования/декодирования только 64 коэффициентов на стороне низкочастотной составляющей целевого блока, где (a) демонстрирует случай внешнего прогнозирования, и (b) демонстрирует случай внутреннего прогнозирования.
Фиг.25 демонстрирует пример структуры данных кодированных данных коэффициентов.
Фиг.26 иллюстрирует случай, когда осуществляется разбиение в двух классах.
Фиг.27 демонстрирует пример представления дерева флагов (представления квадродерева), указывающего состояние разбиения и состояние распределения коэффициентов целевого блока, представленного на фиг. 26.
Фиг.28 – блок-схема алгоритма, демонстрирующая пример последовательности операций рекурсивного процесса декодирования области.
Фиг.29 демонстрирует другой пример структуры данных кодированных данных коэффициентов.
Фиг.30 демонстрирует пример кодированных данных коэффициентов, показанных на фиг. 29.
Фиг.31 демонстрирует еще один пример структуры данных кодированных данных коэффициентов.
Фиг.32 демонстрирует пример кодированных данных коэффициентов, показанных на фиг. 31.
Фиг.33, в частности, иллюстрирует одну из областей кодирования первого класса на фиг. 26.
Фиг.34, в частности, иллюстрирует одну из областей кодирования первого класса на фиг. 26.
Фиг.35 иллюстрирует разбиение целевого блока размером 16×16.
Фиг.36 иллюстрирует разбиение целевого блока размером 16×16.
Фиг.37 иллюстрирует конфигурации (i) передающего устройства, снабженного устройством кодирования движущихся изображений, и (ii) принимающего устройства, снабженного устройством декодирования движущихся изображений, где (a) иллюстрирует передающее устройство, снабженное устройством кодирования движущихся изображений, и (b) иллюстрирует принимающее устройство, снабженное устройством декодирования движущихся изображений.
Фиг.38 иллюстрирует конфигурации (i) устройства записи, снабженного устройством кодирования движущихся изображений, и (ii) устройства воспроизведения, снабженного устройством декодирования движущихся изображений, где (a) иллюстрирует устройство записи, снабженное устройством кодирования движущихся изображений, и (b) иллюстрирует устройство воспроизведения, снабженное устройством декодирования движущихся изображений.
Описание вариантов осуществления
[1] Вариант осуществления 1
В нижеприведенном описании представлен первый вариант осуществления настоящего изобретения со ссылкой на фиг. 1-14. Прежде всего, опишем в общих чертах устройство 1 декодирования движущихся изображений (устройство декодирования изображений) и устройство 2 кодирования движущихся изображений (устройство кодирования изображений) со ссылкой на фиг.2. На Фиг.2 показана функциональная блок-схема, демонстрирующая общую конфигурацию устройства 1 декодирования движущихся изображений.
В устройстве 1 декодирования движущихся изображений и устройстве 2 кодирования движущихся изображений представленный на фиг. 2 применяются (i) метод, предусмотренный в стандарте H.264/MPEG-4 AVC, (ii) метод, предусмотренный в программном обеспечении KTA, которое является кодеком для совместной разработки в Video Coding Expert Group (VCEG), (iii) метод, предусмотренный в программном обеспечении Test Model under Consideration (TMuC), и (iv) метод, предложенный для High-Efficiency Video Coding (HEVC), который представляет собой кодек, наследующий вышеупомянутые фрагменты программного обеспечения.
Устройство 1 декодирования движущихся изображений принимает кодированные данные #1, полученные устройством 2 кодирования движущихся изображений, кодирующим движущееся изображение. Устройство 1 декодирования движущихся изображений декодирует принятые им кодированные данные #1 и выводит движущееся изображение #2 на внешнее устройство. В нижеприведенном описании представлена структура кодированных данных #1, после чего подробно представлено устройство 1 декодирования движущихся изображений.
[Структура кодированных данных]
Со ссылкой на фиг. 3, в нижеприведенном описании представлен пример структуры кодированных данных #1, которые генерируются устройством 2 кодирования движущихся изображений и затем декодируются устройством 1 декодирования движущихся изображений. Кодированные данные #1 включает в себя, в порядке примера, видеопоследовательность и множество изображений, включенных в видеопоследовательность.
Фиг. 3 иллюстрирует иерархическую структуру кодированных данных #1, причем иерархия включает в себя слой изображения и другие слои под ним. (a)-(d) на фиг. 3, соответственно, иллюстрируют (i) слой изображения, который задает изображение PICT, (ii) слой среза, который задает срез S, (iii) слой блока дерева, который задает блок TBLK дерева, и (iv) слой CU, который задает единицу кодирования (CU), включенную в блок TBLK дерева.
(Слой изображения)
Слой изображения задает набор данных, к которому устройство 1 декодирования движущихся изображений обращается для декодирования изображения PICT (далее также именуемого "целевое изображение") в качестве цели обработки. Изображение PICT, как показано в (a) на фиг. 3, включает в себя заголовок PH изображения и срезы от S1 до SNS (где NS – суммарное количество срезов, включенных в изображение PICT).
В нижеприведенном описании, если отдельные срезы от S1 до SNS не требуется отличать друг от друга, нижние индексы в их обозначениях могут быть опущены. Это также относится к нижним индексам для других данных (описанных ниже), включенных в кодированные данные #1.
Заголовок PH изображения включает в себя группу параметров кодирования, к которым устройство 1 декодирования движущихся изображений обращается для выбора способа для декодирования целевого изображения. Примером параметра кодирования, включенного в заголовок PH изображения, является информация режима кодирования (entropy_coding_mode_flag), указывающая режим кодирования с переменной длиной слова, используемый устройством 2 кодирования движущихся изображений для кодирования.
Значение entropy_coding_mode_flag, равное 0, указывает, что изображение PICT закодировано посредством Энтропийного кодирования низкой сложности (Low Complexity Entropy Coding, LCEC) или Адаптивного кодирования с переменной длиной на основании контекста (Context-based Adaptive Variable Length Coding, CAVLC). Значение entropy_coding_mode_flag, равное 1, указывает, что изображение PICT закодировано посредством Адаптивного двоичного арифметического кодирования на основании контекста (Context-based Adaptive Binary Arithmetic Coding, CABAC).
Заголовок PH изображения также называется "набор параметров изображения (PPS)".
(Слой среза)
Слой среза задает набор данных, к которому устройство 1 декодирования движущихся изображений обращается для декодирования среза S (далее также именуемого "целевой срез") в качестве цели обработки. Срез S, как показано в (b) на фиг. 3, включает в себя заголовок SH среза и последовательность блоков от TBLK1 до TBLKNC дерева (где NC – суммарное количество блоков дерева, включенных в срез S).
Заголовок SH среза включает в себя группу параметров кодирования, к которым устройство 1 декодирования движущихся изображений обращается для выбора способа для декодирования целевого среза. Примером параметра кодирования, включенного в заголовок SH среза, является информация указания типа среза (slice_type), которая задает тип среза.
Примеры типов среза, которые могут быть указаны информацией указания типа среза, включают в себя (1) I-срез, указывающий использование только внутреннего прогнозирования для кодирования, (2) P-срез, указывающий использование однонаправленного прогнозирования или внутреннего прогнозирования для кодирования, и (3) B-срез, указывающий использование однонаправленного прогнозирования, двунаправленного прогнозирования или внутреннего прогнозирования для кодирования.
Заголовок SH среза может включать в себя параметр фильтра, к которому обращается контурный фильтр (не показан), включенный в устройство 1 декодирования движущихся изображений.
(Слой блока дерева)
Слой блока дерева задает набор данных, к которому устройство 1 декодирования движущихся изображений обращается для декодирования блока TBLK дерева (далее также именуемого "целевой блок дерева") в качестве цели обработки.
Блок TBLK дерева включает в себя заголовок TBLKH блока дерева и информационные элементы единиц кодирования от CU1 до CUNL (где NL – суммарное количество информационных элементов единиц кодирования, включенных в блок TBLK дерева). В нижеследующем описании, в первую очередь, обратимся к соотношению между блоком TBLK дерева и информацией единицы кодирования CU.
Блок TBLK дерева разбивается на единицы, указывающие соответствующие размеры блока для (i) внутреннего прогнозирования или внешнего прогнозирования и (ii) отдельных этапов для преобразования.
Блок TBLK дерева разбивается на вышеупомянутые единицы рекурсивно в структуре квадродерева. В нижеприведенном описании термин "дерево кодирования" используется для обозначения древовидной структуры полученной рекурсивным разбиением квадродерева.
В нижеприведенном описании термин "узел кодирования" используется для обозначения единицы, соответствующей листу, который является узлом на конце дерева кодирования. Дополнительно, нижеприведенное описание относится к узлу кодирования, который является основной единицей для процесса кодирования, также как "единица кодирования (CU)".
Элементы информации единиц кодирования (в дальнейшем именуемой "информация CU") от CU1 до CUNL являются, таким образом, информационными элементами, соответствующими соответствующим узлам кодирования (единицам кодирования), полученным рекурсивным разбиением квадродерева блока TBLK дерева.
Дерево кодирования имеет корень, связанный с блоком TBLK дерева. Другими словами, блок TBLK дерева связан с самым верхним узлом в структуре квадродерева, рекурсивно включающей в себя множество узлов кодирования.
Каждому узлу кодирования придается такой размер, чтобы его длина и ширина были вдвое меньше, чем у узла кодирования, которому непосредственно принадлежит узел кодирования (то есть, единичного узла, который на один класс выше, чем узел кодирования).
Каждый узел кодирования может иметь размер, который зависит от информации указания размера и максимальной иерархической глубины для узла кодирования, которые включены в набор параметров последовательности SPS кодированных данных #1. В случае, когда, например, (i) блок TBLK дерева имеет размер 64×64 пикселя, и (ii) максимальная иерархическая глубина равна 3, узлы кодирования в классе блока TBLK дерева и в более низких классах могут иметь один из четырех размеров: 64×64 пикселя, 32×32 пикселя, 16×16 пикселей и 8×8 пикселей.
(Заголовок блока дерева)
Заголовок TBLKH блока дерева включает в себя параметр кодирования, к которому устройство 1 декодирования движущихся изображений обращается для выбора способа для декодирования целевого блока дерева. В частности, заголовок TBLKH блока дерева, как показано в (c) на фиг. 3, включает в себя (i) информацию разбиения блока дерева SP_TBLK, которая указывает шаблон, в котором целевой блок дерева подлежит разбиению на отдельные CU, и (ii) разность параметров квантования Δqp (qp_delta) которая указывает уровень шага квантования.
Информация разбиения блока дерева SP_TBLK это информация, указывающая дерево кодирования для разбиения блока дерева, и, в частности, информация, которая указывает (i) форму и размер каждой CU, включенной в целевой блок дерева и (ii) позицию каждой CU в целевом блоке дерева.
Информация разбиения блока дерева SP_TBLK может не указывать явно форму, размер и пр. каждой CU. Информация разбиения блока дерева SP_TBLK может, альтернативно, представлять собой, например, набор флагов (split_coding_unit_flag), указывающих, разбивать ли весь целевой блок дерева или частичную область блока дерева на четыре сегмента. В этом случае, информация разбиения блока дерева SP_TBLK может дополнительно указывать форму, размер и пр. блока дерева для указания формы, размера и пр. каждой CU.
Разность параметров квантования Δqp указывает разность qp-qp' между (i) параметром qp квантования для целевого блока дерева и (ii) параметром qp' квантования для блока дерева, кодированного непосредственно перед целевым блоком дерева.
(Слой CU)
Слой CU задает набор данных, к которому устройство 1 декодирования движущихся изображений обращается для декодирования CU (далее также именуемой "целевая CU") в качестве цели обработки.