Способ и устройство для кодирования видеоинформации посредством предсказания движения с использованием произвольной области, а также устройство и способ декодирования видеоинформации посредством предсказания движения с использованием произвольной области
Иллюстрации
Показать всеИзобретение относится к кодированию и декодированию видеоинформации. Технический результат заключается в повышении разрешения видеоконтента. Предложены способ и устройство для кодирования видеоинформации, причем способ заключается в том, что кодируют видеоданные максимального элемента кодирования на основе более глубоких элементов кодирования иерархических структур в соответствии по меньшей мере с одной зоной разделения максимального элемента кодирования с осуществлением интерпредсказания с использованием областей, полученных путем разделения элемента кодирования согласно произвольным отношениям, и определяют глубину кодирования; и выводят поток битов, включающий в себя кодированные видеоданные, соответствующие глубине кодирования, в соответствии с максимальным элементом кодирования и информацией, касающейся глубины кодирования и режимов кодирования. 4 з.п. ф-лы 21 ил., 1 табл.
Реферат
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Данное изобретение относится к кодированию и декодированию видеоинформации.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
По мере разработки и поставки аппаратных средств для воспроизведения и запоминания видеоконтента высокого разрешения или высокого качества, существует нарастающая потребность в видеокодеке для эффективного кодирования или декодирования видеоконтента высокого разрешения или высокого качества. В обычном видеокодеке, видеоинформация кодируется в соответствии со способом кодирования с ограничением на основе макроблока, имеющего заранее определенный размер.
Существующее интерпредсказание (межкадровое предсказание), проводимое видеокодеком, обеспечивает оценку вектора движения и оценку движения макроблока размером 2N×2N за счет использования областей макроблока, имеющих размеры 2N×2N, 2N×N, N×2N и N×N.
КРАТКОЕ ИЗЛОЖЕНИЕ СУЩЕСТВА ИЗОБРЕТЕНИЯ
ТЕХНИЧЕСКАЯ ЗАДАЧА
Возможные варианты осуществления обеспечивают кодирование и декодирование видеоинформации с использованием произвольных форм областей.
РЕШЕНИЕ ЗАДАЧИ
В соответствии с аспектом возможного варианта осуществления, предложен способ кодирования видеоинформации, заключающийся в том, что: разделяют видеоданные с получением максимального элемента кодирования; кодируют видеоданные максимального элемента кодирования на основе более глубоких элементов кодирования иерархических структур, при этом более глубокий элемент кодирования меньшей глубины разделяют по мере увеличения глубины в соответствии, по меньшей мере, с одной зоной разделения максимального элемента кодирования, и определяют глубину кодирования, на которой надлежит выводить результат кодирования, включая интерпредсказание с использованием областей, полученных путем разделения элемента кодирования согласно произвольным отношениям; и выводят поток битов, включающий в себя кодированные видеоданные, соответствующие глубине кодирования, по меньшей мере, для одной зоны разделения в соответствии с максимальными элементами кодирования и информацией, касающейся глубины кодирования и режимов кодирования.
ПОЛЕЗНЫЕ ЭФФЕКТЫ ИЗОБРЕТЕНИЯ
В соответствии с возможными вариантами осуществления, можно увеличить эффективность сжатия изображения, поскольку элемент кодирования корректируется с учетом характеристик изображения при одновременном увеличении максимального размера элемента кодирования с учетом размера изображения. Даже если данные изображения имеют высокое разрешение и включают в себя большое количество данных, данные изображения можно эффективно кодировать и восстанавливать за счет использования размера элемента кодирования и режима кодирования, которые адаптивно определяются в соответствии с характеристиками данных изображения, а также за счет использования информации об оптимальном режиме кодирования, получаемом из кодера.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На фиг.1 представлена блок-схема устройства для кодирования видеоинформации в соответствии с возможным вариантом осуществления;
на фиг.2 представлена блок-схема устройства для декодирования видеоинформации в соответствии с возможным вариантом осуществления;
на фиг.3 представлен чертеж для описания концепции элементов кодирования в соответствии с возможным вариантом осуществления;
на фиг.4 представлена блок-схема кодера изображения на основе элементов кодирования в соответствии с возможным вариантом осуществления;
на фиг.5 представлена блок-схема декодера изображения на основе элементов кодирования в соответствии с возможным вариантом осуществления;
на фиг.6 представлен пояснительный чертеж, иллюстрирующий более глубокие элементы кодирования, соответствующие глубинам, и области в соответствии с возможным вариантом осуществления;
на фиг.7 представлен пояснительный чертеж для описания взаимосвязи между элементом кодирования и элементами преобразования в соответствии с возможным вариантом осуществления;
на фиг.8 представлен пояснительный чертеж для описания информации кодирования элементов кодирования, соответствующей кодированной глубине, в соответствии с возможным вариантом осуществления;
на фиг.9 представлен пояснительный чертеж более глубоких элементов кодирования, соответствующих глубинам, в соответствии с возможным вариантом осуществления;
на фиг.10-12 представлены пояснительные чертежи для описания взаимосвязи между элементами кодирования, элементами предсказания и элементами преобразования в соответствии с возможным вариантом осуществления;
на фиг.13 представлен пояснительный чертеж для описания взаимосвязи между элементом кодирования, элементом предсказания или областью и элементом преобразования в соответствии с информацией о режиме кодирования из таблицы 1;
на фиг.14 представлена блок-схема последовательности операций, иллюстрирующая способ кодирования видеоинформации в соответствии с возможным вариантом осуществления;
на фиг.15 представлена блок-схема последовательности операций, иллюстрирующая способ декодирования видеоинформации в соответствии с возможным вариантом осуществления;
на фиг.16 представлена блок-схема устройства для кодирования видеоинформации применительно к интерпредсказанию с использованием разделения на области согласно произвольным отношениям в соответствии с еще одним возможным вариантом осуществления;
на фиг.17 представлена блок-схема устройства для декодирования видеоинформации применительно к интерпредсказанию с использованием разделения на области согласно произвольным отношениям в соответствии с еще одним возможным вариантом осуществления;
на фиг.18 представлен пояснительный чертеж возможных областей, получаемых путем разделения элемента кодирования согласно произвольным отношениям в соответствии с возможным вариантом осуществления;
фиг.19 иллюстрирует синтаксическую структуру набора параметров последовательности, включающего в себя информацию, касающуюся того, включает ли в себя тип области для интерпредсказания те области, которые получены путем разделения элемента кодирования согласно произвольным отношениям в соответствии с возможным вариантом осуществления;
на фиг.20 представлена блок-схема, иллюстрирующая способ кодирования видеоинформации применительно к интерпредсказанию с использованием разделения на области согласно произвольным отношениям в соответствии с еще одним возможным вариантом осуществления; и
на фиг.21 представлена блок-схема, иллюстрирующая способ декодирования видеоинформации применительно к интерпредсказанию с использованием разделения на области согласно произвольным отношениям в соответствии с еще одним возможным вариантом осуществления.
ЛУЧШИЙ СПОСОБ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
В соответствии с аспектом возможного варианта осуществления, предложен способ кодирования видеоинформации, заключающийся в том, что: разделяют видеоданные с получением максимального элемента кодирования; кодируют видеоданные максимального элемента кодирования на основе более глубоких элементов кодирования иерархических структур, при этом элемент кодирования меньшей глубины разделяют по мере увеличения глубины в соответствии, по меньшей мере, с одной зоной разделения максимального элемента кодирования, и определяют глубину кодирования, при которой надлежит выводить результат кодирования, включая интерпредсказание с использованием областей, полученных путем разделения элемента кодирования согласно произвольным отношениям; и выводят поток битов, включающий в себя кодированные видеоданные, соответствующие глубине кодирования, по меньшей мере, для одной зоны разделения в соответствии с максимальными элементами кодирования и информацией, касающейся глубины кодирования и режимов кодирования.
Термин «глубина» обозначает количество раз иерархического разделения элемента кодирования, и по мере увеличения глубины, максимальный элемент кодирования можно разделить на более глубокие элементы кодирования в соответствии с глубинами, чтобы получить минимальные элементы кодирования. Глубина увеличивается от меньшей глубины до большей глубины. По мере увеличения глубины, количество раз разделения максимального элемента кодирования увеличивается, а суммарное количество возможных раз разделения максимального элемента кодирования соответствует максимальной глубине. Максимальный размер и максимальную глубину элемента кодирования можно определить заранее.
Определение глубины кодирования может предусматривать избирательное определение того, проводить ли интерпредсказание с использованием тех областей, которые получены путем разделения элемента кодирования согласно произвольным отношениям.
Вывод потока битов может предусматривать включение в него информации, указывающей, включает ли в себя тип области для интерпредсказания те области, которые получены путем разделения элемента кодирования согласно произвольным отношениям.
Области, которые получены путем разделения элемента кодирования согласно произвольным отношениям, могут быть областями, которые получены путем разделения высоты и ширины элемента кодирования согласно отношению 1:3 или 3:1.
Максимальный элемент кодирования можно задавать как, по меньшей мере, один из блоков, имеющих размеры 16×16, 32×32, 64×64, 128×128 и 256×256.
Глубину кодирования можно определять как глубину более глубокого элемента кодирования, имеющего наивысшую эффективность кодирования среди результатов кодирования, на основе более глубоких элементов кодирования в соответствии с иерархическими структурами соответствующей зоны разделения, а глубину кодирования можно определять независимо, по меньшей мере, для одной зоны разделения в пределах максимального элемента кодирования.
В соответствии с еще одним аспектом возможного варианта осуществления, предложен способ декодирования видеоинформации, заключающийся в том, что: принимают и синтаксически анализируют поток битов касательно кодированных видеоданных; извлекают кодированные видеоданные в соответствии с максимальными элементами кодирования и информацией, касающейся глубин кодирования и режимов кодирования в соответствии с максимальными элементами кодирования, из потока битов; и осуществляют декодирование, предусматривающее компенсацию движения с использованием областей, которые получены путем разделения элементов кодирования согласно произвольным отношениям, для элемента кодирования, по меньшей мере, одной глубины кодирования в соответствии с максимальными элементами кодирования на основе информации, касающейся глубин кодирования и режимов кодирования в соответствии с максимальными элементами кодирования, при этом элементы кодирования, по меньшей мере, одной глубины кодирования определяют как одну из глубин более глубоких элементов кодирования иерархических структур, по меньшей мере, для одной зоны разделения максимального элемента кодирования.
Извлечение кодированных видеоданных может предусматривать дополнительное извлечение информации, указывающей тип области для интерпредсказания, включающий в себя те области, которые получены путем разделения элементов кодирования согласно произвольным отношениям, из потока битов.
Осуществление декодирования может предусматривать избирательное определение того, осуществлять ли компенсацию движения с использованием областей, которые получены путем разделения элементов кодирования согласно произвольным отношениям, на основе информации, указывающей тип области для интерпредсказания, включающий в себя те области, которые получены путем разделения элементов кодирования согласно произвольным отношениям, из потока битов.
В соответствии с еще одним аспектом возможного варианта осуществления, предложено устройство для кодирования видеоинформации, включающее в себя: модуль разделения, дающий максимальный элемент кодирования, предназначенное для разделения видеоданных с получением максимального элемента кодирования; кодер для кодирования видеоданных максимального элемента кодирования на основе более глубоких элементов кодирования иерархических структур, при этом элемент кодирования меньшей глубины разделяется по мере увеличения глубины в соответствии, по меньшей мере, с одной зоной разделения максимального элемента кодирования, и для определения глубины кодирования, при которой надлежит выводить результат кодирования, включая интерпредсказание с использованием областей, полученных путем разделения элементов кодирования согласно произвольным отношениям; и блок вывода, предназначенный для вывода потока битов, включающего в себя кодированные видеоданные, соответствующие глубине кодирования, по меньшей мере, для одной зоны разделения в соответствии с максимальными элементами кодирования и информацией, касающейся глубины кодирования и режимов кодирования.
В соответствии с еще одним аспектом возможного варианта осуществления, предложено устройство для декодирования видеоинформации, включающее в себя: синтаксический анализатор для приема и синтаксического анализа потока битов касательно кодированных видеоданных; модуль извлечения, предназначенный для извлечения кодированных видеоданных в соответствии с максимальными элементами кодирования и информацией, касающейся глубин кодирования и режимов кодирования в соответствии с максимальными элементами кодирования, из потока битов; и декодер для осуществления декодирования, предусматривающего компенсацию движения с использованием областей, которые получены путем разделения элементов кодирования согласно произвольным отношениям, для элемента кодирования, по меньшей мере, одной глубины кодирования в соответствии с максимальными элементами кодирования на основе информации, касающейся глубин кодирования и режимов кодирования в соответствии с максимальными элементами кодирования, при этом элементы кодирования, по меньшей мере, одной глубины кодирования определяются как одна из глубин более глубоких элементов кодирования иерархических структур, по меньшей мере, для одной зоны разделения максимального элемента кодирования.
В соответствии с еще одним аспектом возможного варианта осуществления, предложен машинно-читаемый носитель записи, имеющий записанную на нем программу для осуществления способа кодирования видеоинформации. В соответствии с еще одним аспектом возможного варианта осуществления, предложен машинно-читаемый носитель записи, имеющий записанную на нем программу для осуществления способа декодирования видеоинформации.
ВАРИАНТЫ ИЗОБРЕТЕНИЯ
Ниже, будет приведено более подробное описание возможных вариантов осуществления со ссылками на прилагаемые чертежи, где эти возможные варианты осуществления показаны. В возможных вариантах осуществления, в зависимости от своего контекста, термин «элемент» может относиться или не относиться к единице размера.
В соответствии с возможными вариантами осуществления, термин «элемент кодирования» в нижеследующем тексте означает элемент кодируемых данных, в котором данные изображения кодируются на стороне кодера, и элемент кодированных данных, в котором кодированные данные изображения декодируются на стороне декодера. Кроме того, термин «кодированная глубина» означает глубину, на которой кодируется элемент кодирования.
Термин «изображение» в нижеследующем тексте может обозначать фотографическое изображение для видеоинформации или движущееся изображение, т.е. саму видеоинформацию.
Кодирование и декодирование видеоинформации на основе элемента пространственно-иерархических данных в соответствии с возможным вариантом осуществления будут описаны со ссылками на фиг.1-15, а кодирование и декодирование видеоинформации посредством интерпредсказания с использованием областей, деление на которые проведено согласно произвольному отношению в соответствии с возможным вариантом осуществления, будут описаны со ссылками на фиг.16-21.
На фиг.1 представлена блок-схема устройства 100 для кодирования видеоинформации в соответствии с возможным вариантом осуществления.
Устройство 100 для кодирования видеоинформации включает в себя модуль 110 разделения, дающий максимальный элемент кодирования, модуль 120 определения элементов кодирования и блок 130 вывода.
Средство 110 разделения, дающее максимальный элемент кодирования, может разделять текущий кадр на основе максимального элемента кодирования для текущего кадра изображения. Если текущий кадр больше, чем максимальный элемент кодирования, данные изображения текущего кадра можно разделить с получением, по меньшей мере, одного максимального элемента кодирования. Максимальный элемент кодирования в соответствии с возможным вариантом осуществления может быть элементом данных, имеющим размер 32×32, 64×64, 128×128, 256×256, и т.д., при этом форма элемента данных представляет собой квадрат, имеющий ширину и высоту, выражаемые величинами, которые представляют собой степени двойки. Данные изображения можно выводить в модуль 120 определения элементов кодирования в соответствии, по меньшей мере, с одним максимальным элементом кодирования.
Элемент кодирования в соответствии с возможным вариантом осуществления можно характеризовать максимальным размером и глубиной. Термин «глубина» означает количество раз пространственного разделения для получения данного элемента кодирования из максимального элемента кодирования, и по мере увеличения или нарастания глубины можно получать более глубокие элементы кодирования путем разделения в соответствии с глубинами от максимального элемента кодирования до минимального элемента кодирования. Глубина максимального элемента кодирования является наименьшей глубиной, а глубина минимального элемента кодирования является наибольшей глубиной. Поскольку размер элемента кодирования, соответствующий каждой глубине, уменьшается по мере увеличения глубины максимального элемента кодирования, элемент кодирования, соответствующий меньшей глубине, может включать в себя множество элементов кодирования, соответствующих большим глубинам.
Как описано выше, данные изображения текущего кадра разделяют с получением максимальных элементов кодирования в соответствии с максимальным размером элемента кодирования, а каждый из максимальных элементов кодирования может включать в себя более глубокие элементы кодирования, разделение на которые осуществляется в соответствии с глубинами. Поскольку максимальный элемент кодирования в соответствии с возможным вариантом осуществления разделяют в соответствии с глубинами, данные изображения в пространственной области, включенные в максимальный элемент кодирования, можно иерархически классифицировать в соответствии с глубинами.
Максимальную глубину и максимальный размер элемента кодирования, которые ограничивают суммарное количество раз иерархического разделения высоты и ширины максимального элемента кодирования, можно определять заранее.
Модуль 120 определения элементов кодирования кодирует, по меньшей мере, одну зону разделения, которая получена путем разделения зоны максимального элемента кодирования в соответствии с глубинами, и определяет глубину для вывода заключительных кодированных данных изображения в соответствии с упомянутой, по меньшей мере, одной зоной разделения. Иными словами, модуль 120 определения элементов кодирования определяет кодированную глубину, кодируя данные изображения в более глубоких элементах кодирования, соответствующих глубинам, в соответствии с максимальным элементом кодирования текущего кадра, и выбирают глубину, имеющую наименьшую ошибку кодирования. Таким образом, в конце концов, происходит вывод кодированных данных изображения, соответствующих определенной кодированной глубине. Кроме того, элементы кодирования, соответствующие кодированной глубине, можно рассматривать как кодированные элементы кодирования.
Определенная кодированная глубина и кодированные данные изображения, соответствующие определенной кодированной глубине, выдаются в блок 130 вывода.
Данные изображения в максимальном элементе кодирования кодируются на основе более глубоких элементов кодирования, соответствующих, по меньшей мере, одной глубине, равной максимальной глубине или меньшей, а результаты кодирования данных изображения сравниваются на основе каждого из более глубоких элементов кодирования. Глубину, имеющую наименьшую ошибку кодирования, можно выбрать после сравнения ошибок кодирования более глубоких элементов кодирования. Для каждого максимального элемента кодирования можно выбрать, по меньшей мере, одну кодированную глубину.
Размер максимального элемента кодирования разделяют по мере иерархического разделения элемента кодирования в соответствии с глубинами и по мере увеличения количества элементов кодирования. Кроме того, даже если элементы кодирования соответствуют одной и той же глубине в одном максимальном элементе кодирования, все равно проводится определение того, разбивать ли каждый из элементов кодирования, соответствующих одной и той же глубине, для достижения большей глубины, путем измерения ошибки кодирования данных изображения каждого элемента изображения в отдельности. Соответственно, даже когда данные изображения включены в один максимальный элемент кодирования, эти данные изображения разделяют на зоны в соответствии с глубинами, а ошибки кодирования могут отличаться в соответствии с зонами в упомянутом одном максимальном элементе кодирования, и поэтому кодированные глубины могут отличаться в соответствии с зонами в данных изображения. Таким образом, в одном максимальном элементе кодирования можно определить одну или более кодированных глубин, а данные изображения максимального элемента кодирования можно делить в соответствии с элементами кодирования, по меньшей мере, одной кодированной глубины.
Соответственно, модуль 120 определения элементов кодирования может определять элементы кодирования, имеющие древовидную структуру и включенные в максимальный элемент кодирования. Термин «элементы кодирования, имеющие древовидную структуру» в соответствии с возможным вариантом осуществления включает в себя элементы кодирования, соответствующие глубине, определяемой как являющуюся кодированной глубиной, из числа всех более глубоких элементов кодирования, включенных в максимальный элемент кодирования. Элемент кодирования кодированной глубины может быть иерархически определен в соответствии с глубинами в одной и той же зоне максимального элемента кодирования, и может быть независимо определен в разных зонах. Аналогичным образом, кодированную глубину в текущей зоне можно определять независимо от кодированной глубины в другой зоне.
Максимальная глубина в соответствии с возможным вариантом осуществления является показателем, связанным с количеством раз разделения с переходом от максимального элемента кодирования к минимальному элементу кодирования, т.е. с количеством раз разделения максимального элемента кодирования с получением минимального элемента кодирования. Первая максимальная глубина, соответствующая возможному варианту осуществления, может обозначать суммарное количество раз разделения с переходом от максимального элемента кодирования к минимальному элементу кодирования. Вторая максимальная глубина, соответствующая возможному варианту осуществления, может обозначать суммарное количество уровней глубины от максимального элемента кодирования до минимального элемента кодирования. Например, когда глубина максимального элемента кодирования равна 0, глубину элемента кодирования, для получения которого максимальный элемент кодирования разделяют один раз, можно задать равной 1, а глубину элемента кодирования, для получения которого максимальный элемент кодирования разделяют дважды, можно задать равной 2. В данном случае, если минимальный элемент кодирования представляет собой элемент кодирования, для получения которого максимальный элемент кодирования разделяют четыре раза, существуют 5 уровней глубины - 0, 1, 2, 3 и 4, и поэтому первую максимальную глубину можно задать равной 4, а вторую максимальную глубину можно задать равной 5.
Кодирование с предсказанием и преобразование можно проводить в соответствии с максимальным элементом кодирования. Кодирование с предсказанием и преобразование также проводятся на основе более глубоких элементов кодирования, соответствующих глубине, равной максимальной глубине, или соответствующих глубинам, меньшим чем она, в соответствии с максимальным элементом кодирования. Преобразование можно проводить в соответствии со способом ортогонального преобразования или целочисленного преобразования.
Поскольку количество более глубоких элементов кодирования увеличивается всякий раз, когда максимальный элемент кодирования разделяют в соответствии с глубинами, кодирование, включая кодирование с предсказанием, и преобразование проводят на всех более глубоких элементах кодирования, генерируемых по мере увеличения глубины. Для удобства описания, кодирование с предсказанием и преобразование теперь будут описаны на основе элемента кодирования текущей глубины в максимальном элементе кодирования.
Устройство 100 для кодирования видеоинформации может изменяемо выбирать размер ли форму элемента данных для кодирования данных изображения. Чтобы закодировать данные изображения, проводят операции, такие, как кодирование с предсказанием, преобразование, и энтропийное кодирование, и при этом для всех операций можно использовать один и тот же элемент данных, или для каждой операции можно использовать разные элементы данных.
Например, устройство 100 для кодирования видеоинформации может выбирать не только элемент кодирования с целью кодирования данных изображения, но и элемент данных, отличающийся от элемента кодирования, чтобы осуществить кодирование с предсказанием на упомянутых данных изображения в упомянутом элементе кодирования.
Чтобы провести кодирование с предсказанием в максимальном элементе кодирования, кодирование с предсказанием можно провести на основе элемента кодирования, соответствующего кодированной глубине, т.е. на основе элемента кодирования, который больше не разделяется на элементы кодирования, соответствующие большей глубине. В нижеследующем тексте, элемент кодирования, который больше не разделяется и становится базисным элементом для кодирования с предсказанием, будет теперь именоваться «элементом предсказания». Область, получаемая путем разделения элемента предсказания, может включать в себя элемент предсказания или элемент данных, полученный путем разделения, по меньшей мере, одной из высоты и ширины элемента предсказания.
Например, когда элемент кодирования размером 2N×2N (где N - положительное целое число) больше не разделяется и становится элементом предсказания размером 2N×2N, размер области может составлять 2N×2N, 2N×N, N×2N или N×N. Примеры типа области включают в себя симметричные области, которые получены путем симметричного разделения высоты или ширины элемента предсказания, области, которые получены путем асимметричного разделения высоты или ширины элемента предсказания, такие, как 1:n или n:1, области, которые получены путем геометрического разделения элемента предсказания, и области, имеющие произвольные формы.
Режимом предсказания элемента предсказания может быть, по меньшей мере, один из интра-режима (режима внутрикадрового предсказания), интер-режима (режима межкадрового предсказания) и режима пропуска. Например, интра-режим или интер-режим можно осуществлять на области размером 2N×2N, 2N×N, N×2N или N×N. Кроме того, режим пропуска можно осуществлять только на области размером 2N×2N. Кодирование осуществляют независимо на одном элементе предсказания в элементе кодирования, тем самым выбирая режим предсказания, имеющий наименьшую ошибку кодирования.
Устройство 100 для кодирования видеоинформации также может проводить преобразование на данных изображения в элементе кодирования на основе не только элемента кодирования, предназначенного для кодирования данных изображения, но и на основе элемента данных, который отличается от этого элемента кодирования.
Чтобы провести преобразование в элементе кодирования, это преобразование можно осуществить на основе элемента данных, имеющего размер, меньший, чем элемент кодирования или равный ему. Например, элемент данных для преобразования может включать в себя элемент данных для интра-режима и элемент данных для интер-режима.
Элемент данных, используемый в качестве основы для преобразования, будет теперь именоваться «элементом преобразования». В элементе преобразования также можно задать глубину преобразования, указывающую количество раз разделения для достижения элемента преобразования путем разделения высоты и ширины элемента кодирования. Например, в текущем элементе кодирования размером 2N×2N, глубина преобразования может быть равна 0, когда размер элемента преобразования также составляет 2N×2N, может быть равна 1, когда каждая из высоты и ширины текущего элемента кодирования разделена на две равные части, что в сумме дает разделение на 4^1 элементов преобразования, и таким образом получается, что размер элемента преобразования составляет N×N, и глубина преобразования может быть равна 2, когда каждая из высоты и ширины текущего элемента кодирования разделена на четыре равные части, что в сумме дает разделение на 4^2 элементов преобразования, и таким образом получается, что размер элемента преобразования составляет (N/2)×(N/2). Например, элемент преобразования можно задать в соответствии с иерархической древовидной структурой, в которой элемент преобразования меньшей глубины преобразования разделяется на четыре элемента преобразования большей глубины преобразования в соответствии с иерархическими характеристиками глубины преобразования.
Аналогично элементу кодирования, элемент преобразования в элементе кодирования можно рекурсивно разделять на зоны меньшего размера, так что элемент преобразования можно определять независимо в элементах зон. Таким образом, остальные данные в элементе кодирования можно делить в соответствии с преобразованием, имеющим древовидную структуру, соответствующую глубинам преобразования.
Информация кодирования, соответствующая элементам кодирования, соответствующим кодированной глубине, требует не только информации о кодированной глубине, но и также информации, относящейся к кодированию с предсказанием и преобразованию. Соответственно, модуль 120 определения элементов кодирования не только определяет кодированную глубину, имеющую наименьшую ошибку кодирования, но и определяет тип области в элементе предсказания, режим предсказания, соответствующий элементам предсказания, и размер элемента преобразования, предусматриваемый для преобразования.
Ниже, со ссылками на фиг.3-12, будет приведено более подробное описание элементов кодирования, соответствующих древовидной структуре в максимальном элементе кодирования, и способа определения области, соответствующего возможным вариантам осуществления.
Модуль 120 определения элементов кодирования может измерять ошибку кодирования более глубоких элементов кодирования в соответствии с глубинами путем использования оптимизации искажений в зависимости от скорости передачи на основе множителей Лагранжа.
Блок 130 вывода осуществляет вывод данных изображения максимального элемента кодирования, которые закодированы на основе упомянутой, по меньшей мере, одной кодированной глубины, определенной модулем 120 определения элементов кодирования, и информации о режиме кодирования, соответствующей кодированной глубине, в потоках битов.
Кодированные данные изображения могут быть получены путем кодирования остальных данных изображения.
Информация о режиме кодирования, соответствующая кодированной глубине, может включать в себя информацию о кодированной глубине, о типе области в элементе предсказания, режим предсказания и размер элемента преобразования.
Информация о кодированной глубине может быть определена путем использования информации разделения в соответствии с глубинами, которая указывает, осуществляется ли кодирование на элементах кодирования большей глубины вместо текущей глубины. Если текущая глубина текущего элемента кодирования является кодированной глубиной, то происходит кодирование и вывод данных изображения в текущем элементе кодирования, и поэтому информация разделения может быть определена не для разделения текущего элемента кодирования с достижением большей глубины. В альтернативном варианте, если текущая глубина текущего элемента кодирования не является кодированной глубиной, то кодирование проводят на элементе кодирования большей глубины, и поэтому информация разделения может быть определена для разделения текущего элемента кодирования с целью получения элементов кодирования большей глубины.
Если текущая глубина не является кодированной глубиной, то кодирование проводят на элементе кодирования, который разделен с получением, по меньшей мере, одного элемента кодирования большей глубины. Поскольку, по меньшей мере, один элемент кодирования большей глубины существует в одном элементе кодирования текущей глубины, кодирование проводят повторно на каждом элементе кодирования большей глубины, и поэтому кодирование можно проводить рекурсивно для элементов кодирования, имеющих одну и ту же глубину.
Поскольку элементы кодирования, имеющие древовидную структуру, определяются для одного максимального элемента кодирования, а информация, по меньшей мере, об одном режиме кодирования определяется для элемента кодирования кодированной глубины, информация, по меньшей мере, об одном режиме кодирования может быть определена для одного максимального элемента кодирования. Кроме того, кодированная глубина данных изображения максимального элемента кодирования может быть разной в соответствии с ячейками, поскольку данные изображения иерархически разделяются в соответствии с глубинами, и поэтому для данных изображения можно задавать информацию о кодированной глубине и режиме кодирования.
Соответственно, блок 130 вывода может присваивать информацию кодирования о соответствующей кодированной глубине и режиме кодирования, по меньшей мере, одному из элемента кодирования, элемента предсказания и минимального элемента, включенного в максимальный элемент кодирования.
Минимальный элемент в соответствии с возможным вариантом осуществления представляет собой прямоугольный элемент данных, получаемый путем разделения минимального элемента кодирования, составляющего наибольшую глубину, на 4. В альтернативном варианте, минимальный элемент может быть максимальным прямоугольным элементом данных, который может быть включен во все элементы кодирования, элементы предсказания, элементы области, и элементы преобразования, включенные в максимальный элемент кодирования.
Например, информацию кодирования, выводимую посредством блока 130 вывода, можно подразделить на информацию кодирования, соответствующую элементам кодирования, и информацию кодирования, соответствующую элементам предсказания. Информация кодирования, соответствующая элементам кодирования, может включать в себя информацию о режиме предсказания и о размере областей. Информация кодирования, соответствующая элементам предсказания, может включать в себя информацию о направлении оценки интер-режима, о показателе опорного изображения интер-режима, о векторе движения, о составляющей цветности интра-режима и о способе интерполяции интра-режима. Кроме того, в набор параметров последовательности (НПП (SPS)) или заголовок потока битов может быть включена информация о максимальном размере элемента кодирования, определенная в соответствии с кадрами, фрагментами или GOP, и информация о максимальной глубине.