Способ кодирования видео и устройство для кодирования видео на основе единиц кодирования, определенных в соответствии с древовидной структурой, и способ декодирования видео и устройство для декодирования видео на основе единиц кодирования, определенных в соответствии с древовидной структурой
Иллюстрации
Показать всеИзобретение относится к кодированию и декодированию видео, которые выполняют преобразования между пространственной областью и областью преобразования. Технический результат - повышение эффективности сжатия, кодирования и декодирования изображений. Способ кодирования видео содержит этапы, на которых: разбивают изображение видео на одну или более максимальных единиц кодирования, кодируют изображение на основе единиц кодирования согласно глубинам, которые получаются посредством иерархического разбиения каждой из одной или более максимальных единиц кодирования, и выводят данные, которые кодируются на основе единиц кодирования, имеющих древовидную структуру, информацию относительно кодированных глубин и режима кодирования и информацию структуры единиц кодирования, указывающую размер и переменную глубину единицы кодирования. 6 н. и 9 з.п. ф-лы, 15 ил., 1 табл.
Реферат
Область техники, к которой относится изобретение
Настоящее изобретение относится к кодированию видео и декодированию видео, которые выполняют преобразование между пространственной областью и областью преобразования.
Уровень техники
По мере того как разрабатываются и предоставляются аппаратные средства для воспроизведения и сохранения высококачественного видеоконтента высокого разрешения, растет потребность в видеокодеке для эффективного кодирования или декодирования высококачественного видеоконтента высокого разрешения. В традиционном видеокодеке видео кодируется согласно ограниченному способу кодирования на основе макроблока, имеющего предварительно определенный размер. Кроме того, традиционный видеокодек выполняет преобразование и обратное преобразование для макроблока посредством использования блока, имеющего идентичный размер, и тем самым кодирует и декодирует видеоданные.
Подробное описание изобретения
Техническая задача
Настоящее изобретение предоставляет кодирование видео и декодирование видео, которые выполняют преобразование между пространственной областью и областью преобразования посредством использования иерархической единицы кодирования.
ТЕХНИЧЕСКОЕ РЕШЕНИЕ
Согласно аспекту настоящего изобретения предусмотрен способ декодирования видео на основе единиц кодирования, имеющих древовидную структуру, причем способ включает в себя операции приема потока битов относительно кодированного видео и синтаксического анализа потока битов; извлечения информации структуры единиц кодирования, указывающей размер и переменную глубину единицы кодирования, которая является единицей данных для декодирования изображения видео, и информации относительно кодированной глубины и режима кодирования относительно единиц кодирования, имеющих древовидную структуру изображения, из потока битов; и определения единиц кодирования, имеющих древовидную структуру, на основе информации структуры единиц кодирования и информации относительно кодированной глубины и режима кодирования и декодирования изображения на основе единиц кодирования.
ПРЕИМУЩЕСТВА ИЗОБРЕТЕНИЯ
Эффективность сжатия изображений может быть повышена, поскольку единица кодирования иерархически регулируется с учетом характеристик изображения при увеличении максимального размера единицы кодирования с учетом размера изображения. Поскольку кодер передает кодированные видеоданные с информацией относительно кодированной глубины и режима кодирования, декодер может декодировать каждый фрагмент кодированных данных изображений после определения, по меньшей мере, одной кодированной глубины согласно единицам кодирования, имеющим древовидную структуру, так что может быть повышена эффективность кодирования и декодирования изображения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг. 1 является блок-схемой устройства для кодирования видео на основе единиц кодирования, имеющих древовидную структуру, согласно варианту осуществления настоящего изобретения.
Фиг. 2 является блок-схемой устройства для декодирования видео на основе единиц кодирования, имеющих древовидную структуру, согласно варианту осуществления настоящего изобретения.
Фиг. 3 является схемой для описания принципа единиц кодирования согласно варианту осуществления настоящего изобретения.
Фиг. 4 является блок-схемой кодера изображений на основе единиц кодирования согласно варианту осуществления настоящего изобретения.
Фиг. 5 является блок-схемой декодера изображений на основе единиц кодирования согласно варианту осуществления настоящего изобретения.
Фиг. 6 является схемой, иллюстрирующей более глубокие единицы кодирования согласно глубинам и сегментам, согласно варианту осуществления настоящего изобретения.
Фиг. 7 является схемой для описания взаимосвязи между единицей кодирования и единицами преобразования, согласно варианту осуществления настоящего изобретения.
Фиг. 8 является схемой для описания информации кодирования единиц кодирования, соответствующих кодированной глубине, согласно варианту осуществления настоящего изобретения.
Фиг. 9 является схемой более глубоких единиц кодирования согласно глубинам, согласно варианту осуществления настоящего изобретения.
Фиг. 10-12 являются схемами для описания взаимосвязи между единицами кодирования, единицами прогнозирования и единицами преобразования, согласно варианту осуществления настоящего изобретения.
Фиг. 13 является схемой для описания взаимосвязи между единицей кодирования, единицей прогнозирования или сегментом и единицей преобразования, согласно информации режима кодирования по таблице 1.
Фиг. 14 является блок-схемой последовательности операций, иллюстрирующей способ кодирования видео на основе единиц кодирования, имеющих древовидную структуру, согласно варианту осуществления настоящего изобретения.
Фиг. 15 является блок-схемой последовательности операций, иллюстрирующей способ декодирования видео на основе единиц кодирования, имеющих древовидную структуру, согласно варианту осуществления настоящего изобретения.
ОПТИМАЛЬНЫЙ РЕЖИМ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Согласно аспекту настоящего изобретения, предусмотрен способ декодирования видео на основе единиц кодирования, имеющих древовидную структуру, причем способ включает в себя операции приема потока битов относительно кодированного видео и синтаксического анализа потока битов; извлечения информации структуры единиц кодирования, указывающей размер и переменную глубину единицы кодирования, которая является единицей данных для декодирования изображения видео, и информации относительно кодированной глубины и режима кодирования относительно единиц кодирования, имеющих древовидную структуру изображения, из потока битов; и определения единиц кодирования, имеющих древовидную структуру, на основе информации структуры единиц кодирования и информации относительно кодированной глубины и режима кодирования и декодирования изображения на основе единиц кодирования.
Согласно другому аспекту настоящего изобретения, предусмотрен способ кодирования видео на основе единиц кодирования, имеющих древовидную структуру, причем способ включает в себя операции разбиения изображения видео на одну или более максимальных единиц кодирования, которые являются единицами кодирования, имеющими максимальный размер; кодирования изображения на основе единиц кодирования согласно глубинам, которые получаются посредством иерархического разбиения каждой из одной или более максимальных единиц кодирования согласно глубинам в каждой из одной или более максимальных единиц кодирования, определения единиц кодирования согласно кодированным глубинам относительно каждой из единиц кодирования согласно глубинам и тем самым определения единиц кодирования, имеющих древовидную структуру; и вывода кодированных данных, которые кодируются на основе единиц кодирования, имеющих древовидную структуру, информации относительно кодированных глубин и режима кодирования и информации структуры единиц, указывающей размер и переменную глубину единицы кодирования.
Согласно другому аспекту настоящего изобретения, предусмотрено устройство декодирования видео, содержащее процессор декодирования видео и основанная на единицах кодирования, имеющих древовидную структуру, причем устройство декодирования видео включает в себя приемное устройство для приема потока битов относительно кодированного видео и затем синтаксического анализа потока битов; модуль извлечения для извлечения информации структуры единиц кодирования, указывающей размер и переменную глубину единицы кодирования, которая является единицей данных для декодирования изображения видео, и информации относительно кодированной глубины и режима кодирования относительно единиц кодирования, имеющих древовидную структуру изображения, из потока битов; и декодер для определения единиц кодирования, имеющих древовидную структуру, на основе информации структуры единиц кодирования и информации относительно кодированной глубины и режима кодирования и декодирования изображения на основе единиц кодирования, в ассоциации с процессором декодирования видео.
Согласно другому аспекту настоящего изобретения, предусмотрено устройство кодирования видео, содержащее процессор кодирования видео и основанная на единицах кодирования, имеющих древовидную структуру, причем устройство кодирования видео включает в себя модуль разбиения на максимальные единицы кодирования для разбиения изображения видео на одну или более максимальных единиц кодирования, которые являются единицами кодирования, имеющими максимальный размер; модуль определения единиц кодирования для кодирования изображения на основе единиц кодирования согласно глубинам, которые получаются посредством иерархического разбиения каждой из одной или более максимальных единиц кодирования согласно глубинам в каждой из одной или более максимальных единиц кодирования, определения единиц кодирования согласно кодированным глубинам относительно каждой из единиц кодирования согласно глубинам и тем самым определения единиц кодирования, имеющих древовидную структуру, в ассоциации с процессором кодирования видео; и модуль вывода для вывода указывающих данных, которые кодируются на основе единиц кодирования, имеющих древовидную структуру, информации относительно кодированных глубин и режима кодирования и информации структуры единиц кодирования относительно размера и переменной глубины единицы кодирования.
Информация структуры единиц кодирования может включать в себя информацию относительно максимального размера единицы кодирования из единиц кодирования, имеющих древовидную структуру, информацию относительно минимального размера единицы кодирования и информацию относительно переменной глубины.
Согласно другому аспекту настоящего изобретения, предусмотрен машиночитаемый носитель записи, имеющий записанную программу для осуществления способа декодирования видео, посредством использования компьютера. Согласно другому аспекту настоящего изобретения, предусмотрен машиночитаемый носитель записи, имеющий записанную программу для осуществления способа кодирования видео, посредством использования компьютера.
ОПТИМАЛЬНЫЙ РЕЖИМ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Далее настоящее изобретение описывается более подробно со ссылкой на прилагаемые чертежи, на которых показаны примерные варианты осуществления изобретения. В вариантах осуществления изобретения термин "изображение" может обобщенно указывать не только неподвижное изображение, но также и движущееся изображение, к примеру видео.
В дальнейшем в этом документе подробно описываются устройства и способы кодирования и декодирования видео на основе единиц кодирования, имеющих древовидную структуру, со ссылкой на фиг. 1-15.
Фиг. 1 является блок-схемой устройства для кодирования видео на основе единиц кодирования, имеющих древовидную структуру 100, согласно варианту осуществления настоящего изобретения.
Устройство для кодирования видео на основе единиц кодирования, имеющих древовидную структуру 100, включает в себя модуль 110 разбиения на максимальные единицы кодирования, модуль 120 определения единиц кодирования и модуль 130 вывода. В дальнейшем в этом документе, для удобства описания, устройство для кодирования видео на основе единиц кодирования, имеющих древовидную структуру 100, упоминается "как устройство 100 кодирования видео".
Модуль 110 разбиения на максимальные единицы кодирования может разбивать текущее изображение на основе максимальной единицы кодирования для текущей картины изображения. Если текущее изображение превышает максимальную единицу кодирования, данные изображений текущего изображения могут разбиваться, по меньшей мере, на одну максимальную единицу кодирования. Максимальная единица кодирования согласно варианту осуществления настоящего изобретения может быть единицей данных, имеющей размер 32×32, 64×64, 128×128, 256×256 и т.д., при этом форма единицы данных является квадратом, имеющим ширину и длину в квадратах по 2. Данные изображений могут выводиться в модуль 120 определения единиц кодирования согласно, по меньшей мере, одной максимальной единице кодирования.
Единица кодирования согласно варианту осуществления настоящего изобретения может отличаться посредством максимального размера и глубины. Глубина обозначает число раз, которое единица кодирования пространственно разбивается от максимальной единицы кодирования, и по мере того, как глубина увеличивается, более глубокие единицы кодирования согласно глубинам могут разбиваться от максимальной единицы кодирования до минимальной единицы кодирования. Глубина максимальной единицы кодирования является самой верхней глубиной, а глубина минимальной единицы кодирования является самой нижней глубиной. Поскольку размер единицы кодирования, соответствующей каждой глубине, снижается по мере того, как глубина максимальной единицы кодирования увеличивается, единица кодирования, соответствующая верхней глубине, может включать в себя множество единиц кодирования, соответствующих нижним глубинам.
Как описано выше, данные изображений текущего изображения разбиваются на максимальные единицы кодирования согласно максимальному размеру единицы кодирования, и каждая из максимальных единиц кодирования может включать в себя более глубокие единицы кодирования, которые разбиваются согласно глубинам. Поскольку максимальная единица кодирования согласно варианту осуществления настоящего изобретения разбивается согласно глубинам, данные изображений пространственной области, включенные в максимальную единицу кодирования, могут быть иерархически классифицированы согласно глубинам.
Может быть предварительно определена максимальная глубина и максимальный размер единицы кодирования, которые ограничивают общее число раз, сколько высота и ширина максимальной единицы кодирования иерархически разбиваются.
Модуль 120 определения единиц кодирования кодирует, по меньшей мере, одну область разбиения, полученную посредством разбиения области максимальной единицы кодирования согласно глубинам, и определяет глубину, чтобы выводить конечные кодированные данные изображений согласно, по меньшей мере, одной области разбиения. Другими словами, модуль 120 определения единиц кодирования определяет кодированную глубину посредством кодирования данных изображений в более глубоких единицах кодирования согласно глубинам, согласно максимальной единице кодирования текущего изображения и выбора глубины, имеющей наименьшую ошибку кодирования. Таким образом, кодированные данные изображений единицы кодирования, соответствующей определенной кодированной глубине, в завершение выводятся. Кроме того, единицы кодирования, соответствующие кодированной глубине, могут рассматриваться в качестве кодированных единиц кодирования.
Определенная кодированная глубина и кодированные данные изображений согласно определенной кодированной глубине выводятся в модуль 130 вывода.
Данные изображений в максимальной единице кодирования кодируются на основе более глубоких единиц кодирования, соответствующих, по меньшей мере, одной глубине, равной или ниже максимальной глубины, и результаты кодирования данных изображений сравниваются на основе каждой из более глубоких единиц кодирования. Глубина, имеющая наименьшую ошибку кодирования, может быть выбрана после сравнения ошибок кодирования более глубоких единиц кодирования. По меньшей мере, одна кодированная глубина может быть выбрана для каждой максимальной единицы кодирования.
Размер максимальной единицы кодирования разбивается по мере того, как единица кодирования иерархически разбивается согласно глубинам, и по мере того, как число единиц кодирования увеличивается. Кроме того, даже если единицы кодирования соответствуют идентичной глубине в одной максимальной единице кодирования, определяется то, разбивать или нет каждую из единиц кодирования, соответствующих идентичной глубине, до нижней глубины посредством измерения ошибки кодирования данных изображений каждой единицы кодирования, отдельно. Соответственно, даже когда данные изображений включаются в одну максимальную единицу кодирования, данные изображений разбиваются на области согласно глубинам, ошибки кодирования могут отличаться согласно областям в одной максимальной единице кодирования, и, таким образом, кодированные глубины могут отличаться согласно областям данных изображений. Таким образом, одна или более кодированных глубин могут быть определены в одной максимальной единице кодирования, и данные изображений максимальной единицы кодирования могут разбиваться согласно единицам кодирования, по меньшей мере, одной кодированной глубины.
Соответственно, модуль 120 определения единиц кодирования может определять единицы кодирования, имеющие древовидную структуру, включенные в максимальную единицу кодирования. "Единицы кодирования, имеющие древовидную структуру" согласно варианту осуществления настоящего изобретения включают в себя единицы кодирования, соответствующие глубине, определенной как кодированная глубина, из всех более глубоких единиц кодирования, включенных в максимальную единицу кодирования. Единица кодирования кодированной глубины может быть иерархически определена согласно глубинам в идентичной области максимальной единицы кодирования и может быть независимо определена в различных областях. Аналогично, кодированная глубина в текущей области может быть независимо определена из кодированной глубины в другой области.
Максимальная глубина согласно варианту осуществления настоящего изобретения является индексом, связанным с числом разбиений от максимальной единицы кодирования до минимальной единицы кодирования. Максимальная глубина согласно варианту осуществления настоящего изобретения может обозначать общее число разбиений от максимальной единицы кодирования до минимальной единицы кодирования. Например, когда глубина максимальной единицы кодирования равна 0, глубина единицы кодирования, на которую максимальная единица кодирования разбивается один раз, может задаваться равной 1, а глубина единицы кодирования, на которую максимальная единица кодирования разбивается два раза, может задаваться равной 2. Здесь, если минимальная единица кодирования является единицей кодирования, на которую максимальная единица кодирования разбивается четыре раза, имеется 5 уровней глубины из глубин 0, 1, 2, 3 и 4, и тем самым максимальная глубина может задаваться равной 4.
Прогнозирующее кодирование и преобразование может выполняться согласно максимальной единице кодирования. Прогнозирующее кодирование и преобразование также выполняются на основе более глубоких единиц кодирования согласно глубине, равной, или глубинам, меньшим максимальной глубины, согласно максимальной единице кодирования. Преобразование может выполняться согласно способу преобразования частоты, ортогонального преобразования или целочисленного преобразования.
Поскольку число более глубоких единиц кодирования увеличивается каждый раз, когда максимальная единица кодирования разбивается согласно глубинам, кодирование, включающее в себя прогнозирующее кодирование и преобразование, выполняется для всех более глубоких единиц кодирования, сформированных по мере того, как глубина увеличивается. Для удобства описания прогнозирующее кодирование и преобразование далее описываются на основе единицы кодирования текущей глубины в максимальной единице кодирования.
Устройство 100 кодирования видео может по-разному выбирать размер или форму единицы данных для кодирования данных изображений. Чтобы кодировать данные изображений, выполняются такие операции, как прогнозирующее кодирование, преобразование и энтропийное кодирование, и в это время идентичная единица данных может использоваться для всех операций, или различные единицы данных могут использоваться для каждой операции.
Например, устройство 100 кодирования видео может выбирать не только единицу кодирования для кодирования данных изображений, но также и единицу данных, отличающуюся от единицы кодирования, с тем чтобы выполнять прогнозирующее кодирование для данных изображений в единице кодирования.
Чтобы выполнять прогнозирующее кодирование в максимальной единице кодирования, прогнозирующее кодирование может выполняться на основе единицы кодирования, соответствующей кодированной глубине, т.е. на основе единицы кодирования, которая более не разбивается на единицы кодирования, соответствующие нижней глубине. В дальнейшем в этом документе единица кодирования, которая более не разбивается и становится базисной единицей для прогнозирующего кодирования, далее упоминается как "единица прогнозирования". Сегмент, полученный посредством разбиения единицы прогнозирования, может включать в себя единицу данных, полученную посредством разбиения, по меньшей мере, одной из высоты и ширины единицы прогнозирования.
Например, когда единица кодирования в 2N×2N (где N является положительным целым числом) более не разбивается и становится единицей прогнозирования в 2N×2N, размер сегмента может составлять 2N×2N, 2N×N, N×2N или N×N. Примеры типа сегмента включают в себя симметричные сегменты, которые получаются посредством симметричного разбиения высоты или ширины единицы прогнозирования, сегменты, полученные посредством асимметричного разбиения высоты или ширины единицы прогнозирования, к примеру, 1:n или n:1, сегменты, которые получаются посредством геометрического разбиения единицы прогнозирования, и сегменты, имеющие произвольные формы.
Режим прогнозирования единицы прогнозирования может быть, по меньшей мере, одним из внутреннего режима, взаимного режима и режима пропуска. Например, внутренний режим или взаимный режим могут выполняться для сегмента в 2N×2N, 2N×N, N×2N или N×N. Кроме того, режим пропуска может выполняться только для сегмента в 2N×2N. Кодирование независимо выполняется для одной единицы прогнозирования в единице кодирования, тем самым выбирая режим прогнозирования, вызывающий наименьшую ошибку кодирования.
Устройство 100 кодирования видео также может выполнять преобразование для данных изображений в единице кодирования на основе не только для единицы кодирования для кодирования данных изображений, но также и на основе единицы данных, которая отличается от единицы кодирования.
Чтобы выполнять преобразование в единице кодирования, преобразование может выполняться на основе единицы преобразования, имеющей размер, меньший или равный единице кодирования. Например, единица преобразования для преобразования может включать в себя единицу преобразования для внутреннего режима и единицу преобразования для взаимного режима.
Аналогично единице кодирования, имеющей древовидную структуру, единица преобразования в единице кодирования может рекурсивно разбиваться на области меньших размеров. Таким образом, остаточные данные в единице кодирования могут разбиваться согласно преобразованию, имеющему древовидную структуру согласно глубинам преобразования.
Глубина преобразования, указывающая число разбиений, чтобы достигать единицы преобразования посредством разбиения высоты и ширины единицы кодирования, также может задаваться в единице преобразования. Например, в текущей единице кодирования 2N×2N глубина преобразования может быть равна 0, когда размер единицы преобразования также составляет 2N×2N, может быть равна 1, когда размер единицы преобразования тем самым составляет N×N, и может быть равна 2, когда размер единицы преобразования тем самым составляет N/2×N/2. Например, единица преобразования может задаваться согласно иерархической древовидной структуре согласно иерархическим характеристикам глубин преобразования.
Информация кодирования согласно единицам кодирования, соответствующим кодированной глубине, требует не только информацию относительно кодированной глубины, но также и информацию, связанную с прогнозирующим кодированием и преобразованием. Соответственно, модуль 120 определения единиц кодирования не только определяет кодированную глубину, имеющую наименьшую ошибку кодирования, но также и определяет тип сегмента в единице прогнозирования, режим прогнозирования согласно единицам прогнозирования и размер единицы преобразования для преобразования.
Ниже подробно описываются единицы кодирования согласно древовидной структуре в максимальной единице кодирования и способ определения сегмента согласно вариантам осуществления настоящего изобретения со ссылкой на фиг. 3-13.
Модуль 120 определения единиц кодирования может измерять ошибку кодирования более глубоких единиц кодирования согласно глубинам посредством использования оптимизации искажения в зависимости от скорости передачи на основе множителей Лагранжа.
Модуль 130 вывода выводит данные изображений максимальной единицы кодирования, которая кодируется на основе, по меньшей мере, одной кодированной глубины, определенной посредством модуля 120 определения единиц кодирования, информации относительно режима кодирования согласно кодированной глубине и информации структуры единиц кодирования относительно размера и переменной глубины единицы кодирования в потоках битов.
Кодированные данные изображений могут быть получены посредством кодирования остаточных данных изображения.
Информация относительно режима кодирования согласно кодированной глубине может включать в себя информацию относительно кодированной глубины, относительно типа сегмента в единице прогнозирования, режима прогнозирования и размера единицы преобразования.
Информация относительно кодированной глубины может быть задана посредством использования информации разбиения согласно глубинам, которая указывает, выполняется или нет кодирование для единиц кодирования нижней глубины вместо текущей глубины. Если текущая глубина текущей единицы кодирования является кодированной глубиной, данные изображений в текущей единице кодирования кодируется и выводятся, и тем самым информация разбиения может быть задана так, чтобы не разбивать текущую единицу кодирования до нижней глубины. Альтернативно, если текущая глубина текущей единицы кодирования не является кодированной глубиной, кодирование выполняется для единицы кодирования нижней глубины, и тем самым информация разбиения может быть задана так, чтобы разбивать текущую единицу кодирования, чтобы получать единицы кодирования нижней глубины.
Если текущая глубина не является кодированной глубиной, кодирование выполняется для единицы кодирования, которая разбивается на единицу кодирования нижней глубины. Поскольку, по меньшей мере, одна единица кодирования нижней глубины существует в одной единице кодирования текущей глубины, кодирование многократно выполняется для каждой единицы кодирования нижней глубины, и тем самым кодирование может быть рекурсивно выполнено для единиц кодирования, имеющих идентичную глубину.
Поскольку единицы кодирования, имеющие древовидную структуру, определяются для одной максимальной единицы кодирования, и информация, по меньшей мере, относительно одного режима кодирования определяется для единицы кодирования кодированной глубины, информация, по меньшей мере, относительно одного режима кодирования может быть определена для одной максимальной единицы кодирования. Кроме того, кодированная глубина данных изображений максимальной единицы кодирования может отличаться согласно местоположениям, поскольку данные изображений иерархически разбиваются согласно глубинам, и тем самым информация относительно кодированной глубины и режима кодирования может задаваться для данных изображений.
Соответственно, модуль 130 вывода может назначать информацию кодирования относительно соответствующей кодированной глубины и режима кодирования, по меньшей мере, одной из единицы кодирования, единицы прогнозирования и минимальной единицы, включенной в максимальную единицу кодирования. Модуль 130 вывода может вставлять информацию относительно соответствующей кодированной глубины и соответствующего режима кодирования в заголовок потока битов, набор параметров последовательности (SPS) или набор параметров изображения (PPS) и может выводить их.
Минимальная единица согласно варианту осуществления настоящего изобретения является прямоугольной единицей данных, полученной посредством разбиения минимальной единицы кодирования, составляющей самую нижнюю глубину, на 4. Минимальная единица согласно варианту осуществления настоящего изобретения может быть максимальной прямоугольной единицей данных, которая может быть включена во все из единиц кодирования, единиц прогнозирования, единиц сегментирования и единиц преобразования, включенных в максимальную единицу кодирования.
Например, информация кодирования, выводимая через модуль 130 вывода, может классифицироваться на информацию кодирования согласно единицам кодирования и информацию кодирования согласно единицам прогнозирования. Информация кодирования согласно единицам кодирования может включать в себя информацию относительно режима прогнозирования и относительно размера сегментов. Информация кодирования согласно единицам прогнозирования может включать в себя информацию относительно оцененного направления взаимного режима, относительно индекса опорного изображения взаимного режима, относительно вектора движения, относительно компонента сигнала цветности внутреннего режима и относительно способа интерполяции внутреннего режима.
Кроме того, информация структуры единиц кодирования относительно размера и переменной глубины единицы кодирования, заданной согласно последовательностям, изображениям, сериям последовательных макроблоков или GOP, может быть вставлена в SPS, PPS или заголовок потока битов.
Переменная глубина может указывать не только разрешенную максимальную глубину текущих единиц кодирования, имеющих древовидную структуру, но также и может указывать наименьшую глубину единицы кодирования, имеющей минимальный размер, число уровней глубины или варьирование глубины.
Число уровней глубины может указывать число уровней глубины более глубоких единиц кодирования согласно глубинам, которые могут существовать в текущих единицах кодирования, имеющих древовидную структуру.
Варьирование глубины может указывать число варьирований более глубоких единиц кодирования согласно глубинам, которые могут существовать в текущих единицах кодирования, имеющих древовидную структуру. Например, варьирование глубины может указывать число варьирований уровней глубины единицы кодирования, имеющей минимальный размер и единицы кодирования, имеющей максимальный размер, из текущих единиц кодирования, имеющих древовидную структуру, т.е. число варьирований уровней глубины от наименьшей глубины до наибольшей глубины. Альтернативно, варьирование глубины текущих единиц кодирования, имеющих древовидную структуру, может указывать число варьирований уровней глубины единицы кодирования, имеющей максимальный размер, и единицы кодирования, имеющей минимальный размер, из текущих единиц кодирования, имеющих древовидную структуру, т.е. число варьирований уровней глубины от наибольшей глубины до наименьшей глубины.
В дальнейшем в этом документе описывается переменная глубина в отношении случая, в котором максимальный размер и минимальный размер единицы кодирования, которые определяются в текущих единицах кодирования, имеющих древовидную структуру, равны 128×128 и 16×16, соответственно.
Как описано выше, максимальная глубина может указывать общее число разбиений единицы кодирования согласно глубинам от максимальной единицы кодирования до минимальной единицы декодирования. В этом случае, поскольку единица кодирования разбивается 3 раза от 128×128 до 64×64, от 64×64 до 32×32 и от 32×32 до 16×16, максимальная глубина может задаваться равной 3.
В этом случае глубины единиц кодирования 128×128, 64×64, 32×32 и 16×16 равны 0, 1, 2 и 3 соответственно, так что число уровней глубины может составлять 4.
В этом случае варьирование глубины может указывать число варьирований уровней глубины единиц кодирования 128×128, 64×64, 32×32 и 16×16 из текущих единиц кодирования, имеющих древовидную структуру. Иными словами, поскольку глубина единицы кодирования изменяется 3 раза от глубины в 0 до глубин в 1, 2 и 3 или от глубины в 3 до глубин в 2, 1 и 0, варьирование глубины может составлять 3.
Соответственно, когда максимальный размер и минимальный размер единицы кодирования из текущих единиц кодирования, имеющих древовидную структуру, равны 128×128 и 16×16 соответственно, варьирование глубины может указывать одно из 3, т.е. максимальной глубины, разрешенной для текущей единицы кодирования, 3, т.е. наименьшей глубины единицы кодирования, имеющей минимальный размер, 4, т.е. числа уровней глубины, и 3, т.е. варьирования глубины.
Информация относительно переменной глубины может задаваться согласно последовательностям, изображениям, сериям последовательных макроблоков или GOP. Иными словами, информация относительно переменной глубины и информация относительно максимального размера или информация относительно минимального размера единицы кодирования из текущих единиц кодирования, имеющих древовидную структуру, может задаваться для каждой из единиц данных последовательностей, изображений, серий последовательных макроблоков или GOP.
Таким образом, модуль 130 вывода может включать в себя информацию кодирования, включающую в себя, в качестве информации структуры единиц кодирования, по меньшей мере, два элемента из информации относительно переменной глубины, информации относительно максимального размера единицы кодирования и информации относительно минимального размера единицы кодирования, может вставлять информацию кодирования в заголовок потока битов, т.е. SPS или PPS, и затем может выводить поток битов. Переменная глубина, максимальный размер и минимальный размер единицы кодирования определяются согласно последовательностям, изображениям, сериям последовательных макроблоков или GOP соответственно.
Например, информация кодирования может включать в себя комбинацию информации относительно переменной глубины и информации относительно максимального размера единицы кодирования из текущих единиц кодирования, имеющих древовидную структуру.
Например, информация кодирования может включать в себя комбинацию информации относительно переменной глубины и информации относительно минимального размера единицы кодирования из текущих единиц кодирования, имеющих древовидную структуру. Иными словами, информация кодирования может включать в себя информацию относительно минимального размера единицы кодирования из текущих единиц кодирования, имеющих древовидную структуру, и также может включать в себя информацию относительно переменной глубины, которая указывает одно из максимальной глубины, наименьшей глубины единицы кодирования, имеющей минимальный размер, числа уровней глубины и варьирования глубины.
Например, информация кодирования может включать в себя комбинацию информации относительно переменной глубины и информации относительно максимального размера единицы кодирования из текущих единиц кодирования, имеющих древовидную структуру. Иными словами, информация кодирования может включать в себя информацию относительно максимального размера единицы кодирования из текущих единиц кодирования, имеющих древовидную структуру, и также может включать в себя информацию относительно переменной глубины, которая указывает одно из максимальной глубины, наименьшей глубины единицы кодирования, имеющей максимальный размер, числа уровней глубины и варьирования глубины.
Помимо этого, информация кодирования, выводимая из модуля 130 вывода, может указыв