Способ и устройство для кодирования и декодирования изображения, используя внутреннее предсказание
Иллюстрации
Показать всеИзобретение относится к кодированию/декодированию с внутренним предсказанием изображения. Техническим результатом является повышение эффективности сжатия изображения, используя различные направления предсказания. Предложен способ внутреннего предсказания изображения, содержащий: получение опорных выборок, включающих в себя первую угловую выборку, вторую угловую выборку, первую боковую выборку и вторую боковую выборку, причем эти опорные выборки используются для предсказания текущей выборки; и определение значения предсказания текущей выборки на основе первой угловой выборки, второй угловой выборки, первой боковой выборки и второй боковой выборки. Первая угловая выборка расположена на пересечении строки с верхней стороны текущего блока и столбца с правой стороны текущего блока, вторая угловая выборка расположена на пересечении строки с нижней стороны текущего блока и столбца с левой стороны текущего блока, первая боковая выборка расположена на пересечении строки, в которой расположена текущая выборка, и столбца с левой стороны текущего блока, вторая боковая выборка расположена на пересечении строки с верхней стороны текущего блока и столбца, в котором расположена текущая выборка, и текущий блок предсказывают посредством выполнения определения значений предсказания для выборок, включенных в текущий блок. 3 з.п. ф-лы, 23 ил., 5 табл.
Реферат
ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение относится к кодированию и декодированию изображения, и, в частности, к способам и устройствам для кодирования с внутренним предсказанием и декодирования с внутренним предсказанием изображения, при этом эффективность сжатия изображения повышается посредством использования различных направленностей и нового режима внутреннего предсказания.
УРОВЕНЬ ТЕХНИКИ
В способе сжатия изображения, таком как по стандарту Экспертной Группы по вопросам Движущихся Изображений (MPEG)-1, MPEG-2, MPEG-4, или H.264/MPEG-4 Расширенное Кодирование Видео (AVC), картинка делится на макроблоки, чтобы закодировать изображение. Каждый из макроблоков кодируется во всех режимах кодирования, которые могут быть использованы при внешнем предсказании или внутреннем предсказании, и затем кодируется в режиме кодирования, который выбран в соответствии со скоростью передачи битов, используемой для кодирования макроблока, и степенью искажения, декодированного макроблока, основанной на исходном макроблоке.
Поскольку в настоящее время разрабатывается аппаратное обеспечение для воспроизведения и хранения видеоконтента с высоким разрешением или высоким качеством, то существует растущая потребность в видеокодеке, выполненном с возможностью эффективного кодирования или декодирования видеоконтента с высоким разрешением или высокого качества. В обычном видеокодеке видео кодируется в единицах макроблоков, каждый из которых имеет предварительно определенный размер.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
ТЕХНИЧЕСКАЯ ЦЕЛЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение предоставляет способ и устройство для кодирования с внутренним предсказанием и декодирования с внутренним предсказанием изображения, при этом эффективность кодирования повышается в соответствии с характеристикой изображения с помощью нового способа внутреннего предсказания, используя пиксели, соседние для текущей единицы предсказания.
СРЕДСТВА ДЛЯ ДОСТИЖЕНИЯ ТЕХНИЧЕСКОЙ ЦЕЛИ
Настоящее изобретение также предоставляет новый режим внутреннего предсказания, используя пиксели, соседние для текущей единицы предсказания.
ЭФФЕКТ ИЗОБРЕТЕНИЯ
В соответствии с одним или более вариантами осуществления настоящего изобретения эффективность кодирования изображения может быть повышена посредством применения оптимального способа внутреннего предсказания в соответствии с характеристиками изображения с помощью различных способов внутреннего предсказания, используя соседние пиксели.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг. 1 является структурной схемой устройства для кодирования видео, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 2 является структурной схемой устройства для декодирования видео, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 3 является схемой для описания концепции единиц кодирования в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 4 является структурной схемой кодера изображения, основанного на единицах кодирования, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 5 является структурной схемой декодера изображения, основанного на единицах кодирования, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 6 является схемой, иллюстрирующей более глубокие единицы кодирования в соответствии с глубинами и разделы в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 7 является схемой для описания зависимости между единицей кодирования и единицами преобразования, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 8 является схемой для описания информации кодирования единиц кодирования, соответствующей кодированной глубине, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 9 является схемой более глубоких единиц кодирования в соответствии с глубинами, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. с 10 по 12 являются схемами для описания зависимости между единицами кодирования, единицами предсказания, и единицами преобразования, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 13 является схемой для описания зависимости между единицей кодирования, единицей предсказания или разделом, и единицей преобразования, в соответствии с информацией о режиме кодирования Таблицы 1;
Фиг. 14 является таблицей, показывающей количество режимов внутреннего предсказания в соответствии с размером единицы предсказания, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 15 является ссылочной схемой для описания режимов внутреннего предсказания с различными направленностями, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 16 является схемой для описания зависимости между текущим пикселем и соседними пикселями, расположенными на линии продолжения с направленностью (dx, dy), в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 17 и 18 являются схемами, показывающими направления режима внутреннего предсказания, в соответствии с вариантами осуществления настоящего изобретения;
Фиг. 19 является схемой, показывающей направления режима внутреннего предсказания с 33 направленностями, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 20A и 20B являются схемами для описания планарного режима в соответствии с вариантами осуществления настоящего изобретения;
Фиг. 21 является схемой, показывающей соседние пиксели, которые отфильтрованы вокруг текущей единицы предсказания, в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 22 является ссылочной схемой для описания процесса фильтрации соседнего пикселя; и
Фиг. 23 является блок-схемой, иллюстрирующей режим внутреннего предсказания в соответствии с планарным режимом, в соответствии с вариантом осуществления настоящего изобретения.
ПРЕДПОЧТИТЕЛЬНЫЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
В соответствии с аспектом настоящего изобретения предоставляется способ внутреннего предсказания изображения, при этом способ содержит этапы, на которых: получают первый виртуальный пиксель, расположенный в той же строке, что и текущий предсказываемый пиксель текущей единицы предсказания, при этом соответствующий пикселю, расположенному крайним справа в текущей единице предсказания, посредством использования по меньшей мере одного соседнего пикселя, расположенного выше справа по отношению к текущей единице предсказания; получают второй виртуальный пиксель, расположенный в том же столбце, что и текущий предсказываемый пиксель, при этом соответствующий пикселю, расположенному крайним снизу в текущей единице предсказания, посредством использования по меньшей мере одного соседнего пикселя, расположенного ниже слева по отношению к текущей единице предсказания; получают первое значение предсказания текущего предсказываемого пикселя с помощью линейной интерполяции, используя первый виртуальный пиксель и соседний левый пиксель в той же строке, что и текущий предсказываемый пиксель; получают второе значение предсказания текущего предсказываемого пикселя с помощью линейной интерполяции, используя второй виртуальный пиксель и соседний верхний пиксель в том же столбце, что и текущий предсказываемый пиксель; и получают значение предсказания текущего предсказываемого пикселя посредством использования первого и второго значений предсказания.
В соответствии с другим аспектом настоящего изобретения предоставляется устройство для внутреннего предсказания изображения, при этом устройство содержит: блок внутреннего предсказания для получения первого виртуального пикселя, расположенного в той же строке, что и текущий предсказываемый пиксель текущей единицы предсказания, при этом соответствующего пикселю, расположенному крайним справа в текущей единице предсказания, посредством использования по меньшей мере одного соседнего пикселя, расположенного выше справа по отношению к текущей единице предсказания, получения второго виртуального пикселя, расположенного в том же столбце, что и текущий предсказываемый пиксель, при этом соответствующего пикселю, расположенному крайним снизу в текущей единице предсказания, посредством использования по меньшей мере одного соседнего пикселя, расположенного ниже слева по отношению к текущей единице предсказания, получения первого значения предсказания текущего предсказываемого пикселя с помощью линейной интерполяции, используя первый виртуальный пиксель и соседний левый пиксель в той же строке, что и текущий предсказываемый пиксель, получения второго значения предсказания текущего предсказываемого пикселя с помощью линейной интерполяции, используя второй виртуальный пиксель и соседний верхний пиксель в том же столбце, что и текущий предсказываемый пиксель, и получения значения предсказания текущего предсказываемого пикселя посредством использования первого и второго значений предсказания.
ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Ниже настоящее изобретение описано более полно со ссылками на сопроводительные чертежи, на которых показаны примерные варианты осуществления изобретения.
Фиг. 1 является структурной схемой устройства 100 кодирования видео, в соответствии с вариантом осуществления настоящего изобретения.
Устройство 100 кодирования видео включает в себя блок 110 разбиения на максимальную единицу кодирования, блок 120 определения единицы кодирования, и блок 130 вывода.
Блок 110 разбиения на максимальную единицу кодирования может разбивать текущую картинку на основании максимальной единицы кодирования для текущей картинки изображения. Если текущая картинка больше максимальной единицы кодирования, то данные изображения текущей картинки могут быть разбиты, по меньшей мере, на одну максимальную единицу кодирования. Максимальной единицей кодирования в соответствии с вариантом осуществления настоящего изобретения может быть единица данных с размером 32x32, 64x64, 128x128, 256x256, и т.д., при этом формой единицы данных является квадрат с шириной и длиной в квадратах числа 2. Данные изображения могут быть выведены к блоку 120 определения единицы кодирования в соответствии с по меньшей мере одной максимальной единицей кодирования.
Единица кодирования в соответствии с вариантом осуществления настоящего изобретения может быть охарактеризована максимальным размером и глубиной. Глубина обозначает количество раз, которое единица кодирования пространственно разбивается из максимальной единицы кодирования, и по мере того как глубина становится глубже, более глубокие единицы кодирования в соответствии с глубинами могут быть получены путем разбиения максимальной единицы кодирования до минимальной единицы кодирования. Глубина максимальной единицы кодирования является наивысшей глубиной, а глубина минимальной единицы кодирования является наинизшей глубиной. Поскольку размер единицы кодирования, соответствующей каждой глубине, уменьшается по мере того, как становится глубже глубина максимальной единицы кодирования, то единица кодирования, соответствующая расположенной выше глубине, может включать в себя множество единиц кодирования, соответствующих более низким глубинам.
Как описано выше, данные изображения текущей картинки разбиваются на максимальные единицы кодирования в соответствии с максимальным размером единицы кодирования, и каждая из максимальных единиц кодирования может включать в себя более глубокие единицы кодирования, которые разбиты в соответствии с глубинами. Поскольку максимальная единица кодирования в соответствии с вариантом осуществления настоящего изобретения разбивается в соответствии с глубинами, то данные изображения пространственной области, включенные в максимальную единицу кодирования, могут быть иерархически классифицированы в соответствии с глубинами.
Максимальная глубина и максимальный размер единицы кодирования, которые ограничивают общее количество раз, которое высота и ширина максимальной единицы кодирования иерархически разбиваются, могут быть предварительно определенными.
Блок 120 определения единицы кодирования кодирует по меньшей мере одну разбитую область, полученную посредством разбиения области максимальной единицы кодирования в соответствии с глубинами, и определяет глубину для вывода итоговых закодированных данных изображения в соответствии с по меньшей мере одной разбитой областью. Другими словами, блок 120 единицы кодирования определяет кодированную глубину посредством кодирования данных изображения в более глубоких единицах кодирования в соответствии с глубинами, в соответствии с максимальной единицей кодирования текущей картинки, и выбирая глубину с наименьшей ошибкой кодирования. Определенная кодированная глубина и закодированные данные изображения в соответствии с определенной кодированной глубиной выводятся блоку 130 вывода.
Данные изображения в максимальной единице кодирования кодируются на основании более глубоких единиц кодирования, соответствующих по меньшей мере одной глубине равной или ниже максимальной глубины, и результаты кодирования данных изображения сравниваются на основании каждой из более глубоких единиц кодирования. Глубина с наименьшей ошибкой кодирования может быть выбрана после сравнения ошибок кодирования более глубоких единиц кодирования. По меньшей мере, одна кодированная глубина может быть выбрана для каждой максимальной единицы кодирования.
Размер максимальной единицы кодирования разбивается по мере того как единица кодирования иерархически разбивается в соответствии с глубинами, и по мере того как увеличивается количество единиц кодирования. Также даже если единицы кодирования соответствуют одной и той же глубине в одной максимальной единице кодирования, то определяется, разбить ли каждую из единиц кодирования, соответствующих одной и той же глубине, на более низкую глубину, посредством измерения ошибки кодирования данных изображения каждой единицы кодирования, отдельно. Соответственно, даже когда данные изображения включены в одну максимальную единицу кодирования, ошибки кодирования могут отличаться в соответствии с областями в одной максимальной единице кодирования, и, следовательно, кодированные глубины могут отличаться в соответствии с областями в данных изображения. Следовательно, одна или более кодированные глубины могут быть определены в одной максимальной единице кодирования, и данные изображения максимальной единицы кодирования могут быть разделены в соответствии с единицами кодирования по меньшей мере одной кодированной глубины.
Соответственно, блок 120 определения единицы кодирования может определять единицы кодирования с древовидной структурой, включенные в максимальную единицу кодирования. «Единицы кодирования с древовидной структурой» в соответствии с вариантом осуществления настоящего изобретения включают в себя единицы кодирования, соответствующие глубине, которая определена в качестве кодированной глубины, из числа всех более глубоких единиц кодирования, включенных в максимальную единицу кодирования. Единица кодирования кодированной глубины может быть иерархически определена в соответствии с глубинами в одной и той же области максимальной единицы кодирования, и может быть независимо определена в разных областях. Подобным образом и кодированная глубина в текущей области может быть независимо определена от кодированной глубины в другой области.
Максимальная глубина в соответствии с вариантом осуществления настоящего изобретения является индексом, который относится к количеству раз разбиения от максимальной единицы кодирования до минимальной единицы кодирования. Первая максимальная глубина в соответствии с вариантом осуществления настоящего изобретения может обозначать суммарное количество раз разбиения от максимальной единицы кодирования до минимальной единицы кодирования. Вторая максимальная глубина в соответствии с вариантом осуществления настоящего изобретения может обозначать суммарное количество уровней глубины от максимальной единицы кодирования до минимальной единицы кодирования. Например, когда глубина максимальной единицы кодирования равна 0, то глубина единицы кодирования, при которой максимальная единица кодирования разбивается один раз, может быть установлена равной 1, а глубина единицы кодирования, при которой максимальная единица кодирования разбивается дважды, может быть установлена равной 2. Здесь, если минимальной единицей кодирования является единица кодирования, при которой максимальная единица кодирования разбивается четыре раза, то существует 5 уровней глубины с глубинами 0, 1, 2, 3 и 4, и, следовательно, первая максимальная глубина может быть установлена равной 4, а вторая максимальная глубина может быть установлена равной 5.
Кодирование с предсказанием и преобразование могут быть выполнены в соответствии с максимальной единицей кодирования. Кодирование с предсказанием и преобразование также выполняются на основании более глубоких единиц кодирования в соответствии с глубиной равной или глубинами меньше, чем максимальная глубина, в соответствии с максимальной единицей кодирования.
Поскольку количество более глубоких единиц кодирования растет всякий раз, когда максимальная единица кодирования разбивается в соответствии с глубинами, то кодирование, включающее в себя кодирование с предсказанием и преобразование, выполняется над всеми из более глубоких единиц кодирования, формируемых по мере того как глубина становится глубже. Для удобства описания, кодирование с предсказанием и преобразование теперь будут описаны на основании единицы кодирования текущей глубины, в максимальной единице кодирования.
Устройство 100 кодирования видео может по-разному выбирать размер и форму единицы данных для кодирования данных изображения. Для того чтобы закодировать данные изображения, выполняются операции, такие как кодирование с предсказанием, преобразование и энтропийное кодирование, и в данном случае одинаковая единица данных может быть использована для всех операций или для каждой операции могут использоваться разные единицы данных.
Например, устройство 100 кодирования видео может выбирать не только единицу кодирования для кодирования данных изображения, но также и единицу данных, отличную от единицы кодирования с тем, чтобы выполнить кодирование с предсказанием над данными изображения в единице кодирования.
Для того чтобы выполнить кодирование с предсказанием в максимальной единице кодирования, кодирование с предсказанием может быть выполнено на основании единицы кодирования, соответствующей кодированной глубине, т.е. на основании единицы кодирования, которая более не разбивается на единицы кодирования, соответствующие более низкой глубине. Ниже единица кодирования, которая более не разбивается и становится базовой единицей для кодирования с предсказанием, теперь будет именоваться как «единица предсказания». Раздел, полученный посредством разбиения единицы предсказания, может включать в себя единицу предсказания или единицу данных, полученную посредством разбиения по меньшей мере одного из: высоты или ширины единицы предсказания.
Например, когда единица кодирования размера 2Nx2N (где N положительное целое число) более не разбивается и становится единицей предсказания размера 2Nx2N, то размер раздела может быть 2Nx2N, 2NxN, Nx2N, или NxN. Примеры типа раздела включают в себя: симметричные разделы, которые получены посредством симметричного разбиения высоты или ширины единицы предсказания; разделы, которые получены ассиметричным разбиением высоты или ширины единицы предсказания, как например 1:n или n:1; разделы, которые получены посредством геометрического разбиения единицы предсказания; и разделы, произвольных форм.
Режим предсказания единицы предсказания может быть по меньшей мере одним из режимов: внутрикадровым режимом, межкадровым режимом, и режимом пропуска. Например, внутрикадровый режим или межкадровый режим могут быть выполнены над разделом 2Nx2N, 2NxN, Nx2N, или NxN. Также режим пропуска может быть выполнен только над разделом 2Nx2N. Кодирование независимо выполняется над одной единицей предсказания в единице кодирования, тем самым выбирая режим предсказания с наименьшей ошибкой кодирования.
Устройство 100 кодирования видео также может выполнять преобразование над данными изображения в единице кодирования, основанное не только на единице кодирования для кодирования данных изображения, но также основанное на единице данных, которая отличается от единицы кодирования.
Для того чтобы выполнить преобразование в единице кодирования, преобразование может быть выполнено на основании единицы данных с размером меньше либо равным размеру единицы кодирования. Например, единица данных для преобразования может включать в себя единицу данных для внутрикадрового режима и единицу данных для межкадрового режима.
Единица данных, используемая в качестве базы преобразования, теперь будет именоваться как «единица преобразования». Подобно единице кодирования, единица преобразования в единице кодирования может быть рекурсивно разбита на области меньшего размера таким образом, что единица преобразования может быть определена независимо в единицах областей. Следовательно, остаточные данные в единице кодирования могут быть разделены в соответствии с единицей преобразования с древовидной структурой в соответствии с глубинами преобразования.
Глубина преобразования, указывающая количество раз разбиения для достижения единицы преобразования путем разбиения высоты и ширины единицы кодирования также может быть установлена в единице преобразования. Например, в текущей единице кодирования размером 2Nx2N глубина преобразования может быть равна 0, когда размер единицы преобразования составляет 2Nx2N, может быть равна 1, когда размер единицы преобразования, таким образом, составляет NxN, и может быть равна 2, когда размер единицы преобразования, таким образом, составляет N/2xN/2. Другими словами, единица преобразования с древовидной структурой может быть установлена в соответствии с глубинами преобразования.
Для информации кодирования в соответствии с единицами кодирования, соответствующими кодированной глубине, требуется не только информация о кодированной глубине, но также информация, связанная с кодированием с предсказанием и преобразованием. Соответственно, блок 120 определения единицы кодирования определяет не только кодированную глубину с наименьшей ошибкой кодирования, но также определяет тип раздела в единице предсказания, режим предсказания в соответствии с единицами предсказания, и размер единицы преобразования для преобразования.
Единицы кодирования в соответствии с древовидной структурой в максимальной единице кодирования и способ определения раздела в соответствии с вариантами осуществления настоящего изобретения подробно описаны ниже со ссылкой на Фиг. с 3 по 12.
Блок 120 определения единицы кодирования может измерять ошибку кодирования более глубоких единиц кодирования в соответствии с глубинами посредством использования Оптимизации Скорость-Искажение, основанной на множителях Лагранжа.
Блок 130 вывода выводит данные изображения максимальной единицы кодирования, которые закодированы на основании по меньшей мере одной кодированной глубины, которая определена блоком 120 определения единицы кодирования, и информацию о режиме кодирования в соответствии с кодированной глубиной, в битовый поток.
Закодированные данные изображения могут быть получены посредством кодирования остаточных данных изображения.
Информация о режиме кодирования в соответствии с кодированной глубиной может включать в себя информацию о кодированной глубине, о типе раздела в единице предсказания, режим предсказания, и размер единицы преобразования.
Информация о кодированной глубине может быть определена посредством использования информации разбиения в соответствии с глубинами, которая указывает на то, выполняется ли кодирование над единицами кодирования более низкой глубины вместо текущей глубины. Если текущая глубина текущей единицы кодирования является кодированной глубиной, то данные изображения в текущей единице кодирования кодируются и выводятся, и, следовательно, информация разбиения может быть определена как указывающая на то, чтобы не разбивать текущую единицу кодирования на более низкую глубину. В качестве альтернативы, если текущая глубина текущей единицы кодирования не является кодированной глубиной, то кодирование выполняется над единицей кодирования более низкой глубины, и, следовательно, информация разбиения может быть определена как указывающая на то, чтобы разбивать текущую единицу кодирования, чтобы получить единицы кодирования более низкой глубины.
Если текущая глубина не является кодированной глубиной, то кодирование выполняется над единицей кодирования, которая разбита на единицу кодирования более низкой глубины. Поскольку существует по меньшей мере одна единица кодирования более низкой глубины в одной единице кодирования текущей глубины, то кодирование повторно выполняется над каждой единицей кодирования более низкой глубины, и, следовательно, кодирование может быть рекурсивно выполнено для единиц кодирования с той же глубиной.
Поскольку единицы кодирования с древовидной структурой определены для одной максимальной единицы кодирования, и информация, по меньшей мере, об одном режиме кодирования определяется для единицы кодирования кодированной глубины, то информация, по меньшей мере, об одном режиме кодирования может быть определена для одной максимальной единицы кодирования. Также кодированная глубина данных изображения максимальной единицы кодирования может быть разной в соответствии с местоположениями, поскольку данные изображения иерархически разбиты в соответствии с глубинами, и, следовательно, информация о кодированной глубине и режиме кодирования может быть установлена для данных изображения.
Соответственно, блок 130 вывода может назначить информацию кодирования о соответствующей кодированной глубине и режиме кодирования, по меньшей мере, для одной из единиц: единицы кодирования, единицы предсказания, и минимальной единицы, включенной в максимальную единицу кодирования.
Минимальная единица в соответствии с вариантом осуществления настоящего изобретения является квадратной единицей данных, полученной посредством разбиения минимальной единицы кодирования, составляющую наинизшую глубину, на 4. В качестве альтернативы, минимальная единица может быть максимальной квадратной единицей данных, которая может быть включена во все из единиц кодирования, единиц предсказания, единицы раздела, и единицы преобразования, включенные в максимальную единицу кодирования.
Например, информация кодирования, выводимая посредством блока 130 вывода, может быть классифицирована на информацию кодирования в соответствии с единицами кодирования, и информацию кодирования в соответствии с единицами предсказания. Информация кодирования в соответствии с единицами кодирования может включать в себя информацию о режиме предсказания и о размере разделов. Информация кодирования в соответствии с единицами предсказания может включать в себя информацию об оцененном направлении межкадрового режима, об индексе опорного изображения межкадрового режима, о векторе движения, о составляющей цветности внутрикадрового режима, и о способе интерполяции внутрикадрового режима. Также информация о максимальном размере единицы кодирования, которая определена в соответствии с картинками, последовательностями макроблоков, или GOP, и информация о максимальной глубине может быть вставлена в заголовок битового потока.
В устройстве 100 кодирования видео, более глубокой единицей кодирования может быть единица кодирования, полученная посредством разделения высоты или ширины единицы кодирования более высокой глубины, которая выше на один уровень, на два. Другими словами, когда размер единицы кодирования текущей глубины составляет 2Nx2N, то размер единицы кодирования более низкой глубины составляет NxN. Также единица кодирования текущей глубины с размером 2Nx2N может включать в себя максимум 4 единицы кодирования более низкой глубины.
Соответственно, устройство 100 кодирования видео может образовывать единицы кодирования с древовидной структурой посредством определения единиц кодирования с оптимальной формой и оптимальным размером для каждой максимальной единицы кодирования, основанные на размере максимальной единицы кодирования и максимальной глубине, которая определяется, учитывая характеристики текущей картинки. Также, поскольку кодирование может быть выполнено над каждой максимальной единицей кодирования посредством использования любого из разнообразных режимов предсказания и преобразования, то оптимальный режим кодирования может быть определен, учитывая характеристики единицы кодирования различных размеров изображения.
Таким образом, если изображение с высоким разрешением или большим объемом данных кодируется в обычном макроблоке, то количество макроблоков на картинку чрезмерно увеличивается. Соответственно, количество частей сжатой информации, формируемой для каждого макроблока, увеличивается, и, следовательно, сложно передать сжатую информацию и падает эффективность сжатия данных. Тем не менее, посредством использования устройства 100 кодирования видео, эффективность сжатия изображения может быть увеличена, поскольку единица кодирования регулируется с учетом характеристик изображения, при этом увеличивая максимальный размер единицы кодирования с учетом размера изображения.
Фиг. 2 является структурной схемой устройства 200 декодирования видео, в соответствии с вариантом осуществления настоящего изобретения.
Устройство 200 декодирования видео включает в себя приемник 210, блок 220 извлечения данных изображения и информации кодирования, и декодер 230 данных изображения. Определения различных понятий, таких как единица кодирования, глубина, единица предсказания, единица преобразования, и информация о различных режимах кодирования, применительно к различным операциям устройства 200 декодирования видео, идентичны тем, что описаны со ссылкой на Фиг. 1 и устройство 100 кодирования видео.
Приемник 210 принимает и анализирует битовый поток закодированного видео. Блок 220 извлечения данных изображения и информации кодирования извлекает закодированные данные изображения для каждой единицы кодирования из анализируемого битового потока, при этом единицы кодирования имеют древовидную структуру в соответствии с каждой максимальной единицей кодирования, и выводит извлеченные данные изображения декодеру 230 данных изображения. Блок 220 извлечения данных изображения и информации кодирования может извлекать информацию о максимальном размере единицы кодирования текущей картинки, из заголовка о текущей картинке.
Также блок 220 извлечения данных изображения и информации кодирования извлекает информацию о кодированной глубине и режиме кодирования для единиц кодирования с древовидной структурой в соответствии с каждой максимальной единицей кодирования, из анализируемого битового потока. Извлеченная информация о кодированной глубине и режим кодирования выводятся декодеру 230 данных изображения. Другими словами, данные изображения в битовом потоке разбиты на максимальную единицу кодирования таким образом, что декодер 230 данных изображения декодирует данные изображения для каждой максимальной единицы кодирования.
Информация о кодированной глубине и режиме кодирования в соответствии с максимальной единицей кодирования может быть установлена для информации о по меньшей мере одной единице кодирования, соответствующей кодированной глубине, а информация о режиме кодирования может включать в себя информацию о типе раздела соответствующей единицы кодирования, соответствующей кодированной глубине, о режиме предсказания, и размер единицы преобразования. Также информация разбиения в соответствии с глубинами может быть извлечена в качестве информации о кодированной глубине.
Информация о кодированной глубине и режим кодирования в соответствии с каждой максимальной единицей кодирования, извлеченная блоком 220 извлечения данных изображения и информации кодирования, является информацией о кодированной глубине и режиме кодирования, которые определены для формирования минимальной ошибки кодирования, когда кодер, такой как устройство 100 кодирования видео, неоднократно выполняет кодирование для каждой более глубокой единицы кодирования в соответствии с глубинами в соответствии с каждой максимальной единицей кодирования. Соответственно, устройство 200 декодирования видео может восстановить изображение посредством декодирования данных изображения в соответствии с кодированной глубиной и режимом кодирования, которые формируют минимальную ошибку кодирования.
Поскольку информация кодирования о кодированной глубине и режиме кодирования может быть назначена предварительно определенной единице данных из числа соответствующей единицы кодирования, единицы предсказания, и минимальной единицы, то блок 220 извлечения данных изображения и информации кодирования может извлекать информацию о кодированной глубине и режиме кодирования в соответствии с предварительно определенными единицами данных. Если информация о кодированной глубине и режиме кодирования соответствующей максимальной единицы кодирования записана в соответствии с предварительно определенными единицами данных, то можно сделать вывод о том, что предварительно определенные единицы данных, которым назначена одинаковая информация о кодированной глубине и режиме кодирования, являются единицами данных, включенными в одну и ту же максимальную единицу кодирования.
Декодер 230 данных изображения восстанавливает текущую картинку посредством декодирования данных изображения в каждой максимальной единице кодирования на основании информации о кодированной глубине и режиме кодирования в соответствии с максимальными единицами кодирования. Другими словами, декодер 230 данных изображения может декодировать закодированные данные изображения на основании извлеченной информации о типе раздела, режиме предсказания, и единице преобразования для каждой единицы кодирования из числа единиц кодирования с древовидной структурой, включенных в каждую максимальную единицу кодирования. Процесс декодирования может включать в себя предсказание, включающее в себя внутреннее предсказание и компенсацию движения, и обратное преобразование.
Декодер 230 данных изображения может выполнять внутреннее предсказание или компенсацию движения в соответствии с разделом и режимом предсказания каждой единицы кодирования, на основании информации о типе раздела и режиме предсказания единицы предсказания единицы кодирования в соответствии с кодированными глубинами.
Также декодер 230 данных изображения может выполнять обратное преобразование над каждой единицей преобразования в единице кодирования, на основании информации о размере единицы преобразования единицы кодирования в соответствии с кодированными глубинами, так, чтобы выполнять обратное преобразование в соответствии с максимальными единицами кодирования.
Декодер 230 данных изображения может определять по меньшей мере одну кодированную глубину текущей максимальной единицы кодирования посредством использования информации разбиения в соответствии с глубинами. Если информация разбиения указывает на то, что данные изображения более не разбиваются при текущей глубине, то текущая глубина является кодированной глубиной. Соответственно, декодер 230 данных изображения может декодировать закодированные данные по меньшей мере одной единицы кодирования, соответствующей каждой кодированной глубине в текущей максимальной единице кодирования