Способ и устройство для внутреннего предсказания видео

Иллюстрации

Показать все

Изобретение относится к видеокодированию, в частности, к внутреннему предсказанию видео. Техническим результатом является снижение сложности процесса определения опорного пикселя для внутреннего предсказания. Предложен способ декодирования видео, содержащий этапы, на которых: определяют, является ли предварительно определенное количество смежных пикселей, смежных с текущим блоком, недоступным для внутреннего предсказания текущего блока; когда первый смежный пиксель из числа предварительно определенного количества смежных пикселей недоступен, выполняют поиск второго смежного пикселя из числа предварительно определенного количества смежных пикселей в предварительно определенном направлении от самого нижнего смежного пикселя слева до самого верхнего смежного пикселя слева для смежных пикселей слева и от самого верхнего смежного пикселя слева до самого верхнего смежного пикселя справа для смежных пикселей сверху; назначают пиксельное значение второго смежного пикселя пиксельному значению самого нижнего смежного пикселя слева; замещают недоступный пиксель, расположенный у левой части текущего блока, последовательно пиксельным значением более низкого смежного пикселя, расположенного непосредственно под недоступным пикселем; замещают недоступный пиксель, расположенный у верхней части текущего блока, последовательно пиксельным значением смежного пикселя слева, расположенного непосредственно слева от недоступного пикселя; и выполняют внутреннее предсказание в отношении текущего блока посредством использования предварительно определенного количества смежных пикселей, при этом первый смежный пиксель расположен в самом низу слева от текущего блока, при этом, когда размером текущего блока является nTxnT, где nT - целое число, предопределенным количеством является 4nT+1. 5 табл., 32 ил.

Реферат

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к способу внутреннего предсказания видео, и, более конкретно, к способу и устройству внутреннего предсказания видео, которое предполагает замену смежного пиксела, недоступного в ограниченном режиме внутреннего предсказания, в котором ограничивается использование смежного пиксела, и использование замененного смежного пиксела в качестве опорного пиксела.

УРОВЕНЬ ТЕХНИКИ

В способе сжатия изображения, таком, как стандарт Экспертной Группы по Вопросам Движущегося Изображения (MPEG)-1, MPEG-2, MPEG-4, или H.264/MPEG-4 Усовершенствованного Кодирования Видеосигналов (AVC), видеокадр делится на макроблоки для выполнения кодирования изображения. Каждый из макроблоков кодируется с использованием всех режимов кодирования, которые могут быть использованы во внешнем (интер-) предсказании или внутреннем (интра-) предсказании, а затем кодируется с использованием режима кодирования, который выбирается в соответствии со скоростью передачи данных, используемой для кодирования макроблока, и степенью искажения между декодированным макроблоком и исходным макроблоком.

По мере разработки и внедрения аппаратных средств для воспроизведения и сохранения видеоконтента высокого разрешения или высокого качества, возникает возрастающая потребность в кодеке видео, способном к эффективному выполнению кодирования или декодирования видеоконтента высокого разрешения или высокого качества. В обычном кодеке видео, видео кодируется в единицах макроблоков, каждая из которых имеет предварительно определенные размеры.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

ТЕХНИЧЕСКАЯ ПРОБЛЕМА

Настоящее изобретение обеспечивает способ замены смежного пиксела, недоступного в ограниченном режиме внутреннего предсказания, в котором ограничивается использование смежного пиксела, используемого во внутреннем предсказании.

ТЕХНИЧЕСКОЕ РЕШЕНИЕ

Способ внутреннего предсказания видео определяет доступность предварительно определенного количества смежных пикселов, используемых для внутреннего предсказания, если существует недоступный первый смежный пиксел, выполняет поиск второго смежного пиксела, который доступен посредством выполнения поиска в предварительно определенном количестве смежных пикселов в предварительно определенном направлении на основе первого смежного пиксела, и заменяет пиксельное значение первого смежного пиксела на пиксельное значение найденного второго смежного пиксела. Для недоступного третьего смежного пиксела, процесс замены выполняется посредством использования смежного пиксела в предварительно определенном направлении.

БЛАГОПРИЯТНЫЕ ЭФФЕКТЫ

Согласно одному или более вариантам осуществления настоящего изобретения, сложность процесса определения опорного пиксела, используемого для внутреннего предсказания, может быть уменьшена посредством выполнения поиска и замены доступного смежного пиксела, на основе предварительно определенного направления поиска, недоступным смежным пикселом.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг. 1 изображает блок-схему устройства видеокодирования согласно варианту осуществления настоящего изобретения;

Фиг. 2 изображает блок-схему устройства видеодекодирования согласно варианту осуществления настоящего изобретения;

Фиг. 3 представляет собой схему для описания понятия единиц кодирования согласно варианту осуществления настоящего изобретения;

Фиг. 4 изображает блок-схему кодера изображения, основанного на единицах кодирования согласно варианту осуществления настоящего изобретения;

Фиг. 5 изображает блок-схему декодера изображения, основанного на единицах кодирования согласно варианту осуществления настоящего изобретения;

Фиг. 6 представляет собой схему, иллюстрирующую более глубокие единицы кодирования в соответствии с глубинами и разделы согласно варианту осуществления настоящего изобретения;

Фиг. 7 представляет собой схему для описания взаимосвязи между единицей кодирования и единицами преобразования, согласно варианту осуществления настоящего изобретения;

Фиг. 8 представляет собой схему для описания информации кодирования единиц кодирования, соответствующих кодируемой глубине согласно варианту осуществления настоящего изобретения;

Фиг. 9 представляет собой схему более глубоких единиц кодирования, соответствующих глубинам, согласно варианту осуществления настоящего изобретения;

Фиг. 10-12 представляют собой схемы для описания взаимосвязи между единицами кодирования, единицами предсказания и единицами преобразования согласно варианту осуществления настоящего изобретения;

Фиг. 13 представляет собой схему для описания взаимосвязи между единицей кодирования, единицей предсказания или разделом, и единицей преобразования, в соответствии с информацией режима кодирования из Таблицы 1;

Фиг. 14 изображает таблицу, иллюстрирующую некоторое количество режимов внутреннего предсказания в соответствии с размером единицы предсказания, согласно варианту осуществления настоящего изобретения;

Фиг. 15 иллюстрирует справочное схематическое изображение для описания режимов внутреннего предсказания, имеющих различные направленности, согласно варианту осуществления настоящего изобретения;

Фиг. 16 представляет собой схему для описания взаимосвязи между текущим пикселом и смежными пикселами, расположенными на выносной линии, имеющей направленность (dx, dy), согласно варианту осуществления настоящего изобретения;

Фиг. 17 и 18 представляют собой схемы, изображающие направления режима внутреннего предсказания, согласно вариантам осуществления настоящего изобретения;

Фиг. 19 представляет собой схему, представляющую направления режима внутреннего предсказания, имеющего 33 направленности, согласно варианту осуществления настоящего изобретения;

Фиг. 20 представляет собой схему смежного пиксела, который недоступен в процессе внутреннего предсказания текущего блока в соответствии с типом смежного блока, согласно варианту осуществления настоящего изобретения;

Фиг. 21 представляет собой схему для описания процесса замены недоступного смежного пиксела согласно варианту осуществления настоящего изобретения;

Фиг. 22 представляет собой схему для описания процесса замены недоступного смежного пиксела согласно другому варианту осуществления настоящего изобретения;

Фиг. 23 представляет собой схему для описания процесса замены недоступного смежного пиксела согласно другому варианту осуществления настоящего изобретения;

Фиг. 24 изображает блок-схему устройства внутреннего предсказания согласно варианту осуществления настоящего изобретения;

Фиг. 25A представляет собой схему подвергнутого фильтрации смежного пиксела текущего блока;

Фиг. 25B иллюстрирует справочное схематическое изображение для описания процесса фильтрации смежного пиксела текущего блока;

Фиг. 26 изображает схему последовательности операций, иллюстрирующую способ внутреннего предсказания видео согласно варианту осуществления настоящего изобретения;

Фиг. 27A иллюстрирует физическую структуру диска, на котором сохранена программа согласно варианту осуществления настоящего изобретения;

Фиг. 27B иллюстрирует дисковод, который выполняет запись и считывание программы посредством использования диска;

Фиг. 28 иллюстрирует всю структуру системы доставки контента, которая обеспечивает службу распространения контента;

Фиг. 29 и 30 иллюстрируют внешнюю и внутреннюю конструкции мобильного телефона, к которым применяются способ кодирования видео и способ декодирования видео согласно варианту осуществления настоящего изобретения;

Фиг. 31 иллюстрирует систему цифрового вещания, в которой используется система связи согласно варианту осуществления настоящего изобретения; и

Фиг. 32 иллюстрирует сетевую структуру системы облачных вычислений, использующей устройство кодирования видео и устройство декодирования видео согласно варианту осуществления настоящего изобретения.

ЛУЧШИЕ ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

В соответствии с аспектом настоящего изобретения, обеспечен способ внутреннего предсказания видео, способ содержит этапы, на которых: определяют доступность предварительно определенного количества смежных пикселов, используемых для внутреннего предсказания текущего блока из числа блоков, полученных посредством разбиения видеокадра, формирующего видео, согласно иерархической структуре; если первый смежный пиксел недоступен в предварительно определенном количестве смежных пикселов, то выполняют поиск второго смежного пиксела, который доступен посредством выполнения поиска в предварительно определенном количестве смежных пикселов в предварительно определенном направлении на основе первого смежного пиксела; заменяют пиксельное значение первого смежного пиксела пиксельным значением найденного второго смежного пиксела; и выполняют внутреннее предсказание в отношении текущего блока посредством использования предварительно определенного количества смежных пикселов, содержащих замененный первый смежный пиксел.

Определение доступности содержит этапы, на которых определяют смежные пикселы, которые включены в состав смежного блока, который является внешнее предсказанным, или который принадлежит слайсу (вырезке), отличному от слайса, которому принадлежит текущий блок, в качестве недоступных.

Первый смежный пиксел может являться пикселом, находящемся в предварительно определенном положении, из числа предварительно определенного количества смежных пикселов, и поиск второго смежного пиксела может содержать этап, на котором определяют доступный смежный пиксел, который был изначально найден посредством выполнения поиска в предварительно определенном количестве смежных пикселов в предварительно определенном направлении на основе первого смежного пиксела, в качестве второго смежного пиксела.

Первый смежный пиксел может являться смежным пикселом, расположенным у верхнего левого угла текущего блока, и поиск второго смежного пиксела может содержать этапы, на которых выполняют поиск второго смежного пиксела посредством поиска в смежных пикселах сверху и сверху справа от текущего блока слева направо на основе первого смежного пиксела, и если второй смежный пиксел недоступен в смежных пикселах сверху и сверху справа от текущего блока, то выполняют поиск в смежных пикселах слева и снизу слева от текущего блока сверху вниз на основе первого смежного пиксела.

Первый смежный пиксел может являться смежным пикселом, расположенным у верхнего левого угла текущего блока, и поиск второго смежного пиксела может содержать этапы, на которых выполняют поиск второго смежного пиксела посредством выполнения поиска в смежных пикселах слева и снизу слева от текущего блока сверху вниз на основе первого смежного пиксела, и если второй смежный пиксел недоступен в смежных пикселах слева и снизу слева от текущего блока, то выполняют поиск в смежных пикселах сверху и сверху справа от текущего блока слева направо на основе первого смежного пиксела.

Первый смежный пиксел может являться смежным пикселом, расположенным у верхнего левого угла текущего блока, и поиск второго смежного пиксела может содержать этапы, на которых определяют доступный смежный пиксел слева посредством выполнения поиска в смежных пикселах слева и снизу слева от текущего блока сверху вниз на основе первого смежного пиксела, и определяют доступный смежный пиксел сверху посредством выполнения поиска в смежных пикселах сверху и сверху справа от текущего блока слева направо на основе первого смежного пиксела; и заменяют пиксельное значение первого смежного пиксела посредством использования среднего значения доступного смежного пиксела слева и доступного смежного пиксела сверху.

Первый смежный пиксел может являться смежным пикселом, расположенным у верхнего левого угла текущего блока, и поиск второго смежного пиксела может содержать этапы, на которых определяют доступный смежный пиксел слева посредством выполнения поиска в смежных пикселах слева и снизу слева от текущего блока сверху вниз на основе первого смежного пиксела, определяют доступный смежный пиксел сверху посредством выполнения поиска в смежных пикселах сверху и сверху справа от текущего блока слева направо на основе первого смежного пиксела, и определяют смежный пиксел, который ближе всего находится к первому смежному пикселу из числа найденных смежных пикселов слева и сверху, в качестве второго смежного пиксела.

Первый смежный пиксел может являться смежным пикселом слева в самом низу из числа смежных пикселов слева и снизу слева от текущего блока, и поиск второго смежного пиксела может содержать этапы, на которых выполняют поиск второго смежного пиксела посредством выполнения поиска в смежных пикселах слева и снизу слева от текущего блока снизу вверх на основе первого смежного пиксела, и если второй смежный пиксел недоступен в смежных пикселах слева и снизу слева от текущего блока, то выполняют поиск в смежных пикселах сверху и сверху справа от текущего блока слева направо.

Первый смежный пиксел может являться смежным пикселом крайним справа сверху из числа смежных пикселов сверху и сверху справа от текущего блока, и поиск второго смежного пиксела может содержать этапы, на которых выполняют поиск второго смежного пиксела посредством выполнения поиска в смежных пикселах сверху и сверху справа от текущего блока справа налево на основе первого смежного пиксела, и если второй смежный пиксел недоступен в смежных пикселах сверху и сверху справа от текущего блока, то выполняют поиск в смежных пикселах слева и снизу слева от текущего блока сверху вниз.

Способ может дополнительно содержать, в случае недоступности по меньшей мере одного третьего смежного пиксела, этап, на котором заменяют пиксельное значение упомянутого по меньшей мере одного третьего смежного пиксела пиксельным значением смежного пиксела, найденного ранее на основе предварительно определенного направления.

Первый смежный пиксел может являться смежным пикселом, расположенным у верхнего левого угла текущего блока, и если упомянутый по меньшей мере один третий смежный пиксел расположен сверху от текущего блока, то способ может дополнительно содержать этапы, на которых последовательную заменяют упомянутый по меньшей мере один третий смежный пиксел начиная с третьего смежного пиксела крайнего слева смежным пикселом слева от упомянутого по меньшей мере одного третьего смежного пиксела, а если упомянутый по меньшей мере один третий смежный пиксел расположен слева от текущего блока, то последовательно заменяют упомянутый по меньшей мере один третий смежный пиксел начиная с третьего смежного пиксела крайнего сверху смежным пикселом выше упомянутого по меньшей мере одного третьего смежного пиксела.

Первый смежный пиксел может являться смежным пикселом, расположенным у самого нижнего левого угла текущего блока, и если упомянутый по меньшей мере один третий смежный пиксел расположен слева от текущего блока, то способ может дополнительно содержать этапы, на которых последовательно заменяют упомянутый по меньшей мере один третий смежный пиксел начиная с третьего смежного пиксела крайнего снизу смежным пикселом ниже упомянутого по меньшей мере одного третьего смежного пиксела, и если упомянутый по меньшей мере один третий смежный пиксел расположен сверху текущего блока, то последовательно заменяют упомянутый по меньшей мере один третий смежный пиксел начиная с третьего смежного пиксела крайнего слева смежным пикселом слева от упомянутого по меньшей мере одного третьего смежного пиксела.

Первый смежный пиксел может являться смежным пикселом, расположенным у верхнего самого правого угла текущего блока, и если упомянутый по меньшей мере один третий смежный пиксел расположен сверху от текущего блока, то способ может дополнительно содержать этапы, на которых последовательно заменяют упомянутый по меньшей мере один третий смежный пиксел начиная с третьего смежного пиксела справа смежным пикселом справа от упомянутого по меньшей мере одного третьего смежного пиксела, и если по меньшей мере один третий смежный пиксел расположен слева от текущего блока, то последовательно заменяют упомянутый по меньшей мере один третий смежный пиксел начиная с третьего смежного пиксела крайнего сверху смежным пикселом выше упомянутого по меньшей мере одного третьего смежного пиксела.

Способ может дополнительно содержать замену пиксельного значения первого смежного пиксела предварительно определенным значением, если второй смежный пиксел не существует в предварительно определенном количестве смежных пикселов.

Предварительно определенное значение может быть определено на основе битовой глубины пиксела.

В соответствии с другим аспектом настоящего изобретения, обеспечено устройство для внутреннего предсказания видео, устройство содержит: определитель доступности для определения доступности предварительно определенного количества смежных пикселов, используемых для внутреннего предсказания текущего блока из числа блоков, полученных посредством разбиения видеокадра, формирующего видео согласно иерархической структуре; средство замены для выполнения, если первый смежный пиксел недоступен в предварительно определенном количестве смежных пикселов, поиска второго смежного пиксела, который доступен посредством поиска в предварительно определенном количестве смежных пикселов в предварительно определенном направлении на основе первого смежного пиксела, и замены пиксельного значения первого смежного пиксела пиксельным значением найденного второго смежного пиксела; и средство выполнения внутреннего предсказания для выполнения внутреннего предсказания в отношении текущего блока посредством использования предварительно определенного количества смежных пикселов, содержащих замененный первый смежный пиксел.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Далее в настоящем документе, настоящее изобретение будет более полно описано со ссылкой на сопроводительные чертежи, на которых изображены иллюстративные варианты осуществления изобретения.

Фиг. 1 изображает блок-схему устройства 100 видео кодирования согласно варианту осуществления настоящего изобретения.

Устройство 100 видео кодирования включает в себя средство 110 разбиения на максимальные единицы кодирования, определитель 120 единиц кодирования и блок 130 вывода.

Средство 110 разбиения на максимальные единицы кодирования может разбивать текущий видео кадр на основе максимальной единицы кодирования для текущего видеокадра изображения. Если текущий видеокадр больше, чем максимальная единица кодирования, то может быть выполнено разбиение данных изображения текущего видеокадра на по меньшей мере одну максимальную единицу кодирования. Максимальная единица кодирования, согласно варианту осуществления настоящего изобретения, может являться единицей данных, имеющей размер 32x32, 64x64, 128x128, 256x256, и т.д., причем форма единицы данных является квадратом, имеющим ширину и длину в квадратах 2. Данные изображения могут быть выведены на определитель 120 единиц кодирования в соответствии с по меньшей мере одной максимальной единицей кодирования.

Единица кодирования согласно варианту осуществления настоящего изобретения может характеризоваться максимальным размером и глубиной. Глубина означает число раз, которое единица кодирования пространственно разбивается из максимальной единицы кодирования, и по мере увеличения глубины, более глубокие единицы кодирования в соответствии с глубинами могут быть разбиты от максимальной единицы кодирования до минимальной единицы кодирования. Глубина максимальной единицы кодирования является самой верхней глубиной, а глубина минимальной единицы кодирования является самой нижней глубиной. Поскольку размер единицы кодирования, соответствующей каждой глубине, уменьшается по мере увеличения глубины максимальной единицы кодирования, единица кодирования, соответствующая верхней глубине, может включать в себя множество единиц кодирования, соответствующих более низким глубинам.

Как было описано выше, выполняется разбиение данных изображения текущего видео кадра на максимальные единицы кодирования в соответствии с максимальным размером единицы кодирования, и каждая из максимальных единиц кодирования может включать в себя более глубокие единицы кодирования, которые получены разбиением в соответствии с глубинами. Поскольку максимальная единица кодирования согласно варианту осуществления настоящего изобретения разбивается в соответствии с глубинами, данные изображения пространственной области, включенной в состав максимальной единицы кодирования, могут подвергаться иерархической классификации в соответствии с глубинами.

Максимальная глубина и максимальный размер единицы кодирования, которые ограничивают общее число раз, которое высота и ширина максимальной единицы кодирования иерархически разбивается, могут быть предопределены.

Определитель 120 единиц кодирования выполняет кодирование упомянутой по меньшей мере одной области разбиения, полученной посредством разбиения области максимальной единицы кодирования в соответствии с глубинами, и определяет глубину для вывода окончательно закодированных данных изображения в соответствии с по меньшей мере одной областью разбиения. Другими словами, определитель 120 единиц кодирования определяет кодируемую глубину посредством кодирования данных изображения на более глубокие единицы кодирования, в соответствии с глубинами, в соответствии с максимальной единицей кодирования текущего видеокадра, и выбирает глубину, имеющую наименьшую ошибку кодирования. Определенная кодируемая глубина и закодированные данные изображения в соответствии с определенной кодируемой глубиной выводятся на блок 130 вывода.

Данные изображения в максимальной единице кодирования кодируются на основе более глубоких единиц кодирования, соответствующих по меньшей мере одной глубине, равной или ниже максимальной глубины, и результаты кодирования данных изображения сравниваются на основе каждой из более глубоких единиц кодирования. Глубина, имеющая наименьшую ошибку кодирования, может быть выбрана после сравнения ошибок кодирования более глубоких единиц кодирования. По меньшей мере одна кодируемая глубина может быть выбрана для каждой максимальной единицы кодирования.

Размер максимальной единицы кодирования разбивается по мере выполнения иерархического разбиения единицы кодирования в соответствии с глубинами и по мере увеличения количества единиц кодирования. Кроме того, даже если единицы кодирования соответствуют одной и той же глубине в одной максимальной единице кодирования, определяется, разбить ли каждую из единиц кодирования, соответствующих одной и той же глубине, до более низкой глубины посредством измерения ошибки кодирования данных изображения каждой единицы кодирования, по отдельности. Соответственно, даже если данные изображения включены в состав одной максимальной единицы кодирования, ошибки кодирования могут различаться в соответствии с областями в одной максимальной единице кодирования, и, следовательно, кодируемые глубины могут различаться в соответствии с областями в данных изображения. Следовательно, одна или более кодируемых глубин могут быть определены в одной максимальной единице кодирования, и данные изображения максимальной единицы кодирования могут быть разделены в соответствии с единицами кодирования по меньшей мере одной кодируемой глубины.

Соответственно, определитель 120 единиц кодирования может определять единицы кодирования, имеющие древовидную структуру, включенную в состав максимальной единицы кодирования. «Единицы кодирования, имеющие древовидную структуру» согласно варианту осуществления настоящего изобретения, включают в себя единицы кодирования, соответствующие глубине, определенной как кодируемая глубина, из числа всех более глубоких единиц кодирования, включенных в состав максимальной единицы кодирования. Единица кодирования кодируемой глубины может определяться иерархически в соответствии с глубинами в той же самой области максимальной единицы кодирования, и может определяться независимо в различных областях. Подобным образом, кодируемая глубина в текущей области может быть определена независимо от кодируемой глубины в другой области.

Максимальная глубина согласно варианту осуществления настоящего изобретения является индексом, связанным с числом разбиений от максимальной единицы кодирования до минимальной единицы кодирования. Первая максимальная глубина согласно варианту осуществления настоящего изобретения может означать общее число разбиений от максимальной единицы кодирования до минимальной единицы кодирования. Вторая максимальная глубина согласно варианту осуществления настоящего изобретения может означать общее количество уровней глубины от максимальной единицы кодирования до минимальной единицы кодирования. Например, если глубина максимальной единицы кодирования равна 0, то глубина единицы кодирования, в которой максимальная единица кодирования разбивается один раз, может быть установлена на 1, а глубина единицы кодирования, в которой максимальная единица кодирования разбивается дважды, может быть установлена на 2. В данном случае, если минимальная единица кодирования является единицей кодирования, в которой максимальная единица кодирования разбивается четыре раза, то существует 5 уровней глубины для глубин 0, 1, 2, 3 и 4, и, следовательно, первая максимальная глубина может быть установлена на 4, а вторая максимальная глубина может быть установлена на 5.

Кодирование с предсказанием и преобразование могут выполняться в соответствии с максимальной единицей кодирования. Кодирование с предсказанием и преобразование также выполняются на основе более глубоких единиц кодирования в соответствии с глубиной равной или глубинами меньшими, чем максимальная глубина, в соответствии с максимальной единицей кодирования.

Поскольку количество более глубоких единиц кодирования увеличивается всякий раз, когда максимальная единица кодирования разбивается в соответствии с глубинами, кодирование, включающее в себя кодирование с предсказанием и преобразование, выполняется в отношении всех более глубоких единиц кодирования, генерируемых по мере увеличения глубины. Для удобства описания, кодирование с предсказанием и преобразование теперь будут описаны на основе единицы кодирования текущей глубины в максимальной единице кодирования.

Устройство 100 видеокодирования может по-разному выбирать размер или форму единицы данных для кодирования данных изображения. Для выполнения кодирования данных изображения, выполняются операции, такие, как кодирование с предсказанием, преобразование и энтропийное кодирование, и, в тоже самое время, та же самая единица данных может быть использована для всех операций, или для каждой операции могут быть использованы различные единицы данных.

Например, устройство 100 видеокодирования может выбирать не только единицу кодирования для выполнения кодирования данных изображения, но также и единицу данных, отличную от единицы кодирования для того, чтобы выполнять кодирование с предсказанием в отношении данных изображения в единице кодирования.

Для выполнения кодирования с предсказанием в максимальной единице кодирования, кодирование с предсказанием может выполняться на основе единицы кодирования, соответствующей кодируемой глубине, то есть, на основе единицы кодирования, которая больше не разбивается до единиц кодирования, соответствующих более низкой глубине. Далее в настоящем документе, единица кодирования, которая больше не разбивается и становится базисной единицей для кодирования с предсказанием, теперь будет называться «единицей предсказания». Раздел, полученный посредством разбиения единицы предсказания, может включать в себя единицу предсказания или единицу данных, полученную посредством разбиения по меньшей мере одного из высоты и ширины единицы предсказания.

Например, если единица кодирования 2Nx2N (где N является положительным целым числом) больше не разбивается и становится единицей предсказания 2Nx2N, то размер раздела может составлять 2Nx2N, 2NxN, Nx2N или NxN. Примеры типа раздела включают в себя симметричные разделы, которые получаются посредством симметричного разбиения высоты или ширины единицы предсказания, разделы, получаемые посредством асимметричного разбиения высоты или ширины единицы предсказания, такие, как 1:n или n:1, разделы, которые получаются посредством геометрического разбиения единицы предсказания, и разделы, имеющие произвольные формы.

Режим предсказания единицы предсказания может являться по меньшей мере одним из внутреннего (интра-) режима, внешнего (интер-) режима и режима пропуска. Например, внутренний режим или внешний режим могут выполняться в отношении разделов 2Nx2N, 2NxN, Nx2N или NxN. Кроме того, режим пропуска может выполняться исключительно в отношении раздела 2Nx2N. Кодирование выполняется независимо в отношении одной единицы предсказания в единице кодирования, благодаря чему выбирается режим предсказания, имеющий наименьшую ошибку кодирования.

Устройство 100 видеокодирования также может выполнять преобразование в отношении данных изображения в единице кодировании, не только на основе единицы кодирования для кодирования данных изображения, но также и на основе единицы данных, которая отличается от единицы кодирования.

Для выполнения преобразования в единице кодирования, преобразование может выполняться на основе единицы данных, имеющей размер, меньший или равный единице кодирования. Например, единица данных для преобразования может включать в себя единицу данных для внутреннего режима и единицу данных для внешнего режима.

Единица данных, используемая в качестве основы для преобразования, теперь будет называться «единицей преобразования». Подобно единице кодирования, единица преобразования в единице кодирования может быть рекурсивно разбита на области меньших размеров таким образом, чтобы единица преобразования могла определяться независимо в единицах областей. Таким образом, остаточные данные в единице кодирования могут быть разделены в соответствии с единицей преобразования, имеющей древовидную структуру, в соответствии с глубинами преобразования.

Глубина преобразования, указывающая число разбиений для достижения единицы преобразования посредством выполнения разбиения высоты и ширины единицы кодирования, также может быть установлена в единице преобразования. Например, в текущей единице кодирования 2Nx2N, глубина преобразования может быть равна 0, если размер единицы преобразования составляет 2Nx2N, может быть равна 1, если, соответственно, размер единицы преобразования составляет NxN, и может быть равна 2, если, соответственно, размер единицы преобразования составляет N/2xN/2. Другими словами, единица преобразования, имеющая древовидную структуру, может быть установлена в соответствии с глубинами преобразования.

Информация кодирования в соответствии с единицами кодирования, соответствующими кодируемой глубине, требует не только информации о кодируемой глубине, но также и информации, связанной с кодированием с предсказанием и преобразованием. Соответственно, определитель 120 единиц кодирования не только определяет кодируемую глубину, имеющую наименьшую ошибку кодирования, но также определяет тип разделав единице предсказания, режим предсказания в соответствии с единицами предсказания и размер единицы преобразования для выполнения преобразования.

Далее, со ссылкой на Фиг. 3-12, будут подробно описаны единицы кодирования в соответствии с древовидной структурой в максимальной единице кодирования и способ определения раздела, согласно вариантам осуществления настоящего изобретения.

Определитель 120 единиц кодирования может измерять ошибку кодирования более глубоких единиц кодирования в соответствии с глубинами посредством использования Оптимизации Искажения в зависимости от Скорости передачи, на основе множителей Лагранжа.

Блок 130 вывода выводит данные изображения максимальной единицы кодирования, которые закодированы на основе упомянутой по меньшей мере одной кодируемой глубины, определенной определителем 120 единиц кодирования, и информацию о режиме кодирования в соответствии с кодируемой глубиной, в битовых потоках.

Закодированные данные изображения могут быть получены посредством кодирования остаточных данных изображения.

Информация о режиме кодирования в соответствии с кодируемой глубиной может включать в себя информацию о кодируемой глубине, о типе разделав единице предсказания, режиме предсказания и размере единицы преобразования.

Информация о кодируемой глубине может быть определена посредством использования информации разбиения в соответствии с глубинами, которая указывает, выполняется ли кодирование в отношении единиц кодирования более низкой глубины, вместо текущей глубины. Если текущая глубина текущей единицы кодирования является кодируемой глубиной, то выполняется кодирование и вывод данных изображения в текущей единице кодирования, и, таким образом, информация разбиения может быть задана таким образом, чтобы не разбивать текущую единицу кодирования до более низкой глубины. Альтернативно, если текущая глубина текущей единицы кодирования не является кодируемой глубиной, то кодирование выполняется в отношении единицы кодирования с более низкой глубиной, и, таким образом, информация разбиения может быть задана таким образом, чтобы разбивать текущую единицу кодирования для получения единиц кодирования более низкой глубины.

Если текущая глубина не является кодируемой глубиной, то кодирование выполняется в отношении единицы кодирования, которая разбита на единицу кодирования с более низкой глубиной. Поскольку в одной единице кодирования текущей глубины существует по меньшей мере одна единица кодирования с более низкой глубиной, то кодирование повторно выполняется в отношении каждой единицы кодирования с более низкой глубиной, и, таким образом, может быть выполнено рекурсивное кодирование для единиц кодирования, имеющих одинаковую глубину.

Поскольку единицы кодирования, имеющие древовидную структуру, определены для одной максимальной единицы кодирования, и информация о по меньшей мере одном режиме кодирования определена для единицы кодирования кодируемой глубины, информация о по меньшей мере одном режиме кодирования может быть определена для одной максимальной единицы кодирования. Кроме того, кодируемая глубина данных изображения максимальной единицы кодирования может быть другой в соответствии с положениями, поскольку данные изображения иерархически разбиваются в соответствии с глубинами, и, таким образом, для данных изображения может быть установлена информация о кодируемой глубине и режиме кодирования.

Соответственно, блок 130 вывода может назначать информацию кодирования о соответствующей кодируемой глубине и режиме кодирования по меньшей мере одной из единицы кодирования, единицы предсказания и минимальной единицы, включенной в состав максимальной единицы кодирования.

Минимальная единица, согласно варианту осуществления настоящего изобретения, является единицей данных квадратной формы, полученной посредством разбиения минимальной единицы кодирования, составляющей самую нижнюю глубину, на 4. Альтернативно, минимальная единица может являться максимальной единицей данных квадратной формы, которая может быть включена в состав всех единиц кодирования, единиц предсказания, единиц раздела и единиц преобразования, включенных в состав максимальной единицы кодирования.

Например, информация кодирования, выведенная через блок 130 вывода, может классифицироваться на информацию кодирования в соответствии с единицами ко