Способ обновления параметров для энтропийного кодирования и декодирования уровня коэффициентов преобразования, а также устройство энтропийного кодирования и устройство энтропийного декодирования уровня коэффициентов преобразования с его использованием
Иллюстрации
Показать всеИзобретение относится к технологиям кодирования/декодирования видеоданных. Техническим результатом является уменьшение числа битов, сформированных при кодировании. Предложен способ декодирования видео. Способ содержит этап, на котором получают строку бинов, соответствующую информации уровня текущих коэффициентов преобразования, посредством выполнения арифметического декодирования потока битов. Далее, согласно способу, определяют текущий параметр преобразования в двоичную форму для определения строки бинов префикса из упомянутой строки бинов равным одному из (i) предыдущего параметра преобразования в двоичную форму и (ii) обновленного значения предыдущего параметра преобразования в двоичную форму, полученного посредством добавления n к предыдущему параметру преобразования в двоичную форму, где n является целым числом и n больше или равно 1. 27 ил., 2 табл.
Реферат
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к кодированию и декодированию видео, более конкретно к способам и устройствам для обновления параметра, используемого при энтропийном кодировании и декодировании информации размера коэффициента преобразования.
УРОВЕНЬ ТЕХНИКИ
Согласно способам сжатия изображений, таким как MPEG-1, MPEG-2 или MPEG-4 H.264/MPEG-4 усовершенствованное кодирование видео (AVC), изображение разбивается на блоки, имеющие предварительно определенный размер, а затем остаточные данные блоков получаются посредством внешнего прогнозирования или внутреннего прогнозирования. Остаточные данные сжимаются посредством преобразования, квантования, сканирования, кодирования по длинам серий и энтропийного кодирования. При энтропийном кодировании, элемент синтаксиса, такой как коэффициент преобразования или вектор движения, энтропийно кодируется для того, чтобы выводить поток битов. На стороне декодера элемент синтаксиса извлекается из потока битов, и декодирование выполняется на основе извлеченного элемента синтаксиса.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
ТЕХНИЧЕСКАЯ ЗАДАЧА
Настоящее изобретение предоставляет способ обновления параметра, посредством которого резкое изменение параметра, используемого при энтропийном кодировании и декодировании уровня коэффициентов преобразования, является постепенно варьируемым при предотвращении резкого изменения упомянутого параметра.
Настоящее изобретение также предоставляет способ обновления параметра, используемого при преобразовании в двоичную форму элемента синтаксиса, такого как уровень коэффициентов преобразования, посредством использования способа преобразования в двоичную форму, к примеру, способа на основе кода Голомба-Райса или способа на основе конкатенированного кода.
ТЕХНИЧЕСКОЕ РЕШЕНИЕ
Согласно вариантам осуществления настоящего изобретения, предоставляется способ обновления параметров, в котором постепенно обновляется параметр, используемый при преобразовании в двоичную форму уровня коэффициентов преобразования.
ПРЕИМУЩЕСТВА ИЗОБРЕТЕНИЯ
Согласно вариантам осуществления настоящего изобретения, посредством постепенного варьирования параметра, используемого при энтропийном кодировании информации уровня коэффициента преобразования, может быть уменьшено число битов, сформированных в ходе кодирования, и может повышаться усиление изображения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг. 1 является блок-схемой устройства для кодирования видео согласно варианту осуществления настоящего изобретения;
Фиг. 2 является блок-схемой устройства для декодирования видео согласно варианту осуществления настоящего изобретения;
Фиг. 3 является схемой для описания принципа единиц кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 4 является блок-схемой видеокодера на основе единиц кодирования, имеющих иерархическую структуру, согласно варианту осуществления настоящего изобретения;
Фиг. 5 является блок-схемой видеодекодера на основе единиц кодирования, имеющих иерархическую структуру, согласно варианту осуществления настоящего изобретения;
Фиг. 6 является схемой, иллюстрирующей более глубокие единицы кодирования согласно глубинам и сегменты согласно варианту осуществления настоящего изобретения;
Фиг. 7 является схемой для описания взаимосвязи между единицей кодирования и единицами преобразования, согласно варианту осуществления настоящего изобретения;
Фиг. 8 является схемой для описания информации кодирования единиц кодирования, соответствующих кодированной глубине, согласно варианту осуществления настоящего изобретения;
Фиг. 9 является схемой более глубоких единиц кодирования согласно глубинам, согласно варианту осуществления настоящего изобретения;
Фиг. 10-12 являются схемами для описания взаимосвязи между единицами кодирования, единицами прогнозирования и единицами преобразования частоты, согласно варианту осуществления настоящего изобретения;
Фиг. 13 является схемой для описания взаимосвязи между единицей кодирования, единицей прогнозирования и единицей преобразования, согласно информации режима кодирования по таблице 1;
Фиг. 14 является блок-схемой последовательности операций способа, иллюстрирующей операцию энтропийного кодирования и декодирования информации коэффициентов преобразования, включенной в единицу преобразования, согласно варианту осуществления настоящего изобретения;
Фиг. 15 иллюстрирует единицу преобразования, которая энтропийно кодируется согласно варианту осуществления настоящего изобретения;
Фиг. 16 иллюстрирует карту значимости, соответствующую единице преобразования по фиг. 15 согласно варианту осуществления настоящего изобретения;
Фиг. 17 иллюстрирует coeff_abs_level_greater1_flag, соответствующий единице преобразования 4x4 по фиг. 15;
Фиг. 18 иллюстрирует coeff_abs_level_greater2_flag, соответствующий единице преобразования 4x4 по фиг. 15;
Фиг. 19 иллюстрирует coeff_abs_level_remaining, соответствующий единице преобразования 4x4 по фиг. 15;
Фиг. 20 иллюстрирует таблицу, показывающую элементы синтаксиса, связанные с единицами преобразования, проиллюстрированными на фиг. 15-19;
Фиг. 21 иллюстрирует другой пример coeff_abs_level_remaining, который преобразуется в двоичную форму согласно варианту осуществления настоящего изобретения;
Фиг. 22 является блок-схемой, иллюстрирующей структуру устройства энтропийного кодирования согласно варианту осуществления настоящего изобретения;
Фиг. 23 является блок-схемой, иллюстрирующей структуру устройства преобразования в двоичную форму согласно варианту осуществления настоящего изобретения;
Фиг. 24 является блок-схемой последовательности операций, иллюстрирующей способ энтропийного кодирования элементов синтаксиса, указывающих уровень коэффициентов преобразования, согласно варианту осуществления настоящего изобретения;
Фиг. 25 является блок-схемой, иллюстрирующей устройство энтропийного декодирования согласно варианту осуществления настоящего изобретения;
Фиг. 26 является блок-схемой, иллюстрирующей структуру устройства отмены преобразования в двоичную форму согласно варианту осуществления настоящего изобретения;
Фиг. 27 является блок-схемой последовательности операций, иллюстрирующей способ энтропийного декодирования уровня коэффициентов преобразования согласно варианту осуществления настоящего изобретения.
ОПТИМАЛЬНЫЙ РЕЖИМ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Согласно аспекту настоящего изобретения, предусмотрен способ обновления параметра для энтропийного декодирования уровня коэффициентов преобразования, при этом способ содержит: синтаксический анализ элементов синтаксиса уровня коэффициентов преобразования, указывающих размеры коэффициентов преобразования, включенных в единицу преобразования, из потока битов; определение того, следует или нет заменять на новый предыдущий параметр, посредством сравнения размера предыдущего коэффициента преобразования, который восстанавливается перед текущим коэффициентом преобразования, с предварительно определенным критическим значением, полученным на основе предыдущего параметра, который используется при отмене преобразования в двоичную форму элемента синтаксиса уровня предыдущих коэффициентов преобразования, указывающего размер предыдущего коэффициента преобразования; получение параметра, используемого при отмене преобразования в двоичную форму элемента синтаксиса уровня текущих коэффициентов преобразования, указывающего размер текущего коэффициента преобразования, посредством замены на новый или поддержания предыдущего параметра на основе результата определения; и получение размера текущего коэффициента преобразования посредством отмены преобразования в двоичную форму элемента синтаксиса уровня текущих коэффициентов преобразования посредством использования полученного параметра, при этом предварительно определенное критическое значение устанавливается с возможностью иметь значение, пропорциональное предыдущему параметру, и когда предыдущий параметр заменяется на новый, замененный на новый параметр имеет значение, которое постепенно увеличивается по сравнению с предыдущим параметром.
Согласно другому аспекту настоящего изобретения, предусмотрено устройство для энтропийного декодирования уровня коэффициентов преобразования, причем устройство содержит: модуль синтаксического анализа, который синтаксически анализирует элементы синтаксиса уровня коэффициентов преобразования, указывающие размеры коэффициентов преобразования, включенных в единицу преобразования, из потока битов; модуль определения параметров, который определяет то, следует или нет заменять на новый предыдущий параметр, посредством сравнения размера предыдущего коэффициента преобразования, который восстанавливается перед текущим коэффициентом преобразования, с предварительно определенным критическим значением, полученным на основе предыдущего параметра, который используется при отмене преобразования в двоичную форму элемента синтаксиса уровня предыдущих коэффициентов преобразования, указывающего размер предыдущего коэффициента преобразования, и который получает параметр, используемый при отмене преобразования в двоичную форму элемента синтаксиса уровня текущих коэффициентов преобразования, указывающего размер текущего коэффициента преобразования, посредством замены на новый или поддержания предыдущего параметра на основе результата определения; модуль восстановления элементов синтаксиса, который получает размер текущего коэффициента преобразования посредством отмены преобразования в двоичную форму элемента синтаксиса уровня текущих коэффициентов преобразования посредством использования полученного параметра, при этом предварительно определенное критическое значение устанавливается с возможностью иметь значение, пропорциональное предыдущему параметру, и когда предыдущий параметр заменяется на новый, замененный на новый параметр имеет значение, которое постепенно увеличивается по сравнению с предыдущим параметром.
Согласно другому аспекту настоящего изобретения, предусмотрен способ обновления параметра для энтропийного кодирования уровня коэффициентов преобразования, при этом способ содержит: получение, в предварительно определенном порядке сканирования, элементов синтаксиса уровня коэффициентов преобразования, указывающих размеры коэффициентов преобразования, включенных в единицу преобразования; определение того, следует или нет заменять на новый предыдущий параметр, посредством сравнения размера предыдущего коэффициента преобразования, который кодируется перед текущим коэффициентом преобразования, с предварительно определенным критическим значением, полученным на основе предыдущего параметра, который используется при преобразовании в двоичную форму элемента синтаксиса уровня предыдущих коэффициентов преобразования, указывающего размер предыдущего коэффициента преобразования; получение параметра, используемого при преобразовании в двоичную форму элемента синтаксиса уровня текущих коэффициентов преобразования, указывающего размер текущего коэффициента преобразования, посредством замены на новый или поддержания предыдущего параметра на основе результата определения; и вывод битовой строки, соответствующей элементу синтаксиса уровня коэффициентов преобразования текущего коэффициента преобразования, посредством преобразования в двоичную форму элемента синтаксиса уровня коэффициентов преобразования текущего коэффициента преобразования посредством использования полученного параметра, при этом предварительно определенное критическое значение устанавливается с возможностью иметь значение, пропорциональное предыдущему параметру, и когда предыдущий параметр заменяется на новый, замененный на новый параметр имеет значение, которое постепенно увеличивается по сравнению с предыдущим параметром.
Согласно другому аспекту настоящего изобретения, предусмотрено устройство для энтропийного кодирования уровня коэффициентов преобразования, причем устройство содержит: модуль определения параметров, который получает, в предварительно определенном порядке сканирования, элементы синтаксиса уровня коэффициентов преобразования, указывающие размеры коэффициентов преобразования, включенных в единицу преобразования, определяет то, следует или нет заменять на новый предыдущий параметр, посредством сравнения размера предыдущего коэффициента преобразования, который кодируется перед текущим коэффициентом преобразования, с предварительно определенным критическим значением, полученным на основе предыдущего параметра, который используется при преобразовании в двоичную форму элемента синтаксиса уровня предыдущих коэффициентов преобразования, указывающего размер предыдущего коэффициента преобразования, и получает параметр, используемый при преобразовании в двоичную форму элемента синтаксиса уровня текущих коэффициентов преобразования, указывающего размер текущего коэффициента преобразования, посредством замены на новый или поддержания предыдущего параметра на основе результата определения; модуль формирования битовых строк, который выводит битовые строки, соответствующие элементу синтаксиса уровня коэффициентов преобразования текущего коэффициента преобразования, посредством преобразования в двоичную форму элементов синтаксиса уровня коэффициентов преобразования текущего коэффициента преобразования посредством использования полученного параметра, при этом предварительно определенное критическое значение устанавливается с возможностью иметь значение, пропорциональное предыдущему параметру, и когда предыдущий параметр заменяется на новый, замененный на новый параметр имеет значение, которое постепенно увеличивается по сравнению с предыдущим параметром.
ОПТИМАЛЬНЫЙ РЕЖИМ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
В дальнейшем в этом документе описываются способ и устройство для обновления параметра, используемого при энтропийном кодировании и декодировании информации размера единицы преобразования согласно варианту осуществления настоящего изобретения, со ссылкой на фиг. 1-13. Помимо этого, подробно описывается способ энтропийного кодирования и декодирования элемента синтаксиса, полученного посредством использования способа энтропийного кодирования и декодирования видео, описанного со ссылкой на фиг. 1-13, со ссылкой на фиг. 14-29. Такие выражения, как "по меньшей мере, один из", когда предваряют список элементов, модифицируют весь список элементов и не модифицируют отдельные элементы списка.
Фиг. 1 является блок-схемой устройства 100 кодирования видео согласно варианту осуществления настоящего изобретения.
Устройство 100 кодирования видео включает в себя иерархический кодер 110 и энтропийный кодер 120.
Иерархический кодер 110 может разбивать текущую картинку, которая должна быть кодирована, в единицах предварительно определенных единиц данных, чтобы выполнять кодирование над каждой из единиц данных. Подробно, иерархический кодер 110 может разбивать текущую картинку на основе максимальной единицы кодирования, которая представляет собой единицу кодирования максимального размера. Максимальная единица кодирования согласно варианту осуществления настоящего изобретения может представлять собой единицу данных, имеющую размер 32x32, 64x64, 128x128, 256x256 и т.д., при этом форма единицы данных представляет собой квадрат, который имеет ширину и длину в квадратах 2 и превышает 8.
Единица кодирования согласно варианту осуществления настоящего изобретения может отличаться посредством максимального размера и глубины. Глубина обозначает число раз, которое единица кодирования пространственно разбивается от максимальной единицы кодирования, и по мере того как увеличивается глубина, более глубокие единицы кодирования согласно глубинам могут разбиваться от максимальной единицы кодирования до минимальной единицы кодирования. Глубина максимальной единицы кодирования является самой верхней глубиной, а глубина минимальной единицы кодирования является самой нижней глубиной. Поскольку размер единицы кодирования, соответствующей каждой глубине, снижается по мере того, как увеличивается глубина максимальной единицы кодирования, единица кодирования, соответствующая верхней глубине, может включать в себя множество единиц кодирования, соответствующих нижним глубинам.
Как описано выше, данные изображений для текущей картинки разбиваются на максимальные единицы кодирования согласно максимальному размеру единицы кодирования, и каждая из максимальных единиц кодирования может включать в себя более глубокие единицы кодирования, которые разбиваются согласно глубинам. Поскольку максимальная единица кодирования согласно варианту осуществления настоящего изобретения разбивается согласно глубинам, данные изображений пространственной области, включенные в максимальную единицу кодирования, могут быть иерархически классифицированы согласно глубинам.
Максимальная глубина и максимальный размер единицы кодирования, которые ограничивают общее число раз, которое иерархически разбиваются высота и ширина максимальной единицы кодирования, может быть предварительно определена.
Иерархический кодер 110 кодирует по меньшей мере одну область разбиения, полученную посредством разбиения области максимальной единицы кодирования согласно глубинам, и определяет глубину, чтобы выводить конечные кодированные данные изображений согласно по меньшей мере одной области разбиения. Другими словами, иерархический кодер 110 определяет кодированную глубину посредством кодирования данных изображений в более глубоких единицах кодирования согласно глубинам, согласно максимальной единице кодирования текущей картинки и выбора глубины, имеющей наименьшую ошибку кодирования. Определенная кодированная глубина и кодированные данные изображений согласно максимальным единицам кодирования выводятся в энтропийный кодер 120.
Данные изображений в максимальной единице кодирования кодируются на основе более глубоких единиц кодирования, соответствующих по меньшей мере одной глубине, равной или меньшей максимальной глубины, и результаты кодирования данных изображений сравниваются на основе каждой из более глубоких единиц кодирования. Глубина, имеющая наименьшую ошибку кодирования, может быть выбрана после сравнения ошибок кодирования более глубоких единиц кодирования. По меньшей мере, одна кодированная глубина может быть выбрана для каждой максимальной единицы кодирования.
Размер максимальной единицы кодирования разбивается по мере того, как единица кодирования иерархически разбивается согласно глубинам, и по мере того, как увеличивается число единиц кодирования. Кроме того, даже если единицы кодирования соответствуют идентичной глубине в одной максимальной единице кодирования, определяется то, разбивать или нет каждую из единиц кодирования, соответствующих идентичной глубине, до нижней глубины посредством измерения ошибки кодирования данных изображений каждой единицы кодирования, отдельно. Соответственно, даже когда данные изображений включаются в одну максимальную единицу кодирования, данные изображений разбиваются на области согласно глубинам, ошибки кодирования могут отличаться согласно областям в одной максимальной единице кодирования, и в силу этого кодированные глубины могут отличаться согласно областям в данных изображений. Таким образом, одна или более кодированных глубин могут быть определены в одной максимальной единице кодирования, и данные изображений максимальной единицы кодирования могут быть разделены согласно единицам кодирования по меньшей мере одной кодированной глубины.
Соответственно, иерархический кодер 110 может определять единицы кодирования, имеющие древовидную структуру, включенные в максимальную единицу кодирования. "Единицы кодирования, имеющие древовидную структуру" согласно варианту осуществления настоящего изобретения включают в себя единицы кодирования, соответствующие глубине, определенной как кодированная глубина, из всех более глубоких единиц кодирования, включенных в максимальную единицу кодирования. Единица кодирования, имеющая кодированную глубину, может быть иерархически определена согласно глубинам в идентичной области максимальной единицы кодирования и может быть независимо определена в различных областях. Аналогично, кодированная глубина в текущей области может быть независимо определена из кодированной глубины в другой области.
Максимальная глубина согласно варианту осуществления настоящего изобретения представляет собой индекс, связанный с числом раз, когда выполняется разбиение от максимальной единицы кодирования до минимальной единицы кодирования. Первая максимальная глубина согласно варианту осуществления настоящего изобретения может обозначать общее число раз, когда выполняется разбиение от максимальной единицы кодирования до минимальной единицы кодирования. Вторая максимальная глубина согласно варианту осуществления настоящего изобретения может обозначать общее число уровней глубины от максимальной единицы кодирования до минимальной единицы кодирования. Например, когда глубина максимальной единицы кодирования равна 0, глубина единицы кодирования, на которую максимальная единица кодирования разбивается один раз, может устанавливаться равной 1, а глубина единицы кодирования, на которую максимальная единица кодирования разбивается два раза, может устанавливаться равной 2. Здесь, если минимальная единица кодирования представляет собой единицу кодирования, на которую максимальная единица кодирования разбивается четыре раза, имеется пять уровней глубины с глубинами 0, 1, 2, 3 и 4, и за счет этого первая максимальная глубина может устанавливаться равной 4, а вторая максимальная глубина может устанавливаться равной 5.
Прогнозирующее кодирование и преобразование могут выполняться согласно максимальной единице кодирования. Прогнозирующее кодирование и преобразование также выполняются на основе более глубоких единиц кодирования согласно глубине, равной, или глубинам, меньшим максимальной глубины, согласно максимальной единице кодирования.
Поскольку число более глубоких единиц кодирования увеличивается каждый раз, когда максимальная единица кодирования разбивается согласно глубинам, кодирование, включающее в себя прогнозирующее кодирование и преобразование, выполняется над всеми более глубокими единицами кодирования, сформированными по мере того, как увеличивается глубина. Для удобства описания прогнозирующее кодирование и преобразование далее описываются на основе единицы кодирования текущей глубины в максимальной единице кодирования.
Устройство 100 кодирования видео может по-разному выбирать размер или форму единицы данных для кодирования данных изображений. Чтобы кодировать данные изображений, выполняются такие операции, как прогнозирующее кодирование, преобразование и энтропийное кодирование, и в это время, идентичная единица данных может использоваться для всех операций, или различные единицы данных могут использоваться для каждой операции.
Например, устройство 100 кодирования видео может выбирать не только единицу кодирования для кодирования данных изображений, но также и единицу данных, отличающуюся от единицы кодирования, с тем чтобы выполнять прогнозирующее кодирование над данными изображений в единице кодирования.
Чтобы выполнять прогнозирующее кодирование в максимальной единице кодирования, прогнозирующее кодирование может выполняться на основе единицы кодирования, соответствующей кодированной глубине, т.е. на основе единицы кодирования, которая более не разбивается на единицы кодирования, соответствующие нижней глубине. В дальнейшем в этом документе единица кодирования, которая более не разбивается и становится базисной единицей для прогнозирующего кодирования, далее упоминается как "единица прогнозирования". Сегмент, полученный посредством разбиения единицы прогнозирования, может включать в себя единицу данных, полученную посредством разбиения по меньшей мере одной из высоты и ширины единицы прогнозирования.
Например, когда единица кодирования в 2Nx2N (где N является положительным целым числом) более не разбивается и становится единицей прогнозирования в 2Nx2N, размер сегмента может составлять 2Nx2N, 2NxN, Nx2N или NxN. Примеры типа сегмента включают в себя симметричные сегменты, которые получаются посредством симметричного разбиения высоты или ширины единицы прогнозирования, сегменты, полученные посредством асимметричного разбиения высоты или ширины единицы прогнозирования, к примеру, 1:n или n:1, сегменты, которые получаются посредством геометрического разбиения единицы прогнозирования, и сегменты, имеющие произвольные формы.
Режим прогнозирования единицы прогнозирования может представлять собой по меньшей мере одно из внутреннего режима, внешнего режима и режима пропуска. Например, внутренний режим или внешний режим может выполняться над сегментом в 2Nx2N, 2NxN, Nx2N или NxN. Кроме того, режим пропуска может выполняться только над сегментом в 2Nx2N. Кодирование независимо выполняется над одной единицей прогнозирования в единице кодирования, в силу этого выбирая режим прогнозирования, имеющий наименьшую ошибку кодирования.
Устройство 100 кодирования видео также может выполнять преобразование над данными изображений в единице кодирования на основе не только единицы кодирования для кодирования данных изображений, но также и на основе единицы данных, которая отличается от единицы кодирования.
Чтобы выполнять преобразование в единице кодирования, преобразование может выполняться на основе единицы данных, имеющей размер, меньший или равный единице кодирования. Например, единица данных для преобразования может включать в себя единицу данных для внутреннего режима и единицу данных для внешнего режима.
Единица данных, используемая в качестве базиса преобразования, далее упоминается как "единица преобразования". Аналогично единице кодирования, единица преобразования в единице кодирования может рекурсивно разбиваться на области меньших размеров, так что единица преобразования может быть определена независимо в единицах областей. Таким образом, остаточные данные в единице кодирования могут быть разделены согласно единице преобразования, имеющей древовидную структуру согласно глубинам преобразования.
Глубина преобразования, указывающая число раз, когда выполняется разбиение, чтобы достигать единицы преобразования посредством разбиения высоты и ширины единицы кодирования, также может устанавливаться в единице преобразования. Например, в текущей единице кодирования 2Nx2N глубина преобразования может быть равна 0, когда размер единицы преобразования составляет 2Nx2N, может быть равна 1, когда размер единицы преобразования составляет NxN, и может быть равна 2, когда размер единицы преобразования составляет N/2xN/2. Иными словами, единица преобразования, имеющая древовидную структуру, также может устанавливаться согласно глубинам преобразования.
Информация кодирования согласно единицам кодирования, соответствующим кодированной глубине, требует не только информацию относительно кодированной глубины, но также и информацию, связанную с прогнозирующим кодированием и преобразованием. Соответственно, иерархический кодер 110 не только определяет кодированную глубину, имеющую наименьшую ошибку кодирования, но также и определяет тип сегмента в единице прогнозирования, режим прогнозирования согласно единицам прогнозирования и размер единицы преобразования для преобразования.
Ниже подробно описываются единицы кодирования согласно древовидной структуре в максимальной единице кодирования и способ определения сегмента согласно вариантам осуществления настоящего изобретения со ссылкой на фиг. 3-12.
Иерархический кодер 110 может измерять ошибку кодирования более глубоких единиц кодирования согласно глубинам посредством использования оптимизации искажения в зависимости от скорости передачи на основе множителей Лагранжа.
Энтропийный кодер 120 выводит данные изображений максимальной единицы кодирования, которая кодируется на основе по меньшей мере одной кодированной глубины, определенной посредством иерархического кодера 110, и информации относительно режима кодирования согласно кодированной глубине в потоках битов. Кодированные данные изображений могут представлять собой результат кодирования остаточных данных изображения. Информация относительно режима кодирования согласно кодированной глубине может включать в себя информацию относительно кодированной глубины, информацию относительно типа сегмента в единице прогнозирования, информацию режима прогнозирования и информацию размера единицы преобразования. В частности, как описано ниже, при энтропийном кодировании элемента синтаксиса, указывающего размер единицы преобразования, энтропийный кодер 120 преобразует в двоичную форму элемент синтаксиса, указывающий размер преобразования, но согласно битовым строкам посредством использования параметра, который постепенно обновляется. Ниже описывается операция энтропийного кодирования единицы преобразования посредством использования модуля 120 энтропийного кодирования.
Информация относительно кодированной глубины может быть задана посредством использования информации разбиения согласно глубинам, которая указывает то, выполняется или нет кодирование над единицами кодирования нижней глубины вместо текущей глубины. Если текущая глубина текущей единицы кодирования является кодированной глубиной, данные изображений в текущей единице кодирования кодируются и выводятся и в силу этого информация разбиения может быть задана таким образом, чтобы не разбивать текущую единицу кодирования до нижней глубины. Альтернативно, если текущая глубина текущей единицы кодирования не является кодированной глубиной, кодирование выполняется над единицей кодирования нижней глубины и в силу этого информация разбиения может быть задана таким образом, чтобы разбивать текущую единицу кодирования, чтобы получать единицы кодирования нижней глубины.
Если текущая глубина не является кодированной глубиной, кодирование выполняется над единицей кодирования, которая разбивается на единицу кодирования нижней глубины. Поскольку по меньшей мере одна единица кодирования нижней глубины существует в одной единице кодирования текущей глубины, кодирование многократно выполняется над каждой единицей кодирования нижней глубины и за счет этого кодирование может быть рекурсивно выполнено для единиц кодирования, имеющих идентичную глубину.
Поскольку единицы кодирования, имеющие древовидную структуру, определяются для одной максимальной единицы кодирования, и информация, по меньшей мере, относительно одного режима кодирования определяется для единицы кодирования кодированной глубины, информация, по меньшей мере, относительно одного режима кодирования может быть определена для одной максимальной единицы кодирования. Кроме того, кодированная глубина данных изображений максимальной единицы кодирования может отличаться согласно местоположениям, поскольку данные изображений иерархически разбиваются согласно глубинам и в силу этого информация относительно кодированной глубины и режима кодирования может устанавливаться для данных изображений.
Соответственно, энтропийный кодер 120 может назначать информацию кодирования относительно соответствующей кодированной глубины и режима кодирования по меньшей мере одной из единицы кодирования, единицы прогнозирования и минимальной единицы, включенной в максимальную единицу кодирования.
Минимальная единица согласно варианту осуществления настоящего изобретения представляет собой единицу данных квадратной формы, полученной посредством разбиения минимальной единицы кодирования, составляющей самую нижнюю кодированную глубину, на 4. Альтернативно, минимальная единица может представлять собой максимальную единицу данных квадратной формы, которая может быть включена во все из единиц кодирования, единиц прогнозирования, единиц сегментирования и единиц преобразования, включенных в максимальную единицу кодирования.
Например, информация кодирования, выводимая через энтропийный кодер 120, может классифицироваться на информацию кодирования согласно единицам кодирования и информацию кодирования согласно единицам прогнозирования. Информация кодирования согласно единицам кодирования может включать в себя информацию относительно режима прогнозирования и относительно размера сегментов. Информация кодирования согласно единицам прогнозирования может включать в себя информацию относительно оцененного направления внешнего режима, относительно индекса опорного изображения внешнего режима, относительно вектора движения, относительно компонента сигнала цветности внутреннего режима и относительно способа интерполяции внутреннего режима. Кроме того, информация относительно максимального размера единицы кодирования, заданного согласно картинкам, слайсам или GOP, и информация относительно максимальной глубины могут вставляться в заголовок потока битов.
В устройстве 100 кодирования видео, более глубокая единица кодирования может представлять собой единицу кодирования, полученную посредством деления высоты или ширины единицы кодирования верхней глубины, которая на один слой выше, на два. Другими словами, когда размер единицы кодирования текущей глубины равен 2Nx2N, размер единицы кодирования нижней глубины равен NxN. Кроме того, единица кодирования текущей глубины, имеющей размер 2Nx2N, может включать в себя максимальное число в четыре единицы кодирования нижней глубины.
Соответственно, устройство 100 кодирования видео может формировать единицы кодирования, имеющие древовидную структуру, посредством определения единиц кодирования, имеющих оптимальную форму и оптимальный размер для каждой максимальной единицы кодирования, на основе размера максимальной единицы кодирования и максимальной глубины, определенных с учетом характеристик текущей картинки. Кроме того, поскольку кодирование может выполняться над каждой максимальной единицей кодирования посредством использования любого из различных режимов прогнозирования и преобразований, оптимальный режим кодирования может быть определен с учетом характеристик единицы кодирования различных размеров изображений.
Таким образом, если изображение, имеющее высокое разрешение или большой объем данных, кодируется в традиционном макроблоке, число макроблоков в расчете на картинку чрезмерно увеличивается. Соответственно, увеличивается число фрагментов сжатой информации, сформированной для каждого макроблока, и в силу этого трудно передавать сжатую информацию, и снижается эффективность сжатия данных. Тем не менее, посредством использования устройства 100 кодирования видео, эффективность сжатия изображений может повышаться, поскольку единица кодирования регулируется с учетом характеристик изображения при увеличении максимального размера единицы кодирования с учетом размера изображения.
Фиг. 2 является блок-схемой устройства 200 декодирования видео, согласно варианту осуществления настоящего изобретения.
Устройство 200 декодирования видео включает в себя синтаксический анализатор 210, энтропийный декодер 220 и иерархический декодер 230. Определения различных терминов, таких как единица кодирования, глубина, единица прогнозирования, единица преобразования и информация относительно различных режимов кодирования, для различных операций устройства 200 декодирования видео являются идентичными определениям, описанным со ссылкой на фиг. 1 и устройство 100 кодирования видео.
Синтаксический анализатор 210 принимает поток битов кодированного видео, чтобы синтаксически анализировать элемент синтаксиса. Энт