Сигнализация долгосрочных опорных изображений для кодирования видео

Иллюстрации

Показать все

Изобретение относится к области кодирования/декодирования видеосигнала. Технический результат – повышение эффективности кодирования/декодирования видео за счет улучшенной сигнализации долгосрочных опорных изображений. Способ декодирования видеоданных содержит этапы, на которых: декодируют первое значение, представляющее разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (РОС) текущего изображения видеоданных и значением первых MSB первого значения РОС первого долгосрочного опорного изображения видеоданных; декодируют второе значение, представляющее разность между значением вторых MSB второго значения РОС второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение РОС и второе значение РОС имеют разные значения младших битов (LSB); и декодируют по меньшей мере часть текущего изображения видеоданных относительно по меньшей мере одного из первого долгосрочного опорного изображения с использованием первого значения и второго долгосрочного опорного изображения с использованием первого значения и второго значения. 6 н. и 24 з.п. ф-лы, 6 ил., 1 табл.

Реферат

[0001] Данная заявка испрашивает приоритет по предварительной патентной заявке США № 61/665784, поданной 28 июня 2012 г., содержание которой, таким образом, целиком включено в данный документ посредством ссылки.

ОБЛАСТЬ ТЕХНИКИ

[0002] Настоящее изобретение относится к кодированию видеосигнала.

УРОВЕНЬ ТЕХНИКИ

[0003] Возможности обработки цифрового видеосигнала могут быть включены в самые разнообразные устройства, включающие в себя цифровые телевизоры, системы прямого цифрового вещания, беспроводные широковещательные системы, карманные персональные компьютеры (КПК), портативные или настольные компьютеры, планшетные компьютеры, устройства чтения электронных книг, цифровые камеры, цифровые устройства записи, цифровые медиапроигрыватели, устройства для видеоигр, консоли для видеоигр, сотовые или спутниковые радиотелефоны, так называемые “смартфоны”, устройства видеоконференцсвязи, устройства потоковой передачи видеосигнала и пр. Устройства обработки цифрового видеосигнала реализуют методы кодирования видеосигнала, например, описанные в стандартах, заданных в MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, Part 10, Advanced Video Coding (AVC), стандарте High Efficiency Video Coding (HEVC) в настоящее время находящемся в разработке, и расширениях таких стандартов. Недавний проект перспективного стандарта HEVC, именуемый “HEVC Working Draft 7” или “WD7,” описан в документе JCTVC-I1003, Bross et al., “High efficiency video coding (HEVC) text specification draft 7,” Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 9th Meeting: San Jose, California, USA, 27 April to 7 May, 2012, который, с 13 мая 2013 г., можно загрузить по ссылке http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v22.zip. Устройства кодирования видеосигнала могут передавать, принимать, кодировать, декодировать и/или сохранять цифровую видеоинформацию более эффективно за счет реализации таких методов кодирования видеосигнала.

[0004] Методы кодирования видеосигнала включают в себя пространственное прогнозирование (внутри изображения) и/или временное прогнозирование (между изображениями) для снижения или устранения избыточности, присущей видеопоследовательностям. Для кодирования видеосигнала на основе блоков, слайс видео (например, кадр видео или часть кадра видео) можно разбивать на видеоблоки, которые также могут именоваться древовидными блоками, единицами кодирования (CU) и/или узлами кодирования. Видеоблоки в кодированном с интра-предсказанием (I) слайсе изображения кодируются с использованием пространственного прогнозирования в отношении опорных выборок в соседних блоках одного и того же изображения. Видеоблоки в кодированном с интер-предсказанием (P или B) слайсе изображения могут использовать пространственное прогнозирование в отношении опорных выборок в соседних блоках одного и того же изображения или временное прогнозирование в отношении опорных выборок в других опорных изображениях. Изображения могут именоваться кадрами, и опорные изображения могут относиться к опорным кадрам.

[0005] Пространственное или временное прогнозирование дает прогностический блок для блока, подлежащего кодированию. Остаточные данные представляют пиксельные разности между первоначальным блоком, подлежащим кодированию, и прогностическим блоком. Кодированный с интер-предсказанием блок кодируется согласно вектору движения, который указывает на блок опорных выборок, образующий прогностический блок, и остаточным данным, указывающим разность между кодированным блоком и прогностическим блоком. Кодированный с интра-предсказанием блок кодируется согласно режиму кодирования с интра-предсказанием и остаточным данным. Для дополнительного сжатия, остаточные данные можно преобразовывать из пиксельной области в преобразовательную область, полученную в остаточных коэффициентах преобразования, которые затем можно квантовать. Квантованные коэффициенты преобразования, первоначально размещенный в двухмерном массиве, можно сканировать для создания одномерного вектора коэффициентов преобразования, и для достижения еще большего сжатия можно применять энтропийное кодирование.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0006] В целом, в настоящем раскрытии описаны методы сигнализации долгосрочных опорных изображений для кодирования видеосигнала. Опорное изображение, в общем случае, соответствует изображению, которое можно использовать в качестве опорного для кодирования с временным прогнозированием данных других изображений. В целом, долгосрочные опорные изображения сохраняются в буфере декодированных изображений дольше, чем другие опорные изображения, например, краткосрочные опорные изображения. В настоящем раскрытии описаны различные методы, связанные с сигнализацией, относящейся к долгосрочным опорным изображениям, например, с сигнализацией долгосрочных опорных изображений в заголовках слайсов для слайсов изображений. Методы настоящего раскрытия могут обеспечивать усовершенствование способов сигнализации долгосрочных опорных изображений в заголовке слайса, например, в отношении эффективности и/или применимости.

[0007] В одном примере, способ включает в себя декодирование первого значения, представляющего разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, декодирование второго значения, представляющего разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB), и декодирование по меньшей мере части текущего изображения видеоданных относительно по меньшей мере одного из первого долгосрочного опорного изображения с использованием первого значения и второго долгосрочного опорного изображения с использованием первого значения и второго значения.

[0008] В другом примере, устройство для декодирования видеоданных включает в себя видеодекодер, выполненный с возможностью декодирования первого значения, представляющего разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, декодирования второго значения, представляющего разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB), и декодирования по меньшей мере части текущего изображения видеоданных относительно по меньшей мере одного из первого долгосрочного опорного изображения с использованием первого значения и второго долгосрочного опорного изображения с использованием первого значения и второго значения.

[0009] В другом примере, устройство включает в себя средство для декодирования первого значения, представляющего разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, средство для декодирования второго значения, представляющего разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB), и средство для декодирования по меньшей мере части текущего изображения видеоданных относительно по меньшей мере одного из первого долгосрочного опорного изображения с использованием первого значения и второго долгосрочного опорного изображения с использованием первого значения и второго значения.

[0010] В другом примере, на компьютерно-читаемом носителе данных хранятся инструкции, которые, при выполнении, предписывают процессору декодировать первое значение, представляющее разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, декодировать второе значение, представляющее разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB), и декодировать по меньшей мере часть текущего изображения видеоданных относительно по меньшей мере одного из первого долгосрочного опорного изображения с использованием первого значения и второго долгосрочного опорного изображения с использованием первого значения и второго значения.

[0011] В другом примере, способ кодирования видеоданных включает в себя кодирование по меньшей мере первой части текущего изображения видеоданных относительно первого долгосрочного опорного изображения и по меньшей мере вторая часть текущего изображения во второе долгосрочное опорное изображение, кодирование первого значения, представляющего разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, и кодирование второго значения, представляющего разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB).

[0012] В другом примере, устройство для кодирования видеоданных включает в себя видеокодер, выполненный с возможностью кодирования по меньшей мере первой части текущего изображения видеоданных относительно первого долгосрочного опорного изображения и по меньшей мере второй части текущего изображения во второе долгосрочное опорное изображение, кодирования первого значения, представляющего разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, и кодирования второго значения, представляющего разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB).

[0013] В другом примере, устройство для кодирования видеоданных включает в себя средство для кодирования по меньшей мере первой части текущего изображения видеоданных относительно первого долгосрочного опорного изображения и по меньшей мере второй части текущего изображения во второе долгосрочное опорное изображение, средство для кодирования первого значения, представляющего разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, и средство для кодирования второго значения, представляющего разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB).

[0014] В другом примере, на компьютерно-читаемом носителе данных хранятся инструкции, которые предписывают процессору кодировать по меньшей мере первую часть текущего изображения видеоданных относительно первого долгосрочного опорного изображения и по меньшей мере вторую часть текущего изображения во второе долгосрочное опорное изображение, кодировать первое значение, представляющее разность между значением базовых старших битов (MSB) значения счетчика порядка изображений (POC) текущего изображения видеоданных и значением первых MSB первого значения POC первого долгосрочного опорного изображения видеоданных, и кодировать второе значение, представляющее разность между значением вторых MSB второго значения POC второго долгосрочного опорного изображения видеоданных и значением первых MSB, причем первое значение POC и второе значение POC имеют разные значения младших битов (LSB).

[0015] Детали одного или более примеров представлены в прилагаемых чертежах и нижеприведенном описании. Другие признаки, задачи и преимущества явствуют из описания и чертежей, а также их формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0016] Фиг. 1 - блок-схема, демонстрирующая иллюстративную систему кодирования и декодирования видеосигнала, которая может использовать методы улучшения сигнализации долгосрочных опорных изображений в заголовках слайсов.

[0017] Фиг. 2 - блок-схема, демонстрирующая пример видеокодера, который может реализовать методы улучшения сигнализации долгосрочных опорных изображений в заголовках слайсов.

[0018] Фиг. 3 - блок-схема, демонстрирующая пример видеодекодера, который может реализовать методы улучшения сигнализации долгосрочных опорных изображений в заголовках слайсов.

[0019] Фиг. 4 - принципиальная схема, демонстрирующая последовательность кодированных видеоизображений.

[0020] Фиг. 5 - блок-схема операций, демонстрирующая иллюстративный способ кодирования значения счетчика порядка изображений (POC) для долгосрочных опорных изображений в соответствии с методами настоящего раскрытия.

[0021] Фиг. 6 - блок-схема операций, демонстрирующая иллюстративный способ декодирования значений POC для долгосрочных опорных изображений в соответствии с методами настоящего раскрытия.

ПОДРОБНОЕ ОПИСАНИЕ

[0022] В общем случае, видеоданные представляется последовательностью изображений, которые захватываются или отображаются в быстрой последовательности. Следует понимать, что в некоторых примерах, изображения или части изображений могут генерироваться, например, с использованием компьютерной графики, вместо (или помимо) захвата. Порядок, в котором изображения подлежат отображению (который, в общем случае, может совпадать с порядком, в котором изображения захватываются или генерируются) может отличаться от порядка, в котором изображения кодируются. Порядок отображения изображений, в общем случае, представляется значениями счетчика порядка изображений (POC), тогда как порядок кодирования изображений, в общем случае, представляется значениями номера кадра (frame_num).

[0023] Кодирование изображений, в общем случае, предусматривает пользование преимуществом наличия избыточных данных в изображениях. Например, пространственное кодирование, также именуемое кодирование с интра-предсказанием, пользуется преимуществом избыточностей, возникающих между пространственно соседствующими блоками пиксельных значений общего изображения. В порядке другого примера, временное кодирование, также именуемое кодирование с интер-предсказанием, пользуется преимуществом избыточностей, возникающих между разными изображениями, которые захватываются, генерируются или отображаются в разные моменты времени. В частности, изображение может делиться на слайсы, которые могут быть предназначены для интра- или интер-предсказания. Кроме того, каждый слайс может делиться на блоки (например, наибольшие единицы кодирования (LCU)), и каждый из блоков может подвергаться либо дополнительному разбиению, либо кодированию на основании того, предназначен ли соответствующий слайс для интра- или интер-предсказания.

[0024] В связи с примером кодирования с интер-предсказанием, блоки кодируемого в данный момент изображения (также именуемого “текущим изображением”) можно прогнозировать из опорного изображения. WD7 определяет “опорное изображение” как изображение с nal_ref_flag равным 1. nal_ref_flag это элемент синтаксиса единицы уровня сетевых абстракций (NAL), указывающий, следует ли рассматривать данные, включенные в единицу NAL, как опорное изображение. WD7 также предусматривает, что опорное изображение содержит выборки (то есть пиксельные значения), который можно использовать для интер-предсказания в процессе декодирования следующих изображений в порядке декодирования.

[0025] Кроме того, WD7 отличает долгосрочные опорные изображения от краткосрочных опорных изображений. Например, WD7 определяет долгосрочное опорное изображение как опорное изображение, которое помечено как “используемое в качестве долгосрочного опорного”. WD7 предусматривает, что флаг в наборе параметров последовательности (SPS) указывает, полностью ли сигнализируются долгосрочные опорные изображения для кодированной видеопоследовательности. В соответствии с WD7, видеокодеры сигнализируют младшие биты (LSB) значений POC долгосрочных опорных изображений в заголовках слайсов для слайсов. Сигнализация LSB может приводить к экономии битов, по сравнению с сигнализацией полного значения POC. Видеокодеры, в соответствии с WD7, может сигнализировать старшие биты (MSB) значений POC долгосрочных опорных изображений, если в буфере декодированных изображений (DPB) присутствует более одного опорного изображения, имеющего такие же младшие биты, как долгосрочное опорное изображение. Кроме того, в соответствии с WD7, видеокодеры могут использовать флаг для указания, могут ли сигнализируемые долгосрочные опорные изображения использоваться текущим изображением в качестве опорного.

[0026] Видеокодеры могут поддерживать MSB текущего изображения, именуемые здесь “значением базового MSB”, и сигнализировать MSB долгосрочного опорного изображения i с использованием значений смещения относительно значений базовых MSB, например, с использованием элемента синтаксиса delta_poc_msb_cycle_lt[i] для изображения i. Этот элемент синтаксиса именуется ниже значением “цикла MSB”. Другими словами, для вычисления значения POC для конкретного изображения, видеокодер может вычислять: (базовый MSB + цикл MSB для изображения), сцепленный с (LSB для изображения).

[0027] В WD7, значение цикла MSB кодировалось как разность между значением базового MSB и MSB для изображения, для которого сигнализировался цикл MSB, т.е. изображения i. Только когда сигнализируется два или более долгосрочных опорных изображения с одинаковыми значениями LSB, цикл MSB первого такого долгосрочного опорного изображения будет сигнализироваться как таковой, и значения цикла MSB для остальных долгосрочных опорных изображений будет сигнализироваться как смещения относительно друг друга. Однако эта сигнализация долгосрочных опорных изображений, в соответствии с WD7, может страдать одним или более недостатками. Например, при наличии двух долгосрочных опорных изображений с разными значениями LSB, оба из которых сигнализируют delta_poc_msb_cycle_lt[i], текущий синтаксис будет сигнализировать delta_poc_msb_cycle_lt[i] как рассмотрено выше, т.е. как смещение относительно значения базового MSB. Однако из настоящего раскрытия следует, что сигнализация разности между значения цикла MSB для изображений может быть более эффективной.

[0028] Сигнализация идентификационных данных для долгосрочных опорных изображений в заголовке слайса, в соответствии с WD7, может страдать одним или более недостатками. Например, если текущее изображение имеет значение POC, равное MaxPicOrderCntLsb * N−1, и изображение, которое имеет значение POC, равное MaxPicOrderCntLsb * N, является первым долгосрочным опорным изображением, для которого сигнализируется delta_poc_msb_cycle_lt[i], то WD7 не обеспечивает методы сигнализации delta_poc_msb_cycle_lt[i]. В этом случае, значение delta_poc_msb_cycle_lt[i], должно быть равно, но не может, −1 (минус единице).

[0029] В порядке другого примера, при наличии двух долгосрочных опорных изображений с разными значениями LSB, оба из которых сигнализируют delta_poc_msb_cycle_lt[i], текущий синтаксис будет сигнализировать delta_poc_msb_cycle_lt[i] как таковой. Однако из настоящего раскрытия следует, что сигнализация разности для одного из изображений была бы более эффективной.

[0030] В порядке другого примера, при наличии в DPB более одного опорного изображения, имеющего такой же LSB, как и у сигнализируемого долгосрочного опорного изображения, WD7 требует, чтобы цикл MSB LTRP также сигнализировался с использованием элемента синтаксиса delta_poc_msb_cycle_lt[i]. Однако из настоящего раскрытия следует, что, если в DPB присутствует изображение, которое будет помечено текущим изображением как краткосрочное опорное изображение, то включение краткосрочного опорного изображения в набор кандидатов долгосрочных опорных изображений может препятствовать сигнализации старших битов сверх необходимости.

[0031] В порядке другого примера, когда в DPB присутствует n опорных изображений, для которых LSB POC равно poc_lsb_lt[i], и когда в текущем изображении сигнализируется k долгосрочных опорных изображений, где k меньше или равно n, которые имеют LSB, равные poc_lsb_lt[i], синтаксис, заданный в WD7 требует, чтобы все k изображений имели delta_poc_msb_present_flag[i], равный 1. Если же k=n, из настоящего раскрытия следует, что видеокодеру не нужно задавать delta_poc_msb_present_flag[i] равным 1 для всех k долгосрочных опорных изображений, но будет достаточно, если он задаст delta_poc_msb_present_flag[i] равным 1 для n-1 изображений. Методы настоящего раскрытия, более подробно описанные ниже со ссылками на фигуры, способны преодолеть любые или все из этих недостатков. В целом, в настоящем раскрытии описаны различные методы, которые позволяют улучшать сигнализацию для долгосрочных опорных изображений в заголовке слайса.

[0032] На фиг. 1 показана блок-схема, демонстрирующая иллюстративную систему 10 кодирования и декодирования видеосигнала, которая может использовать методы улучшения сигнализации долгосрочных опорных изображений в заголовках слайсов. Как показано на фиг. 1, система 10 включает в себя исходное устройство 12, которое обеспечивает кодированные видеоданные, подлежащие декодированию в более позднее время устройством 14 назначения. В частности, исходное устройство 12 подает видеоданные на устройство 14 назначения через компьютерно-читаемый носитель 16. Исходное устройство 12 и устройство 14 назначения могут содержать самые разнообразные устройства, включающие в себя настольные компьютеры, компьютеры-ноутбуки (т.е. портативные компьютеры), планшетные компьютеры, телевизионные приставки, телефонные трубки, например, так называемые “смартфоны”, так называемые “смартпэды”, телевизоры, камеры, устройства отображения, цифровые медиапроигрыватели, консоли для видеоигр, устройства потоковой передачи видеосигнала и т.п. В ряде случаев, исходное устройство 12 и устройство 14 назначения могут быть снабжены оборудованием для беспроводной связи.

[0033] Устройство 14 назначения может принимать кодированные видеоданные, подлежащие декодированию, через компьютерно-читаемый носитель 16. Компьютерно-читаемый носитель 16 может содержать любой тип носителя или устройства, способного перемещать кодированные видеоданные от исходного устройства 12 на устройство 14 назначения. В одном примере, компьютерно-читаемый носитель 16 может содержать среду передачи данных, чтобы исходное устройство 12 могло передавать кодированные видеоданные непосредственно на устройство 14 назначения в реальном времени. Кодированные видеоданные можно модулировать согласно стандарту связи, например, протоколу беспроводной связи, и передавать на устройство 14 назначения. Среда передачи данных может содержать любую беспроводную или проводную среду передачи данных, например, радиочастотный (РЧ) спектр или одну или более физических линий передачи. Среда передачи данных может образовывать часть сети с коммутацией пакетов, например, локальной сети, широкомасштабной сети или глобальной сети, например, интернета. Среда передачи данных может включать в себя маршрутизаторы, коммутаторы, базовые станции или любое другое оборудование, которое может быть полезно для облегчения передачи от исходного устройства 12 на устройство 14 назначения.

[0034] В некоторых примерах, кодированные данные могут выводиться из выходного интерфейса 22 на запоминающее устройство. Аналогично, входной интерфейс может обращаться к запоминающему устройству за кодированными данными. запоминающее устройство может включать в себя любые носители данных распределенного или локального доступа, например, жесткий диск, диски Blu-ray, DVD, CD-ROM, флэш-память, энергозависимую или энергонезависимую память, или любые другие подходящие носители цифровых данных для хранения кодированных видеоданных. В дополнительном примере, запоминающее устройство может соответствовать файловому серверу или другому промежуточному запоминающему устройству, где может храниться кодированный видеосигнал, генерируемый исходным устройством 12.

[0035] Устройство 14 назначения может извлекать сохраненные видеоданные из запоминающего устройства посредством потоковой передачи или загрузки. Файловым сервером может быть сервер любого типа, способный хранить кодированные видеоданные и передавать эти кодированные видеоданные на устройство 14 назначения. Примером файлового сервера является веб-сервер (например, для веб-сайта), FTP-сервер, устройства типа сетевого хранилища данных (NAS) или локальный дисковод. Устройство 14 назначения может осуществлять доступ к кодированным видеоданным через любое стандартное соединение для передачи данных, в том числе, интернет-соединение. Оно может включать в себя беспроводной канал (например, соединение Wi-Fi), проводное соединение (например, DSL, кабельный модем и т.д.) или их комбинацию, пригодный для осуществления доступа к кодированным видеоданным, хранящимся на файловом сервере. Передача кодированных видеоданных из запоминающего устройства может осуществляться в потоковом режиме, в режиме загрузки или в комбинированном режиме.

[0036] Методы настоящего раскрытия не ограничиваются беспроводными приложениями или установками. Методы могут применяться к кодированию видеосигнала для поддержки любого из различных мультимедийных приложений, например, эфирного телевизионного вещания, кабельных телевизионных передач, спутниковых телевизионных передач, передач потокового видео в интернете, например, динамической адаптивной потоковой передачи по HTTP (DASH), цифрового видеосигнала, который кодируется на носитель данных, декодирование цифрового видеосигнала хранящегося на носителе данных, или других приложений. В некоторых примерах, система 10 может быть выполнена с возможностью поддержки односторонней или двусторонней передачи видеосигнала для поддержки таких приложений, как потоковая передача видеосигнала, воспроизведение видео, видеовещание и/или видеотелефония.

[0037] В примере, показанном на фиг. 1, исходное устройство 12 включает в себя источник 18 видеосигнала, видеокодер 20 и выходной интерфейс 22. Устройство 14 назначения включает в себя входной интерфейс 28, видеодекодер 30 и устройство 32 отображения. В соответствии с настоящим раскрытием, видеокодер 20 исходного устройства 12 может быть выполнен с возможностью применения методов улучшения сигнализации долгосрочных опорных изображений в заголовках слайсов. В других примерах, исходное устройство и устройство назначения может включать в себя другие компоненты или компоновки. Например, исходное устройство 12 может принимать видеоданные от внешнего источника 18 видеосигнала, например, внешней камеры. Аналогично, устройство 14 назначения может сопрягаться с внешним устройством отображения, вместо того, чтобы включать в себя встроенное устройство отображения.

[0038] Система 10, проиллюстрированная на фиг. 1, является всего лишь одним примером. Методы улучшения сигнализации долгосрочных опорных изображений в заголовках слайсов может осуществляться любым устройством кодирования и/или декодирования цифрового видеосигнала. Хотя, в общем случае, методы настоящего раскрытия осуществляются устройством кодирования видеосигнала, методы также могут осуществляться видеокодером/декодером, обычно именуемым “кодеком”. Кроме того, методы настоящего раскрытия также могут осуществляться препроцессором видеосигнала. Исходное устройство 12 и устройство 14 назначения являются лишь примерами таких устройств кодирования, в которых исходное устройство 12 генерирует кодированные видеоданные для передачи на устройство 14 назначения. В некоторых примерах, устройства 12, 14 могут работать, по существу, симметричным образом, таким образом, что каждое из устройств 12, 14 включает в себя компоненты кодирования и декодирования видеосигнала. Поэтому, система 10 может поддерживать одностороннюю или двустороннюю передачу видеосигнала между устройствами 12, 14 обработки видеосигнала, например, для потоковой передачи видеосигнала, воспроизведения видео, видеовещания или видеотелефонии.

[0039] Источник 18 видеосигнала исходного устройства 12 может включать в себя устройство захвата видео, например, видеокамеру, архив видеозаписей, содержащий ранее захваченное видео и/или интерфейс подачи видео для приема видеосигнала от поставщика видеоконтента. В порядке дополнительной альтернативы, источник 18 видеосигнала может генерировать данные на основе компьютерной графики в качестве исходного видеосигнала или комбинацию видеосъемки в реальном времени, архивных видеозаписей и видео, создаваемого на компьютере. В ряде случаев, если источником 18 видеосигнала является видеокамера, исходное устройство 12 и устройство 14 назначения могут формировать так называемые камерофоны или видеофоны. Однако, как упомянуто выше, методы, описанные в настоящем раскрытии, можно применять к кодированию видеосигнала в целом и можно применять к беспроводным и/или проводным приложениям. В каждом случае, захваченное, предзахваченное видео или видео, создаваемое на компьютере, может кодироваться видеокодером 20. Затем кодированная видеоинформация может выводиться выходным интерфейсом 22 на компьютерно-читаемый носитель 16.

[0040] Компьютерно-читаемый носитель 16 может включать в себя переходные среды, например, беспроводное широковещание или передачу по проводной сети, или носители данных (то есть некратковременные, или нетранзиторные носители данных), например, жесткий диск, флэш-носитель, компакт-диск, цифровой видеодиск, диск Blu-ray или другие компьютерно-читаемые носители. В некоторых примерах, сетевой сервер (не показан) может принимать кодированные видеоданные от исходного устройства 12 и выдавать кодированные видеоданные на устройство 14 назначения, например, посредством сетевой передачи. Аналогично, вычислительное устройство установки по производству носителей, например, установки по штамповки дисков, может принимать кодированные видеоданные от исходного устройства 12 и изготавливать диск, содержащий кодированные видеоданные. Таким образом, компьютерно-читаемый носитель 16 можно рассматривать как включающий в себя один или более компьютерно-читаемых носителей различных типов, в различных примерах.

[0041] Входной интерфейс 28 устройства 14 назначения принимает информацию с компьютерно-читаемого носителя 16. Информация компьютерно-читаемого носителя 16 может включать в себя синтаксическую информацию, заданную видеокодером 20, которая также используется видеодекодером 30, который включает в себя элементы синтаксиса, которые описывают характеристики и/или обработку блоков и других кодированных единиц, например, GOP. Устройство 32 отображения отображает декодированные видеоданные пользователю и может содержать любое из различных устройств отображения, например, электронно-лучевую трубку (ЭЛТ), жидкокристаллический дисплей (ЖКД), плазменный дисплей, органо-светодиодный (ОСИД) или устройство отображения другого типа.

[0042] Видеокодер 20 и видеодекодер 30 может работать согласно стандарту кодирования видеосигнала, например, стандарту High Efficiency Video Coding (HEVC) в настоящее время находящемся в разработке, и может согласовываться с HEVC Test Model (HM). Альтернативно, видеокодер 20 и видеодекодер 30 могут работать согласно другим собственным или промышленным стандартам, например, стандарту ITU-T H.264, альтернативно именуемому MPEG-4, часть 10, Advanced Video Coding (AVC) или расширениям таких стандартов. Однако методы настоящего раскрытия не ограничиваются каким-либо конкретным стандартом кодирования. Другие примеры стандартов кодирования видеосигнала включают в себя MPEG-2 и ITU-T H.263. Хотя это не показано на фиг. 1, в некоторых аспектах, каждый из видеокодера 20 и видеодекодера 30 может быть объединен с аудиокодером и декодером, и может включать в себя надлежащие блоки мультиплексирования/демультиплексирования или другое аппаратное обеспечение и программное обеспечение, для осуществления кодирования аудиосигнала и видеосигнала в общем потоке данных или отдельных потоках данных. Если применимо, блоки мультиплексирования/демультиплексирования могут согласовываться с протоколом мультиплексора ITU H.223 или другими протоколами, например, протоколом пользовательских дейтаграмм (UDP).

[0043] Стандарт ITU-T H.264/MPEG-4 (AVC) был сформулирован ITU-T Video Coding Experts Group (VCEG) совместно с ISO/IEC Moving Picture Experts Group (MPEG) как продукта коллективного партнерств, известного как Joint Video Team (JVT). В некоторых аспектах, методы, описанные в настоящем раскрытии, могут применяться к устройствам, которые, в общем случае, согласуются со стандартом H.264. Стандарт H.264 описан в ITU-T Recommendation H.264, Advanced Video Coding для универсальных аудиовизуальных услуг, группой ITU-T Study Group и датирован мартом 2005 г., и может именоваться здесь стандартом H.264 или спецификацией H.264, или стандартом или спецификацией H.264/AVC. Joint Video Team (JVT) продолжает работать над расширениями H.264/MPEG-4 AVC.

[0044] Каждый из видеокодера 20 и видеодекодера 30 можно реализовать в виде любой из различных подходящих схем кодера, например, одном или более микропроцессоров, цифровых сигнальных процессоров (DSP), специализированных интегральных схем (ASIC), вентильных матриц, программируемых пользователем (FPGA), дискретной логики, программном обеспечении, аппаратном обеспечении, программно-аппаратном обеспечении или любых их комбинациях. Когда методы реализуются частично в программном обеспечении, в устройстве могут храниться инструкции для программного обеспечения на пригодном некратковременном компьютерно-читаемом носителе и оно может выполнять инструкции аппаратными средствами с использованием одного или более процессоров для осуществления методов настоящего раскрытия. Каждый из видеокодера 20 и видеодекодера 30 может входить в состав одного или более кодеров или декодеров, любой из которых может входить в состав объединенного кодера/декодера (кодека) в соответствующем устройстве.

[0045] JCT-VC работает над разработкой стандарта HEVC. Усилия по стандартизации HEVC базируются на развивающейся модели устройства кодирования видеосигнала, именуемой HEVC Test Model (HM). HM предусматривает несколько дополнительных возможностей устройств кодирования видеосигнала по сравнению с существующими устройствами согласно, например, ITU-T H.264/AVC. Например, в то время, как H.264 обеспечивает девять режимов кодирования с интра-предсказанием, HM может обеспечивать целых тридцать три режима кодирования с интра-предсказанием.

[0046] В целом, рабочая модель HM описывает, что кадр видео или изображение может делиться на последовательность древовидных блоков или наибольших единиц кодирования (LCU), которые включают в себя яркостные и цветностные выборки. Данные синтаксиса в битовом потоке могут задавать размер LCU, которая является наибольшей единицей кодирования в отношении количества пикселей. Слайс включает в себя некоторое количество последовательных древовидных блоков в порядке кодирования. Кадр видео или изображение можно разбивать на один или более слайсов. Каждый древовидный блок можно разбивать на единицы кодирования (CU) согласно квадродереву. В целом, структура данных квадродерева включает в себя по одному узлу на CU, причем корневой узел соответствует древовидному блоку. Если CU разбивается на четыре под-CU, узел, соответствующий CU, включает в себя четыре краевых узла, каждый из которых соответствует одной из под-CU.

[0047] Каждый узел структуры данных квадродерева могут обеспечивать данные синтаксиса для соответствующей CU. Например, узел в квадродереве может включать в себя флаг разбиения, указывающий, разбивается ли CU, соответствующая узлу, на под-CU. Элементы синтаксиса для CU можно задавать рекурсивно, и они могут зависеть от того, разбивается ли CU на под-CU. Если