Многоракурсное видеокодирование

Иллюстрации

Показать все

Изобретение относится к области кодирования видеоданных. Технический результат - обеспечение увеличения эффективности кодирования видео. Способ декодирования видеоданных содержит этапы, на которых получают только один раз из закодированного битового потока и для любого компонента ракурса первого ракурса, включающего в себя любой компонент ракурса, который используется в качестве точки произвольного доступа, и любой компонент ракурса, который не используется в качестве точки произвольного доступа, информацию опорных ракурсов, применимую к любому компоненту ракурса первого ракурса; для декодирования первого компонента ракурса в элементе доступа и в первом ракурсе включают одно или несколько потенциальных опорных изображений в список опорных изображений, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; и декодируют первый компонент ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений. 8 н. и 52 з.п. ф-лы, 18 табл., 12 ил.

Реферат

Это раскрытие притязает на приоритет предварительной заявки на патент США № 61/512,771, поданной 28 июля 2011 года, содержание которой включено в настоящий документ по ссылке во всей полноте.

ОБЛАСТЬ ТЕХНИКИ

Это раскрытие имеет отношение к видеокодированию.

УРОВЕНЬ ТЕХНИКИ

Возможности цифрового видео могут быть включены в широкий диапазон устройств, в том числе в цифровые телевизоры, системы цифрового прямого вещания, беспроводные системы вещания, карманные персональные компьютеры (PDA), ноутбуки или настольные компьютеры, планшетные компьютеры, устройства для чтения электронных книг, цифровые фотоаппараты, устройства цифровой записи, проигрыватели цифровых данных, устройства видеоигр, игровые приставки, сотовые или спутниковые радио-телефоны, так называемые "смарт-телефоны", устройства организации видеоконференций, устройства потоковой передачи видеоинформации и т.п. Цифровые видеоустройства реализуют методики сжатия видеоинформации, такие как описанные в стандартах MPEG 2, MPEG 4, ITU-T H.263, ITU-T H.264/MPEG-4 Часть 10, усовершенствованное видеокодирование (AVC), в разрабатываемом в настоящее время стандарте высокоэффективного видеокодирования (HEVC) и в расширениях таких стандартов. Видеоустройства могут передавать, принимать, кодировать, декодировать и/или сохранять информацию цифрового видео более эффективно посредством реализации таких методик сжатия видеоинформации.

Методики сжатия видеоинформации выполняют пространственное (внутри изображения) предсказание и/или временное (между изображениями) предсказание для уменьшения или удаления избыточности, свойственной последовательностям видеокадров. Для основанного на блоках видеокодирования видеосекция (то есть, изображение или часть изображения) может быть разделена на видеоблоки, которые могут также упоминаться как иерархические блоки, элементы кодирования (CU) и/или узлы кодирования. Видеоблоки во интра-кодированной (I) секции изображения кодируются с использованием пространственного предсказание относительно опорных отсчетов в соседних блоках в том же самом изображении. Видеоблоки в интер-кодированной (P или B) секции изображения могут использовать пространственное предсказание относительно опорных отсчетов в соседних блоках в одном и том же изображении или временное предсказании относительно опорных отсчетов в других опорных изображениях.

Пространственное или временное предсказание дает в результате блок предсказания для блока, который должен быть закодирован. Разностные данные представляют различия в пикселях между первоначальным блоком, который должен быть закодирован, и блоком предсказания. Интер-кодированный блок кодируется в соответствии с вектором движения, который указывает блок опорных отсчетов, формирующих блок предсказания, и разностных данных, указывающих различие между закодированным блоком и блоком предсказания. Интра-кодированный блок кодируется в соответствии с режимом интра-кодирования и разностными данными. Для дополнительного сжатия разностные данные могут быть преобразованы из области пикселей в область преобразования, что приводит к разностным коэффициентам преобразования, которые затем могут быть квантованы. Квантованные коэффициенты преобразования, первоначально расположенные в двухмерном массиве, могут быть просканированы, чтобы получить одномерный вектор коэффициентов преобразования, и может быть применено статистическое кодирование для достижения еще большего сжатия.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Это раскрытие в общем описывает методики для кодирования видеоданных. Например, это раскрытие описывает методики для выполнения многоракурсного видеокодирования (MVC) и для расширения MVC для стандарта видеокодирования HEVC, разрабатываемого в настоящее время. Таким образом, MVC представляет собой методику видеокодирования для инкапсуляции нескольких ракурсов видеоданных. Каждый ракурс может соответствовать отдельной точке обзора или углу, под которым были захвачены соответствующие видеоданные общей сцены. Методики этого раскрытия в общем имеют отношение к строению элементов сетевого уровня абстракции (NAL) MVC, множеств параметров MVC и т.п.

В примере аспекты этого раскрытия направлены на способ декодирования видеоданных, который содержит этапы, на которых получают из закодированного битового потока один или несколько элементов сетевого уровня абстракции (NAL) для каждого компонента ракурса множества компонентов ракурса закодированных видеоданных, причем каждый компонент ракурса множества компонентов ракурса соответствует общему временному местоположению, причем один или несколько элементов NAL инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса и включают в себя информацию, являющуюся показателем порядка декодирования соответствующих компонентов ракурса; получают из закодированного битового потока информацию, отдельную от элементов NAL, указывающую отношения между идентификаторами ракурса для ракурсов и порядком декодирования компонентов ракурса; и декодируют закодированных видеоданные множества компонентов ракурса в порядке декодирования на основе принятой информации.

В другом примере аспекты этого раскрытия направлены на устройство для декодирования видеоданных, которое содержит один или несколько процессоров, выполненных с возможностью получать из закодированного битового потока один или несколько элементов сетевого уровня абстракции (NAL) для каждого компонента ракурса множества компонентов ракурса закодированных видеоданных, причем каждый компонент ракурса множества компонентов ракурса соответствует общему временному местоположению, причем один или несколько элементов NAL инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса и включают в себя информацию, являющуюся показателем порядка декодирования соответствующих компонентов ракурса; получать из закодированного битового потока информацию, отдельную от элементов NAL, указывающую отношения между идентификаторами ракурса для ракурсов и порядком декодирования компонентов ракурса; и декодировать закодированные видеоданные множества компонентов ракурса в порядке декодирования на основе принятой информации.

В другом примере аспекты этого раскрытия направлены на устройству для декодирования видеоданных, которое содержит средство для получения из закодированного битового потока одного или нескольких элементов сетевого уровня абстракции (NAL) для каждого компонента ракурса множества компонентов ракурса закодированных видеоданных, причем каждый компонент ракурса множества компонентов ракурса соответствует общему временному местоположению, причем один или несколько элементов NAL инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса и включают в себя информацию, являющуюся показателем порядка декодирования соответствующих компонентов ракурса; средство для получения из закодированного битового потока информации, отдельной от элементов NAL, указывающей отношения между идентификаторами ракурса для ракурсов и порядок декодирования компонентов ракурса; и средство для декодирования закодированных видеоданных множества компонентов ракурса в порядке декодирования на основе принятой информации.

В другом примере аспекты этого раскрытия направлены на непереходной машиночитаемый носитель, имеющий сохраненные на нем команды, которые при исполнении заставляют один или несколько процессоров получать из закодированного битового потока один или несколько элементов сетевого уровня абстракции (NAL) для каждого компонента ракурса множества компонентов ракурса закодированных видеоданных, причем каждый компонент ракурса множества компонентов ракурса соответствует общему временному местоположению, причем один или несколько элементов NAL инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса и включают в себя информацию, являющуюся показателем порядка декодирования соответствующих компонентов ракурса; получать из закодированного битового потока информацию, отдельную от элементов NAL, указывающую отношения между идентификаторами ракурса для ракурсов и порядком декодирования компонентов ракурса; и декодировать закодированные видеоданные множества компонентов ракурса в порядке декодирования на основе принятой информации.

В другом примере аспекты этого раскрытия направлены на способ кодирования видеоданных, который содержит этапы, на которых кодируют видеоданные для множества компонентов ракурса для соответствующих ракурсов видеоданных, причем каждое множество компонентов ракурса соответствует общему временному местоположению; формируют как часть закодированного битового потока один или несколько элементов сетевого уровня абстракции (NAL) для закодированных видеоданных каждого из компонентов ракурса таким образом, что элементы NAL включают в себя информацию, являющуюся показателем порядка декодирования видеоданных соответствующих компонентов ракурса, и инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса; и предоставляют информацию в закодированном битовом потоке, отдельную от элементов NAL, указывающую отношения между идентификаторами ракурса для ракурсов и порядком декодирования компонентов ракурса.

В другом примере аспекты этого раскрытия направлены на устройство для кодирования видеоданных, устройство содержит один или несколько процессоров, выполненных с возможностью кодировать видеоданные для множества компонентов ракурса для соответствующих ракурсов видеоданных, причем каждое множество компонентов ракурса соответствует общему временному местоположению; формировать как часть закодированного битового потока один или несколько элементов сетевого уровня абстракции (NAL) для закодированных видеоданных каждого из компонентов ракурса таким образом, что элементы NAL включают в себя информацию, являющуюся показателем порядка декодирования видеоданных соответствующих компонентов ракурса, и инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса; и предоставлять информацию в закодированном битовом потоке, отдельную от элементов NAL, указывающую отношения между идентификаторами ракурса для ракурсов и порядком декодирования компонентов ракурса.

В другом примере аспекты этого раскрытия направлены на устройство для кодирования видеоданных кодирования, которое содержит средство для кодирования видеоданных для множества компонентов ракурса для соответствующих ракурсов видеоданных, причем каждое множество компонентов ракурса соответствует общему временному местоположению; средство для формирования как части закодированного битового потока одного или нескольких элементов сетевого уровня абстракции (NAL) для закодированных видеоданных каждого из компонентов ракурса таким образом, что элементы NAL включают в себя информацию, являющуюся показателем порядка декодирования видеоданных соответствующих компонентов ракурса, и инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса; и средство для предоставления информации в закодированном битовом потоке, отдельной от элементов NAL, указывающей отношения между идентификаторами ракурса для ракурсов и порядком декодирования компонентов ракурса.

В другом примере аспекты этого раскрытия направлены на непереходный машиночитаемый носитель, имеющий сохраненный на нем команды, которые при исполнении заставляют один или несколько процессоров кодировать видеоданные для множества компонентов ракурса для соответствующих ракурсов видеоданных, причем каждое множество компонентов ракурса соответствует общему временному местоположению; формировать как часть закодированного битового потока один или несколько элементов сетевого уровня абстракции (NAL) для закодированных видеоданных каждого из компонентов ракурса таким образом, что элементы NAL включают в себя информацию, являющуюся показателем порядка декодирования видеоданных соответствующих компонентов ракурса, и инкапсулируют по меньшей мере часть закодированных видеоданных для соответствующих компонентов ракурса; и предоставлять информацию в закодированном битовом потоке, отдельную от элементов NAL, указывающую отношения между идентификаторами ракурса для ракурсов и порядком декодирования компонентов ракурса.

В другом примере аспекты этого раскрытия направлены на способ декодирования видеоданных, содержащий этапы, на которых получают из закодированного битового потока и для любого компонента ракурса первого ракурса информацию опорного ракурсе, указывающую один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; для декодирования первого компонента ракурса в элементе доступа и в первом ракурсе включают одно или несколько потенциальных опорных изображений в список опорных изображений, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; и декодируют первый компонент ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений.

В другом примере аспекты этого раскрытия направлены на устройство для декодирования видеоданных, устройство содержит один или несколько процессоров, выполненных с возможностью получать из закодированного битового потока и для любого компонента ракурса первого ракурса информацию опорного ракурсе, указывающую один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; для декодирования первого компонента ракурса в элементе доступа и в первом ракурсе включать одно или несколько потенциальных опорных изображений в список опорных изображений, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; и декодировать первый компонент ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений.

В другом примере аспекты этого раскрытия направлены на устройство для декодирования видеоданных, устройство содержит средство для получения из закодированного битового потока и для любого компонента ракурса первого ракурса информации опорного ракурсе, указывающей один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; средство для включения одного или нескольких потенциальных опорных изображений в список опорных изображений для декодирования первого компонента ракурса в элементе доступа и в первом ракурсе, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; и средство для декодирования первого компонента ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений.

В другом примере аспекты этого раскрытия направлены на непереходный машиночитаемый носитель, имеющий сохраненные на нем команды, которые при исполнении заставляют один или несколько процессоров получать из закодированного битового потока и для любого компонента ракурса первого ракурса информацию опорного ракурсе, указывающую один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; для декодирования первого компонента ракурса в элементе доступа и в первом ракурсе включать одно или несколько потенциальных опорных изображений в список опорных изображений, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; и декодировать первый компонент ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений.

В другом примере аспекты этого раскрытия направлены на способ кодирования видеоданных содержащий этапы, на которых определяют для любого компонента ракурса первого ракурса информацию опорных ракурсов, указывающую один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; для кодирования первого компонента ракурса в элементе доступа и в первом ракурсе включают одно или несколько потенциальных опорных изображений в список опорных изображений, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; кодируют первый компонент ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений; и снабжают закодированный первый компонент ракурса определенной информацией опорных ракурсов в закодированном битовом потоке.

В другом примере аспекты этого раскрытия направлены на устройство для кодирования видеоданных, содержащее один или несколько процессоров, выполненных с возможностью определять для любого компонента ракурса первого ракурса информацию опорных ракурсов, указывающую один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; для кодирования первого компонента ракурса в элементе доступа и в первом ракурсе включать одно или несколько потенциальных опорных изображений в список опорных изображений, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; кодировать первый компонент ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений; и снабжать закодированный первый компонент ракурса определенной информацией опорных ракурсов в закодированном битовом потоке.

В другом примере аспекты этого раскрытия направлены на устройство для кодирования видеоданных, устройство содержит средство для определения для любого компонента ракурса первого ракурса информации опорных ракурсов, указывающей один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; средство для включения одного или нескольких потенциальных опорных изображений в список опорных изображений для кодирования первого компонента ракурса в элементе доступа и в первом ракурсе, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; средство для кодирования первого компонента ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений; и средство для снабжения закодированного первого компонента ракурса определенной информацией опорных ракурсов в закодированном битовом потоке.

В другом примере аспекты этого раскрытия направлены на непереходный машиночитаемый носитель, имеющий сохраненные на нем команды, которые при исполнении заставляют один или несколько процессоров определять для любого компонента ракурса первого ракурса информацию опорных ракурсов, указывающую один или несколько опорных ракурсов для предсказания компонентов ракурса первого ракурса; для кодирования первого компонента ракурса в элементе доступа и в первом ракурсе включать одно или несколько потенциальных опорных изображений в список опорных изображений, причем одно или несколько потенциальных опорных изображений содержат компоненты ракурса в элементе доступа и в опорных ракурсах, указанных информацией опорных ракурсов, причем количество потенциальных опорных изображений равно количеству опорных ракурсов; кодировать первый компонент ракурса на основе одного или нескольких потенциальных опорных изображений в списке опорных изображений; и снабжать закодированный первый компонент ракурса определенной информацией опорных ракурсов в закодированном битовом потоке.

Подробности одного или нескольких аспектов раскрытия изложены в приложенных чертежах и в приведенном ниже описании. Другие признаки, объекты и преимущества методик, описанных в этом раскрытии, будут понятны из описания и чертежей, а также из формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг. 1 - блок-схема, показывающая иллюстративную систему кодирования и декодирования видеоинформации, которая может использовать методики, описанные в этом раскрытии.

Фиг. 2 - блок-схема, показывающая иллюстративный видеокодер, который может реализовать методики, описанные в этом раскрытии.

Фиг. 3 - блок-схема, показывающая иллюстративный видеодекодер, который может реализовать методики, описанные в этом раскрытии.

Фиг. 4 - концептуальная схема, показывающая иллюстративный шаблон предсказания многоракурсного видеокодирования (MVC).

Фиг. 5A - концептуальная схема, иллюстрирующая пример структуры битового потока, который может использоваться в реализации одной или нескольких методик этого раскрытия.

Фиг. 5B - концептуальная схема, иллюстрирующая пример ракурса, который может быть включен в структуру битового потока на фиг. 5A.

Фиг. 5C - концептуальная схема, иллюстрирующая пример элемента сетевого уровня абстракции (NAL), который может быть включен в структуру битового потока на фиг. 5A.

Фиг. 5D - концептуальная схема, иллюстрирующая другой пример элемента NAL, который может быть включен в структуру битового потока на фиг. 5A.

Фиг. 6 - блок-схема последовательности операций, показывающая иллюстративный способ кодирования многоракурсного битового потока.

Фиг. 7 - блок-схема последовательности операций, показывающая иллюстративный способ декодирования многоракурсного битового потока.

Фиг. 8 - блок-схема последовательности операций, показывающая иллюстративный способ кодирования многоракурсного битового потока.

Фиг. 9 - блок-схема последовательности операций, показывающая иллюстративный способ декодирования многоракурсного битового потока.

ПОДРОБНОЕ ОПИСАНИЕ

Согласно некоторым системам видеокодирования оценка движения и компенсация движения могут использоваться для уменьшения временной избыточности в последовательности видеокадров для достижения сжатия данных. В этом случае может быть сформирован вектор движения, который идентифицирует прогнозирующий блок видеоданных, например, блок из другого изображения или секции видеоданных, который может использоваться для предсказания значения текущего кодируемого видеоблока. Значения прогнозирующего видеоблока вычитаются из значений текущего видеоблока для получения блока разностных данных. Информация движения (например, вектор движения, индексы вектора движения, направления предсказания или другая информация) передается от видеокодера видеодекодеру вместе с разностными данными. Декодер может определить местоположение этого же прогнозирующего блока (на основе вектора движения) и воссоздать закодированный видеоблок посредством комбинации разностных данных с данными прогнозирующего блока.

Многоракурсного видеокодирование (MVC) является стандартом видеокодирования для инкапсуляции нескольких ракурсов видеоданных. В общем случае каждый ракурс соответствует отдельной перспективе или углу, под которым были захвачены соответствующие видеоданные общей сцены. Закодированные ракурсы могут использоваться для трехмерного (3D) отображения видеоданных. Например, два ракурса (например, ракурсы левого и правого глаза зрителя) могут быть отображены одновременно или почти одновременного с использованием разной поляризации света, и зритель может носить пассивные поляризационные очки, с тем чтобы каждый из глаз зрителя принимал соответствующий ракурс. В качестве альтернативы, зритель может носить активные очки, которые независимо закрывают каждый глаз, и отображение может быстро чередоваться между изображениями для каждого глаза синхронно с очками.

В кодировании MVC конкретное изображение конкретного ракурса называется компонентом ракурса. Таким образом, компонент ракурса соответствует конкретному временному экземпляру ракурса. Многоракурсная видеоинформация может содержать относительно большое количество статистических зависимостей между ракурсами, поскольку все камеры, используемые для захвата многоракурсных данных, захватывают одну и ту же сцену с различных точек обзора. Такие зависимости могут быть использованы для объединенного временного предсказания и/или межракурсного предсказания, когда изображения предсказываются не только на основе соседних по времени изображений, но также и на основе соответствующих изображений из других ракурсов. Таким образом, межракурсное предсказание может быть выполнено среди изображений в одном и том же элементе доступа (то есть, в пределах одного и того же экземпляра времени).

Межракурсное предсказание обычно реализуется, как если бы компонент ракурса в другом ракурсе являлся ссылкой интер-предсказания. Вместо того, чтобы использовать векторы "движения" для предсказания, межракурсное предсказание использует векторы "смещения", которые концептуально подобны векторам движения, но описывают смещение, а не движение. Потенциальные ссылки между ракурсами сообщаются в расширении MVC множества параметров последовательности (SPS) и могут быть модифицированы посредством процесса построения списка опорных изображений, что обеспечивает возможность для гибкого порядка ссылок интер-предсказания или межракурсного предсказания.

Видеоданные, в том числе видеоданные кодирования MVC, могут быть организованы в элементы уровня сетевой абстракции (NAL), которые обеспечивают "благоприятное для сети" представление видеоинформации для таких применений, как видеотелефония, хранение, широковещание или потоковая передача. Например, видеокодер обычно кодирует каждое изображение видеоданных как одну или несколько независимо декодируемых секций. Секция может быть упакована в элементы NAL для передачи по сети. Элементы NAL, включающие в себя данные уровня видеокодирования (VCL), могут включать в себя данные для изображения или данные для секции изображения. Например, элементы NAL могут включать в себя информацию синтаксиса, такую как значения шаблона кодового блока (CBP), тип блока, режим кодирования, максимальный размер блока для закодированного элемента (например, кадр, секция, блок или последовательность) или другую информацию.

Каждый элемент NAL включает в себя заголовок, который идентифицирует тип данных, хранящихся в элементе NAL. Иллюстративный заголовок элемента NAL кодирования MVC может включать в себя синтаксические элементы, указывающие идентификатор ракурса для ракурса, которому принадлежит элемент NAL, принадлежит ли элемент NAL так называемому якорному изображению, которое может использоваться в качестве точки произвольного доступа (для ссылки на него другими компонентами ракурса), используется ли элемент NAL для межракурсного предсказания для элементов NAL в других ракурсах, и множество другой информации. Как описано здесь, якорное изображение обычно может соответствовать изображению произвольного доступа, и такие термины могут быть использованы взаимозаменяемо. Таким образом, "произвольный доступ" обычно относится к действию начала процесса декодирования для битового потока в точке, отличной от начала потока. Изображением произвольного доступа обычно называется изображение, которое содержит только интра-кодированную секцию (I-секцию). Закодированные изображения, которые следуют за изображением произвольного доступа в порядке декодирования и в порядке вывода, не предсказываются на основе изображений, предшествующих изображению произвольного доступа либо в порядке декодирования, либо в порядке вывода.

В общем случае элемент доступа может включать в себя все компоненты ракурса экземпляра конкретного времени. Конкретный компонент ракурса включает в себя все элементы NAL конкретного ракурса в экземпляре конкретного времени. Элемент NAL кодирования MVC может содержать однобайтовый заголовок элемента NAL (включающий в себя тип элемента NAL) и может также включать в себя расширение заголовка элемента NAL кодирования MVC.

В то время как стандарт H.264/AVC включает в себя поддержку кодирования MVC, текущее расширение кодирования MVC до стандарта H.264/AVC может содержать несколько неэффективных моментов относительно других стандартов видеокодирования. Кроме того, как обсуждено более подробно ниже, прямой импорт кодирования MVC из стандарта H.264/AVC в другие стандарты кодирования, такие как будущий стандарт HEVC, может являться невыполнимым. Методики этого раскрытия обычно имеют отношение к формированию связанных элементов NAL кодирования MVC, множествам параметров, относящихся к кодированию MVC, и т.п. Некоторые методики этого раскрытия могут обеспечить возможность для эффективного кодирования MVC для будущего стандарта HEVC.

Фиг. 1 является блок-схемой, показывающей иллюстративную систему 10 кодирования и декодирования видеоинформации, которая может использовать методики для предсказания вектора движения при многоракурсном кодировании. Как показано на фиг. 1, система 10 включает в себя устройство 12 источника, обеспечивающее закодированные видеоданные, которые должны быть позднее декодированы устройством 14 назначения. В частности, устройство 12 источника обеспечивает видеоданные для устройства 14 назначения через машиночитаемый носитель 16. Устройство 12 источника и устройство 14 назначения могут содержать любое из широкого диапазона устройств, включающего в себя настольные компьютеры, ноутбуки (или переносные компьютеры), планшетные компьютеры, телеприставки, переносные телефоны, такие как так называемые "интеллектуальные" телефоны (смартфоны), так называемые "интеллектуальные" клавиатуры, телевизоры, камеры, устройства отображения, проигрыватели цифровых данных, консоли видеоигр, устройство потоковой передачи видеоинформации и т.п. В некоторых случаях устройство 12 источника и устройство 14 назначения могут быть оборудованы беспроводной связью.

Устройство 14 назначения может принимать закодированные видеоданные, которые должны быть декодированы, через машиночитаемый носитель 16. Машиночитаемый носитель 16 может содержать носитель или устройство любого типа, способные переносить закодированные видеоданные от устройства 12 источника к устройству 14 назначения. В одном примере машиночитаемый носитель 16 может содержать средство связи для обеспечения возможности для устройства 12 источника передавать закодированные видеоданные непосредственно устройству 14 назначения в реальном времени.

Закодированные видеоданные могут быть модулированы в соответствии со стандартом связи, таким как протокол беспроводной связи, и переданы устройству 14 назначения. Средство связи может содержать любое средство беспроводной или проводной связи, такое как радиочастотный (RF) спектр или одна или несколько физических линий передачи. Средство связи может являться частью пакетной сети, такой как локальная сеть, широкомасштабная сеть или глобальная сеть, например, Интернет. Средство связи может включать в себя маршрутизаторы, переключатели, базовые станции или любое другое оборудование, которое может быть полезным для обеспечения возможности связи от устройства 12 источника до устройства 14 назначения.

В некоторых примерах закодированные данные могут быть выданы из выходного интерфейса 22 устройству хранения. Аналогичным образом, к закодированным данным может быть получен доступ от устройства хранения посредством входного интерфейса. Устройство хранения может включать в себя любой из множества распределенных или локально доступных носителей данных, таких как накопитель на жестком диске, диски Blu-ray, цифровые универсальные диски (DVD), компакт-диски (CD-ROM), флэш-память, энергозависимая или энергонезависимая память или любые другие подходящие цифровые носители для хранения закодированных видеоданных. В дополнительном примере устройство хранения может соответствовать файловому серверу или другому промежуточному устройству хранения, которое может хранить закодированную видеоинформацию, сформированную устройством 12 источника.

Устройство 14 назначения может осуществить доступ к сохраненным видеоданным от устройства хранения через потоковую передачу или загрузку. Файловый сервер может представлять собой сервер любого типа, способный хранить закодированные видеоданные и передавать эти закодированные видеоданные устройству 14 назначения. Иллюстративные файловые серверы включают в себя веб-сервер (например, для веб-сайта), сервер FTP, сетевые хранилища данных (NAS), или локальный дисковый накопитель. Устройство 14 назначения может осуществить доступ к закодированным видеоданным посредством любого стандартного соединения передачи данных, в том числе Интернет-соединения. Оно может включать в себя беспроводной канал (например, соединение Wi-Fi), проводное соединение (например, DSL, кабельный модем и т.д.) или их комбинацию, которая является подходящей для доступа к закодированным видеоданным, сохраненным на файловом сервере. Передача закодированных видеоданных от устройства хранения может представлять собой потоковую передачу, передачу загрузки или их комбинацию.

Методики этого раскрытия не обязательно ограничены приложениями или настройками в беспроводной связи. Методики могут быть применены к видеокодированию при поддержке любого из множества мультимедийных приложений, таких как эфирное телевещание, передачи кабельного телевидения, передачи спутникового телевидения, передачи потокового видео через Интернет, например, динамическая адаптивная потоковая передача по HTTP (DASH), цифровое видео, которое закодировано на носитель данных, декодирование цифрового видео, сохраненного на носителе данных, или других приложений. В некоторых примерах система 10 может быть выполнена с возможностью поддержки односторонней или двухсторонней передачи видеоинформации для поддержки таких приложений, как потоковая передача видеоинформации, воспроизведение видео, видеовещание и/или видеотелефония.

В примере на фиг. 1 устройство 12 источника включает в себя источник 18 видеоинформации, видеокодер 20 и выходной интерфейс 22. Устройство 14 назначения включает в себя входной интерфейс 28, видеодекодер 30 и устройство 32 отображения. В соответствии с этим раскрытием видеокодер 20 устройства 12 источника может быть выполнен с возможностью применять методики для предсказания вектора движения при многоракурсном кодировании. В других примерах устройство источника и устройство назначения могут включать в себя другие компоненты или устройства. Например, устройство 12 источника может принимать видеоданные от внешнего источника 18 видеоинформации, такого как внешняя камера. Аналогичным образом, устройство 14 назначения может взаимодействовать через интерфейс с внешним устройством отображения вместо того, чтобы включать в себя интегрированное устройство отображения.

Проиллюстрированная система 10 на фиг. 1 является лишь одним примером. Методики для предсказания вектора движения при многоракурсном кодировании могут быть выполнены любым устройством кодирования и/или декодирования цифрового видео. Хотя обычно методики этого раскрытия выполняются устройством кодирования видеоинформации, мето