Устройство кодирования видеосигнала, представляющего изображения, приемник телевизионного сигнала, включающего данные заголовков и полезные данные в виде сжатых видеоданных

Реферат

 

Изобретение относится к системам обработки телевизионного сигнала высокой четкости. Устройство для кодирования телевизионного сигнала, соответствующего изображению, содержит схему сжатия, формирующую в соответствии с сигналами источника видеосигналов высокой четкости кодовые слова СW, имеющие иерархические уровни и представляющие сжатые видеоданные, и кодовые слова Т, определяющие типы данных, представленных кодовыми словами СW. Схема выбора приоритета, реагирующая на кодовые слова СW, Т, разбивает кодовые слова СW на последовательности кодовых слов высокого и низкого приоритета, которые соответствуют сжатым видеоданным соответственно большей или меньшей значимости с точки зрения воспроизведения изображений. Технический результат заключается в том, что процессор передачи, реагирующий на последовательности кодовых слов высокого или низкого приоритета, формирует блоки передачи высокого и низкого приоритета кодовых слов соответственно высокого и низкого приоритета. Каждый блок передачи содержит заголовок, кодовые слова СW и контрольные биты обнаружения ошибок. Соответствующие блоки передачи поступают в схему прямого контроля ошибок, которая формирует дополнительные данные о контроле ошибок. Затем данные высокого и низкого приоритета поступают в модем, где они модулируют квадратурно по амплитуде соответствующие несущие для передачи данных. 2 с. и 10 з.п.ф-лы, 11 ил.

Данное изобретение относится к системе формирования и обработки телевизионного сигнала высокой четкости. Международной организацией по стандартизации внедрен стандартизированный код представления видеосигналов для цифровых носителей данных. Прежде всего этот стандарт предназначен для применения в цифровых носителях данных, обеспечивающих постоянную скорость передачи данных до 1.5 Мбит/с., например в компакт-дисках. Он используется в нечередующихся форматах изображения, имеющих порядка 288 строк по 352 элемента изображения в каждой и частоту кадров около 30 Гц. Стандарт приведен в документе "International Organization For Standardization", ISO-IEC JT(1/SC2/WG1), Coding of Moving Pictures and Associated Audio, MPEG 90/176/ Rev. 2, Dec. 18, 1990, который упоминается здесь в качестве ссылки при описании структуры основного формата кодирования. Далее по тексту система, описанная в этом документе, будет упоминаться как MPEG-система.

В MPEG-системе сжатие последовательных видеокадров происходит в соответствии с одним из трех типов алгоритмов сжатия: внутрикадрового кодирования (I), кодирования с предсказанием (Р) и кодирования с двухмерным предсказанием (В). Пример кодирования последовательных кадров с помощью указанных алгоритмов показан на фиг. 1B. На фиг. 1B обозначенные числами прямоугольники соответствуют длительностям последовательных кадров изображения. Буква над каждым прямоугольником обозначает тип кодирования соответствующего кадра.

При внутрикадровом кодировании кадр кодируется с использованием информации одного кадра таким образом, что во время декодирования кадр изображения может быть восстановлен полностью по одному кадру I-кодированной информации. Метод внутрикадрового кодирования включает дискретное косинусное преобразование данных изображения и последующее дифференциальное кодирование с помощью дифференциальной импульсно-кодовой модуляции (ДИКМ) полученных DC-коэффициентов, а также неравномерное кодирование дифференциально кодированных DC-коэффициентов и АC-коэффициентов.

Метод кодирования с предсказанием включает предсказание с компенсацией движения, формируемое по непосредственно предшествующему I-кодированному кадру (I-кадру) или P-кодированному кадру (P-кадру) или, другими словами, прямое предсказание. B этом режиме формируются векторы перемещения или движения, которые описывают перемещение фрагментов изображения предыдущего I или P кадра на соответствующие фрагменты текущего P кадра. Предсказанный кадр формируется с помощью векторов движения и видеоданных, относящихся к предыдущему I или P кадру. Затем вычисляются (на уровне элементов изображения) разности между текущим и предсказанным кадрами, и полученные значения, именуемые как остатки, последовательно преобразуются методом дискретного косинусного преобразования и кодируются методом неравномерного кодирования. Эти кодированные остатки и векторы движения образуют кодированные данные P кадра. Кадры изображения, кодируемые с помощью метода кодирования с двухмерным предсказанием, находятся между I и P кадрами или между P и P кадрами или между I и I кадрами и кодируются так же, как и P кадры, за исключением того, что для каждого кадра векторы движения формируются относительно последующего I или P кадра и предыдущего I или P кадра. Эти векторы движения анализируются на предмет наилучшего соответствия, и с помощью вектора, дающего наиболее точное предсказание фрагмента изображения, или с помощью взвешенного среднего значения предсказанных изображений с использованием вектора как прямого, так и обратного движения, формируется предсказанный кадр. Затем формируются остатки, которые преобразуются методом дискретного косинусного преобразования и кодируются методом неравномерного кодирования. Кодированные остатки и векторы движения образуют кодированные данные B кадра.

Информация яркости (Y) и цветности (U и V) кодируется раздельно, однако векторы движения яркости используются для формирования кадров, кодированных методами B и P как по яркости, так и по цветности. Векторы движения передаются только с яркостной информацией. В схемах кодирования и декодирования системы B кадры, подлежащие кодированию/декодированию методом двухмерного предсказания, предшествуют P или I кадрам, которые необходимы для кодирования/декодирования методом двухмерного предсказания. Поэтому естественная последовательность кадров перераспределяется для упрощения операций кодирования/декодирования. Подобное перераспределение порядка следования кадров показано на фиг. 1C и может быть реализовано путем записи последовательных кадров в буферное ЗУ определенной емкости и считывания кадров из него в требуемом порядке. Кодированные кадры передаются в перераспределенной последовательности, чтобы исключить перераспределения в декодере.

Устройство для избирательного выполнения трех типов сжатия описано, например, в статье Alain Artiere and Oswald Colavin "A Chip Set Core for Image Compression" и изготавливается фирмой SGS-Thomson Microelectronics, имеющей отделение Image Processing Business Unit, 17, avenie des martyrs-B.P. 217, Grenoble, France. Данная статья приводится в настоящем описании в качестве ссылки. Это устройство может использоваться для выполнения MPEG-кодирования с помощью соответствующей синхронизации для выбора типа сжатия соответствующих кадров и добавления средств запоминания и мультиплексирования для введения соответствующей информации заголовков в поток сжатых данных.

MPEG-стандарт предусматривает передачу 240 строк (стандарт НТСЦ) за кадр без чередования, что обычно выполняется путем кодирования только нечетных или только четных полей исходного видеосигнала при чересстрочной развертке или путем субдискретизации видеосигнала при прогрессивной развертке. Ни в том, ни в другом случае этот формат не обеспечивает воспроизведение изображения высокой четкости. Кроме того, так как MPEG-стандарт прежде всего предназначен для компьютерных дисплеев телевизионного изображения и передачи по специализированным линиям передачи, ошибок в битах практически не возникает, потому что каналы передачи относительно устойчивы к шумам. С другой стороны, если кодированный MPEG-сигнал предназначен для передачи наземной системой телевидения высокой четкости, могут возникать существенные ошибки в данных или искажения сигнала. В этом случае необходима специальная аппаратура для обеспечения приемлемого воспроизведения изображений.

Настоящее изобретение касается устройства для кодирования/декодирования телевизионного сигнала, передаваемого наземной системой, например, телевидения высокой четкости.

В первом варианте реализации изобретения представлен кодер телевизионного сигнала, например, высокой четкости, который содержит источник последовательности кодовых слов, представляющих сжатый видео-сигнал. Первые схемные средства, связанные с источником и реагирующие на кодовые слова, разбивают, в зависимости от количества данных видеосигнала, соответствующих заранее определенным фрагментам изображения, последовательность кодовых слов на последовательность кодовых слов высокого приоритета и последовательность кодовых слов низкого приоритета в зависимости от относительной значимости соответствующих кодовых слов с точки зрения воспроизведения изображения, а также выдают знаки для восстановления единой последовательности кодовых слов из последовательностей кодовых слов высокого и низкого приоритета. Вторые схемные средства, связанные с первыми средствами, формируют взаимноисключающие блоки передачи последовательностей кодовых слов высокого и низкого приоритета. Каждый блок передачи содержит заранее определенное количество битов, занятых кодовыми словами только высокого или низкого приоритета, данные заголовка блока передачи, включающие знаки для идентификации указанных данных, а также биты контроля ошибок указанных данных и указанных данных заголовка. Вторые схемные средства формируют первую последовательность блоков передачи, содержащую блоки передачи кодовых слов высокого приоритета, и вторую последовательность блоков передачи, содержащую блоки передачи кодовых слов низкого приоритета. Имеются средства прямого контроля ошибок для формирования данных исправления ошибок, соответствующих взаимоисключающим частям первой и второй последовательностей блоков передачи, а также для добавления соответствующих данных исправления ошибок к соответственным первой и второй последовательностям блоков передачи.

Другой вариант реализации изобретения представляет собой приемник телевизионного сигнала высокой четкости, содержащего сжатые видеоданные, неравномерно разделенные на уровне фрагментов изображения в пределах фрагмента изображения по каналам высокого и низкого приоритета, при этом данные в каналах высокого и низкого приоритета образуют блоки передачи заранее определенной емкости. Блоки передачи содержат данные заголовков блоков передачи, которые включают данные управления разбиением данных по каналам, данные сигнала, а также данные контроля ошибок в данных заголовка блока передачи и данных сигнала соответственных блоков передачи. Данные сигнала в каждом блоке представляют собой особый тип данных (т.е. видеоданные высокого приоритета и видеоданные низкого приоритета). Приемник содержит первые схемные средства для приема телевизионного сигнала и формирования первого и второго потоков данных, соответствующих блокам передачи, передаваемым по каналам соответственно высокого и низкого приоритета. Вторые схемные средства, связанные с первыми схемными средствами, формируют первую и вторую последовательности кодовых слов, которые соответствуют видеоданным соответственно высокого и низкого приоритета и из которых исключены данные заголовков блоков передачи, и дополнительную последовательность кодовых слов, соответствующих данным заголовков блоков передачи. Третьи схемные средства, связанные со вторыми электронными средствами и реагирующие на данные заголовков блоков передачи, содержащие управляющие данные, объединяют первую и вторую последовательности кодовых слов в третью последовательность кодовых слов. И, наконец, четвертые схемные средства, связанные с третьими схемными средствами, осуществляют декомпрессию третьей последовательности кодовых слов, соответствующих сжатым видеоданным, для формирования несжатого видеосигнала.

Изобретение поясняется чертежами, где На фиг. 1 представлены структурные схемы системы кодирования/декодирования телевизионного сигнала высокой четкости, выполненной в соответствии с данным изобретением.

На фиг. 1B-1C представлены графические изображения последовательностей полей/кадров кодированного видеосигнала, поясняющие описание изобретения.

На фиг. 2 представлено графическое изображение макроблока данных, формируемого схемой сжатия, показанной на фиг. 3.

На фиг. 3 представлена структурная схема-схемы сжатия видеосигнала.

На фиг. 3A представлено графическое изображение формата данных, формируемых схемой сжатия, показанной на фиг.3.

На фиг. 4 представлена структурная схема одного из возможных примеров реализации схемы 111 форматирования, показанной на фиг. 3.

На фиг. 5 представлена структурная схема одного из возможных примеров реализации схемы выбора приоритета, показанной на фиг.1.

На фиг. 5A представлена блок-схема алгоритма, описывающая работу анализатора, показанного на фиг. 5.

На фиг. 6 представлен формат сигнала, вырабатываемого процессором 12 передачи данных, показанным на фиг. 1.

На фиг. 7 представлена структурная схема одного из возможных примеров реализации процессора передачи, показанного на фиг. 1.

На фиг. 8 представлена структурная схема одного из возможных примеров реализации процессора 25 передачи данных, показанного на фиг. 1.

На фиг. 9 представлена структурная схема одного из возможных примеров реализации схемы 26 смешивания приоритетов, показанной на фиг. 1.

На фиг. 10 представлена структурная схема одного из возможных примеров реализации схемы 27 декомпрессии, показанной на фиг. 1.

На фиг. 11 представлена структурная схема одного из возможных примеров реализации модемов 17 и 20, показанных на фиг. 1.

Один из возможных вариантов системы телевидения высокой четкости, выполненной в соответствии с настоящим изобретением, формирует телевизионный сигнал из 1050 строк изображения с чередованием 2:1 при частоте кадров равной 59.94 кадров в секунду. Активная часть кадра состоит из 960 строк, каждая из которых содержит 1440 элементов изображения, при формате изображения 16: 9. Телевизионный сигнал передается с помощью двух 64-уровневых квадратурно-амплитудно модулированных несущих (64-КАМ), объединенных в полосе частот, равной 6 МГц. Номинальная скорость передачи данных, включая видеоданные, данные, относящиеся к звуковому сопровождению, и вспомогательные данные, составляет 26-29 Мбит/с.

Сначала видеосигнал сжимается, принимая формат типа MPEG-формата с той разницей, что используются оба поля каждого кадра, и плотность размещения элементов изображения выше. После этого кодовые слова MPEG-сигнала разбиваются на две последовательности бит в зависимости от относительной значимости соответственных кодовых слов. Эти две последовательности бит обрабатываются независимо друг от друга для формирования битов исправления ошибок и затем осуществляют квадратурно-амплитудную модуляцию соответствующих несущих. Модулированные несущие объединяются при передаче. Последовательности бит большей и меньшей значимости обозначаются соответственно как каналы высокого (HP) и низкого (LP) приоритета. Мощность передачи данных по каналу высокого приоритета примерно в два раза выше, чем по каналу низкого приоритета. Количество информации, передаваемой по каналу высокого приоритета, примерно в четыре раза меньше, чем по каналу низкого приоритета. Результирующая скорость передачи данных после прямого исправления ошибок примерно равна 4.5 Мбит/с для канала высокого приоритета и 18 Мбит/с для канала низкого приоритета.

На фиг. 1 представлен один из возможных примеров системы кодирования/декодирования телевизионного сигнала высокой четкости, выполненной в соответствии с настоящим изобретением. На фиг. 1 показана система, в которой осуществляется обработка одного входного видеосигнала, однако должно быть понятно, что яркостная и цветоразностные составляющие сжимаются отдельно друг от друга, а векторы движения яркостной составляющей используются при формировании сжатых цветоразностных составляющих. Сжатые яркостная и цветоразностные составляющие чередуются для формирования макроблоков перед распределением данных по каналам приоритетов.

Последовательность полей/кадров изображения, показанная на фиг. 1B, поступает в блок 5, в котором реализуется перераспределение последовательности полей/кадров так, как показано на фиг. 1C. Перераспределенная последовательность полей/кадров поступает в схему 10 сжатия, которая формирует последовательность сжатых кадров, кодированных в MPEG-подобном формате. Данный формат иерархический и показан в упрощенном виде на фиг. 3A.

Иерархический MPEG-формат содержит множество уровней, каждый из уровней имеет соответственный заголовок. Обычно каждый заголовок содержит начальный код, данные, относящиеся к соответствующему уровню, и резервные биты для расширения заголовка. Наибольшая часть данных заголовка (как говорится в вышеупомянутом MPEG-документе) необходима в целях синхронизации со средствами обеспечения MPEG-систем. При формировании сжатого видеосигнала в системах одновременной передачи цифрового телевизионного сигнала высокой четкости различными станциями требуется только описательная часть заголовка, а начальные коды и возможные расширения могут быть опущены. Уровни, соответствующие кодированному видеосигналу, показаны графически на фиг. 2.

При упоминании о MPEG-сигнале, формируемом данной системой, имеется в виду, что а) последовательные поля/кадры видеосигнала кодируются согласно требуемой последовательности I, P, B и б) кодированные данные видеосигнала на уровне изображения располагаются в MPEG-полосках или группах блоков, хотя количество полосок в поле/ кадре и количество макроблоков в ячейке может быть иным.

Кодированный выходной сигнал данной системы разбивается на группы полей/кадров (GOF), показанных в виде группы прямоугольников уровня L1 на фиг. 3A. Каждая группа полей/кадров (уровень L2) содержит заголовок, за которым следуют сегменты данных изображения (P1..Pn). Заголовок группы полей/кадров (GOF) содержит данные, относящиеся к горизонтальному и вертикальному размерам изображения, формату изображения, частоте полей/кадров, скорости передачи битов и т.д.

Данные изображения (уровень L3), соответствующие определенным полям/кадрам изображения, содержат заголовок, за которым следуют данные полоски (уровень L4). Заголовок данных изображения содержит номер поля/кадра и тип кодирования данных изображения. Каждая полоска (уровень L4) содержит заголовок, за которым следуют блоки данных (MBi). Заголовок полоски содержит номер группы и параметр квантования.

Каждый блок MBi (уровень L5) представляет собой макроблок данных и содержит заголовок, за которым следуют векторы движения (MV) и кодированные коэффициенты. Заголовки макроблоков содержат адрес макроблока, тип макроблока и параметр квантования. Кодированные коэффициенты представлены в уровне L6. Обратим внимание на то, что каждый макроблок состоит из шести блоков: четырех блоков яркостной составляющей Y, одного блока цветоразностной составляющей U и одного блока цветоразностной составляющей V сигнала, что показано на фиг. 2. Блок представляет собой матрицу элементов изображения размером, например, 8 на 8, над которой производится дискретное косинусное преобразование. Четыре смежных блока яркостной составляющей расположены в виде матрицы 2 на 2, образуя результирующую матрицу, например, размером 16 на 16 элементов изображения. Общая площадь блоков цветоразностных составляющих U и V такая же, что и площадь блоков яркостной составляющей. Т.е. перед сжатием цветоразностный сигнал субдискретизируется с коэффициентом дискретизации, равным двум, по горизонтали и вертикали относительно яркостного сигнала. Полоска данных соответствует данным, относящимся к прямоугольному фрагменту изображения, соответствующему области, представленной в виде группы смежных макроблоков.

Коэффициенты блока образуют один блок во время выполнения дискретного косинусного преобразования, при этом DC-коэффициент появляется первым, за ним следуют соответствующие AC-коэффициенты дискретного косинусного преобразования в порядке их относительной значимости. В конце каждого блока данных указывается КОД EOB конца блока.

Количество данных, формируемых схемой 10 сжатия, определяется контроллером 18 скорости передачи данных. Как известно, скорость передачи сжатых данных может изменяться, однако желательно, чтобы данные передавались с постоянной скоростью, равной пропускной способности канала передачи для более эффективной работы канала. Буферные схемы 13 и 14 выполняют преобразование скорости передачи данных из переменной в постоянную. Также известно, что количество данных, формируемых схемой сжатия, регулируется в соответствии с уровнем занятости буферных схем. Таким образом, буферные схемы 13 и 14 содержат схему выработки сигналов, указывающую на их уровень занятости. Эти сигналы поступают в контроллер 18 скорости для регулирования средней скорости передачи данных с выхода схемы 10 сжатия. Обычно регулирование осуществляется путем регулирования квантования коэффициентов дискретного косинусного преобразования. Уровни квантования могут быть различными для различных типов сжатия кадра. Более подробно один из возможных способов определения уровней квантования описан в заявке с N 494 098 от 15.03.90 на патент США, которая используется в данном описании в качестве ссылки.

Сжатые видеоданные в иерархическом формате, показанном на фиг. 3A, поступают в схему 11 выбора приоритета, которая распределяет кодированные данные между каналом HP высокого приоритета и каналом LP низкого приоритета. Данные высокого приоритета - это данные, потеря или разрушение которых вызывает наибольшие искажения при воспроизведении изображений. Иначе говоря, эти данные - тот минимум информации, который необходим для формирования изображения, хотя и недостаточно высокого качества. Данные низкого приоритета являются остальной информацией. Данные высокого приоритета содержат практически все типы заголовков в различных иерархических уровнях плюс DC-коэффициенты соответственных блоков и часть AC-коэффициентов соответственных блоков (уровень L6 на фиг. 3A).

Отношение количества данных высокого приоритета HP к количеству данных низкого приоритета LP составляет примерно 1:4. В процессоре передачи к передаваемому сигналу добавляются вспомогательные данные. Эти вспомогательные данные могут содержать цифровые данные звукового сопровождения и, например, данные телетекста. В этом случае по меньшей мере цифровые данные звукового сопровождения передаются по каналу высокого приоритета. Вычисляется усредненное количество вспомогательных данных, передаваемых по каналу высокого приоритета, и сравнивается с ожидаемым статистическим средним сжатых видеоданных. Отсюда вычисляется отношение количества сжатых видеоданных, передаваемых по каналу высокого приоритета, к количеству сжатых видеоданных, передаваемых по каналу низкого приоритета. Схема выбора приоритета распределяет данные, формируемые схемой 10 сжатия, согласно этому отношению.

Сжатые видеоданные высокого и низкого приоритета поступают в процессор 12 передачи, который а) разбивает потоки данных высокого и низкого приоритета на блоки передачи, б) выполняет контроль по четности или периодический контроль избыточности для каждого блока передачи и добавляет к нему соответствующие биты контроля по четности и в) мультиплексирует видеоданные высокого или низкого приоритета вспомогательными данными. Биты контроля по четности используются приемником для локализации ошибок вместе с синхронизирующими данными заголовков и для маскировки ошибок в случае, если в принятых данных имеются неисправляемые ошибки. Каждый блок передачи содержит заголовок, включающий данные, указывающие на тип данных в этом блоке, например, видеоданные, данные звукового сопровождения и указатели начальных точек данных, подобных сопутствующим данным.

Потоки данных высокого и низкого приоритета из процессора 12 передачи поступают в соответственные буферные схемы 13 и 14 преобразования скорости, которые преобразуют переменную скорость передачи сжатых видеоданных из процессора 12 в постоянную скорость. Данные высокого и низкого приоритета с установленной скоростью передачи поступают в схемы 15 и 16 кодирования с прямым исправлением ошибок, которые а) выполняют кодирование с прямым исправлением ошибок с помощью блочных кодов Рида-Соломона независимо для каждого из соответственных потоков данных, б) чередуют блоки данных, чтобы предотвратить искажение большими пакетами ошибок большой смежной области воспроизведенного изображения и в) дополняют данные, например, кодами Баркера для синхронизации потока данных в приемнике. Затем сигналы поступают в модем 17 передачи, где данные высокого приоритета модулируют квадратурно по амплитуде первую несущую, а данные низкого приоритета модулируют квадратурно по амплитуде вторую несущую, которая отстает от первой несушей приблизительно на 2.88 МГц. Ширина полосы пропускания модулированных первой и второй несущих на уровне 6 дБ составляет соответственно 0.96 МГц и 3.84 МГц. Мощность передачи первой модулированной несущей примерно на 9 дБ выше, чем мощность передачи второй несущей. Так как информация высокого приоритета передается с более высокой мощностью, ее искажение в канале передачи маловероятно. Несущая сигнала высокого приоритета расположена в части частотного спектра канала передачи, например, телевизионной системы НТСЦ, обычно занятого частично подавленной боковой полосой стандартного телевизионного сигнала НТСЦ. Эта часть спектра обычно существенно ослабляется с помощью фильтров Найквиста в стандартном приемнике НТСЦ, и поэтому телевизионные сигналы высокой четкости с данным форматом передачи не вносят внутриканальных радиопомех.

В приемнике передаваемый сигнал принимается модемом 20, который вырабатывает два сигнала, соответствующие данным каналов высокого и низкого приоритета. Эти два сигнала поступают в соответственные декодеры 21 и 22 с исправлением ошибок Рида-Соломона. После исправления ошибок сигналы поступают в буферные схемы 23 и 24 преобразования скорости, которые принимают данные с переменной скоростью, согласованной с требованиями последующей схемы декомпрессии. Данные высокого и низкого приоритета с переменной скоростью передачи поступают в процессор 25 передачи, который выполняет функции, обратные функциям, выполняемым процессором 12. Кроме этого он определяет коэффициент обнаружения ошибок на основании битов контроля по четности, которые содержатся в соответственных блоках передачи. Процессор 25 передачи формирует разделенные вспомогательные данные, данные высокого приоритета, данные низкого приоритета и сигнал ошибки Е. Последние три типа данных поступают в процессор 26 смешивания приоритетов, который изменяет формат данных высокого и низкого приоритета, преобразуя их в сигнал иерархической структуры, поступающий в схему 27 декомпрессии. Схема 27 декомпрессии выполняет функции, обратные функциям, выполняемым схемой 10 сжатия.

На фиг. 3 представлен один из возможных примеров устройства сжатия, которое может быть использовано в качестве схемы 10, показанной на фиг. 1, для формирования иерархически организованных сжатых видеоданных. Представленное устройство содержит только схемы, необходимые для формирования сжатых данных яркостного сигнала. Такое же устройство требуется для формирования сжатых данных цветоразностных сигналов U и V. Блоки 104 и 105 предназначены для вычисления векторов соответственно прямого и обратного движения. Поскольку вектор движения является вектором прямого или обратного движения в зависимости от того, анализируется ли текущее поле по отношению к предыдущему или последующему полю, то блоки 104 и 105 выполнены по одной схеме и фактически работают поочередно от поля к полю (от кадра к кадру), генерируя векторы прямого и обратного движения. Блоки 104 и 105 могут быть выполнены на интегральных схемах типа STI 3220 Motion Estimation Proccessor фирмы SGS-Thomson Microelectronics. Для обеспечения необходимой скорости обработки каждый из блоков 104 и 105 содержит несколько подобных интегральных схем, работающих одновременно, для различных областей изображения.

Блок 109 дискретного косинусного преобразования и квантования выполняет дискретное косинусное преобразование и квантование коэффициентов преобразования и может быть выполнен на интегральных схемах типа STV 3200 Discrete Cosine Transform фирмы SGS-Thomson Microelectronics. Блок 109 также содержит несколько таких интегральных схем, работающих параллельно, для параллельной обработки различных областей изображения.

Обратившись к фиг. 1C, представим, что в данный момент текущим кадром является кадр 16. Пришедший ранее P кадр 13 принят и записан в блок 101 буферной памяти В. Кроме того сформированный предсказанный кадр 13 хранится в одном из блоков 114 или 115 буферной памяти. При поступлении кадра 16 он запоминается в блоке 102 буферной памяти A. Кроме того кадр 16 поступает в блок 100 рабочей буферной памяти. При поступлении кадра 16 соответствующие блоки данных изображения подаются с блока 100 памяти на вход "уменьшаемое" схемы 108 вычитания. Во время сжатия I кадра на входе "вычитаемое" схемы 108 вычитания поддерживается уровень логического нуля и поэтому данные, передаваемые через схему 108 вычитания, остаются неизменными. Эти данные поступают в блок 109 дискретного косинусного преобразования и квантования, который формирует квантованные коэффициенты преобразования, необходимые для работы блоков 110 и 112. Блок 112 выполняет инверсное квантование и инверсное дискретное косинусное преобразование коэффициентов преобразования для формирования восстановленного изображения. Данные восстановленного изображения через сумматор 113 передаются в один из блоков 114 или 115 буферной памяти, где они запоминаются для использования при сжатии последующих В и P кадров. Во время сжатия I кадров через сумматор 113 не добавляется никакой информации к восстановленным в блоке 112 данным изображения.

Блок 110 выполняет две функции во время сжатия I кадра. Сначала он выполняет дифференциальное кодирование (ДИКМ) DC-коэффициентов, формируемых блоком 109. Затем он производит неравномерное кодирование ДИКМ-кодированных DC-коэффициентов, а также кодирование по нулевым промежуткам и неравномерное кодирование AC-коэффициентов, формируемых блоком 109. Кодированные методом неравномерного кодирования кодовые слова поступают в блок 111 форматирования, который разбивает данные и добавляет к ним данные заголовков в соответствии с уровнями, показанными на фиг. 3A. Кодированные данные с блока 111 поступают затем в схему выбора приоритета. Каждый из блоков 109, 110 и 111 работает под управлением системного контроллера 116 для обеспечения цикличности выполнения определенных операций в определенное время.

За кадром 16 поступает В кадр 14 и загружается в блок 100 буферной памяти. Данные, относящиеся к кадру 14, поступают также в блоки 104 и 105. Блок 104 принимает данные кадра 14 из блока 100 памяти и данные кадра 13 из блока 101 памяти и вычисляет векторы прямого движения для соответственных блоков данных размером 16 на 16 элементов изображения. Он также вырабатывает сигнал искажения, указывающий относительную точность соответственных векторов прямого движения. Векторы прямого движения и соответствующие сигналы искажения поступают в анализатор 106.

Блок 105 принимает данные кадра 14 из блока 100 памяти и данные I кадра 16 из блока 102 памяти и формирует векторы обратного движения и соответствующие сигналы искажения, которые также поступают в анализатор 106. Анализатор 106 сравнивает сигналы искажения с пороговой величиной, и если оба сигнала искажения превышают эту пороговую величину, то выдает оба вектора (прямого и обратного) движения в качестве вектора движения, а также вырабатывает сигнал, соответствующий отношению сигналов искажения. При восстановлении предсказанные изображения формируются как с помощью векторов прямого движения, так и с помощью векторов обратного движения и соответствующих данных кадра, из которых они получены. Интерполированный кадр формируется из кадров, полученных при прямом и обратном предсказании, в соответствии с отношением сигналов искажения. Если сигналы искажения для векторов прямого и обратного движения меньше пороговой величины, то в качестве вектора движения выбирается вектор движения с меньшим значением сигнала искажения.

После того, как вектор движения определен, он поступает в блок 107 предсказания с компенсацией движения, который выбирает соответствующий блок данных, заданный вектором, полученным из ранее восстановленного кадра 16 или кадра 13 или обоих сразу, хранящихся в блоках 114 и 115 памяти. Этот блок данных поступает на вход "вычитаемое" схемы 108 вычитания, где он вычитается поэлементно из соответствующего блока данных текущего кадра 14, поступающего с блока 100 буферной памяти. Затем полученные разности или, другими словами, остатки кодируются в блоке 109, и коэффициенты поступают в блок 110 кодирования с помощью ДИКМ и неравномерного кодирования. Вектор соответствующего блока данных также поступает в блок 110. Для В и P кадров DC-коэффициенты не кодируются с помощью ДИКМ, однако DC-коэффициенты и AC-коэффициенты подвергаются неравномерному кодированию. Векторы движения кодируются с помощью ДИКМ, и затем ДИКМ-кодированные векторы подвергаются неравномерному кодированию. Кодированные векторы и коэффициенты поступают затем в блок 111 форматирования. В кадры не подвергаются инверсному квантованию и инверсному преобразованию в блоке 112, так как они не используются в последующем кодировании.

P кадры кодируются подобным образом за исключением того, что в этом случае формируются только векторы прямого движения. Например, P кадр 19 кодируется с помощью векторов движения, объединяющих соответствующие блоки I кадра 16 и P кадра 19. Во время кодирования P кадров блок 112 формирует соответствующие декодированные остатки, а блок 107 формирует соответствующий предсказанный P кадр. Предсказанный кадр и остатки складываются в сумматоре 113 на уровне элементов изображения для формирования восстановленного кадра, который запоминается в одном из блоков 114 или 115 памяти, не содержащих данные кадра, по которым формируется предсказанный P кадр. Восстановленный и записанный в память P кадр используется для кодирования последующих B кадров. Отметим, что для P и В полей/кадров дискретные косинусные преобразования выполняются на уровне блоков (например, матриц из 8 на 8 элементов изображения), однако векторы движения вычисляются для макроблоков (например, для матрицы из 2 на 2 блоков яркостного сигнала или матрицы из 16 на 16 элементов изображения).

На фиг. 4 дан один из возможных вариантов схемы, которая может быть использована для выполнения функций блоков 110 и 111, показанных на фиг. 3. Формат выходных сигналов этой схемы отличается от обычного формата при МPEG-кодировании тем, что выходной MPEG- сигнал представляет собой последовательный по битам поток данных, а данные, формируемые схемой, показанной на фиг. 4, передаются в формате параллельных по битам слов. Данный формат выбран для того, чтобы упростить выполнение процессора выбора приоритета и процессора передачи. Кроме этого вырабатываются два дополнительных сигнала, которые определяют тип каждого выходного кодового слова CW, и его длину CL.

На фиг. 4 векторы движения с анализатора 106, показанного на фиг. 3, кодируются дифференциально в блоке 127 ДИКМ на уровне полосок и затем поступают в мультиплексор 129 через блок 133 буферной памяти. Коэффициенты преобразования из блока 109 преобразования передаются в мультиплексор 132 и блок 128 ДИКМ. ДИКМ-кодированные коэффициенты с блока 128 подаются на второй вход мультиплексора 132. Во время кодирования P или B кадров все коэффициенты передаются непосредственно через мультиплексор 132. Во время кодирования I кадров DC-коэффициенты кодируются избирательно с помощью дифференциального кодирования в блоке 128 ДИКМ. ДИКМ-кодированные DC-коэффициенты и не кодированные с помощью дифференциального кодирования AC-коэффициенты через мультиплексор 132 и блок 133 буферной памяти поступают на второй вход мультиплексора 129. Данные заголовка с блока 126 управления форматом и хранения заголовков передаются на третий вход мультиплексора 129. Блок 126 осуществляет хран