Способ преобразования цифрового сигнала изображения и устройство для его реализации
Иллюстрации
Показать всеИзобретение относится к телевизионной технике, в частности к передаче видеосигналов по узкополосным каналам, и касается улучшения качества изображений при реализации цифрового кодирования видеосигнала для сужения его полосы частот. Технический результат заключается в улучшении качества сигнала изображения. Технический результат достигается тем, что в известное устройство преобразования цифрового сигнала изображения вводят блок коррекции, две линии задержки, генератор тактовых импульсов, что позволяет кодированием из цифрового сигнала блочного формата полукадров яркостной составляющей телевизионного сигнала изображения выделить интервалы сигналов строк, в пределах которых значение сигналов межстрочной разности превышает заранее заданное пороговое значение, сформировать соответствующие этим интервалам сигналы управления фиксированного уровня, совместить во времени и вычесть сигналы смежных полей кадров изображения, полученные сигналы межполевой разности привести к нулевому уровню в интервалах, совпадающих с наличием сформированных сигналов управления, а полученные в результате этого преобразованные сигналы межполевой разности совместить во времени и суммировать с сигналами смежных полей изображения. 2 н.п. ф-лы, 24 ил.
Реферат
Изобретение относится к телевизионной технике, в частности к передаче видеосигналов по узкополосным каналам, и касается улучшения качества изображений при реализации цифрового кодирования видеосигнала для сужения его полосы частот.
Известен способ передачи и приема полного цветового телевизионного сигнала изображения и устройство для его реализации, сокращающие полосу частот передаваемого телевизионного сигнала (авторское свидетельство СССР №1370796), основанные на ограничении по частоте и сжатии во времени сигнала яркости в четных (нечетных) полях, содержащих сигналы четных (нечетных) строк. Сигнал цветности в различных полях формируют из сигнала разности между цветоразностным сигналом соответствующих полей. Формирование передаваемого телевизионного сигнала осуществляют путем преобразования по масштабу во времени и размещения в течение телевизионной строки последовательно во времени сигналов синхронизации, сигнала цветности и сигнала яркости.
Недостатками данного способа являются масштабные укрупнения шумовых составляющих сигнала передачи и искажения структуры изображений в пространстве кадра, в межкадровом и цветовом направлениях, которые проявляются нарушением качества передачи движения, появлением цветовых окантовок на границах объектов в пространстве кадра и при их движении, мельканиями фона изображения и др.
Известно устройство для передачи и приема полного цветового телевизионного сигнала (авторское свидетельство СССР №1370796), содержащее блок разделения сигналов яркости и цветности, выход которого соединен с входом блока временного согласования, выходы которого соединены через ФНЧ с входом блока вычитания цветоразностных сигналов соответствующих полей и с входами блоков коммутации, выходы которых через ЗУ соединены с входом блока формирования сигнала передачи.
Недостатками данного устройства являются укрупнение в пространстве и во времени шумовых составляющих, расслоение переходных искажений и появление заметных искажений при передаче движущихся объектов.
Наиболее близким по технической сущности является способ передачи [Ю.Б.Зубарев, М.И.Кривошеев, И.Н.Красносельский. Цифровое телевизионное вещание: основы, методы, системы. - М.: НИИР, 2001, стр.188], заключающийся в том, что телевизионный сигнал, состоящий из сигналов кадров изображения, содержащих соответствующие сигналы четных и нечетных полей трех основных цветов, формируют сигнал яркости и два цветоразностных сигнала, фильтруют по низкой частоте, преобразуют аналоговый сигнал в цифровой сигнал изображения блочного формата, кодируют, при этом объединяют сигналы кадров, содержащих информацию о яркости и цветности, изменяют порядок следования сигналов кадров изображения блочного формата, так что первый кадр сохраняет свое положение, а в последующих группах из трех кадров изменяют положение кадров, так что каждый третий в группе кадр занимает место первого кадра, каждый второй кадр занимает место третьего кадра, каждый первый кадр занимает место второго кадра, преобразуют через n-групп сигналы кадров изображения блочного формата в совокупность независимых частотных спектральных составляющих, полученные значения уровней каждой из составляющих преобразованных n-х кадров делят на коэффициенты, соответствующие каждой частотной спектральной составляющей, и квантуют по амплитуде, квантованные значения амплитуд спектральных составляющих преобразуют в энтропийном кодере, одновременно подвергают умножению на коэффициенты, соответствующие каждой частотной спектральной составляющей, и получают из квантованных значений амплитуд спектральных составляющих значения их уровней, совокупность которых затем преобразуют в сигналы кадров изображения, содержащие сигналы четных и нечетных полей блочного формата, формируют в периодах между n-ми кадрами сигнал, соответствующий различиям в относительном положении сигналов блочного формата последовательных кадров изображения в структуре совокупности их сигналов строк, который преобразуют в энтропийном кодере, одновременно формируют последовательные сигналы предсказанных кадров изображения блочного формата с использованием сигнала, соответствующего различиям в относительном положении сигналов блочного формата сигналов кадров изображения, вычитают сигналы предсказанных кадров изображения блочного формата из соответствующих сигналов измененной последовательности кадров изображения блочного формата, результирующий сигнал межкадровой разности блочного формата преобразуют в совокупность независимых частотных спектральных составляющих, полученные значения уровней каждой из составляющих делят на коэффициенты, соответствующие каждой частотной спектральной составляющей, и квантуют по амплитуде, квантованные значения амплитуд спектральных составляющих преобразуют в энтропийном кодере и передают совокупность квантованных и преобразованных значений амплитуд спектральных составляющих отдельных кадров, сигнал различий в относительном положении сигналов блочного формата кадров и квантованные значения амплитуд межкадровой разности блочного формата.
Недостатком данного способа является то, что при преобразовании сигналов кадров изображения блочного формата, включающих сигналы четных и нечетных полей изображения, содержащих искажения геометрической структуры на границах движущихся объектов изображения, вызванные различным положением движущихся участков изображения в четных и нечетных полях (эффект расчески) одного кадра, в совокупности частотных спектральных составляющих значительно возрастают значения амплитуд, соответствующих вышеуказанным искажениям структуры спектральных составляющих, что снижает эффективность работы сжимающего кодера и приводит к снижению четкости и искажениям яркости участков изображения.
Наиболее близким по технической сущности для реализации способа является устройство [Ю.Б.Зубарев, М.И.Кривошеев, И.Н.Красносельский. Цифровое телевизионное вещание: основы, методы, системы. - М.: НИИР, 2001, стр.188], содержащее матрицу преобразования, первый выход которой через первый ФНЧ подключен к сигнальном входу первого АЦП, второй выход через второй ФНЧ - к сигнальному входу второго АЦП, а третий выход через третий ФНЧ - к сигнальному входу третьего АЦП, каждый из трех входов матрицы преобразования подключен соответственно к одному из сигналов трех основных цветов, и сжимающий кодер.
Недостатком данного устройства является то, что при преобразовании сигналов кадров изображения блочного формата, включающих сигналы четных и нечетных полей изображения, содержащих чересстрочные искажения геометрической структуры на границах движущихся объектов изображения, вызванные различным положением движущихся участков изображения в четных и нечетных полях (эффект расчески) одного кадра, в совокупности частотных спектральных составляющих значительно возрастают значения амплитуд, соответствующих чересстрочным искажениям структуры спектральных составляющих, что снижает эффективность работы сжимающего кодера и приводит к снижению четкости и искажениям яркости участков изображения.
Задачей, на решение которой направлено предлагаемое изобретение, является улучшение качества сигнала изображения за счет преобразования сигналов четных и нечетных полей исходного кадра изображения в сигналы кадров изображения с устранением в смежных кадрах чересстрочных искажений геометрической структуры на границах движущихся объектов изображения.
Для решения поставленной задачи в способе преобразования цифрового сигнала изображения телевизионный сигнал, состоящий из сигналов кадров изображения, содержащих соответствующие сигналы четных и нечетных полей трех основных цветов, формируют сигнал яркости и два цветоразностных сигнала, фильтруют по низкой частоте, преобразуют аналоговый сигнал в цифровой сигнал изображения блочного формата, кодируют, при этом объединяют сигналы кадров, содержащих информацию о яркости и цветности, изменяют порядок следования сигналов кадров изображения блочного формата, так что первый кадр сохраняет свое положение, а в последующих группах из трех кадров изменяют положение кадров так, что каждый третий в группе кадр занимает место первого кадра, каждый второй кадр занимает место третьего кадра, каждый первый кадр занимает место второго кадра, преобразуют через n-групп сигналы кадров изображения блочного формата в совокупность независимых частотных спектральных составляющих, полученные значения уровней каждой из составляющих преобразованных n-х кадров делят на коэффициенты, соответствующие каждой частотной спектральной составляющей, и квантуют по амплитуде, квантованные значения амплитуд спектральных составляющих преобразуют в энтропийном кодере, одновременно подвергают умножению на коэффициенты, соответствующие каждой частотной спектральной составляющей, и получают из квантованных значений амплитуд спектральных составляющих значения их уровней, совокупность которых затем преобразуют в сигналы кадров изображения, содержащие сигналы четных и нечетных полей блочного формата, формируют в периодах между n-ми кадрами сигнал, соответствующий различиям в относительном положении сигналов блочного формата последовательных кадров изображения в структуре совокупности их сигналов строк, который преобразуют в энтропийном кодере, одновременно формируют последовательные сигналы предсказанных кадров изображения блочного формата с использованием сигнала, соответствующего различиям в относительном положении сигналов блочного формата сигналов кадров изображения, вычитают сигналы предсказанных кадров изображения блочного формата из соответствующих сигналов измененной последовательности кадров изображения блочного формата, результирующий сигнал межкадровой разности блочного формата преобразуют в совокупность независимых частотных спектральных составляющих, полученные значения уровней каждой из составляющих делят на коэффициенты, соответствующие каждой частотной спектральной составляющей, и квантуют по амплитуде, квантованные значения амплитуд спектральных составляющих преобразуют в энтропийном кодере и передают совокупность квантованных и преобразованных значений амплитуд спектральных составляющих отдельных кадров, сигнал различий в относительном положении сигналов блочного формата кадров и квантованные значения амплитуд межкадровой разности блочного формата, перед кодированием из цифрового сигнала блочного формата полукадров яркостной составляющей телевизионного сигнала изображения выделяют интервалы сигналов строк, в пределах которых значение сигналов межстрочной разности превышает пороговое значение амплитуды, формируют соответствующие этим интервалам сигналы управления фиксированного уровня, совмещают во времени и вычитают сигналы смежных полей кадров изображения, полученные сигналы межполевой разности приводят к нулевому уровню в интервалах, совпадающих с наличием сформированных сигналов управления, а полученные в результате этого преобразованные сигналы межполевой разности совмещают во времени и суммируют с сигналами четных (нечетных) полей изображения.
Для устранения указанных искажений в устройство (фиг.1), содержащее матрицу преобразования, первый выход которой через первый ФНЧ подключен к сигнальному входу первого АЦП, второй выход через второй ФНЧ - к сигнальному входу второго АЦП, а третий выход через третий ФНЧ - к сигнальному входу третьего АЦП, каждый из трех входов матрицы преобразования подключен соответственно к одному из сигналов трех основных цветов, и сжимающий кодер, введены блок коррекции, первая и вторая линии задержки, генератор тактовых импульсов, причем выход первого АЦП через блок коррекции соединен с первым входом сжимающего кодера, выход второго АЦП через первую линию задержки соединен с вторым входом сжимающего кодера, выход третьего АЦП через вторую линию задержки соединен с третьим входом сжимающего кодера, первый выход генератора тактовых импульсов подключен к входу синхронизации первого АЦП, а второй выход генератора тактовых импульсов подключен к входам синхронизации второго и третьего АЦП, третий выход генератора тактовых импульсов подключен к входу синхронизации блока коррекции и к первому входу синхронизации сжимающего кодера, второй вход синхронизации которого подключен к четвертому выходу генератора тактовых импульсов.
В результате полученное сжатое изображение не будет содержать искажения границ движущихся объектов в пределах кадра и будет иметь лучшее качество передачи движущихся объектов при фиксированном коэффициенте сжатия.
На фиг.1 показано устройство, реализующее способ преобразования цифрового сигнала изображения, где 1 - матрица преобразования, 2 - первый ФНЧ, 3 - первый АЦП, 4 - блок коррекции, 5 - второй ФНЧ, 6 - второй АЦП, 7 - первая линия задержки, 8 - третий ФНЧ, 9 - третий АЦП, 10 - вторая линия задержки, 11 - генератор тактовых импульсов, 12 - сжимающий кодер;
Фиг.2 - кадр изображения с искажениями границ движущихся объектов;
Фиг.3 - поля изображения (а - нечетное поле, б - четное поле), содержащие движущийся квадрат (1) и неподвижный квадрат (2);
Фиг.4 - сигнал временной разности;
Фиг.5 - кадр изображения без искажений;
Фиг.6 - последовательность кадров и направление предсказания движения;
Фиг.7 - матрица преобразования (1), где 13 - кодирующая матрица, 14 - первый умножитель, 15 - второй умножитель;
Фиг.8 - блок коррекции (4), где 16 - третья линия задержки, 17 - четвертая линия задержки, 18 - первый вычитатель, 19 - первый детектор, 20 - четвертый ФНЧ, 21 - первый амплитудный ограничитель, 22 - первый логический элемент "ИЛИ", 23 - второй вычитатель, 24 - второй детектор, 25 - пятый ФНЧ, 26 - второй амплитудный ограничитель, 27 - пятая линия задержки, 28 - шестая линия задержки, 29 - третий вычитатель, 30 - блок выделения сигналов временной разности, 31 - первый ключ, 32 - первый сумматор;
Фиг.9 - блок выделения сигналов временной разности (30), где 33 - второй логический элемент "ИЛИ", 34 - первый переключатель, 35 - первый логический элемент "НЕ", 36 - второй сумматор;
Фиг.10 - сжимающий кодер (12), где 37 - блок объединения цифровых потоков, 38 - блок управления режимом кодирования, 39 - блок управления квантованием, 40 - блок перестановки кадров, 41 - четвертый вычитатель, 42 - второй переключатель, 43 - блок дискретного косинусного преобразования, 44 - квантователь, 45 - энтропийный кодер, 46 - инверсный квантователь, 47 - блок обратного дискретного косинусного преобразования, 48 - второй ключ, 49 - третий сумматор, 50 - блок компенсации движения, 51 - первое ЗУ, 52 - второе ЗУ, 53 - блок оценки движения, 54 - первый буфер;
Фиг.11 - блок объединения цифровых потоков (37), где 55 - третий ключ, 56 - восьмая линия задержки, 57 - четвертый ключ, 58 - первый делитель частоты, 59 - второй делитель частоты, 60 - первый логический элемент "И", 61 - седьмая линия задержки, 62 - девятая линия задержки, 63 - десятая линия задержки, 64 - пятый ключ, 65 - четвертый сумматор;
Фиг.12 - блок перестановки кадров (40), где 66 - третье ЗУ, 67 - шестой ключ, 68 - одиннадцатая линия задержки, 69 - пятый сумматор, 70 - седьмой ключ, 71 - двенадцатая линия задержки, 72 - шестой сумматор, 73 - восьмой ключ, 74 - первый триггер, 75 - второй логический элемент "НЕ", 76 - седьмой сумматор, 77 - второй триггер, 78 - тринадцатая линия задержки, 79 - первый счетчик, 80 - второй счетчик, 81 - третий триггер;
Фиг.13 - блок дискретного косинусного преобразования (43), где 82 - восьмой сумматор, 83 - четвертое ЗУ, 84 - 91 - пятое - двенадцатое ЗУ, 92 - 98 - первый - седьмой регистры, 99 - 106 - первый - восьмой арифметико-логический блоки, 107 - девятый сумматор;
Фиг.14 - арифметико-логический блок (первый - восьмой), где 108 - третий умножитель, 109 - десятый сумматор, 110 - восьмой регистр;
Фиг.15 - квантователь (44), где 111 - тринадцатое ЗУ, 112 - третий счетчик, 113 - третий переключатель, 114 - четырнадцатое ЗУ, 115 - четвертый умножитель, 116 - пятый умножитель, 117 - пятнадцатое ЗУ, 118 - первый компаратор, 119 - одиннадцатый сумматор;
Фиг.16 - инверсный квантователь (46), где 120 - четвертый счетчик, 121 - шестой умножитель, 122 - седьмой умножитель, 123 - четвертый переключатель, 124 - шестнадцатое ЗУ, 125 - семнадцатое ЗУ;
Фиг.17 - блок оценки движения (53), где 126 - пятый переключатель, 127 - пятый счетчик, 128 - формирователь адреса, 129 - восемнадцатое ЗУ, 130 - блок вычисления, 131 - девятнадцатое ЗУ, 132 - пятый вычитатель, 133 - двадцатое ЗУ, 134 - первый блок сравнения;
Фиг.18 - блок вычисления (130), где 135 - шестой вычитатель, 136 - блок вычисления абсолютного значения, 137 - девятый регистр;
Фиг.19 - блок компенсации движения (50), где 138 - шестой счетчик, 139 - двенадцатый сумматор, 140 - двадцать первое ЗУ, 141 - двадцать второе ЗУ, 142 - двадцать третье ЗУ, 143 - тринадцатый сумматор, 144 - седьмой счетчик, 145 - четырнадцатый сумматор, 146 - двадцать четвертое ЗУ, 147 - двадцать пятое ЗУ, 148 - восьмой счетчик, 149 - пятнадцатый сумматор, 150 - двадцать шестое ЗУ, 151 - двадцать седьмое ЗУ, 152 - девятый счетчик, 153 - шестой переключатель;
Фиг.20 - энтропийный кодер (45), где 154 - блок преобразования, 155 - шестнадцатый сумматор, 156 - второй компаратор, 157 - четвертый триггер, 158 - седьмой переключатель, 159 - десятый регистр, 160 - одиннадцатый регистр, 161 - семнадцатый сумматор;
Фиг.21 - блок преобразования (154), где 162-213 - второй - пятьдесят третий блоки сравнения, 214 - восемнадцатый сумматор, 215 - девятнадцатый сумматор;
Фиг.22 - блок сравнения (второй - пятьдесят третий), где 216 - двенадцатый регистр, 217 - седьмой вычитатель, 218 - третий компаратор, 219 - девятый ключ, 220 - тринадцатый регистр, 221 - двадцать восьмое ЗУ, 222 - двадцать девятое ЗУ, 223 - десятый ключ;
Фиг.23 - блок управления квантованием, где 224 - тридцатое ЗУ, 225 - восьмой вычитатель, 226 - десятый счетчик, 227 - делитель, 228 - блок округления;
Фиг.24 - блок управления режимом кодирования, 229 - одиннадцатый счетчик, 230 - четвертый компаратор.
Применяемая в настоящее время в нашей стране система вещательного телевидения SECAM использует чересстрочное разложение телевизионного растра, представляемого в виде двух полей, передаваемых за период кадра. При представлении динамических изображений в процессе преобразования (сжатия) в виде совмещения в пространстве растра двух полей, следующих с частотой 50 Гц, возникают специфические искажения границ движущихся объектов (фиг.2), вызванные различным положением движущихся объектов в двух полях одного кадра изображения.
Фактически, пространственная структура в пределах каждого из изображений четного и нечетного полей отличается не только за счет относительного смещения движущихся объектов, но и за счет различной фазы строк в пределах растра нечетного поля. На фиг.3 представлены поля изображения (а - нечетное поле, б - четное поле), содержащие движущийся квадрат (1) и неподвижный квадрат (2).
Можно заметить, что структура изображения подвижного квадрата отличается в смежных (четном и нечетном) полях не только за счет несовпадения положения внутриполевого растра, отражающего данный объект. Вторая составляющая собственно определяет появление пространственной разности изображений.
Для определения сигналов пространственной разности, соответствующих горизонтальным границам неподвижных деталей изображения, необходимо текущее поле смещать в вертикальном в пространстве растра направлении относительно опорного положения в пространстве растра на ±2 строки и вычитать соответствующие смещенные поля из опорного.
Для изображения неподвижного квадрата имеет место лишь пространственная разность изображений, которая в данном конкретном примере определяется изменением числа строк, отражающих неподвижный квадрат в четном и нечетном полях.
В связи с этим при вычитании сигналов двух смежных полей сигнал разности в общем случае содержит составляющие как пространственной, так и временной разности. Соответственно, сигнал данного типа не может быть использован для высококачественного сжатия сигнала по межкадровому направлению.
Сигнал пространственной разности, который возникает при вычитании сигналов совмещенных полей, не позволяет скомпенсировать эффект "расчески" в сигнале временной разности без мешающего действия сигнала пространственной разности. Этот сигнал при сжатии как раз и вызывает расширение спектра и дискретность сигнала временной разности в вертикальном по растру направлении, что в конечном итоге приводит к уменьшению степени сжатия или увеличению искажений подвижных участков в ТВ изображениях при их сжатии.
В момент прихода сигнала управления выделяется сигнал, соответствующий временной разности из сигнала пространственно-временной разности. Полученный сигнал временной разности (фиг.4) вводится только в сигнал четного поля, т.е. через одно поле. В результате этого компенсируются составляющие движения и при формировании кадра изображения на нем будут отсутствовать искажения в виде "расчески" подвижных элементов изображения (фиг.5).
Обработанные таким способом нечетные и четные поля изображения преобразуют в соответствующие кадры изображения (фиг.6), которые далее кодируют. Для этого поблочно выполняют дискретное косинусное преобразование (ДКП), для чего ТВ изображение разбивается на блоки. Каждый блок - квадратная матрица. Ее размеры: 8 отсчетов (строк) по вертикали и 8 отсчетов по горизонтали. Таким образом, матрица содержит 8×8=64 отсчета ТВ сигнала. Она называется сигнальной матрицей. При этом в ТВ кадре создается: 576/8=72 зоны по вертикали и 704/8=88 зон по горизонтали, что в общей сложности дает: 72×88=6336 блоков, подлежащих ДКП в реальном масштабе времени. В результате ДКП исходная сигнальная матрица 8×8=64 ТВ отсчетов преобразуется в матрицу частотных коэффициентов ДКП такого же размера 8×8=64.
Поскольку положение ТВ отсчетов сигнальной матрицы определяется двумя координатами, то частотные коэффициенты (С) матрицы ДКП являются функциями этих двух переменных и обозначаются двузначными номерами. Отметим, что матрица частотных коэффициентов ДКП уже не имеет прямой геометрической связи с положением отсчетов ТВ сигнала на ТВ растре, а представляет собой только удобную форму математической записи, при которой частотные коэффициенты ДКП можно трактовать как двумерный спектр ТВ изображения в горизонтальном и вертикальном направлениях ТВ кадра.
Спектр ДКП имеет очень важную, если ее оценивать с позиций компрессии видеоданных, особенность: основная энергия частотных составляющих этого спектра концентрируется в небольшой области около нулевых частот. Амплитуда высокочастотных составляющих или мала, или просто равна нулю. Передаче подлежат только те частотные коэффициенты матрицы ДКП, величины которых превышают принятые пороговые значения. Коэффициенты ниже порогового значения считаются нулевыми. Следует отметить, что при кодировании динамический интервал уровней коэффициентов ДКП возрастает.
Для кодирования коэффициентов ДКП в таком широком динамическом интервале в последующих узлах кодера реализуют переход от 8 битового к 11-битовому коду. Чтобы избежать этого, после ДКП производится масштабирование (сжатие) динамического интервала сигналов коэффициентов ДКП за счет увеличения шага квантования. Эта операция сводится к делению полученных в матрице значений коэффициентов ДКП. Результат деления затем округляется до ближайших целых значений уровней новой шкалы квантования. Так, например, если исходное значение коэффициента ДКП было 22, то после деления на 8 и округления до ближайшего целого значения (22/8=2.75) новое значение будет 3. При этом новый динамический интервал составит от -255 до +255 дискретных уровней. После выравнивания динамического диапазона коэффициенты ДКП подвергаются взвешенному квантованию для сокращения избыточности в высокочастотной области. Надо заметить, что чувствительность зрения наблюдателя здесь наименьшая. Точность кодирования зависит от шага квантования. Он выбирается разным для разных коэффициентов матрицы ДКП, его масштаб в процессе кодирования может меняться от 1 до 31.
После квантования коэффициенты ДКП преобразуют в энтропийном кодере, одновременно подвергают инверсному квантованию, обратному ДКП с целью получения декодированного изображения в кодере для более точного предсказания и компенсации движения.
Предсказание может быть экстраполяционным. В этом случае (его часто называют предсказанием "вперед") по предшествующим значениям отсчетов ТВ сигнала оцениваются последующие отсчеты. Интерполяционное (двунаправленное) предсказание означает, что оценка среднего по положению отсчета ТВ сигнала выполняется по известным значениям предшествующих и последующих отсчетов. Такое предсказание наиболее точно оценивает текущие отсчеты. Однако за точность приходится расплачиваться возросшим объемом вычислений и, соответственно, памяти, необходимой при реализации. При этом эффект не окупает затраты.
Как уже отмечалось, предсказание выполняется по соседним с предсказываемым отсчетам, причем под соседними надо понимать отсчеты, расположенные "до и за" рассматриваемым. Возможно построчное, межстрочное, внутриполевое, внутрикадровое, межполевое и межкадровое предсказание. Это полный набор возможных направлений корреляций.
При простейшем внутриполевом предсказании вперед предшествующий отсчет ТВ строки принимается как ожидаемый уровень последующего отсчета. Фактически это означает вычеркивание постоянной составляющей или, что то же самое, выделение разностной информации. Такой метод предсказания особенно эффективен, когда передаются крупные, не содержащие мелких деталей фрагменты изображения, где яркость постоянна или изменяется медленно.
Другой способ - межкадровое предсказание "вперед". В этом случае текущий отсчет оценивается по отсчету с теми же координатами, но предыдущего кадра. Это очень эффективный метод предсказания для неподвижных изображений. Ситуация усложняется, когда изображение содержит движущиеся объекты или изменятся в целом. В этом случае отсчеты, принадлежащие однотипным элементам изображения от кадра к кадру будут смещаться. Возникает разностная информация, даже если в остальном никаких изменений не происходит. Это можно ослабить, если ввести компенсацию движения. Для этого необходимо определить векторы перемещения движущихся частей изображения при последовательном переходе от кадра к кадру. Векторы движения позволяют определить положение кодируемого отсчета в новом кадре (скомпенсировать его перемещение) и, таким образом, сохранить высокую точность предсказания.
Так называемые "опорные" (I) кадры обрабатываются только с применением внутрикадрового кодирования. Это первый этап, где сжатие видеоданных относительно невелико, но зато при восстановлении ТВ изображения оно менее всего деградирует и зависит от ошибок кодирования и передачи видеоданных по каналу связи. Также существуют "предсказанные" (Р) кадры (фиг.6), кодирование которых выполняется с использованием алгоритмов компенсации движения и предсказания "вперед" по предшествующим опорным или предсказанным кадрам. В предсказанных кадрах, если сравнивать их с опорными кадрами, в три раза выше достижимая степень сжатия видеоданных.
Обработка видеоданных в предсказанном кадре при межкадровом предсказании выполняется по макроблокам. Это квадратные матрицы 16×16 (отсчетов × строк). Такой макроблок обрабатывается с использованием алгоритмов компенсации движения и предсказания вперед. Предшествующие предсказанные кадры являются опорными для последующих кадров и являются опорными для предсказания предшествующих и последующих кадров с двунаправленным предсказанием (В). Отметим, что необходима высокая точность восстановления исходного изображения при декодировании опорных и предсказанных кадров. Дело в том, что ошибки этих кадров распределяются по всем кадрам, связанным с данным.
Алгоритмы кодирования двунаправлено предсказанных кадров зависят от характера ТВ изображения, чаще всего применяется компенсация движения и предсказание вперед по ближайшим предшествующим опорным или предсказанным кадрам. Очевидно, что точность кодирования должна быть максимальной для опорных кадров, ниже для предсказанных кадров и минимальной для двунаправлено предсказанных кадров.
Метод компенсации движения основан на макроблоках. Два смежных кадра, содержащих только активные строки сигнала яркости (576 активных строк), разбиваются на макроблоки и более крупные зоны поиска. Размеры макроблока должны быть согласованы со структурой дискретизации кадра ТВ изображения, а ТВ кадр разбивается при этом на целое число зон. По вертикали (576 активных строк/16) - это 36 зон, по горизонтали (704 активных отсчета/16) - 44 зоны.
Зона поиска должна быть достаточно большой, чтобы быстро движущийся макроблок изображения первого кадра не вышел из зоны поиска второго кадра. Размеры зоны поиска ограничиваются объемом вычислений, которые необходимо выполнить в реальном масштабе времени. Эти размеры также должны быть согласованы с принятой структурой дискретизации ТВ кадра. Обычно они в 4 раза больше размеров отдельного макроблока. Иными словами, размеры зоны поиска - это 64×64. Таким образом, в ТВ кадре создается 576/64=9 зон поиска по вертикали и 704/64=11 зон по горизонтали.
Например, надо определить координаты движения при предсказании вперед. Для этого берется макроблок отсчетов первого кадра и ищется его новое положение в зоне поиска второго кадра, вычисляются межкадровые разности отсчетов. Положение макроблока, при котором суммарное значение модулей межкадровых разностей макроблока получается наименьшим, принимается за его реальное перемещение, после чего координаты вектора движения рассчитываются как смещение макроблока по вертикали и горизонтали относительно его начального положения. Сигналы вектора движения также преобразуют в энтропийном кодере.
Устройство работает следующим образом. Матрица преобразования (1) предназначена для преобразования сигналов трех основных цветов R, G, В в сигнал яркости Еу и два цветоразностных сигнала U и V. На фиг.7 показана схема матрицы преобразования (1). На вход кодирующей матрицы (13) (Телевидение, под ред. В.Е.Джаконии, М. 2002, стр.248) поступают сигналы трех основных цветов R, G, В. На выходе кодирующей матрицы (13) формируются яркостной Еу и два цветоразностных сигналов ЕB-Y и ЕR-Y, которые поступают на соответствующие входы первого (14) и второго (15) умножителей, где умножаются на коэффициент 0,493 и 0,877 соответственно. Для иллюстрации этого на фиг.7 показаны коэффициенты умножения, поступающие на соответствующие входы первого (14) и второго (15) умножителей. На практике первый (14) и второй (15) умножители выполняются на основе аналоговых перемножителей [Цифровые и аналоговые интегральные микросхемы: Справочник. Под ред. С.В.Якубовского. - М.: Радио и связь, 1989, стр.373], имеющих фиксированный коэффициент умножения и поэтому один сигнальный вход.
На выходе блоков умножения формируются сигналы U и V соответственно. Далее сигналы Еу, U и V через первый (2), второй (5) и третий (8) фильтры нижних частот (ФНЧ) соответственно поступают на входы первого (3), второго (6) и третьего (9) аналогово-цифровых преобразователей. Далее сигнал Еу в цифровой форме поступает в блок коррекции, а сигналы U и V в цифровой форме через первую (7) и вторую (10) линии задержки, соответственно, выравнивающие задержку сигнала, вносимую блоком коррекции (4), поступают на второй и третий входы сжимающего кодера (12) соответственно.
Блок коррекции (4) предназначен для устранения возникающих специфических искажений границ движущихся объектов (фиг.2), вызванных различным положением движущихся объектов в двух полях одного кадра изображения. Включает в себя (фиг.8) третью (16) и четвертую (17) линии задержки на длительность строки; первый (18), второй (23), третий (29) вычитатель; первый (19) и второй (24) детекторы; четвертый (20) и пятый (25) фильтры нижних частоты; первый (21) и второй (26) амплитудные ограничители по максимуму и минимуму; первый логический элемент "ИЛИ" (22), формирующий сигнал управления; пятую линию задержки (27) на длительность поля; шестую линию задержки (28) на длительность половины строки; блок выделения сигналов временной разности (30); первый ключ (31); первый сумматор (32).
Устранение влияния эффекта "расчески" на границах движущихся объектов на качество телевизионного изображения при использовании дискретного косинусного преобразования (ДКП) в пределах кадра за счет поочередного преобразования в исходной последовательности полей видеосигнала двух смежных полей в кадр изображения осуществляется следующим образом.
Для определения сигналов, соответствующих горизонтальным границам неподвижных деталей изображения, необходимо текущее поле смещать в вертикальном по растру направлении относительно опорного положения в пространстве полного растра на ±2 строки и вычитать соответствующие смещенные поля из опорного. С этой целью задерживаем текущее поле (F) на период строки Тстр (F1) в третьей линии задержки (16) и далее считаем это поле опорным, также задерживаем текущее поле на 2Тстр (F2) в четвертой линии задержки (17). Для определения сигналов, соответствующих границам неподвижных объектов изображения, отличных от вертикальных границ, вычитаем F1 из F во втором вычитателе (23), и F2 из F1 в первом вычитателе (18). Детектируем значения сигналов в первом (19) и втором (24) детекторе; результирующие сигналы подвергаем цифровой фильтрации в четвертом (20) и пятом (25) фильтрах нижних частот, с целью уменьшения влияния шумов ограничиваем по уровню в первом (21) и втором (26) амплитудном ограничителе по максимуму и минимуму; далее сигнал поступает в на первый логический элемент "ИЛИ" (22), который формирует сигнал управления, соответствующий границам неподвижных объектов изображения, отличным от вертикальных, поступающий на первый вход блока выделения сигналов временной разности (30).
На фиг.9 показана схема блока выделения сигналов временной разности (30). Он включает в себя второй логический элемент "ИЛИ" (33), первый переключатель (34), первый логический элемент "НЕ" (35), второй сумматор (36). На первый вход второго логического элемента "ИЛИ" (33) поступает сигнал с выхода первого логического элемента "ИЛИ" (22), на второй вход - сигнал с выхода третьего вычитателя (29). В момент поступления логической "1" на управляющий вход первого переключателя (34) сигнал проходит через первый выход первого переключателя (34), соединенный с первым логическим элементом "НЕ" (35), на первый вход второго сумматора (36). При поступлении логического "0" на управляющий вход первого переключателя (34) сигнал проходит через второй выход первого переключателя (34) на второй вход второго сумматора (36) и далее поступает на сигнальный вход первого ключа (31).
Для формирования сигнала пространственно-временной разности сигнал F задерживают на время длительности поля в пятой линии задержки (27), чтобы совместить во времени с опорным текущим полем, и подают на вход третьего вычитателя (29). На другой вход третьего вычитателя (29) поступает опорное текущее поле, задержанное на время длительности половины строки в шестой линии задержки (28) для того, чтобы совместить во времени сигналы строк текущего и предыдущего полей. Таким образом, после вычитания получаем сигнал пространственно-временной разности, который параллельно поступает на второй вход блока выделения сигналов временной разности (30).
Блок выделения сигналов временной разности (30) в момент прихода сигнала управления выделяет сигнал, соответствующий временной разности (фиг.4), из сигнала пространственно-временной разности. С выхода блока выделения сигналов временной разности (30) полученный сигнал временной разности поступает на сигнальный вход первого ключа (31). На управляющий вход первого ключа (31) поступает сигнал синхронизации с частотой 25 Гц с третьего выхода генератора тактовых импульсов (11). Таким образом, первый ключ (31) пропускает сигнал временной разности на первый сумматор (32) через одно поле. В первом сумматоре (32) происходит суммирование сигнала временной разности с сигналом текущего поля, в результате чего устраняются специфические искажения границ движущихся объектов (фиг.5). Результирующий сигнал поступает на первый вход сжимающего кодера (12).