Контекстное энтропийное кодирование выборочных значений спектральной огибающей

Иллюстрации

Показать все

Изобретение относится к средствам для контекстного энтропийного кодирования выборочных значений спектральной огибающей. Технический результат заключается в повышении эффективности кодирования. Спектрально-временным методом предсказывают текущее выборочное значение спектральной огибающей, чтобы получать оцененное значение для текущего выборочного значения. Определяют контекст для текущего выборочного значения в зависимости от показателя для отклонения между парой уже декодированных выборочных значений спектральной огибающей в спектрально-временной окрестности текущего выборочного значения. Энтропийно декодируют значение остатка предсказания для текущего выборочного значения с использованием упомянутого определенного контекста. Комбинируют оцененное значение и значение остатка предсказания для того, чтобы получать текущее выборочное значение. 7 н. и 17 з.п. ф-лы, 14 ил.

Реферат

Настоящая заявка относится к контекстному энтропийному кодированию выборочных значений спектральной огибающей и его использованию при кодировании/сжатии аудио.

Множество современных аудиокодеров с потерями предшествующего уровня техники, к примеру, описанных в [1] и [2], основаны на MDCT-преобразовании и используют как уменьшение нерелевантности, так и уменьшение избыточности, для того чтобы минимизировать требуемую скорость передачи битов для заданного перцепционного качества. Уменьшение нерелевантности типично использует перцепционные ограничения слуховой системы человека, чтобы уменьшать точность представления или удалять информацию частоты, которая не является перцепционно релевантной. Уменьшение избыточности применяется, чтобы использовать статистическую структуру или корреляцию, чтобы достигать наиболее компактного представления оставшихся данных, типично посредством использования статистического моделирования в сочетании с энтропийным кодированием.

В числе прочего, принципы параметрического кодирования используются для того, чтобы эффективно кодировать аудиоконтент. С использованием параметрического кодирования, части аудиосигнала, такие как, например, части его спектрограммы, описываются с использованием параметров вместо использования фактических аудиовыборок временной области и т.п. Например, части спектрограммы аудиосигнала могут быть синтезированы на стороне декодера с потоком данных, просто содержащим параметры, такие как спектральная огибающая, и необязательные дополнительные параметры, управляющие синтезированием, чтобы адаптировать синтезированную часть спектрограммы к передаваемой спектральной огибающей. Новая технология такого вида представляет собой репликацию полос спектра (SBR), согласно которой базовый кодек используется для того, чтобы кодировать и передавать низкочастотный компонент аудиосигнала, тогда как передаваемая спектральная огибающая используется на стороне декодирования с тем, чтобы придавать спектральную форму/формировать спектральные репликации восстановления компонента полосы низких частот аудиосигнала, так чтобы синтезировать компонент полосы высоких частот аудиосигнала на стороне декодирования.

Спектральная огибающая в рамках структуры вышеуказанных технологий кодирования передается в потоке данных с некоторым подходящим спектрально-временным разрешением. Аналогично передаче выборочных значений спектральной огибающей, коэффициенты масштабирования для масштабирования коэффициентов спектральных линий либо коэффициенты частотной области, такие как MDCT-коэффициенты, аналогично передаются с некоторым подходящим спектрально-временным разрешением, которое является менее точным, чем исходное разрешение спектральных линий, менее точным, например, в спектральном смысле.

Фиксированная таблица кодирования методом Хаффмана может использоваться для того, чтобы передавать информацию относительно выборок, описывающих спектральную огибающую, либо коэффициентов масштабирования или коэффициентов частотной области. Усовершенствованный подход заключается в том, чтобы использовать контекстное кодирование, как, например, описано в [2] и [3], в которых контекст, используемый для того, чтобы выбирать распределение вероятностей для кодирования значения, перекрывает как время, так и частоту. Отдельная спектральная линия, к примеру, значение MDCT-коэффициента, представляет собой реальную проекцию комплексной спектральной линии, и она может казаться в определенной степени случайной по своему характеру, даже когда абсолютная величина комплексной спектральной линии является постоянной во времени, но фаза варьируется между кадрами. Это требует достаточной сложной схемы выбора, квантования и преобразования контекста для хороших результатов, как описано в [3].

При кодировании изображений, используемые контексты типично являются двумерными по осям X и Y изображения, к примеру, как указано в [4]. При кодировании изображений, значения находятся в линейной области или в степенной области, к примеру, посредством использования регулирования гаммы. Дополнительно, одно фиксированное линейное предсказание может использоваться в каждом контексте в качестве подбора плоскости, и устаревшего механизма обнаружения краев, и ошибка предсказания может кодироваться. Параметрическое кодирование Голомба или Голомба-Райса может использоваться для кодирования ошибок предсказания. Кодирование по длинам серий дополнительно используется для того, чтобы компенсировать сложности непосредственного кодирования сигналов с очень низкой энтропией, ниже 1 бита в расчете на выборку, например, с использованием побитового кодера.

Тем не менее, несмотря на улучшения в связи с кодированием коэффициентов масштабирования и/или спектральных огибающих, по-прежнему имеется необходимость в усовершенствованном принципе для кодирования выборочных значений спектральной огибающей. Соответственно, цель настоящего изобретения заключается в том, чтобы предоставлять принцип для кодирования спектральных значений спектральной огибающей.

Эта цель достигается посредством предмета независимых пунктов формулы изобретения.

Варианты осуществления, описанные в данном документе, основаны на таких выявленных сведениях, что усовершенствованный принцип для кодирования выборочных значений спектральной огибающей может получаться посредством комбинирования спектрально-временного предсказания, с одной стороны, и контекстного энтропийного кодирования остатков, с другой стороны, при одновременном конкретном определении контекста для текущего выборочного значения в зависимости от показателя для отклонения между парой уже кодированных/декодированных выборочных значений спектральной огибающей в спектрально-временном окружении текущего выборочного значения. Комбинация спектрально-временного предсказания, с одной стороны, и контекстного энтропийного кодирования остатков предсказания с выбором контекста в зависимости от показателя отклонения, с другой стороны, гармонирует с характером спектральных огибающих: гладкость спектральной огибающей приводит к компактным распределениям остатков предсказания, так что спектрально-временная взаимная корреляция почти полностью удаляется после предсказания и может игнорироваться в выборе контекста относительно энтропийного кодирования результата предсказания. Это, в свою очередь, сокращает объем служебной информации для управления контекстами. Тем не менее, использование показателя отклонения между уже кодированными/декодированными выборочными значениями в спектрально-временном окружении текущего выборочного значения по-прежнему обеспечивает адаптивность контекста, которая повышает эффективность энтропийного кодирования таким способом, который оправдывает дополнительный объем служебной информации, вызываемый в силу этого.

В соответствии с вариантами осуществления, описанными в дальнейшем в этом документе, линейное предсказание комбинировано с использованием разностного значения в качестве показателя отклонения, за счет этого поддерживая низким объем служебной информации для кодирования.

В соответствии с вариантом осуществления, позиция уже кодированных/декодированных выборочных значений, используемых для того, чтобы определять разностное значение, в конечном счете используемое для того, чтобы выбирать/определять контекст, выбирается таким образом, что они являются соседними между собой, по спектру или по времени, способом совмещения с текущим выборочным значением, т.е. они находятся вдоль одной линии параллельно временной или спектральной оси, и знак разностного значения дополнительно учитывается при определении/выборе контекста. Посредством этого показателя, тип "тренда" в остатке предсказания может учитываться при определении/выборе контекста для текущего выборочного значения только при одновременном целесообразном увеличении объема служебной информации для управления контекстом.

Предпочтительные варианты осуществления настоящей заявки описываются ниже со ссылкой на чертежи, на которых:

Фиг. 1 показывает схематический вид спектральной огибающей и иллюстрирует ее структуру из выборочных значений и возможного порядка декодирования, заданного для нее, а также возможное спектрально-временное окружение для текущего кодированного/декодированного выборочного значения спектральной огибающей;

Фиг. 2 показывает блок-схему контекстного энтропийного кодера для кодирования выборочных значений спектральной огибающей в соответствии с вариантом осуществления;

Фиг. 3 показывает схему, иллюстрирующую функцию квантования, которая может использоваться при квантовании показателя извлечения;

Фиг. 4 показывает блок-схему контекстного энтропийного декодера, соответствующего кодеру по фиг. 2;

Фиг. 5 показывает блок-схему контекстного энтропийного кодера для кодирования выборочных значений спектральной огибающей в соответствии с дополнительным вариантом осуществления;

Фиг. 6 показывает схему, иллюстрирующую размещение интервала энтропийно кодированных возможных значений остатка предсказания относительно полного интервала возможных значений остатков предсказания в соответствии с вариантом осуществления с использованием кодирования перехода;

Фиг. 7 показывает блок-схему контекстного энтропийного декодера, соответствующего кодеру по фиг. 5;

Фиг. 8 показывает возможное определение спектрально-временного окружения с использованием определенной системы обозначений;

Фиг. 9 показывает блок-схему параметрического аудиодекодера в соответствии с вариантом осуществления;

Фиг. 10 показывает схематический вид, иллюстрирующий возможный вариант реализации параметрического декодера по фиг. 9 посредством показа взаимосвязи между частотным интервалом, покрываемым спектральной огибающей, с одной стороны, и точной структурой, покрывающей другой интервал полного частотного диапазона аудиосигнала, с другой стороны;

Фиг. 11 показывает блок-схему аудиокодера, соответствующего параметрическому аудиодекодеру по фиг. 9 согласно варианту по фиг. 10;

Фиг. 12 показывает схему, иллюстрирующую вариант параметрического аудиодекодера по фиг. 9 при поддержке IGF (интеллектуального заполнения интервалов отсутствия сигнала);

Фиг. 13 показывает схему, иллюстрирующую спектр из спектрограммы точной структуры, т.е. спектральный срез, IGF-заполнение спектра и его формирование в соответствии со спектральной огибающей в соответствии с вариантом осуществления; и

Фиг. 14 показывает блок-схему аудиокодера, поддерживающего IGF, соответствующего варианту параметрического декодера по фиг. 9 в соответствии с фиг. 12.

В качестве обоснования вариантов осуществления, приведенных в данном документе ниже, которые являются, в общем, применимыми к кодированию спектральной огибающей, некоторые идеи, которые приводят к преимущественным вариантам осуществления, указанным ниже, представлены ниже с использованием интеллектуального заполнения интервалов отсутствия сигнала (IGF) в качестве примера. IGF является новым способом для того, чтобы значительно повышать качество кодированного сигнала даже на очень низких скоростях передачи битов. На предмет подробностей следует обратиться к нижеприведенному описанию. В любом случае, IGF учитывает тот факт, что значительная часть спектра в высокочастотной области квантуется до нуля вследствие типично недостаточного битового бюджета. Чтобы сохранять максимально возможно хорошей точную структуру области верхних частот, в IGF, информация в низкочастотной области используется в качестве источника для того, чтобы адаптивно заменять целевые области в высокочастотной области, которые в основном квантуются до нуля. Важное требование для того, чтобы достигать хорошего перцепционного качества, представляет собой совпадение декодированной энергетической огибающей спектральных коэффициентов с декодированной энергетической огибающей исходного сигнала. Чтобы достигать этого, средние спектральные энергии вычисляются для спектральных коэффициентов из одной или более последовательных полос частот AAC-коэффициентов масштабирования. Вычисление средних энергий с использованием границ, заданных посредством полос частот коэффициентов масштабирования, обусловлено посредством уже существующей тщательной подстройки этих границ к частям критических полос частот, которые являются характерными для человеческого слуха. Средние энергии преобразуются в представление на шкале в дБ с использованием формулы, аналогичной формуле для AAC-коэффициентов масштабирования, а затем равномерно квантуются. В IGF, различная точность квантования может быть необязательно использована в зависимости от запрашиваемой полной скорости передачи битов. Средние энергии составляют значительную часть информации, сформированной посредством IGF, так что их эффективное представление имеет высокую важность для общей производительности IGF.

Соответственно, в IGF, энергии коэффициентов масштабирования описывают спектральную огибающую. Энергии коэффициентов масштабирования (SFE) представляют спектральные значения, описывающие спектральную огибающую. Можно использовать специальные свойства SFE при их декодировании. В частности, выяснено, что в отличие от [2] и [3], SFE представляют средние значения спектральных MDCT-линий, и, соответственно, их значения являются гораздо более "сглаженными" и линейно коррелированными со средней абсолютной величиной соответствующих комплексных спектральных линий. С использованием этого факта, нижеприведенные варианты осуществления используют комбинацию предсказания выборочных значений спектральной огибающей, с одной стороны, и контекстного энтропийного кодирования остатка предсказания с использованием контекстов в зависимости от показателя отклонения пары соседних уже кодированных/декодированных выборочных значений спектральной огибающей, с другой стороны. Использование этой комбинации специально адаптировано к этому виду данных, которые должны кодироваться, т.е. к спектральной огибающей.

Чтобы упрощать понимание вариантов осуществления, подробнее указанных ниже, фиг. 1 показывает спектральную огибающую 10 и ее структуру из выборочных значений 12, которые дискретизируют спектральную огибающую 10 аудиосигнала с определенным спектрально-временным разрешением. На фиг. 1, выборочные значения 12 примерно размещаются вдоль временной оси 14 и спектральной оси 16. Каждое выборочное значение 12 описывает или задает высоту спектральной огибающей 10 в соответствующем пространственно-временном мозаичном фрагменте, покрывающем, например, определенный прямоугольник пространственно-временной области спектрограммы аудиосигнала. Таким образом, выборочные значения являются интегральными значениями, получаемыми посредством интегрирования спектрограммы по ассоциированному спектрально-временному мозаичному фрагменту. Выборочные значения 12 могут измерять высоту или интенсивность спектральной огибающей 10 с точки зрения энергии или некоторого другого физического показателя и могут задаваться в нелогарифмической или линейной области либо в логарифмической области, при этом логарифмическая область может предоставлять дополнительные преимущества вследствие своей характеристики дополнительного сглаживания выборочных значений вдоль осей 14 и 16, соответственно.

Следует отметить, что в отношении нижеприведенного описания, только в качестве иллюстрации предполагается то, что выборочные значения 12 регулярно упорядочены спектрально и временно, т.е. то, что соответствующие пространственно-временные мозаичные фрагменты, соответствующие выборочным значениям 12, регулярно покрывают полосу 18 частот из спектрограммы аудиосигнала, но такая регулярность не является обязательной. Вместо этого, также может использоваться нерегулярная дискретизация спектральной огибающей 10 посредством выборочных значений 12, причем каждое выборочное значение 12 представляет усредненное среднее высоты спектральной огибающей 10 в соответствующем пространственно-временном мозаичном фрагменте. Тем не менее, определения окружения, подробнее приведенные ниже, могут быть перенесены на такие альтернативные варианты осуществления нерегулярной дискретизации спектральной огибающей 10. Ниже представлено краткое изложение такого варианта.

Тем не менее, прежде всего следует отметить, что вышеуказанная спектральная огибающая может подвергаться кодированию и декодированию для передачи из кодера в декодер по различным причинам. Например, спектральная огибающая может использоваться для целей масштабируемости, с тем чтобы расширять базовое кодирование полосы низких частот аудиосигнала, а именно, расширять полосу низких частот до верхних частот, а именно, в полосу высоких частот, с которой связана спектральная огибающая. В этом случае, контекстные энтропийные декодеры/кодеры, описанные ниже, например, могут быть частью SBR-декодера/кодера. Альтернативно, они могут быть частью аудиокодеров/декодеров с использованием IGF, как уже упомянуто выше. В IGF, высокочастотная часть спектрограммы аудиосигнала дополнительно описывается с использованием спектральных значений, описывающих спектральную огибающую высокочастотных частей спектрограммы, с тем чтобы иметь возможность заполнять нулевые квантованные области спектрограммы в высокочастотной части с использованием спектральной огибающей. Ниже подробнее описываются сведения в этом отношении.

Фиг. 2 показывает контекстный энтропийный кодер для кодирования выборочных значений 12 спектральной огибающей 10 аудиосигнала в соответствии с вариантом осуществления настоящей заявки.

Контекстный энтропийный кодер по фиг. 2, в общем, указывается с использованием ссылки с номером 20 и содержит модуль 22 предсказания, модуль 24 определения контекста, энтропийный кодер 26 и модуль 28 определения остатков. Модуль 24 определения контекста и модуль 22 предсказания имеют входы, на которых они имеют доступ к выборочным значениям 12 спектральной огибающей (фиг. 1). Энтропийный кодер 26 имеет управляющий вход, соединенный с выходом модуля 24 определения контекста, и вход данных, соединенный с выходом модуля 28 определения остатков. Модуль 28 определения остатков имеет два входа, один из которых соединен с выходом модуля 22 предсказания, а другой из которых предоставляет модулю 28 определения остатков доступ к выборочным значениям 12 спектральной огибающей 10. В частности, модуль 28 определения остатков принимает выборочное значение x, которое должно в данный момент кодироваться на входе, в то время как модуль 24 определения контекста и модуль 22 предсказания принимают на входах выборочные значения 12, уже кодированных и находящиеся в спектрально-временном окружении текущего выборочного значения x.

Модуль 22 предсказания выполнен с возможностью спектрально-временным методом предсказывать текущее выборочное значение x спектральной огибающей 10, чтобы получать оцененное значение . Как проиллюстрировано в связи с более подробным вариантом осуществления, указанным ниже, модуль 22 предсказания может использовать линейное предсказание. В частности, при выполнении спектрально-временного предсказания, модуль 22 предсказания анализирует уже кодированные выборочные значения в спектрально-временном окружении текущего выборочного значения x. Обратимся, например, к фиг. 1. Текущее выборочное значение x проиллюстрировано с использованием полужирного непрерывно нарисованного контура. С использованием штриховки, показаны выборочные значения в спектрально-временном окружении текущей выборки x, которые, в соответствии с вариантом осуществления, формируют основу для спектрально-временного предсказания модуля 22 предсказания; "a", например, обозначает выборочное значение 12, непосредственно соседнее с текущей выборкой x, которое совместно размещается с текущей выборкой x спектрально, но предшествует текущей выборке x временно. Аналогично, соседнее выборочное значение b обозначает выборочное значение, непосредственно соседнее с текущей выборкой x, которое совместно размещается с текущим выборочным значением x временно, но связано с нижними частотами при по сравнении с текущим выборочным значением x, и выборочное значение c в спектрально-временном окружении текущего выборочного значения x является ближайшим соседним выборочным значением для текущего выборочного значения x, которое предшествует последнему временно и связано с нижними частотами. Спектрально-временное окружение может даже охватывать выборочные значения, представляющие следующие предпоследние соседние узлы текущей выборки x. Например, выборочное значение d отделяется от текущего выборочного значения x посредством выборочного значения a, т.е. оно совместно размещается с текущим выборочным значением x временно и предшествует текущему значению x, при этом только выборочное значение a позиционируется между ними. Аналогично, выборочное значение e граничит с выборочным значением x при совместном размещении с текущим выборочным значением x временно и граничном размещении с выборочным значением x вдоль спектральной оси 16, при этом только соседняя выборка b позиционируется между ними.

Как уже указано выше, хотя выборочные значения 12 предположительно регулярно упорядочены вдоль временных и спектральных осей 14 и 16, эта регулярность не является обязательной, и определение окружения и идентификация соседних выборочных значений может быть расширена на такой нерегулярный случай. Например, соседнее выборочное значение a может задаваться как значение, граничащее с верхним левым углом спектрально-временного мозаичного фрагмента текущей выборки вдоль временной оси с предшествованием верхнему левому углу временно. Аналогичные определения также могут использоваться для того, чтобы задавать другие соседние узлы, к примеру, соседние узлы b-e.

Как подробнее указано ниже, модуль 22 предсказания, в зависимости от спектрально-временной позиции текущего выборочного значения x, может использовать различный поднабор всех выборочных значений в спектрально-временном окружении, т.е. поднабор {a, b, c, d, e}. То, какой поднабор фактически используется, например, может зависеть от доступности соседних выборочных значений в спектрально-временном окружении, заданном посредством набора {a, b, c, d, e}. Соседние выборочные значения a, d и c, например, могут быть недоступными вследствие того, что текущее выборочное значение x следует сразу после точки произвольного доступа, т.е. точки во времени, позволяющей декодерам начинать декодирование таким образом, что зависимости от предыдущих частей спектральной огибающей 10 запрещаются/предотвращаются. Альтернативно, соседние выборочные значения b, c и e могут быть недоступными вследствие того, что текущее выборочное значение x представляет низкочастотный край интервала 18, так что позиция соответствующего соседнего выборочного значения выходит за пределы интервала 18. В любом случае, модуль 22 предсказания может спектрально-временным методом предсказывать текущее выборочное значение x посредством линейного комбинирования уже кодированных выборочных значений в спектрально-временном окружении.

Задача модуля 24 определения контекста состоит в том, чтобы выбирать один из нескольких поддерживаемых контекстов для энтропийного кодирования остатка предсказания, т.е. r=x-. С этой целью, модуль 24 определения контекста определяет контекст для текущего выборочного значения x в зависимости от показателя для отклонения между парой уже кодированных выборочных значений из числа a-e в спектрально-временном окружении. В конкретных вариантах осуществления, подробнее приведенных ниже, разность пары выборочных значений в спектрально-временном окружении используется в качестве показателя для отклонения между ними, к примеру, a-c, b-c, b-e, a-d и т.п., но альтернативно, могут использоваться другие показатели отклонения, такие как, например, частное (т.е. a/c, b/c, a/d), разность со степенью значения, не равная единице, к примеру, нечетное число n, не равное единице (т.е. (a-c)n, (b-c)n, (a-d)n), или некоторый другой тип показателя отклонения, к примеру, an-cn, bn-cn, an-dn или (a/c)n, (b/c)n, (a/d)n, где n≠1. Здесь, n также может быть любым значением, например, большим 1.

Как показано подробнее ниже, модуль 24 определения контекста может быть выполнен с возможностью определять контекст для текущего выборочного значения x в зависимости от первого показателя для отклонения между первой парой уже кодированных выборочных значений в спектрально-временном окружении и второго показателя для отклонения между второй парой уже кодированных выборочных значений в спектрально-временном окружении, причем первая пара является соседней между собой по спектру, а вторая пара является соседней между собой по времени. Например, могут использоваться разностные значения b-c и a-c, где a и c являются соседними между собой по спектру, а b и c являются соседними между собой по времени. Идентичный набор соседних выборочных значений, а именно, {a, c, b}, может использоваться посредством модуля 22 предсказания для того, чтобы получать оцененное значение , а именно, например, посредством их линейной комбинации. Различный набор соседних выборочных значений может использоваться для определения контекстов и/или предсказания в случаях определенной недоступности любого из выборочных значений a, c и/или b. Коэффициенты линейной комбинации, как подробнее изложено ниже, могут задаваться таким образом, что коэффициенты являются идентичными для различных контекстов, в случае если скорость передачи битов, на которой кодируется аудиосигнал, превышает предварительно определенное пороговое значение, и коэффициенты задаются отдельно для различных контекстов, в случае если скорость передачи битов ниже предварительно определенного порогового значения.

В качестве промежуточного примечания, следует отметить, что определение спектрально-временного окружения может быть адаптировано к порядку кодирования/декодирования, в котором контекстный энтропийный кодер 20 последовательно кодирует выборочные значения 12. Как показано на фиг. 1, например, контекстный энтропийный кодер может быть выполнен с возможностью последовательно кодировать выборочные значения 12 с использованием порядка 30 декодирования, который проходит выборочные значение 12 для каждого момента времени, при этом в каждый момент времени он идет от наименьшей к наибольшей частоте. Далее, "моменты времени" обозначаются как "кадры", но моменты времени альтернативно могут называться временными квантами, единицами времени и т.п. В любом случае, при использовании такого спектрального обхода перед временным упреждением, определение спектрально-временного окружения, которое расширяется до предшествующего времени и к нижним частотам, обеспечивает наибольшую осуществимую вероятность того, что соответствующие выборочные значения уже кодированы/декодированы и доступны. В данном случае, значения в окружении всегда уже кодированы/декодированы, если они присутствуют, но это может отличаться для другого окружения и пар в порядке декодирования. Естественно, декодер использует идентичный порядок 30 декодирования.

Выборочные значения 12, как уже обозначено выше, могут представлять спектральную огибающую 10 в логарифмической области. В частности, спектральные значения 12, возможно, уже квантованы в целочисленные значения с использованием логарифмической функции квантования. Соответственно, вследствие квантования, показатели отклонения, определенные посредством модуля 24 определения контекста, по сути уже могут быть целыми числами. Это, например, имеет место при использовании разности в качестве показателя отклонения. Независимо от внутренне присущего целочисленного характера показателя отклонения, определенного посредством модуля 24 определения контекста, модуль 24 определения контекста может подвергать показатель отклонения квантованию и определять контекст с использованием квантованного показателя. В частности, как указано ниже, функция квантования, используемая посредством модуля 24 определения контекста, может быть постоянной для значений показателя отклонения за пределами предварительно определенного интервала, причем предварительно определенный интервал, например, включает в себя нуль.

Фиг. 3 примерно показывает такую функцию 32 квантования, преобразующую неквантованные показатели отклонения в квантованные показатели отклонения, причем, в этом примере, вышеуказанный предварительно определенный интервал 34 идет от -2,5 до 2,5, при этом неквантованные значения показателя отклонения выше этого интервала постоянно преобразуются в квантованное значение показателя отклонения в 3, а неквантованные значения показателя отклонения ниже того интервала 34 постоянно преобразуются в квантованное значение показателя отклонения в -3. Соответственно, только семь контекстов различаются и должны поддерживаться посредством контекстного энтропийного кодера. В нижеуказанных примерах реализации, длина интервала 34 равна 5, как проиллюстрировано выше, при этом число элементов набора возможных значений для выборочных значений спектральной огибающей равно 2n (например=128), т.е. более чем в 16 раз превышает длину интервала. В случае использования кодирования перехода, как проиллюстрировано ниже, диапазон возможных значений для выборочных значений спектральной огибающей может быть задан как {0; 2n}, где n является целым числом, выбранным таким образом, что 2n+1 ниже числа элементов кодируемых возможных значений для значений остатка предсказания, которое составляет, в соответствии с конкретным примером реализации, описанным ниже, 311.

Энтропийный кодер 26 использует контекст, определенный посредством модуля 24 определения контекста, для того чтобы эффективно энтропийно кодировать остаток r предсказания, который, в свою очередь, определяется посредством модуля 28 определения остатков на основе фактического текущего выборочного значения x и оцененного значения , к примеру, посредством вычитания. Предпочтительно, используется арифметическое кодирование. Контексты, возможно, имеют ассоциированные постоянные распределения вероятностей. Для каждого контекста, распределение вероятностей, ассоциированное с ним, назначает определенное значение вероятности каждому возможному символу из символьного алфавита энтропийного кодера 26. Например, символьный алфавит энтропийного кодера 26 совпадает или покрывает диапазон возможных значений остатка r предсказания. В альтернативных вариантах осуществления, которые приводятся подробнее ниже, определенный механизм кодирования перехода может использоваться с тем, чтобы гарантировать то, что значение r, которое должно энтропийно кодироваться посредством энтропийного кодера 26, находится в символьном алфавите энтропийного кодера 26. При использовании арифметического кодирования, энтропийный кодер 26 использует распределение вероятностей определенного контекста, определенного посредством модуля 24 определения контекста, с тем чтобы подразделять текущий интервал вероятности, который представляет внутреннее состояние энтропийного кодера 26, на один подыинтервал в расчете на значение алфавита, при выборе одного из подыинтервалов в зависимости от фактического значения r и выводе арифметически кодированного потока битов, информирующего сторону декодирования в отношении обновлений смещения и ширины интервала вероятности, посредством использования, например, процесса ренормализации. Тем не менее, альтернативно, энтропийный кодер 26 может использовать, для каждого контекста, отдельную таблицу кодирования переменной длины, транслирующую распределение вероятностей соответствующего контекста в соответствующее преобразование возможных значений r в коды длины, соответствующей надлежащей частоте соответствующего возможного значения r. Также могут использоваться другие энтропийные кодеки.

Для полноты, фиг. 2 показывает то, что квантователь 36 может быть соединен перед входом модуля 28 определения остатков, для которого текущее выборочное значение x является входящим, с тем чтобы получать текущее выборочное значение x, к примеру, как уже указано выше, посредством использования логарифмической функции квантования, например, применяемой к неквантованному выборочному значению x.

Фиг. 4 показывает контекстный энтропийный декодер в соответствии с вариантом осуществления, который соответствует контекстному энтропийному кодеру по фиг. 2.

Контекстный энтропийный декодер по фиг. 4 указывается с использованием ссылки с номером 40 и истолковывается аналогично кодеру по фиг. 2. Соответственно, контекстный энтропийный декодер 40 содержит модуль 42 предсказания, модуль 44 определения контекста, энтропийный декодер 46 и модуль 48 комбинирования. Модуль 44 определения контекста и модуль 42 предсказания работают аналогично модулю 22 предсказания и модулю 24 определения контекста кодера 20 по фиг. 2. Иными словами, модуль 42 предсказания спектрально-временным методом предсказывает текущее выборочное значение x, т.е. выборочное значение, которое должно в данный момент декодироваться, чтобы получать оцененное значение , и выводит его в модуль 48 комбинирования, и модуль 44 определения контекста определяет контекст для энтропийного декодирования остатка r предсказания текущего выборочного значения x в зависимости от показателя отклонения между парой уже декодированных выборочных значений в спектрально-временном окружении выборочного значения x с информированием энтропийного декодера 46 в отношении контекста, определенного через его управляющий вход. Соответственно, как модуль 44 определения контекста, так и модуль 42 предсказания имеют доступ к выборочным значениям в спектрально-временном окружении. Модуль 48 комбинирования имеет два входа, соединенных с выходами модуля 42 предсказания и энтропийного декодера 46, соответственно, и выход для вывода текущего выборочного значения. В частности, энтропийный кодер 46 энтропийно декодирует остаточное значение r для текущих выборочных значений x с использованием контекста, определенного посредством модуля 44 определения контекста, и модуль 48 комбинирования комбинирует оцененное значение и соответствующее остаточное значение r, чтобы получать текущее выборочное значение x, к примеру, посредством суммирования. Только для полноты, фиг. 4 показывает то, что деквантователь 50 может следовать после выхода модуля 48 комбинирования, с тем чтобы деквантовать выборочное значение, выводимое посредством модуля 48 комбинирования, к примеру, посредством его подвергания преобразованию из логарифмической области в линейную область с использованием, например, показательной функции.

Энтропийный декодер 46 выполняет в обратном порядке энтропийное кодирование, выполняемое посредством энтропийного кодера 26. Иными словами, энтропийный декодер также управляет числом контекстов и использует, для текущего выборочного значения x, контекст, выбранный посредством модуля 44 определения контекста, причем каждый контекст имеет ассоциированное соответствующее распределение вероятностей, которое назначает каждому возможному значению r определенную вероятность, которая является идентичной вероятности, выбранной посредством модуля 24 определения контекста для энтропийного кодера 26.

При использовании арифметического кодирования, энтропийный декодер 46, например, выполняет в обратном порядке последовательность подразделения на интервалы энтропийного кодера 26. Внутреннее состояние энтропийного декодера 46, например, задается посредством ширины интервала вероятности текущего интервала и значения смещения, указывающего, в теку