Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая итеративное уменьшение размера интервала

Иллюстрации

Показать все

Группа изобретений относится к технологиям кодирования/декодирования аудио информации. Техническим результатом является повышение эффективности кодирования/декодирования аудио информации. Предложен аудио декодер для обеспечения декодированной аудио информации на основе кодированной аудио информации. Аудио декодер содержит арифметический декодер и конвертер частотной области во временную область. При этом арифметический декодер предназначен для обеспечения множества декодированных спектральных значений на основе арифметически кодированного представления спектральных значений. При этом арифметический декодер настроен выбирать правило отображения, описывающее отображение значения кода на код символа в зависимости от числового значения текущего контекста, которое описывает текущее состояние контекста. А также арифметический декодер настроен определять числовое значение текущего контекста в зависимости от множества ранее декодированных спектральных значений. 6 н. и 9 з.п. ф-лы, 48 ил.

Реферат

Техническая область

Воплощения в соответствии с изобретением связаны с аудио декодером для обеспечения декодированной аудио информации на основе кодированной аудио информации, аудио кодером для обеспечения кодированной аудио информации на основе входной аудио информации, способ для получения декодированной аудио информации на основе кодированной аудио информации, способ получения кодированной аудио информации на основе входной аудио информации и компьютерной программой.

Воплощения в соответствии с изобретением связаны с улучшенным спектральным бесшумным кодированием, которое может быть использовано в аудио кодере и декодере, как, например, так называемом единый кодере речи и аудио (USAC).

Предпосылки создания изобретения

Далее будет кратко описана концепция изобретения в целях облегчения понимания настоящего изобретения и его преимуществ. За последние десять лет большие усилия были предприняты для создания возможности для цифрового хранения и распространения аудио содержания с хорошей эффективностью битрейта. Одним из важных достижений на этом пути является определение международного стандарта ISO/IEC 14496-3. Часть 3 данного стандарта связана с кодированием и декодированием аудио содержимого, а подраздел 4 части 3 связан с общим аудио кодированием. ISO/IEC 14496, часть 3, раздел 4 определяет концепцию кодирования и декодирования общего аудио содержания. Кроме того, дальнейшие улучшения были предложены с целью улучшения качества и/или снижения необходимой скорости передачи данных.

Согласно концепции, описанной в указанном стандарте, во временной области звуковой сигнал преобразуется в частотно-временное представление. Преобразование из временной области в частотно-временную область, как правило, осуществляется с помощью блоков преобразования, который обозначаются как "кадры" из образцов временной области. Было установлено, что выгоднее использовать перекрывающиеся кадры, которые перемещаются, например, на половину кадра, так как перекрытие позволяет эффективно избежать (или хотя бы уменьшить) артефакты. Кроме того, было обнаружено, что оконная работа должна быть выполнена для того, чтобы избежать артефактов, происходящих из этой обработки временно ограниченных кадров.

При преобразовании оконной части входного звукового сигнала из временной области в частотно-временную область, уплотнение энергии получается во многих случаях, так что некоторые спектральные значения составляют значительно большую величину, чем множество других спектральных значений. Соответственно, во многих случаях есть сравнительно небольшое число спектральных значений с величиной, которая существенно выше средней величины спектральных значений. Типичным примером преобразования из временной области в частотно-временную область, приводящего к уплотнению энергии, является так называемое модифицированное дискретное косинус преобразование (MDCT).

Спектральные значения часто масштабируются и квантуются в соответствии с психоакустической моделью, так что ошибки квантования сравнительно меньше для психоакустичеки важных спектральных значений и сравнительно больше для психоакустически менее важных спектральных значений. Масштабированные и квантованные спектральные значения кодируются в целях обеспечения эффективного битрейта их представления.

Например, использование так называемого Huffman кодирования квантованных спектральных коэффициентов описано в международном стандарте ISO/IEC 14496-3:2005 (Е), часть 3, раздел 4.

Тем не менее, было установлено, что качество кодирования спектральных значений оказывает значительное влияние на требуемый битрейт.Кроме того, было установлено, что сложность аудио декодирования, которое часто осуществляется в портативных устройствах потребителей, и которое поэтому должно быть дешевыми и потреблять мало энергии, зависит от кодирования, используемого для кодирования спектральных значений.

В связи с этой ситуацией, есть необходимость в концепции кодирования и декодирования аудио содержания, которая предусматривает улучшение компромисса между битрейт эффективностью и вычислительными затратами.

Сущность изобретения

Примером воплощения изобретения является аудио декодер для получения декодированной аудио информации на основе кодированной аудио информации. Аудио декодер включает в себя арифметический декодер для предоставления множества декодированных спектральных значений на основе арифметически кодированного представления спектральных коэффициентов. Арифметический декодер также включает конвертер из частотной области во временную область для обеспечения во временной области аудио представления с помощью декодированных спектральных значений в целях получения декодированной аудио информации. Арифметический декодер настроен выбрать правило отображения, описывающее отображение значения кода на код символа в зависимости от численного значения текущего контекста, описывающего текущее состояние контекста. Арифметический декодер настроен, чтобы определить численное текущее значение контекста в зависимости от множества ранее декодированных спектральных значений. Кроме того, арифметический декодер настроен на оценку по крайней мере одной таблицы, используя итеративное уменьшение размера интервала, чтобы определить является ли численное текущее значение контекста идентичным значению таблицы контекста, описываемому записью в таблице, или лежит в интервале, описываемом записями таблицы, в целях получения значения индекса правила отображения, описывающего выбранное правило отображения.

Вариант осуществления данного изобретения основан на открытии, что возможно для обеспечения числового значения текущего контекста, описывающего состояние текущего контекста арифметического декодера для декодирования спектральных значений аудио содержания, которое числовое значение текущего контекста хорошо подходит для извлечения значения индекса правила отображения, при этом значение индекса правила отображения описывает правило отображения, которое должно быть выбрано арифметическим декодером, используя итеративное уменьшение размера интервала на основе таблицы. Было установлено, что таблица поиска, использующая итеративное уменьшение размера интервала, хорошо подходит для выбора правила отображения (описываемого значением индекса правила отображения) из сравнительно небольшого числа правил отображения, в зависимости от числового значения текущего контекста, которое, как правило, вычисляется для описания сравнительно большого числа различных состояний контекста, при этом число возможных правил отображения, как правило, меньше, по крайней мере, в десять раз, чем число возможных состояний контекста, описываемых числовьм значением текущего контекста. Детальный анализ показал, что выбор подходящего правила отображения могут быть выполнены с высокой вычислительной эффективности с помощью итеративного уменьшения размера интервала. Количество таблиц доступа может быть сравнительно небольшим согласно этой концепции, даже в самом худшем случае. Это оказалось очень полезным при попытке осуществить аудио декодирование в реальном времени. Кроме того, было обнаружено, что итеративное уменьшение размера интервала можно применять как для обнаружения является ли числовое значение текущего контекста идентичным значению таблицы контекста, описанному записью в таблице, так и для обнаружения лежит ли числовое значение текущего контекста в интервале, описыванном записями в таблице.

Подводя итог, было установлено, что использование итеративного уменьшения размера интервала хорошо подходит для выполнения алгоритма хеширования, чтобы выбрать правило отображения для арифметического декодирования аудио содержания в зависимости от числового значения текущего контекста, при этом обычно число возможных значений числового значения текущего контекста значительно больше, чем число правил отображения, которое нужно для того, чтобы требования к памяти для хранения правил отображения были значительно малыми.

В предпочтительном варианте арифметический декодер настроен на инициализацию переменной нижней границы интервала для обозначения нижней границы первоначального интервала таблицы и для инициализации переменной верхней границы интервала для обозначения верхней границы первоначального интервала таблицы. Арифметический декодер предпочтительно настроен оценивать запись таблицы, табличный индекс которой расположен в центре начального интервала таблицы, сравнивать числовое значение текущего контекста с значением контекста таблицы, которое представлено с помощью оцениваемой записи таблицы. Арифметический декодер также настроен адаптировать переменную нижней границы интервала или переменную верхней границы интервала в зависимости от результата сравнения для получения уточненного интервала таблицы. Кроме того, арифметический декодер настроен повторять оценку записи таблицы и адаптацию переменной нижней границы интервала или переменной верхней границы интервала на основе одного или более уточненных интервалов таблицы до тех пор, пока значение контекста таблицы не станет равным числовому значению текущего контекста или размеру интервала таблицы, определенного с помощью уточненных переменных границ интервала достигнет или опустится до предельного размера интервала таблицы. Было установлено, что итеративное уменьшение размера интервала может быть реализовано эффективно с помощью описанных выше шагов.

В предпочтительном варианте использования арифметический декодер настроен обеспечивать индексное значение правила отображения, описанное заданной записью таблицы в ответ на обнаружение, что указанная заданная запись таблицы представляет значение контекста таблицы, равное числовому значению текущего контекста. Соответственно, будет реализован очень эффективный механизм доступа к таблице, который хорошо подходит для аппаратной реализации, потому что ряд доступов к таблице, который обычно потребляет время и электрическую энергию, будет сохраняться небольшим.

В предпочтительном варианте арифметический декодер настроен для выполнения алгоритма, в котором переменная нижней границы интервала i_min имеет значение -1, а переменная верхней границы интервала i_max установлена на количество записей таблицы минус 1 на подготовительных шагах. В алгоритме далее проверяется, является ли разница между переменными границ интервала i_max и i_min больше, чем 1, и следующие шаги повторяются, пока указанное выше условие (i_max-i_min>1) не выполняются, или достигается условие отмены: (1) установка переменной i до i_min+((i_max-i_min)/2), (2) установка переменной верхней границы i_max до i, если значение контекста таблицы, описываемое записью в таблице, имеющей индекс таблицы i, больше, чем числовое значение текущего контекста, и (3) установка переменной нижней границы интервала i_min до i, если значение контекста таблицы, описываемое записью в таблице, имеющей индекс таблицы i, меньше, чем числовое значение текущего контекста. Повторение шагов (1) (2) (3), описанных выше, отменяется, если значение контекста таблицы, описываемое записью в таблице, имеющей индекс таблицы i, равно числовому значению текущего контекста. В этом случае, т.е. если значение контекста таблицы, описываемое записью в таблице, имеющей индекс таблицы i, равно числовому значению текущего контекста, значение индекса правила отображения, описываемое записью в таблице, имеющей индекс таблицы i, возвращается. Выполнение этого алгоритма в аудио декодере обеспечивает очень хорошую вычислительную эффективность при выборе правила отображения.

В предпочтительном варианте арифметический декодер настроен для получения числового значения текущего контекста на основе взвешенной комбинации значений величин, описывающих величины ранее декодированных спектральных значений. Было установлено, что этот механизм для получения числового значения текущего контекста приводит к числовому значению текущего контекста, который позволяет эффективный выбор правила отображения, используя итеративное уменьшение размера интервала. Это связано с тем, что взвешенное сочетание значений величин, описывающее величины ранее декодированных спектральных значений, приводит к числовому значению текущего контекста, такому, что численно соседние числовые значения текущего контекста часто связаны с аналогичными условиями контекста спектрального значения, в настоящее время декодированного. Это делает возможным эффективное применение алгоритма хеширования на основе итеративного уменьшения размера интервала.

В предпочтительном варианте таблица содержит множество записей, где каждая из множества записей описывает значение контекста таблицы и связанное значение индекса правила отображения, и при этом записи в таблице численно упорядочены в соответствии со значениями контекста таблицы. Было установлено, что такая таблица очень хорошо подходит для применения в сочетании с итеративным уменьшением размера интервала. Числовая упорядоченность записей таблицы позволяет выполнять поиск значения контекста таблицы, которое совпадает с числовым значением текущего контекста, или выявление интервала, в котором числовое значение текущего контекста лежит, в пределах относительно небольшого числа итераций. Соответственно, количество доступов к таблице сохраняеться небольшим. Кроме того, путем объединения значение контекста таблицы и связанного значения индекса правила отображения в пределах одной записи в таблице, количество доступов к таблице может быть снижено, что помогает сохранить время исполнения в аппаратном оборудовании и энергопотребление малым.

В предпочтительном варианте таблица содержит множество записей, при этом каждое множество записей описывает значение контекста таблицы, определяющее пограничное значение интервала значения контекста, а также значение индекса правила отображения, связанное с интервалом значения контекста. Используя эту концепцию, можно эффективно определить интервал, в котором лежит числовое значение текущего контекста с помощью итеративного уменьшения размера интервала. Опять же, число итераций и число доступов к таблице сохраняется небольшим.

В предпочтительном варианте арифметический декодер настроен выполнять двухшаговый выбор правила отображения в зависимости от числового значения текущего контекста. В этом случае арифметический декодер настроен контролировать, на первом шаге выбора, равняется ли числовое значение текущего контекста или производное от него значение значению значимого состояния, описанного с помощью записи таблицы прямого попадания. Арифметический декодер также настроен определять, на втором шаге выбора, который выполняется только в том случае, если числовое значение текущего контекста или производное от него значение отличается от значений значимого состояния, описанных с помощью записей таблицы прямого попадания, в одном из интервалов которой, среди множества интервалов, лежит числовое значение текущего контекста. Арифметический декодер настроен оценивать таблицу прямого попадания, используя итеративное уменьшение размера интервала, чтобы определять, идентично ли числовое значение текущего контекста значению контекста таблицы, которое описано с помощью записи таблицы прямого попадания. Было установлено, что, используя этот двухшаговый механизм оценки таблиц можно эффективно выявлять особенно значимые состояния контекста, которые особенно значимые состояния контекста описываются записями таблицы прямого попадания, а также выбирать соответствующее правило отображения для менее значимых состояний контекста (которые не описываются записями таблипцы прямого попадания) на втором шаге отбора. Таким образом, наиболее значимые состояния контекста могут быть обработаны на первом шаге отбора, что уменьшает вычислительную сложность в присутствии особенно значимых состояний. Кроме того, можно найти хорошо подходящее правило отображения даже для менее значимых состояний.

В предпочтительном варианте арифметический декодер настроен оценивать, на втором шаге выбора, таблицу отображения интервала, записи которой описывают значения границ интервалов контекстного значения при помощи итеративного уменьшения размера интервала. Было установлено, что итеративное уменьшение размера интервала хорошо подходит как для идентификации прямого попадания, так и для идентификации в каком интервале из множества интервалов, описанных в таблице отображения интервала, лежит числовой значение текущего контекста.

В предпочтительном варианте арифметический декодер настроен на итеративное уменьшение размера интервала таблицы в зависимости от сравнения контекстных значений границ интервала, представленных с помощью записей таблицы отображения интервала и числового значения текущего контекста, пока размер интервала таблицы не достигнет или упадет ниже заданного предельного размера интервала таблицы, либо контекстное значение границы интервала, описанное с помощью записи таблицы в центре интервала таблицы, равно числовому значению текущего контекста. Арифметический декодер настроен обеспечивать индексное значение правила отображения в зависимости от настройки границ интервала таблицы, когда прервано итеративное уменьшение интервала таблицы. Используя эту концепцию, можно определить с низкими вычислительными затратами в каком интервале таблицы из множества интервалов таблицы, определяемых записями таблицы отображения интервала, лежит числовое значение текущего контекста. Соответственно, правило отображения может быть выбрано с низкими вычислительными усилиями.

Другой вариант использования изобретения приводит к созданию аудио кодера для получения кодированной аудио информации на основе входной аудио информации. Аудио кодер включает в себя энергоуплотняющий конвертер из временной области в частотную для обеспечения в частотной области аудио представления на основе представления во временной области входной аудио информации, так что аудио представление в частотной области включает в себя набор спектральных значений. Аудио кодер также включает в себя арифметический кодер, который настроен на кодирование спектрального значения, или его предварительно обработанной версии с помощью кодового слова с переменной длиной. Арифметический кодер настроен для отображения спектрального значения или значения наиболее значимого бита плоскости спектрального значения на значение кода. Арифметический кодер настроен выбирать правило отображения, описывающее отображение спектрального значения, или наиболее значимой битовой плоскости спектрального значения, на значение кода, в зависимости от числового значения текущего контекста, описывающего состояние текущего контекста. Арифметический кодер настроен, чтобы определить численное текущее значение контекста в зависимости от множества ранее кодированных спектральных значений. Арифметический декодер настроен на оценку по крайней мере одной таблицы, используя итеративное уменьшение размера интервала, чтобы определить является ли численное текущее значение контекста идентичным значению контекста, описываемому записью в таблице, или лежит в интервале, описываемом записями таблицы, и таким образом, получить значение индекса правила отображения, описывающее выбранное правило отображения. Этот кодер аудио сигнала основан на тех же открытиях, как и декодер аудио сигнала, описанный выше. Было установлено, что механизм выбора правила отображения, который показал свою эффективность для декодирования аудио содержания, следует также применять на стороне кодера для того, чтобы обеспечить последовательность системы.

Примером воплощения данного изобретения является создание способа для получения декодированной аудио информации на основе кодированной аудио информации.

Еще одним примером воплощения данного изобретения является создание способа для получения кодированной аудио информации на основе входной аудио информации.

Другой вариант воплощения изобретения содержит компьютерную программу для выполнен

Эти способы и компьютерная программа основываются на тех же открытиях, как и вышеописанные аудио декодер и аудио кодер.

Краткое описание фигур

Использования изобретения будут далее описаны со ссылкой на прилагаемые фигуры, на которых:

Фиг.1 показывает блок-схему аудио кодера, согласно одному из вариантов использования изобретения;

Фиг.2 показывает блок-схему аудио декодера в соответствии с одним из вариантов использования изобретения;

Фиг.3 показывает представление кода псевдо-программы алгоритма "value_decode ()" для декодирования спектрального значения;

Фиг.4 показывает схематическое представление контекста для вычисления контекста;

Фиг.5а показывает представление кода псевдо-программы алгоритма "arith_map_context ()" для отображения контекста;

Фиг.5b и 5с показывают представление кода псевдо-программы алгоритма "arith_get_context ()" для получения значения состояния контекста;

Фиг.5d показывает представление кода псевдо-программы алгоритма "get_pk(s)" для извлечения значения индекса сводной таблицы частот „pki" из переменной состояния;

Фиг.5е показывает представление кода псевдо-программы алгоритма "arith_get_pk(s)" для извлечения значения индекса сводной таблицы частот „pki" из значения состояния;

Фиг.5f показывает представление кода псевдо-программы алгоритма "get_pk(unsigned long s)" для извлечения значения индекса сводной таблицы частот „pki" из значения состояния;

Фиг.5g показывает представление кода псевдо-программы алгоритма "arith_decode ()" для арифметического декодирования символа из кодового слова переменной длины;

Фиг.5h показывает представление кода псевдо-программы алгоритма "arith_update_context ()" для обновления контекста;

Фиг.5i показывает легенду определений и переменных;

Фиг.6а показывает синтаксис представления необработанного блока единого кодирования речи и аудио (USAC);

Фиг.6b показывает синтаксис представления единого элемента канала;

Фиг.6с показывает синтаксис представления парного элемента канала;

Фиг.6d показывает синтаксис представления "ics" контрольной информации;

Фиг.6е показывает синтаксис представления потока канала частотной области;

Фиг.6f показывает синтаксис представления арифметически кодированных спектральных данных;

Фиг.6g показывает синтаксис представление для декодирования множества спектральных значений;

Фиг.6h показывает легенду элементов данных и переменных;

Фиг.7 показывает блок-схему аудио кодера, согласно другому варианту осуществления изобретения;

Фиг.8 показывает блок-схему аудио декодера в соответствии с другим вариантом использования изобретения;

Фиг.9 показывает организацию сравнения бесшумного кодирования в соответствии с рабочим проектом 3 проекта стандарта USAC с схемой кодирования в соответствии с настоящим изобретением:

Фиг.10а показывает схематическое представление контекста расчета состояния, так как оно используется в соответствии с рабочим проектом 4 проекта стандарта USAC;

Фиг.10b показывает схематическое представление контекста расчета состояния, так как оно используется воплощениях в соответствии с изобретением;

Фиг.11а показывает обзор таблицы, используемой в схеме арифметического кодирования в соответствии с рабочим проектом 4 проекта стандарта USAC;

Фиг.11b показывает обзор таблицы, используемой в схеме арифметического кодирования в соответствии с изобретением;

Фиг.12а показывает графическое представление запроса памяти только для чтения на схемы бесшумного кодирования в соответствии с настоящим изобретением и в соответствии с рабочим проектом 4 проекта стандарта USAC;

Фиг.12b показывает графическое представление общего запроса данных памяти только для чтения декодера USAC в соответствии с настоящим изобретением и в соответствии с рабочим проектом 4 проекта стандарта USAC;

Фиг.13а показывает таблицу представления средних битрейтов, которые используются кодером единого кодирования речи и аудио, с помощью арифметического кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и арифметическим декодером в соответствии с вариантом осуществления настоящего изобретения;

Фиг.13b показывает таблицу представления контроля резервуара бит для кодера единого кодирования речи и аудио с помощью арифметического кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и арифметического кодера в соответствии с вариантом осуществления настоящего изобретения;

Фиг.14 показывает таблицу представления средних битрейтов USAC кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и в соответствии с вариантом осуществления настоящего изобретения;

Фиг.15 показывает таблицу представления минимального, максимального и среднего битрейта USAC на основе кадра;

Фиг.16 показывает таблицу представления лучшего и худшего случаев на основе кадра;

Фиг.17 (1) и 17 (2) показывают таблицу представления содержания таблицы "ari_s_hash[387]";

Фиг.18 показывает таблицу представления содержания таблицы "ari_gs_hash[225]";

Фиг.19 (1) и 19 (2) показывают таблицу представления содержания таблицы "ari_cf_m[64][9]"; и

Фиг.20 (1) и 20 (2) показывают таблицу представления содержания "ari_s_hash[387];

Фиг.21 показывает блок-схему аудио кодера, согласно одному из вариантов использования изобретения;

Фиг.22 показывает блок-схему аудио декодера в соответствии с одним из вариантов использования изобретения;

Подробное описание вариантов использования изобретения

1. Аудио кодер в соответствии с фиг.7

Фиг.7 показывает блок-схему аудио кодера, согласно одному из вариантов использования изобретения; Аудио декодер 700 настроен на получение входной аудио информации 710 и на представлении на ее основе кодированной аудио информации 712. Аудио кодер включает в себя энергоуплотняющий конвертер из временной области в частотную 720, который предназначен для обеспечения в частотной области аудио представления 722 на основе представления входной аудио информации 710 во временной области, так что аудио представление в частотной области 722 включает в себя набор спектральных значений. Аудио кодер 700 также включает в себя арифметический кодер 730, предназначенный для кодирования спектрального значения (из множества спектральных значений, формирующих в частотной области аудио представление 722), или его предварительно обработанной версии с помощью кодового слова переменной длиной, чтобы получить кодированную аудио информацию 712 (которая может включать, например, множество кодовых слов переменной длины).

Арифметический кодер 730 настроен на отображение спектрального значения или значения наиболее значимого бита плоскости спектрального значения на значение кода (т.е. на кодовое слово переменной длины) в зависимости от состояния контекста. Арифметический кодер 730 предназначен для выбора правила отображения, описывающего отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода в зависимости от состояния контекста. Арифметический кодер предназначен, чтобы определять текущее состояние контекста в зависимости от множества ранее кодированных (желательно, но не обязательно смежных) спектральных значений. Для этого арифметический кодер настроен на обнаружение группы из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, а также для определения текущего состояния контекста в зависимости от результата обнаружения.

Как можно видеть, отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода может осуществляться кодированием спектрального значения 740 с помощью отображения 742. Трекер состояния 750 может быть сконфигурирован для отслеживания состояния контекста и может включать в себя детектор группы 752 для обнаружения группы из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины. Трекер состояния 750 также желательно настроить для определения текущего состояния контекста в зависимости от результата этого обнаружения, выполненного детектором группы 752. Таким образом, трекер состояния 750 обеспечивает информацию 754, описывающую текущее состояние контекста. Селектор правила отображения 760 может выбрать правило отображения, например, сводную таблицу частот, описывающую отображение спектрального значения, или наиболее значимого бита плоскости спектрального значения, на значение кода. Соответственно, селектор правила отображения 760 предоставляет информацию правила отображения 742 для спектрального кодирования 740.

Подводя итог вышесказанному, аудио кодер 700 выполняет арифметическое кодирование в частотной области аудио представления, осуществляемого конвертером из временной области в частотную. Арифметическое кодирование зависит от контекста, например, правило отображения (например, сводная таблица частот) выбирается в зависимости от ранее кодированных спектральных значений. Таким образом, спектральные значения, смежные во времени и/или частоте (или, по крайней мере, в заданном окружении) друг с другом и/или с в данный момент кодируемым спектральным значением (т.е. спектральные значения в заданном окружении в данный момент кодируемого спектрального значения) рассматриваются в арифметическом кодировании для регулировки распределения вероятности, оцениваемой арифметическим кодированием. При выборе соответствующего правила отображения, обнаружения проводится с целью выявления, есть ли группа из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины. Результат этого обнаружения применяется при выборе текущего состояния контекста, т.е. при выборе правила отображения. Определив, существует ли группа из множества спектральных значений, которые являются особенно малыми или особенно большими, можно распознать особенности в частотной области аудио представления, которое может быть частотно-временным представлением. Особые черты, такие как, например, группа из множества особенно малых или особенно больших спектральных значений, показывают, что особое состояние контекста следует использовать, поскольку это особое состояние контекста может дать особенно хорошую эффективность кодирования. Таким образом, выявление группы смежных спектральных значений, которые удовлетворяют заданному условию, что обычно используется в сочетании с альтернативной оценкой контекста, основанной на сочетании множества ранее кодированных спектральных значений, представляет собой механизм, который позволяет эффективно выбирать соответствующий контекст, если входная аудио информация требует некоторых особых состояний (например, содержит большой маскированный диапазон частот).

Соответственно, эффективное кодирование может быть достигнуто при сохранении расчета контекста достаточно простым.

2. Аудио декодер в соответствии с фиг.8

Фиг.8 показывает блок-схему аудио декодера 800. Аудио декодер 800 настроен на получение кодированной аудио информации 810 и на представлении на ее основе декодированной аудио информации 812. Аудио декодер 800 включает в себя арифметический декодер 820, который предназначен для предоставления множества декодированных спектральных значений 822 на основе арифметически-кодированного представления 821 спектральных значений. Аудио декодер 800 также включает конвертер из частотной области во временную область 830, который предназначен для получения декодированных спектральных значений 822 и предоставления во временной области аудио представления 812, которое может включать декодированную аудио информацию, с помощью декодированных спектральных значений 822, для получения декодированной аудио информации 812.

Арифметический декодер 820 включает в себя определитель спектрального значения 824, настроенный на отображения значения кода арифметически кодированного представления 821 спектральных значений на код символа, представляющий одно или несколько декодированных спектральных значений, или, по крайней мере, часть (например, наиболее значимые биты плоскости) одного или нескольких декодированных спектральных значений. Определитель спектрального значения 824 может быть настроен для выполнения отображения в зависимости от правила отображения, которое может быть описано в информации правила отображения 828а.

Арифметический декодер 820 настроен на выбор правила отображения (например, сводной таблицы частот), описывающего отображение значения кода (описываемого в арифметически кодированном представлении 821 спектральных значений) на код символа (описывающий одно или несколько спектральных значений) в зависимости от состояния контекста (которое может быть описано в информациии состояния контекста 826а). Арифметический декодер 820 настроен, чтобы определить текущее состояние контекста в зависимости от множества ранее декодированных спектральных значений 822. Для этого трекер состояния 826 может быть использован, который получает информацию с описанием ранее декодированных спектральных значений. Арифметический декодер также настроен на обнаружение группы из множества ранее декодированных (желательно, но не обязательно смежных) спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, а также для определения текущего состояния контекста (описанного, например, в информации состояния контекста 826а) в зависимости от результата обнаружения.

Обнаружение группы из множества ранее декодированных смежных спектральных значений, которые соответствуют заданному условию относительно их величины, может, например, проводиться детектором группы, который является частью трекера состояния 826. Таким образом, получается информация текущего состояния контекста 826а. Выбор правила отображения может выполняться селектором правила отображения 828, который извлекается из информации правила отображения 828а из информации текущего состояния контекста 826а, и который обеспечивает информацию правила отображения 828а для определителя спектрального значения 824.

Что касается функциональных возможностей декодера аудио сигнала 800, следует отметить, что арифметический декодер 820 настроен на выбор правила отображения (например, сводную таблицу частот), которое, в среднем, хорошо адаптировано к спектральному значению для декодирования, так как правило отображения выбирается в зависимости от текущего состояния контекста, что в свою очередь, определяется в зависимости от множества ранее декодированных спектральных значений. Таким образом, статистические зависимости между смежными спектральными значениями для декодирования могут быть использованы. Более того, обнаружив группу из множества ранее декодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, можно адаптировать правило отображения к особым условиям (или моделям) ранее декодированных спектральных значений. Например, особое правило отображения может быть выбрано, если группа из множества сравнительно небольших ранее декодированных смежных спектральных значений идентифицирована, или если группа из множества сравнительно больших ранее декодированных смежных спектральных значений идентифицирована. Было обнаружено, что присутствие группы сравнительно больших спектральных значений или группы сравнительно небольших спектральных значений можно рассматривать как существенный признак того, что выделенное правило отображения, специально адаптированное для такого состояния, должно быть использовано. Таким образом, вычислению контекста может способствовать (или ускорять) использование обнаружения такой г