Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая обнаружение группы ранее декодированных спектральных значений
Иллюстрации
Показать всеИзобретение относится к аудио декодеру, аудио кодеру, способам и машиночитаемым носителям для предоставления декодированной и кодированной аудио информации. Технический результат заключается в повышении эффективности настройки контекста. Аудио декодер содержит арифметический декодер для обеспечения множества декодированных спектральных значений на основе арифметически кодированного представления спектральных значений и конвертер частотной области во временную область для обеспечения аудио представления временной области, используя декодированные спектральные значения, где арифметический декодер настроен, чтобы выбрать правило отображения, описывающее отображение значения кода на код символа в зависимости от состояния контекста, также чтобы определить текущее состояние контекста в зависимости от множества ранее декодированных спектральных значений, и чтобы обнаружить группу множества ранее декодированных спектральных значений, которые соответствуют по отдельности или вместе взятые заданному условию относительно их величины, а также определить или изменить текущее состояние контекста в зависимости от результата обнаружения. 6 н. и 13 з.п. ф-лы, 46 ил.
Реферат
Техническая область
Воплощения в соответствии с изобретением связаны с аудио декодером для обеспечения декодированной аудио информации на основе кодированной аудио информации, аудио кодером для обеспечения кодированной аудио информации на основе входной аудио информации, способ для получения декодированной аудио информации на основе кодированной аудио информации, способ получения кодированной аудио информации на основе входной аудио информации и компьютерной программой.
Воплощения в соответствии с изобретением связаны с улучшенным спектральным бесшумным кодированием, которое может быть использовано в аудио кодере и декодере, как, например, так называемом единый кодере речи и аудио (USAC).
Предпосылки создания изобретения
Далее будет кратко описана концепция изобретения в целях облегчения понимания настоящего изобретения и его преимуществ. За последние десять лет большие усилия были предприняты для создания возможности для цифрового хранения и распространения аудио содержания с хорошей эффективностью битрейта. Одним из важных достижений на этом пути является определение международного стандарта ISO / IEC 14496-3. Часть 3 данного стандарта связана с кодированием и декодированием аудио содержимого, а подраздел 4 части 3 связан с общим аудио кодированием. ISO/IEC 14496, часть 3, раздел 4 определяет концепцию кодирования и декодирования общего аудио содержания. Кроме того, дальнейшие улучшения были предложены с целью улучшения качества и/или снижения необходимой скорости передачи данных.
Согласно концепции, описанной в указанном стандарте, во временной области звуковой сигнал преобразуется в частотно-временное представление. Преобразование из временной области в частотно-временную область, как правило, осуществляется с помощью блоков преобразования, который обозначаются как ″кадры″ из образцов временной области. Было установлено, что выгоднее использовать перекрывающиеся кадры, которые перемещаются, например, на половину кадра, так как перекрытие позволяет эффективно избежать (или хотя бы уменьшить) артефакты. Кроме того, было обнаружено, что оконная работа должна быть выполнена для того, чтобы избежать артефактов, происходящих из этой обработки временно ограниченных кадров.
При преобразовании оконной части входного звукового сигнала из временной области в частотно-временную область, уплотнение энергии получается во многих случаях, так что некоторые спектральные значения составляют значительно большую величину, чем множество других спектральных значений. Соответственно, во многих случаях есть сравнительно небольшое число спектральных значений с величиной, которая существенно выше средней величины спектральных значений. Типичным примером преобразования из временной области в частотно-временную область, приводящего к уплотнению энергии, является так называемое модифицированное дискретное косинус преобразование (MDCT).
Спектральные значения часто масштабируются и квантуются в соответствии с психоакустической моделью, так что ошибки квантования сравнительно меньше для психоакустичеки важных спектральных значений и сравнительно больше для психоакустически менее важных спектральных значений. Масштабированные и квантованные спектральные значения кодируются в целях обеспечения эффективного битрейта их представления.
Например, использование так называемого Huffman кодирования квантованных спектральных коэффициентов описано в международном стандарте ISO / IEC 14496-3:2005 (Е), часть 3, раздел 4.
Тем не менее, было установлено, что качество кодирования спектральных значений оказывает значительное влияние на требуемый битрейт. Кроме того, было установлено, что сложность аудио декодирования, которое часто осуществляется в портативных устройствах потребителей, и которое поэтому должно быть дешевыми и потреблять мало энергии, зависит от кодирования, используемого для кодирования спектральных значений.
В связи с этой ситуацией, есть необходимость в концепции кодирования и декодирования аудио содержания, которая предусматривает улучшение компромисса между битрейт эффективностью и эффективностью использования ресурсов.
Сущность изобретения
Примером воплощения изобретения является аудио декодер для получения декодированной аудио информации (или декодированного аудио представления) на основе кодированной аудио информации (или кодированного аудио представления). Аудио декодер включает в себя арифметический декодер для предоставления множества декодированных спектральных значений на основе арифметически-кодированного представления спектральных значений. Аудио декодер также включает конвертер из частотной области во временную область для обеспечения во временной области аудио представления с помощью декодированных спектральных значений в целях получения декодированной аудио информации. Арифметический декодер предназначен для выбора правила отображения, описывающего отображение значения кода в код символа в зависимости от состояния контекста. Арифметический декодер настроен, чтобы определить текущее состояние контекста в зависимости от множества ранее декодированных спектральных значений. Арифметический декодер настроен на обнаружение группы из множества ранее декодированных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, а также для определения или изменения текущего состояния контекста в зависимости от результата обнаружения.
Этот вариант в соответствии с изобретением основан на открытии, что наличие группы из множества ранее декодированных (желательно, но не обязательно смежных) спектральных значений, которые соответствуют заданному условию относительно их величины, делает возможным особенно эффективное определение текущего состояния контекста, поскольку такие группы ранее декодированных (желательно смежных) спектральных значений являются характерной чертой в спектральном представлении, и поэтому могут быть использованы для облегчения определения текущего состояния контекста. При обнаружении группы из множества ранее декодированных (желательно смежных) спектральных значений, которые содержат, например, особенно малую величину, возможно узнать части сравнительно малой амплитуды в пределах спектра, а также настроить (определить или изменить) текущее состояние контекста соответственно, так что дальнейшие спектральные значения могут быть кодированы и декодированы с хорошей эффективностью кодирования (в пересчете на битрейт). Кроме того, группы из множества ранее декодированных смежных спектральных значений, которые содержат относительно большую амплитуду, могут быть обнаружены, и контекст может быть соответствующим образом скорректирован (определен или изменен), чтобы увеличить эффективность кодирования и декодирования. Кроме того, обнаружение группы из множества ранее декодированных (желательно смежных) спектральных значений, которые выполняют, по отдельности или вместе взятые, заданное условие, часто осуществляется с меньшими вычислительными усилиями, чем вычисление контекста, в котором многие ранее декодированные спектральные значения объединены. Подводя итоги, вышеописанные воплощения в соответствии с изобретением делают возможным упрощенное вычисление контекста и позволяют настройку контекста к конкретным совокупностям сигнала, в которых есть группы смежных сравнительно небольших спектральных значений или группы смежных сравнительно больших спектральных значений.
В предпочтительном варианте арифметический декодер настроен, чтобы определить или изменить текущее состояние контекста независимого от ранее декодированных спектральных значений в ответ на обнаружение, что заданное условие выполнено. Таким образом, получается вычислительно особенно эффективный механизм для вывода значения, описывающего контекст. Было установлено, что значительная адаптация контекста может быть достигнута, если обнаружение группы из множества ранее декодированных спектральных значений, которые соответствуют заданному условию, что приводит к простому механизму, который не требует вычислительно затратных числовых комбинаций ранее декодированных спектральных значений. Таким образом, вычислительное усилие уменьшается по сравнению с другими подходами. Кроме того, ускорения вывода контекста можно достичь, исключив сложные шаги расчета, которые зависят от обнаружения, поскольку такая концепция, как правило, неэффективна в программной реализации, выполняемой на процессоре.
В предпочтительном варианте арифметический декодер настроен на обнаружение группы из множества ранее декодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины.
В предпочтительном варианте арифметический декодер настроен на обнаружение группы из множества ранее декодированных смежных спектральных значений, которые, по отдельности или вместе взятые, содержат величину, которая меньше, чем заданный порог величины, и на определение текущего состояния контекста в зависимости от результатов обнаружения. Было установлено, что группа из множества смежных сравнительно низких спектральных значений может быть использована для выбора контекста, который хорошо адаптирован к данной ситуации. Если есть группа смежных сравнительно небольших спектральных значений, существует значительная вероятность того, что спектральное значение, декодируемое следующим, также содержит сравнительно небольшое значение. Соответственно, настройка контекста обеспечивает хорошую эффективность кодирования и может помочь избежать затрат времени на вычисление контекста.
В предпочтительном варианте арифметический декодер настроен на обнаружение группы из множества ранее декодированных смежных спектральных значений, при этом каждое из ранее декодированных спектральных значений имеет нулевое значение, а также на определение состояния контекста в зависимости от результата обнаружения. Было установлено, что в связи с спектральными или временными эффектами маскирования часто есть группы смежных спектральных значений, которые имеют нулевое значение.
Описанный вариант обеспечивает эффективную обработку такой ситуации. Кроме того, присутствие группы смежных спектральных значений, которые квантованы к нулю, делает весьма вероятным, что спектральное значение, декодируемой следующим, имеет либо нулевое значение, или сравнительно большое спектральное значение, что приводит к маскирующему эффекту.
В предпочтительном варианте арифметический декодер настроен на обнаружение группы из множества ранее декодированных смежных спектральных значений, которые содержат общее значение, которое меньше, чем заданный порог значения, и на определение состояния контекста в зависимости от результатов обнаружения. Было установлено, что в дополнение к группам смежных спектральных значений, которые равны нулю, также группы смежных спектральных значений, которые почти равны нулю в среднем (т.е. общее значение которых меньше заданного порогового значения) представляют собой характерную черту спектрального представления (например, время-частотное представление аудио содержания), которые могут быть использованы для адаптации контекста.
В предпочтительном варианте арифметический декодер настроен на установление текущего состояния контекста к заданному значению в ответ на обнаружение заданного условия. Было установлено, что эта реакция очень проста в реализации и по-прежнему приводит к адаптации контекста, которая обеспечивает хорошую эффективность кодирования.
В предпочтительном варианте арифметический декодер настроен выборочно пропускать расчет текущего состояния контекста в зависимости от числовых значений из множества ранее декодированных спектральных значений в ответ на обнаружение заданного условия. Таким образом, вычисление контекста существенно упрощается в связи с обнаружением группы из множества ранее декодированных смежных спектральных значений, которые удовлетворяют заданному условию. При экономии усилий на вычисление потребление энергии декодером аудио сигнала также снижается, что обеспечивает значительные преимущества в мобильных устройствах.
В предпочтительном варианте арифметический декодер настроен на установление текущего состояния контекста к значению, которое указывает на обнаружение заданного условия. Установив состояние контекста к значению, которое может быть в пределах заданного диапазона значений, дальнейшая оценка состояния контекста может быть проконтролирована. Тем не менее, следует отметить, что значение, в которое установлено текущее состояние контекста, может зависеть и от других критериев, даже если это значение находится в характерном диапазоне значений, которые указывают на обнаружение заданного условия.
В предпочтительном варианте арифметический декодер настроен на отображение кода символа на декодированное спектральное значение.
В предпочтительном варианте арифметический декодер настроен на оценку спектральных значений первого частотно-временного региона, обнаружение группы из множества спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины. Арифметический декодер настроен на получение числового значения, которое представляет состояние контекста, в зависимости от спектральных значений второго частотно-временного региона, который отличается от первого частотно-временного региона, если заданное условие не выполняется. Было установлено, что рекомендуется обнаружение группы из множества спектральных значений, которые удовлетворяют заданному условию относительно величины в регионе, который отличается от региона, обычно используемого для вычисления контекста. Это связано с тем, что расширение, например, частотное расширение, регионов, включающих сравнительно небольшие спектральные значения, или сравнительно большие спектральные значения, как правило, больше, чем размерность региона спектральных значений, которые рассматриваются для числовых расчетов числового значения, представляющего состояние контекста. Соответственно, рекомендуется провести анализ различных регионов для обнаружения группы из множества спектральных значений, выполняющих заданное условие, и для числового вычисления числового значения, представляющего состояние контекста (при этом числовой расчет может ожидаться на втором шаге, если обнаружение не дает бит.
В предпочтительном варианте арифметический декодер настроен на оценку одной или нескольких хэш-таблиц, чтобы выбрать правило отображения в зависимости от состояния контекста. Было установлено, что выбором правила отображения можно управлять с помощью механизма обнаружения множества смежных спектральных значений, которые удовлетворяют заданному условию.
Другой вариант использования изобретения приводит к созданию аудио кодера для получения кодированной аудио информации на основе входной аудио информации. Аудио кодер включает в себя энергоуплотняющий конвертер из временной области в частотную для обеспечения в частотной области аудио представления на основе представления входной аудио информации во временной области, так что аудио представление в частотной области включает в себя набор спектральных значений. Аудио кодер также включает в себя арифметический кодер, который настроен на кодирование спектрального значения, или его предварительно обработанной версии с помощью кодового слова с переменной длиной. Арифметический кодер настроен для отображения спектрального значения или значения наиболее значимого бита плоскости спектрального значения на значение кода. Арифметический кодер предназначен для выбора правила отображения, описывающего отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода в зависимости от состояния контекста. Арифметический декодер предназначен, чтобы определять текущее состояние контекста в зависимости от множества ранее декодированных смежных спектральных значений. Арифметический декодер настроен на обнаружение группы из множества ранее декодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, а также для определения текущего состояния контекста в зависимости от результата обнаружения.
Этот кодер аудио сигнала основан на тех же открытиях, как и декодер аудио сигнала, описанный выше. Было установлено, что механизм адаптации контекста, который показал свою эффективность для декодирования аудио содержания, следует также применять на стороне кодера для того, чтобы обеспечить последовательность системы.
Примером воплощения данного изобретения является создание способа для получения декодированной аудио информации на основе кодированной аудио информации.
Еще одним примером воплощения данного изобретения является создание способа для получения кодированной аудио информации на основе входной аудио информации.
Другой вариант воплощения изобретения содержит компьютерную программу для выполнения одного из указанных способов.
Эти способы и компьютерная программа основываются на тех же открытиях, как и вышеописанные аудио декодер и аудио кодер.
Краткое описание фигур
Использования изобретения будут далее описаны со ссылкой на прилагаемые фигуры, на которых:
Фиг.1 показывает блок-схему аудио кодера, согласно одному из вариантов использования изобретения;
Фиг.2 показывает блок-схему аудио декодера в соответствии с одним из вариантов использования изобретения;
Фиг.3 показывает представление кода псевдопрограммы алгоритма ″value_decode ()″ для декодирования спектрального значения;
Фиг.4 показывает схематическое представление контекста для вычисления контекста;
Фиг.5а показывает представление кода псевдопрограммы алгоритма ″arith_map_context ()″ для отображения контекста;
Фиг.5b и 5с показывают представление кода псевдопрограммы алгоритма ″arith_get_context ()″ для получения значения состояния контекста;
Фиг.5d показывает представление кода псевдопрограммы алгоритма ″get_pk(s)″ для извлечения значения индекса сводной таблицы частот ″pki″ из переменной состояния;
Фиг.5е показывает представление кода псевдопрограммы алгоритма ″arith_get_pk(s)″ для извлечения значения индекса сводной таблицы частот „pki″ из значения состояния;
Фиг.5f показывает представление кода псевдопрограммы алгоритма ″get_pk(unsigned long s)″ для извлечения значения индекса сводной таблицы частот „pki″ из значения состояния;
Фиг.5g показывает представление кода псевдопрограммы алгоритма ″arithdecode ()″ для арифметического декодирования символа из кодового слова переменной длины;
Фиг.5h показывает представление кода псевдопрограммы алгоритма ″arithupdatecontext ()″ для обновления контекста;
Фиг.5i показывает легенду определений и переменных;
Фиг.6а показывает синтаксис представления необработанного блока единого кодирования речи и аудио (USAC);
Фиг.6b показывает синтаксис представления единого элемента канала;
Фиг.6с показывает синтаксис представления парного элемента канала;
Фиг.6d показывает синтаксис представления ″ics″ контрольной информации;
Фиг.6е показывает синтаксис представления потока канала частотной области;
Фиг.6f показывает синтаксис представления арифметически кодированных спектральных данных;
Фиг.6g показывает синтаксис представление для декодирования множества спектральных значений;
Фиг.6h показывает легенду элементов данных и переменных;
Фиг.7 показывает блок-схему аудио кодера, согласно другому варианту осуществления изобретения;
Фиг.8 показывает блок-схему аудио декодера в соответствии с другим вариантом использования изобретения;
Фиг.9 показывает организацию сравнения бесшумного кодирования в соответствии с рабочим проектом 3 проекта стандарта USAC с схемой кодирования в соответствии с настоящим изобретением:
Фиг.10а показывает схематическое представление контекста расчета состояния, так как оно используется в соответствии с рабочим проектом 4 проекта стандарта USAC;
Фиг.10b показывает схематическое представление контекста расчета состояния, так как оно используется в воплощениях в соответствии с изобретением;
Фиг.11а показывает обзор таблицы, используемой в схеме арифметического кодирования в соответствии с рабочим проектом 4 проекта стандарта USAC;
Фиг.11b показывает обзор таблицы, используемой в схеме арифметического кодирования в соответствии с изобретением;
Фиг.12а показывает графическое представление запроса памяти только для чтения на схемы бесшумного кодирования в соответствии с настоящим изобретением и в соответствии с рабочим проектом 4 проекта стандарта USAC;
Фиг.12b показывает графическое представление общего запроса данных памяти только для чтения декодера USAC в соответствии с настоящим изобретением и в соответствии с рабочим проектом 4 проекта стандарта USAC;
Фиг.13а показывает таблицу представления средних битрейтов, которые используются кодером единого кодирования речи и аудио, с помощью арифметического кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и арифметическим декодером в соответствии с вариантом осуществления настоящего изобретения;
Фиг.13b показывает таблицу представления контроля резервуара бит для кодера единого кодирования речи и аудио с помощью арифметического кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и арифметического кодера в соответствии с вариантом осуществления настоящего изобретения;
Фиг.14 показывает таблицу представления средних битрейтов USAC кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и в соответствии с вариантом осуществления настоящего изобретения;
Фиг.15 показывает таблицу представления минимального, максимального и среднего битрейта USAC на основе кадра;
Фиг.16 показывает таблицу представления лучшего и худшего случаев на основе кадра;
Фиг.17 (1) и 17 (2) показывают таблицу представления содержания таблицы ″ari_s_hash[387]″;
Фиг.18 показывает таблицу представления содержания таблицы ″ari_gs_hash[225]″;
Фиг.19 (1) и 19 (2) показывают таблицу представления содержания таблицы ″ari_cf_m[64][9]″; и
Фиг.20 (1) и 20 (2) показывают таблицу представления содержания таблицы ″ari_s_hash[387]″.
Подробное описание вариантов использования изобретения 1. Аудио кодер в соответствии с фиг.7
Фиг.7 показывает блок-схему аудио кодера, согласно одному из вариантов использования изобретения; Аудио декодер 700 настроен на получение входной аудио информации 710 и на представлении на ее основе кодированной аудио информации 712. Аудио кодер включает в себя энергоуплотняющий конвертер из временной области в частотную 720, который предназначен для обеспечения в частотной области аудио представления 722 на основе представления входной аудио информации 710 во временной области, так что аудио представление в частотной области 722 включает в себя набор спектральных значений. Аудио кодер 700 также включает в себя арифметический кодер 730, предназначенный для кодирования спектрального значения (из множества спектральных значений, формирующих в частотной области аудио представление 722), или его предварительно обработанной версии с помощью кодового слова переменной длиной, чтобы получить кодированную аудио информацию 712 (которая может включать, например, множество кодовых слов переменной длины).
Арифметический кодер 730 настроен на отображение спектрального значения или значения наиболее значимого бита плоскости спектрального значения на значение кода (т.е. на кодовое слово переменной длины) в зависимости от состояния контекста. Арифметический кодер 730 предназначен для выбора правила отображения, описывающего отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода в зависимости от состояния контекста. Арифметический кодер предназначен, чтобы определять текущее состояние контекста в зависимости от множества ранее кодированных (желательно, но не обязательно смежных) спектральных значений. Для этого арифметический кодер настроен на обнаружение группы из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, а также для определения текущего состояния контекста в зависимости от результата обнаружения.
Как можно видеть, отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода может осуществляться кодированием спектрального значения 740 с помощью отображения 742. Трекер состояния 750 может быть сконфигурирован для отслеживания состояния контекста и может включать в себя детектор группы 752 для обнаружения группы из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины. Трекер состояния 750 также желательно настроить для определения текущего состояния контекста в зависимости от результата этого обнаружения, выполненного детектором группы 752. Таким образом, трекер состояния 750 обеспечивает информацию 754, описывающую текущее состояние контекста. Селектор правила отображения 760 может выбрать правило отображения, например, сводную таблицу частот, описывающую отображение спектрального значения, или наиболее значимого бита плоскости спектрального значения, на значение кода. Соответственно, селектор правила отображения 760 предоставляет информацию правила отображения 742 для спектрального кодирования 740.
Подводя итог вышесказанному, аудио кодер 700 выполняет арифметическое кодирование в частотной области аудио представления, осуществляемого конвертером из временной области в частотную. Арифметическое кодирование зависит от контекста, например, правило отображения (например, сводная таблица частот) выбирается в зависимости от ранее кодированных спектральных значений. Таким образом, спектральные значения, смежные во времени и/или частоте (или, по крайней мере, в заданном окружении) друг с другом и/или с в данный момент кодируемым спектральным значением (т.е. спектральные значения в заданном окружении в данный момент кодируемого спектрального значения) рассматриваются в арифметическом кодировании для регулировки распределения вероятности, оцениваемой арифметическим кодированием. При выборе соответствующего правила отображения, обнаружения проводится с целью выявления, есть ли группа из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины. Результат этого обнаружения применяется при выборе текущего состояния контекста, т.е. при выборе правила отображения. Определив, существует ли группа из множества спектральных значений, которые являются особенно малыми или особенно большими, можно распознать особенности в частотной области аудио представления, которое может быть частотно-временным представлением. Особые черты, такие как, например, группа из множества особенно малых или особенно больших спектральных значений, показывают, что особое состояние контекста следует использовать, поскольку это особое состояние контекста может дать особенно хорошую эффективность кодирования. Таким образом, выявление группы смежных спектральных значений, которые удовлетворяют заданному условию, что обычно используется в сочетании с альтернативной оценкой контекста, основанной на сочетании множества ранее кодированных спектральных значений, представляет собой механизм, который позволяет эффективно выбирать соответствующий контекст, если входная аудио информация требует некоторых особых состояний (например, содержит большой маскированный диапазон частот).
Соответственно, эффективное кодирование может быть достигнуто при сохранении расчета контекста достаточно простым.
2. Аудио декодер в соответствии с фиг.8
Фиг.8 показывает блок-схему аудио декодера 800. Аудио декодер 800 настроен на получение кодированной аудио информации 810 и на представлении на ее основе декодированной аудио информации 812. Аудио декодер 800 включает в себя арифметический декодер 820, который предназначен для предоставления множества декодированных спектральных значений 822 на основе арифметически-кодированного представления 821 спектральных значений. Аудио декодер 800 также включает конвертер из частотной области во временную область 830, который предназначен для получения декодированных спектральных значений 822 и предоставления во временной области аудио представления 812, которое может включать декодированную аудио информацию, с помощью декодированных спектральных значений 822, для получения декодированной аудио информации 812.
Арифметический декодер 820 включает в себя определитель спектрального значения 824, настроенный на отображения значения кода арифметически кодированного представления 821 спектральных значений на код символа, представляющий одно или несколько декодированных спектральных значений, или, по крайней мере, часть (например, наиболее значимые биты плоскости) одного или нескольких декодированных спектральных значений. Определитель спектрального значения 824 может быть настроен для выполнения отображения в зависимости от правила отображения, которое может быть описано в информации правила отображения 828а.
Арифметический декодер 820 настроен на выбор правила отображения (например, сводной таблицы частот), описывающего отображение значения кода (описываемого в арифметически кодированном представлении 821 спектральных значений) на код символа (описывающий одно или несколько спектральных значений) в зависимости от состояния контекста (которое может быть описано в информации состояния контекста 826а). Арифметический декодер 820 настроен, чтобы определить текущее состояние контекста в зависимости от множества ранее декодированных спектральных значений 822. Для этого трекер состояния 826 может быть использован, который получает информацию с описанием ранее декодированных спектральных значений. Арифметический декодер также настроен на обнаружение группы из множества ранее декодированных (желательно, но не обязательно смежных) спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, а также для определения текущего состояния контекста (описанного, например, в информации состояния контекста 826а) в зависимости от результата обнаружения.
Обнаружение группы из множества ранее декодированных смежных спектральных значений, которые соответствуют заданному условию относительно их величины, может, например, проводиться детектором группы, который является частью трекера состояния 826. Таким образом, получается информация текущего состояния контекста 826а. Выбор правила отображения может выполняться селектором правила отображения 828, который извлекается из информации правила отображения 828а из информации текущего состояния контекста 826а, и который обеспечивает информацию правила отображения 828а для определителя спектрального значения 824.
Что касается функциональных возможностей декодера аудио сигнала 800, следует отметить, что арифметический декодер 820 настроен на выбор правила отображения (например, сводную таблицу частот), которое, в среднем, хорошо адаптировано к спектральному значению для декодирования, так как правило отображения выбирается в зависимости от текущего состояния контекста, что в свою очередь, определяется в зависимости от множества ранее декодированных спектральных значений. Таким образом, статистические зависимости между смежными спектральными значениями для декодирования могут быть использованы. Более того, обнаружив группу из множества ранее декодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, можно адаптировать правило отображения к особым условиям (или моделям) ранее декодированных спектральных значений. Например, особое правило отображения может быть выбрано, если группа из множества сравнительно небольших ранее декодированных смежных спектральных значений идентифицирована, или если группа из множества сравнительно больших ранее декодированных смежных спектральных значений идентифицирована. Было обнаружено, что присутствие группы сравнительно больших спектральных значений или группы сравнительно небольших спектральных значений можно рассматривать как существенный признак того, что выделенное правило отображения, специально адаптированное для такого состояния, должно быть использовано. Таким образом, вычислению контекста может способствовать (или ускорять) использование обнаружения такой группы из множества спектральных значений. Кроме того, те характеристики аудио содержания можно рассматривать, которые нельзя рассматривать так же легко без применения вышеупомянутой концепции. Например, обнаружение группы множества спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, может быть выполнено на основе различных наборов спектральных значений, по сравнению с набором спектральных значения, используемых для вычисления нормального контекста.
Дальнейшие подробности будут описаны ниже.
3. Аудио кодер в соответствии с фиг.1
Далее будет описан аудио кодер в соответствии с вариантом осуществления настоящего изобретения. Фиг.1 показывает блок-схему такого аудио кодера 100.
Аудио кодер 100 настроен на получение входной аудио информации ПО и на предоставлении на ее основе битового потока 112, который представляет собой кодированную аудио информацию. Аудио декодер 100 может дополнительно включать препроцессор 120, который настроен на получение входной аудио информации ПО и предоставление на ее основе предварительно обработанную входную аудио информацию 110а. на фиг. Аудио кодер 100 также включает в себя энергоуплотняющий трансформер сигнала из временной области в частотную 130, который также обозначается как конвертер сигнала. Конвертер сигнала 130 настроен на получение входной аудио информации 110, 110а и предоставление на ее основе аудио информации 132 в частотной области, которая предпочтительно имеет вид набора спектральных значений. Например, трансформер сигнала 130 может быть сконфигурирован для получения кадра входной аудио информации 110, 110а (например, блок образцов временной области) и для предоставления набора спектральных значений, представляющих аудио содержание соответствующего аудио кадра. Кроме того, трансформер сигнала 130 может быть настроен на получение множества последующих, перекрывающихся или неперекрывающихся, аудио кадров входной аудио информации 110, 110а и предоставления на ее основе аудио представления во временной и частотной области, которое состоит из последовательности последующих наборов спектральных значений, один набор спектральных значений связан с каждым кадром.
Энергоуплотняющий трансформер сигнала из временной области в частотную 130 может включать в себя энергоуплотняющий банк фильтров, который обеспечивает спектральные значения, связанные с различными, перекрывающимися или неперекрывающимися, частотными диапазонами. Например, трансформер сигнала 130 может включать в себя оконный MDCT трансформер 130а, который настроен на оконную работу с входной аудио информацией 110, 110а (или его кадр) с помощью окна преобразования и выполнения модифицированного дискретного косинус-преобразования оконной входной аудио информации 110, 110а (или оконный кадр). Таким образом, аудио представление в частотной области 132 может включать в себя набор, например, 1024 спектральных значений в виде MDCT коэффициентов, связанных с кадром входной аудио информации.
Аудио декодер 100 может дополнительно в