Аудио кодер, аудио декодер, способ кодирования аудио информации, способ декодирования аудио информации и компьютерная программа, использующая зависимое от диапазона арифметическое кодирующее правило отображения
Иллюстрации
Показать всеИзобретение относится к аудио кодированию. Технический результат заключается в повышении эффективности кодирования при незначительных вычислительных затратах. Аудио декодер включает арифметический декодер для обеспечения множества декодированных спектральных значений на основе арифметически кодированного представления спектральных значений; и конвертер частотной области во временную область; при этом арифметический декодер настроен, чтобы выбрать правило отображения, описывающее отображение значения кода арифметически кодированного отображения на код символа, отображающего одно или более декодированное спектральное значение или как минимум часть одного или более декодированного спектрального значения, в зависимости от состояния контекста; при этом арифметический декодер настроен определять числовое значение текущего контекста, описывающее состояние текущего контекста в зависимости от множества ранее декодированных спектральных значений, а также в зависимости от того, где расположено декодируемое спектральное значение - в первой заданном частотной области или во второй заданной частотной области. 6 н. и 11 з.п. ф-лы, 48 ил.
Реферат
Область техники
Воплощения в соответствии с изобретением связаны с аудио декодером для обеспечения декодированной аудио информации на основе кодированной аудио информации, аудио кодером для обеспечения кодированной аудио информации на основе входной аудио информации, способ для получения декодированной аудио информации на основе кодированной аудио информации, способ получения кодированной аудио информации на основе входной аудио информации и компьютерной программой.
Воплощения в соответствии с изобретением связаны с улучшенным спектральным бесшумным кодированием, которое может быть использовано в аудио кодере и декодере, как, например, так называемом единый кодере речи и аудио (USAC).
Предпосылки создания изобретения
Далее будет кратко описана концепция изобретения в целях облегчения понимания настоящего изобретения и его преимуществ. За последние десять лет большие усилия были предприняты для создания возможности для цифрового хранения и распространения аудио содержания с хорошей эффективностью битрейта. Одним из важных достижений на этом пути является определение международного стандарта ISO/IEC 14496-3. Часть 3 данного стандарта связана с кодированием и декодированием аудио содержимого, а подраздел 4 части 3 связан с общим аудио кодированием. ISO/IEC 14496, часть 3, раздел 4 определяет концепцию кодирования и декодирования общего аудио содержания. Кроме того, дальнейшие улучшения были предложены с целью улучшения качества и/или снижения необходимой скорости передачи данных.
Согласно концепции, описанной в указанном стандарте, во временной области звуковой сигнал преобразуется в частотно-временное представление. Преобразование из временной области в частотно-временную область, как правило, осуществляется с помощью блоков преобразования, который обозначаются как "кадры" из образцов временной области. Было установлено, что выгоднее использовать перекрывающиеся кадры, которые перемещаются, например, на половину кадра, так как перекрытие позволяет эффективно избежать (или хотя бы уменьшить) артефакты. Кроме того, было обнаружено, что оконная работа должна быть выполнена для того, чтобы избежать артефактов, происходящих из этой обработки временно ограниченных кадров.
При преобразовании оконной части входного звукового сигнала из временной области в частотно-временную область, уплотнение энергии получается во многих случаях, так что некоторые спектральные значения составляют значительно большую величину, чем множество других спектральных значений. Соответственно, во многих случаях есть сравнительно небольшое число спектральных значений с величиной, которая существенно выше средней величины спектральных значений. Типичным примером преобразования из временной области в частотно-временную область, приводящего к уплотнению энергии, является так называемое модифицированное дискретное косинус преобразование (MDCT).
Спектральные значения часто масштабируются и квантуются в соответствии с психоакустической моделью, так что ошибки квантования сравнительно меньше для психоакустичеки важных спектральных значений и сравнительно больше для психоакустически менее важных спектральных значений. Масштабированные и квантованные спектральные значения кодируются в целях обеспечения эффективного битрейта их представления.
Например, использование так называемого Huffman кодирования квантованных спектральных коэффициентов описано в международном стандарте ISO/IEC 14496-3:2005 (Е), часть 3, раздел 4.
Тем не менее, было установлено, что качество кодирования спектральных значений оказывает значительное влияние на требуемый битрейт. Кроме того, было установлено, что сложность аудио декодирования, которое часто осуществляется в портативных устройствах потребителей, и которое поэтому должно быть дешевыми и потреблять мало энергии, зависит от кодирования, используемого для кодирования спектральных значений.
В связи с этой ситуацией, есть необходимость в концепции кодирования и декодирования аудио содержания, которая предусматривает улучшение компромисса между битрейт эффективностью и эффективностью использования ресурсов.
Сущность изобретения
Примером воплощения изобретения является аудио декодер для получения декодированной аудио информации на основе кодированной аудио информации. Аудио декодер включает в себя арифметический декодер для предоставления множества декодированных спектральных значений на основе арифметически-кодированного представления спектральных значений. Аудио декодер также включает конвертер из частотной области во временную область для обеспечения во временной области аудио представления с помощью декодированных спектральных значений в целях получения декодированной аудио информации. Арифметический декодер предназначен для выбора правила отображения, описывающего отображение значения кода (который может быть извлечен из битового потока, представляющего кодированную аудио информацию) в код символа (который может быть числовым значением, представляющим декодированное спектральное значение или его наиболее значимую битовую плоскость) в зависимости от состояния контекста. Арифметический декодер настроен определять числовое значение текущего контекста, описывающее текущее состояние контекста в зависимости от множества ранее декодированных спектральных значений, а также в зависимости от того, где находится декодируемое спектральное значение - в первой заданной частотной области или во второй заданной частотной области.
Обнаружено, что если учитывать частотную область, в которой находится декодируемое частотное значение, то это позволит значительно улучшить качество вычисления контекста без значительного увеличения объема вычислений, необходимых для вычисления контекста. Кроме этого, принимая во внимание тот факт, что статистические зависимости между ранее декодированными спектральными значениями и расположенным рядом декодируемым спектральным значением изменяются в зависимости от частоты, можно выбрать контекст, который обеспечит высокую эффективность кодирования как для декодирования спектральных значений, соответствующих относительно низким частотам, так и для декодирования спектральных значений, соответствующих относительно высоким частотам. Хорошая адаптация контекста к деталям статистических зависимостей между декодируемым спектральным значением и ранее декодированными спектральными значениями (обычно не находящиеся в непосредственной или косвенной близости от спектрального значения, декодируемого в настоящий момент) позволяет увеличить эффективность кодирования, оставляя при этом вычислительные затраты небольшими. Обнаружено, что учет частотной области возможен при незначительных затратах, т.к. индекс частоты декодируемого спектрального значения, разумеется, определяется в процессе арифметического декодирования. Таким образом, выборочная адаптация контекста может производится при незначительных вычислительных затратах и при этом повышать эффективность кодирования.
В предпочтительном варианте арифметический декодер настроен выборочно модифицировать числовое значение текущего контекста в зависимости от того, где находится декодируемое спектральное значение - в первой заданной частотной области или во второй заданной частотной области. Выборочная модификация числового значения текущего контекста совместно с вычислением (или иным определением) числового значения текущего контекста позволяет комбинировать «обычное» вычисление (или иное определение) числового значения текущего контекста с учетом частотной области, в которой находятся спектральные значения, декодируемые в данный момент.. «Обычное» вычисление числового значения текущего контекста может быть проведено отдельно от адаптации числового значения текущего контекста в зависимости от частотной области, которая обычно упрощает алгоритм и уменьшает вычислительные затраты. Используя данную концепцию, можно легко обновить системы, включающие «обычное» вычисление числового значения текущего контекста.
В предпочтительном варианте арифметический декодер настроен определять числовое значение текущего контекста таким образом, что числовое значение текущего контекста основано на комбинации множества ранее декодированных спектральных значений или на комбинации множества промежуточных значений, производных от множества ранее декодированных спектральных значений, и при этом числовое значение текущего контекста выборочно превышает значение, полученное на основе комбинации множества ранее декодированных спектральных значений или на основе комбинации множества промежуточных значений, производных от множества ранее декодированных спектральных значении, в зависимости от того, где находится декодируемое спектральное значение - в первой заданной частотной области или во второй заданной частотной области. Обнаружено, что выборочное увеличение числового значения текущего контекста в зависимости от частотной области, в которой находится спектральное значение, декодируемое в настоящий момент, позволяет эффективно оценить числовое значение текущего контекста, оставляя при этом вычислительные затраты незначительными.
В предпочтительном варианте арифметический декодер настроен разграничивать по меньшей мере первую частотную область и вторую частотную область для того, чтобы определить числовое значение текущего контекста, при этом первая частотная область включает по меньшей мере 15% спектральных значений, соответствующих данной временной области (например, фрейму или подфрейму) аудио контента, при этом первая частотная область является областью низких частот и включает соответствующее спектральное значение, имеющее самую низкую частоту (в пределах набора спектральных значений, соответствующих данной (текущей) временной области аудио контента. Было обнаружено, что можно достичь хорошей адаптации контекста, если просто рассматривать нижнюю часть спектра (включающую по меньшей мере 15% спектральных значений) как первую частотную область, т.к. статистические зависимости между спектральными значениями не содержат сильных колебаний в области низких частот. В связи с этим количество различных областей может быть небольшим, что поможет избежать использование большого количества различных правил отображения. Однако для некоторых вариантов реализации изобретения может быть достаточно, если первая частотная область включает по меньшей мере одно спектральное значение, по меньшей мере два спектральных значения или по меньшей мере три спектральных значения, хотя предпочтителен выбор более расширенной первой спектральной области.
В предпочтительном варианте арифметический декодер настроен разграничивать по меньшей мере между первой частотной областью и второй частотной областью для того, чтобы определить числовое значение текущего контекста, при этом вторая частотная область включает по меньшей мере 15% спектральных значений, соответствующих заданной темпоральной области (например, фрейму, или подфрейму) аудио контента, при этом вторая частотная область является областью высоких частот и включает соответствующее спектральное значение, имеющее самую высокую частоту (в пределах набора спектральных значений, соответствующих данной (текущей) временной области аудио контента). Было обнаружено, что хорошей адаптации контекста можно достичь, если просто учитывать верхнюю часть спектра (включающую, по меньшей мере, 15% спектральных значений) как вторую частотную область, так как статистические зависимости между спектральными значениями не содержат сильных колебаний в области высоких частот. В связи с этим количество различных областей может быть небольшим, что в свою очередь поможет избежать использования большого количества различных правил отображения. Однако, для некоторых вариантов реализации изобретения может быть достаточно, если вторая частотная, область включает по меньшей мере одно спектральное значение, по меньшей мере два спектральных значений, или по меньшей мере три спектральных значений, хотя предпочтителен выбор более расширенной второй спектральной области.
В предпочтительном варианте арифметический декодер настроен разграничивать по меньшей мере, первую спектральную область, вторую спектральную область и третью спектральную область для того, чтобы определить числовое значение текущего контекста в зависимости от того, в какой из по меньшей мере трех частотных областей находится декодируемое спектральное значение. В этом случае первая, вторая и третья частотные области включают множества соответствующих спектральных значений. Было обнаружено, что для обычных аудио сигналов предпочтительно разграничивать по меньшей мере три различные частотные области, так как обычно существуют по меньшей мере три частотные области, в которых есть статистические зависимости между спектральными значениями. Рекомендуется (хотя это не обязательно) разграничивать три и более частотных областей даже для узкополосных аудио сигналов (например, для аудио сигналов, имеющих частотный диапазон от 300 Гц до 3 кГц). Для аудио сигналов, имеющих более высокий диапазон частот, предпочтительно (хотя не обязательно) разграничивать три или более расширенные частотные области (каждая их которых имеет более чем одно соответствующее ей спектральное значение).
В предпочтительном варианте по меньшей мере 1/8 спектральных значений (текущей) временной области аудио информации соответствует первой частотной области, по меньшей мере 1/5 спектральных значений (текущей) временной части аудио информации соответствует второй частотной области, и по меньшей мере V* спектральных значений (текущей) временной области аудио информации соответствует третьей частотной области. Рекомендуется использовать достаточно большие частотные области, поскольку достаточно большие частотные области позволяют найти компромисс между эффективным кодированием и сложностью вычисления. Также было обнаружено, что использование очень маленьких частотных областей (например, частотных областей, включающих только одно соответствующее спектральное значение) неэффективно с точки зрения вычисления и может даже ухудшить эффективность кодирования. Кроме этого, необходимо отметить, что выбор достаточно больших частотных областей (например, частотных областей, включающих по меньшей мере два соответствующих спектральных значения) предпочтителен, даже при использовании двух частотных областей.
В предпочтительном варианте арифметический декодер настроен вычислять сумму, включающую, по меньшей мере первое слагаемое и второе слагаемое, для того, чтобы получить числовое значение текущего контекста в результате суммирования. В этом случае первое слагаемое представляет собой комбинацию множества промежуточных значений, которые описывают величины ранее декодированных спектральных значений, и второе слагаемое показывает какой частотной области из множества частотных областей соответствует декодируемое (в настоящий момент) спектральное значение. При таком подходе можно разграничивать вычисление контекста на основе информации о величинах раннее декодируемых спектральных значений и адаптацию контекста в зависимости от области, которой соответствует декодируемое в настоящий момент спектральное значение. Обнаружено, что величины раннее декодированных спектральных значений являются важным индикатором окружения спектрального значения, декодируемого в настоящий момент. Определение статистических зависимостей, которые базируются на оценке величин раннее декодированных спектральных значений, может быть более эффективным, если принимать во внимание частотную область, которой соответствует декодируемое в настоящий момент спектральное значение. С точки зрения вычислений достаточно включать информацию о частотной области в числовое значение текущего контекста в качестве значения суммы, даже такой простой механизм улучшает числовое значение текущего контекста.
В предпочтительном варианте арифметический декодер настроен модифицировать одну или более заданных битовых позиций двоичного представления числового значения текущего контекста в зависимости от того, в какой частотной области из множества различных частотных областей находится декодируемое спектральное значение.
Использование выделенных битовых позиций для информации о частотной области облегчает выбор правила отображения в зависимости от числового значения текущего контекста. Например, при использовании заданной битовой позиции числового значения текущего контекста для описания частотной области, которой соответствует декодируемое спектральное значение, выбор правила отображения может быть упрощен. Например, обычно существует ряд контекстных ситуаций, в которых применяется одно и то же правило отображения. в присутствии определенного окружения (в плане спектральных значений) спектрального значения, декодируемого в настоящий момент независимо от частотной области, которой соответствует декодируемое в настоящий момент спектральное значение. В таких случаях информация относительно частотной области, которой соответствует декодируемое в настоящий момент значение, может остаться не учтенной, чему способствует использование заданной битовой позиции для кодирования информации. Однако в остальных случаях, то есть для различных комбинаций (в плане спектральных значений) окружения спектрального значения, декодируемого в настоящий момент, информация о частотной области, соответствующей декодируемым в настоящий момент спектральным значениям может использоваться при выборе правила отображения.
В предпочтительном варианте арифметический декодер настроен выбирать правило отображения в зависимости от числового значения текущего контекста таким образом, что для множества различных числовых значений текущего контекста в результате выбирается одно и то же правило отображения. Концепцию, согласно которой принимается во внимание частотная область, которой соответствует декодируемое в настоящий момент спектральное значение, можно сочетать с концепцией, согласно которой одно и то же правило отображения соответствует множеству различных числовых значений текущего контекста. Нет необходимости всегда учитывать частоту, соответствующую декодируемому в настоящий момент спектральному значению, однако, необходимо, по меньшей мере в некоторых случаях, учитывать информацию о частотной области, соответствующую декодируемому в настоящий момент спектральному значению.
В предпочтительном варианте арифметический декодер настроен выполнять двухшаговый выбор правила отображения в зависимости от числового значения текущего контекста. В этом случае арифметический декодер настроен проверять, на первом шаге выбора, идентично ли числовое значение текущего контекста величине значимого состояния, описанного с помощью записи таблицы прямого попадания. Арифметический декодер настроен определять, на втором шаге выбора, который выполняется только в том случае, если числовое значение текущего контекста отличается от величин значимых состояний, описанных с помощью записей таблицей прямого попаданий, в каком из интервалов из интервалов, среди множества интервалов, находится числовое значение текущего контекста. В этом случае арифметический декодер настроен выбирать правило отображения в зависимости от результата первого шага выбора и/или второго шага выбора. Арифметический декодер также настроен выбирать правило выбора в зависимости от того в какой частотной области находится декодируемое спектральное значение - в первой или во второй частотной области. Обнаружено, что комбинация описанной выше концепции вычисления числового значения текущего контекста с двухшаговым выбором правила отображения имеет ряд преимуществ. Например, при использовании данной концепции возможно определение различных конфигураций контекста «прямого попадания», которым соответствует правило отображения на первом шаге выборе, для декодируемых спектральных значений, расположенных в различных частотных областях. Также второй шаг выбора, когда производится выбор правила отображения на основе интервала, подходит для обработки тех ситуаций, (окружения раннее декодированных спектральных значений), в которых не желателен (или, по меньшей мере в нем нет необходимости) учет частотной области, которой соответствует спектральное значение, декодируемое в настоящий момент.
В предпочтительном варианте арифметический декодер настроен выборочно модифицировать одну или более наименее значимых битовых позиций двоичного представления числового значения текущего контекста в зависимости от того в какой частотной области из множества различных частотных областей находится декодируемое спектральное значение. В этом случае арифметический декодер настроен определять в. процессе второго шага выбора в каком интервале из множества интервалов находится двоичное представление числового значения текущего контекста, для того чтобы выбрать отображение таким образом, что для нескольких числовых значений текущего контекста выбирается одно и то же правило отображение независимо от того, в какой частотной области находится декодируемое спектральное значение, а также таким образом, что для нескольких числовых значений текущего контекста правило отображения выбирается в зависимости от того в какой частотной области находится кодируемое спектральное значение. Механизм, согласно которому, частотная область кодируется в наименее значимых битах двоичного представления числового значения текущего контекста, вполне подходит для продуктивной совместной работы с двухшаговым выбором правила отображения.
Другой вариант использования изобретения приводит к созданию аудио кодера для получения кодированной аудио информации на основе входной аудио информации. Аудио кодер включает в себя энергоуплотняющий конвертер из временной области в частотную для обеспечения в частотной области аудио представления на основе представления входной аудио информации во временной области, так что аудио представление в частотной области включает в себя набор спектральных значений. Арифметический кодер настроен на кодирование спектрального значения, или его предварительно обработанной версии с помощью кодового слова с переменной длиной. Арифметический кодер настроен для отображения спектрального значения, или значения наиболее значимого бита плоскости спектрального значения на значение кода (которое может быть включено в битовый поток, представляющий входную аудио информацию в кодированной форме). Арифметический кодер предназначен для выбора правила отображения, описывающего отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода в зависимости от состояния контекста. Арифметический кодер предназначен, чтобы определять числовое значение текущего контекста, описывающее текущее состояние контекста в зависимости от множества ранее кодированных спектральных значений, а также в зависимости от того, где находится кодируемое спектральное значение - в первой заданной частотной области или во второй заданной частотной области.
Этот кодер аудио сигнала основан на тех же открытиях, как и декодер аудио сигнала, описанный выше. Было установлено, что механизм адаптации контекста, который показал свою эффективность для декодирования аудио содержания, следует также применять на стороне кодера для того, чтобы обеспечить последовательность системы.
Примером воплощения данного изобретения является создание способа для получения декодированной аудио информации на основе кодированной аудио информации.
Еще одним примером воплощения данного изобретения является создание способа для получения кодированной аудио информации на основе входной аудио информации.
Другой вариант воплощения изобретения содержит компьютерную программу для выполнения одного из указанных способов.
Эти способы и компьютерная программа основываются на тех же открытиях, как и вышеописанные аудио декодер и аудио кодер.
Краткое описание фигур
Использования изобретения будут далее описаны со ссылкой на прилагаемые фигуры, на которых:
Фиг.1 показывает блок-схему аудио кодера, согласно одному из вариантов использования изобретения;
Фиг.2 показывает блок-схему аудио декодера в соответствии с одним из вариантов использования изобретения;
Фиг.3 показывает представление кода псевдо-программы алгоритма "value_decode ()" для декодирования спектрального значения;
Фиг.4 показывает схематическое представление контекста для вычисления контекста;
Фиг.5а показывает представление кода псевдо-программы алгоритма "arith_map_context ()" для отображения контекста;
Фиг.5b и 5 с показывают представление кода псевдо-программы алгоритма "arith_get_context ()" для получения значения состояния контекста;
Фиг.5d показывает представление кода псевдо-программы алгоритма "get_pk(s)" для извлечения значения индекса сводной таблицы частот „pki" из переменной состояния;
Фиг.5е показывает представление кода псевдо-программы алгоритма "arith_get_pk(s)" для извлечения значения индекса сводной таблицы частот „pki" из значения состояния;
Фиг.5f показывает представление кода псевдо-программы алгоритма "get_pk(unsigned long s)" для извлечения значения индекса сводной таблицы частот „pki" из значения состояния;
Фиг.5g показывает представление кода псевдо-программы алгоритма "arith_decode ()" для арифметического декодирования символа из кодового слова переменной длины;
Фиг.5h показывает представление кода псевдо-программы алгоритма "arith_update_context ()" для обновления контекста;
Фиг.5i показывает легенду определений и переменных;
Фиг.6а показывает синтаксис представления необработанного блока единого кодирования речи и аудио (USAC);
Фиг.6b показывает синтаксис представления единого элемента канала;
Фиг.6с показывает синтаксис представления парного элемента канала;
Фиг.6d показывает синтаксис представления "ics" контрольной информации;
Фиг.6е показывает синтаксис представления потока канала частотной области;
Фиг.6f показывает синтаксис представления арифметически кодированных спектральных данных;
Фиг.6g показывает синтаксис представление для декодирования множества спектральных значений;
Фиг.6h показывает легенду элементов данных и переменных;
Фиг.7 показывает блок-схему аудио кодера, согласно другому варианту осуществления изобретения;
Фиг.8 показывает блок-схему аудио декодера в соответствии с другим вариантом использования изобретения;
Фиг.9 показывает организацию сравнения бесшумного кодирования в соответствии с рабочим проектом 3 проекта стандарта USAC с схемой кодирования в соответствии с настоящим изобретением:
Фиг.10а показывает схематическое представление контекста расчета состояния, так как оно используется в соответствии с рабочим проектом 4 проекта стандарта US АС;
Фиг.10b показывает схематическое представление контекста расчета состояния, так как оно используется воплощениях в соответствии с изобретением;
Фиг.11а показывает обзор таблицы, используемой в схеме арифметического кодирования в соответствии с рабочим проектом 4 проекта стандарта USAC;
Фиг.11b показывает обзор таблицы, используемой в схеме арифметического кодирования в соответствии с изобретением;
Фиг.12а показывает графическое представление запроса памяти только для чтения на схемы бесшумного кодирования в соответствии с настоящим изобретением и в соответствии с рабочим проектом 4 проекта стандарта USAC;
Фиг.12b показывает графическое представление общего запроса данных памяти только для чтения декодера USAC в соответствии с настоящим изобретением и в соответствии с рабочим проектом 4 проекта стандарта USAC;
Фиг.13а показывает таблицу представления средних битрейтов, которые используются кодером единого кодирования речи и аудио, с помощью арифметического кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и арифметическим декодером в соответствии с вариантом осуществления настоящего изобретения;
Фиг.13b показывает таблицу представления контроля резервуара бит для кодера единого кодирования речи и аудио с помощью арифметического кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и арифметического кодера в соответствии с вариантом осуществления настоящего изобретения;
Фиг.14 показывает таблицу представления средних битрейтов USAC кодера в соответствии с рабочим проектом 3 проекта стандарта USAC и в соответствии с вариантом осуществления настоящего изобретения;
Фиг.15 показывает таблицу представления минимального, максимального и среднего битрейта USAC на основе кадра;
Фиг.16 показывает таблицу представления лучшего и худшего случаев на основе кадра;
Фиг.17(1) и 17(2) показывают таблицу представления содержания таблицы "ari_s_hash[387]";
Фиг.18 показывает таблицу представления содержания таблицы "ari_gs_hash[225]";
Фиг.19 (1) и 19 (2) показывают таблицу представления содержания таблицы "ari_cf_m[64][9]"; и
Фиг.20 (1) и 20 (2) показывают таблицу представления содержания таблицы "ari_s_hash[387]".
Фиг.21 показывает блок-схему аудио кодера в соответствии с_ вариантом использования изобретения; и
Фиг.22 показывает блок-схему аудио декодера в соответствии с вариантом использования изобретения.
Подробное описание вариантов использования изобретения
1. Аудио кодер в соответствии с фиг.7
Фиг.7 показывает блок-схему аудио кодера, согласно одному из вариантов использования изобретения; Аудио декодер 700 настроен на получение входной аудио информации 710 и на представлении на ее основе кодированной аудио информации 712. Аудио кодер включает в себя энергоуплотняющий конвертер из временной области в частотную 720, который предназначен для обеспечения в частотной области аудио представления 722 на основе представления входной аудио информации 710 во временной области, так что аудио представление в частотной области 722 включает в себя набор спектральных значений. Аудио кодер 700 также включает в себя арифметический кодер 730, предназначенный для кодирования спектрального значения (из множества спектральных значений, формирующих в частотной области аудио представление 722), или его предварительно обработанной версии с помощью кодового слова переменной длиной, чтобы получить кодированную аудио информацию 712 (которая может включать, например, множество кодовых слов переменной длины).
Арифметический кодер 730 настроен на отображение спектрального значения или значения наиболее значимого бита плоскости спектрального значения на значение кода (т.е. на кодовое слово переменной длины) в зависимости от состояния контекста. Арифметический кодер 730 предназначен для выбора правила отображения, описывающего отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода в зависимости от состояния контекста. Арифметический кодер предназначен, чтобы определять текущее состояние контекста в зависимости от множества ранее кодированных смежных спектральных значений. Для этого арифметический кодер настроен на обнаружение группы из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины, а также для определения текущего состояния контекста в зависимости от результата обнаружения.
Как можно видеть, отображение спектрального значения или наиболее значимого бита плоскости спектрального значения на значение кода может осуществляться кодированием спектрального значения 740 с помощью отображения 742. Трекер состояния 750 может быть сконфигурирован для отслеживания состояния контекста и может включать в себя детектор группы 752 для обнаружения группы из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины. Трекер состояния 750 также желательно настроить для определения текущего состояния контекста в зависимости от результата этого обнаружения, выполненного детектором группы 752. Таким образом, трекер состояния 750 обеспечивает информацию 754, описывающую текущее состояние контекста. Селектор правила отображения 760 может выбрать правило отображения, например, сводную таблицу частот, описывающую отображение спектрального значения, или наиболее значимого бита плоскости спектрального значения, на значение кода. Соответственно, селектор правила отображения 760 предоставляет информацию правила отображения 742 для спектрального кодирования 740.
Подводя итог вышесказанному, аудио кодер 700 выполняет арифметическое кодирование в частотной области аудио представления, осуществляемого конвертером из временной области в частотную. Арифметическое кодирование зависит от контекста, например, правило отображения (например, сводная таблица частот) выбирается в зависимости от ранее кодированных спектральных значений. Таким образом, спектральные значения, смежные во времени и/или частоте (или, по крайней мере, в заданном окружении) друг с другом и/или с в данный момент кодируемым спектральным значением (т.е. спектральные значения в заданном окружении в данный момент кодируемого спектрального значения) рассматриваются в арифметическом кодировании для регулировки распределения вероятности, оцениваемой арифметическим кодированием. При выборе соответствующего правила отображения, обнаружения проводится с целью выявления, есть ли группа из множества ранее кодированных смежных спектральных значений, которые соответствуют, по отдельности или вместе взятые, заданному условию относительно их величины. Результат этого обнаружения применяется при выборе текущего состояния контекста, т.е. при выборе правила отображения. Определив, существует ли группа из множества спектральных значений, которые являются особенно малыми или особенно большими, можно распознать особенности в частотной области аудио представления, которое может быть частотно-временным представлением. Особые черты, такие как, например, группа из множества особенно малых или особенно больших спектральных значений, показывают, что особое состояние контекста следует использовать, поскольку это особое состояние контекста может дать особенно хорошую эффективность кодирования. Таким образом, выявление группы смежных спектральных значений, которые удовлетворяют заданному условию, что обычно используется в сочетании с альтернативной оценкой контекста, основанной на сочетании множества ранее кодированных спектральных значений, представляет собой механизм, который позволяет эффективно выбирать соответствующий контекст, если входная аудио информация требует некоторых особых состояний (например, содержит большой маскированный диапазон частот).
Соответственно, эффективное кодирование может быть достигнуто при сохранении расчета контекста достаточно простым.
2. Аудио декодер в соответствии с фиг.8
Фиг.8 показывает блок-схему аудио декодера 800. Аудио декодер 800 настроен на получение кодированной аудио информации 810 и на представлении на ее основе декодированной аудио информации 812. Аудио декодер 800 включает в себя арифметический декодер 820, который предназначен для предоставления множества декодированных спектральных значений 822 на основе арифметически-кодированного представления 821 спектральных значений. Аудио декодер 800 также включает конвертер из частотной области во временную область 830, который предназначен для получения декодированных спектральных значений 822 и предоставления во временной области аудио представления 812, которое может включать декодированную аудио информацию, с помощью декодированных спектральных значений 822, для получения декодированной аудио информации 812.
Арифметический декодер 820 включает в себя определитель спектрального значения 824, настроенный на отображения зна