Усовершенствованный квантователь

Иллюстрации

Показать все

Настоящее изобретение относится к системе звукового кодирования и декодирования. Технический результат заключается в повышении гибкости в отношении допущения разных скоростей передачи данных и разных уровней искажений. Модуль квантования, сконфигурированный для квантования первого коэффициента из блока коэффициентов. Этот блок коэффициентов содержит ряд коэффициентов для ряда соответствующих элементов разрешения по частоте. Модуль квантования сконфигурирован для создания набора квантователей. Этот набор квантователей содержит ряд различных квантователей, связанных с рядом различных отношений сигнал-шум, соответственно, именуемых SNR. Этот ряд различных квантователей содержит квантователь с заполнением шумом; один или несколько квантователей с добавлением псевдослучайного шума; и один или несколько квантователей без добавления псевдослучайного шума. Модуль квантования также сконфигурирован для определения указателя SNR, служащего признаком SNR, приписанного указанному первому коэффициенту, и для выбора первого квантователя из набора квантователей на основе этого указателя SNR. В дополнение, модуль квантования сконфигурирован для квантования указанного первого коэффициента с использованием указанного первого квантователя. 6 н. и 14 з.п. ф-лы, 19 ил.

Реферат

ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИ

Данная заявка заявляет приоритет предварительной заявки на патент США №61/808,673, поданной 5 апреля 2013 г., и предварительной заявки на патент США №61/875,817, поданной 10 сентября 2013 г., каждая из которых ссылкой полностью включается в данное описание.

ОБЛАСТЬ ТЕХНИЧЕСКОГО ПРИМЕНЕНИЯ

Настоящий документ относится к системе звукового кодирования и декодирования (именуемой системой звукового кодека). В частности, настоящий документ относится к системе звукового кодека на основе преобразования, особенно хорошо подходящей для голосового кодирования/декодирования.

ПРЕДПОСЫЛКИ

Перцепционные звуковые кодеры общего назначения достигают относительно высоких эффективностей кодирования путем использования таких преобразований, как модифицированное дискретное косинусное преобразование (MDCT) с размерами блоков дискретных значений, охватывающими несколько десятков миллисекунд (например, 20 мс). Одним из примеров такой системы звукового кодека на основе преобразования является Advanced Audio Coding (ААС) или High Efficiency (HE)-AAC. Однако при использовании таких систем звуковых кодеков на основе преобразования для голосовых сигналов качество голосовых сигналов в направлении более низких битовых скоростей передачи данных ухудшается быстрее, чем таковое для музыкальных сигналов, особенно в случае сухих (нереверберирующих) речевых сигналов.

Настоящий документ описывает систему звукового кодека на основе преобразования, особенно хорошо подходящую для кодирования речевых сигналов. Кроме того, настоящий документ описывает схемы квантования, которые можно использовать в такой системе звукового кодека на основе преобразования. В сочетании с системами кодеков на основе преобразовании можно использовать и другие различные схемы квантования. Примерами являются векторное квантование (например, двойное векторное квантование), квантование с сохранением распределения, квантование с добавлением псевдослучайного шума, скалярное квантование со случайным смещением и скалярное квантование, объединенное с заполнением шумом (например, в квантователе, описанном в патенте США №7447631). Эти различные схемы квантования обладают разнообразными преимуществами и недостатками в отношении одного или нескольких из следующих определяющих признаков:

- оперативная сложность (кодера), как правило, включающая вычислительную сложность квантования и генерирования битового потока (например, кодирования переменной длины);

- перцепционная производительность, которую можно оценить на основе теоретических представлений (производительность в отношении зависимости искажений от скорости передачи данных) и на основе характерных признаков связанного поведения заполнения шумом (например, при битовых скоростях передачи данных, практически значимых для кодирования речи с преобразованием на низкой скорости передачи данных);

- сложность процесса распределения битов в присутствии общего ограничения битовой скорости передачи данных (например, максимального количества битов); и/или

- гибкость в отношении допущения разных скоростей передачи данных и разных уровней искажений.

В настоящем документе описывается схема квантования, обращенная по меньшей мере к некоторым из вышеупомянутых определяющих признаков. В частности, описывается схема квантования, обеспечивающая повышенную производительность в отношении некоторых или всех вышеупомянутых определяющих признаков.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Согласно одной из особенностей, описывается модуль квантования (также именуемый в настоящем документе модулем квантования коэффициентов), сконфигурированный для квантования первого коэффициента из блока коэффициентов. Этот блок коэффициентов может соответствовать блоку остаточных коэффициентов предсказания (также именуемому блоком коэффициентов ошибок предсказания), или он может быть полученным из него. Как таковой, указанный модуль квантования может составлять часть звукового кодера на основе преобразования, использующего предсказание поддиапазонов, как в дальнейших подробностях описывается ниже. В общем выражении, блок коэффициентов может содержать ряд коэффициентов для ряда соответствующих элементов разрешения по частоте. Блок коэффициентов можно получить исходя из блока коэффициентов преобразования, причем этот блок коэффициентов преобразования был определен путем преобразования звукового сигнала (например, речевого сигнала) из временной области в частотную область с использованием преобразования из временной области в частотную область (например, модифицированного дискретного косинусного преобразования, MDCT).

Следует отметить, что указанный первый коэффициент блока коэффициентов может соответствовать любому одному или нескольким коэффициентам этого блока коэффициентов. Блок коэффициентов может содержать K коэффициентов (K>1, например, K=256). Указанный первый коэффициент может соответствовать любому одному из частотных коэффициентов k=1, …, K. Как будет описано впоследствии, ряд элементов разрешения по частоте можно сгруппировать в ряд из L полос частот, где 1<L<K. Коэффициент блока коэффициентов можно присвоить одной полосе из ряда полос частот (l=1, L). Коэффициенты q, где q=1, …Q и 0<Q<K, присвоенные конкретной полосе 1 частот, можно квантовать, используя один и тот же квантователь. Первый коэффициент может соответствовать q-му коэффициенту l полосы частот для любого q=1, …Q и для любого l=1, …, L.

Модуль квантования может быть сконфигурирован для создания набора квантователей. Этот набор квантователей может содержать ряд различных квантователей, связанных с рядом различных отношений сигнал-шум (SNR) или, соответственно, рядом различных уровней искажений. Как таковые, эти различные квантователи из набора квантователей могут приводить к соответствующим отношениям SNR, или уровням искажений. Квантователи в наборе квантователей могут быть упорядочены в соответствии с рядом отношений SNR, связанных этим рядом квантователей. В частности, квантователи могут быть упорядочены так, что отношение SNR, получаемое с использованием конкретного квантователя, увеличивается по сравнению с SNR, полученным с использованием непосредственно предшествующего смежного квантователя.

Этот набор квантователей также может именоваться набором приемлемых квантователей. Как правило, количество квантователей, заключенных в наборе квантователей, ограничено количеством R квантователей. Это количество R квантователей, заключенных в наборе квантователей, может быть выбрано на основе всего диапазона SNR, который необходимо охватить этим набором квантователей (например, диапазона SNR от, приблизительно, 0 дБ до 30 дБ). Кроме того, количество R квантователей, как правило, зависит от целевой разности SNR между смежными квантователями в пределах упорядоченного набора квантователей. Типичные значения для количества R квантователей составляют 10-20 квантователей.

Указанный набор различных квантователей может содержать квантователь с заполнением шумом, один или несколько квантователей с добавлением псевдослучайного шума и/или один или несколько квантователей без добавления псевдослучайного шума. В одном из предпочтительных примеров указанный набор различных квантователей содержит единственный квантователь с заполнением шумом, один или несколько квантователей с добавлением псевдослучайного шума и один или несколько квантователей без добавления псевдослучайного шума. Как будет описано в настоящем документе, преимущественным является использование квантователя с заполнением шумом для ситуации нулевой битовой скорости передачи данных (например, вместо использования квантователя с добавлением псевдослучайного шума с большой величиной шага квантования). Квантователь с заполнением шумом связан с относительно наинизшим SNR из ряда отношений SNR, а один или несколько квантователей без добавления псевдослучайного шума могут быть связаны одним или несколькими наивысшими отношениями SNR из ряда отношений SNR. Один или несколько квантователей с добавлением псевдослучайного шума могут быть связаны с одним или несколькими промежуточными отношениями SNR, выше, чем относительное наинизшее отношение SNR, и ниже, чем относительно наивысшие отношения SNR из ряда отношений SNR. Как таковой, упорядоченный набор квантователей может содержать квантователь с заполнением шумом для наинизшего SNR (например, меньшего или равного 0 дБ), за которым следуют один или несколько квантователей с добавлением псевдослучайного шума для промежуточных отношений SNR, а за ними следуют один или несколько квантователей без добавления псевдослучайного шума для относительно высоких отношений SNR. Поступая таким образом, можно повысить воспринимаемое качество восстановленного звукового сигнала (получаемого из блока квантованных коэффициентов, квантованных с использованием этого набора квантователей). В частности, можно уменьшать слышимые артефакты, вызванные спектральными провалами, и, в то же время, поддерживать на высоком уровне производительность модуля квантования в отношении MSE (среднеквадратичной ошибки).

Квантователь с заполнением шумом может содержать генератор случайных чисел, сконфигурированный для генерирования случайных чисел в соответствии с предварительно определенной статистической моделью. Эта предварительно определенная статистическая модель генератора случайных чисел квантователя с заполнением шумом может зависеть от дополнительной информации (например, от флага сохранения дисперсии), доступной в кодере и в соответствующем декодере. Квантователь с заполнением шумом может быть сконфигурирован для квантования первого коэффициента (или любого из коэффициентов блока коэффициентов) путем замены первого коэффициента случайным числом, сгенерированным генератором случайных чисел. Генератор случайных чисел, используемый в модуль квантования (например, в локальном декодере, заключенном в кодере) может действовать в синхронном режиме с соответствующим генератором случайных чисел в модуле обратного квантования (в соответствующем декодере). Как таковой, вывод квантователя с заполнением шумом может не зависеть от первого коэффициента, поэтому вывод квантователя с заполнением шумом может не требовать передачи каких-либо индексов квантования. Квантователь с заполнением шумом может быть связан с SNR, составляющим (близким или, по существу, равным) 0 дБ. Иными словами, квантователь с заполнением шумом может действовать с SNR, близким к 0 дБ. В ходе процесса распределения скорости передачи данных квантователь с заполнением шумом можно считать обеспечивающим SNR 0 дБ, хотя на практике его SNR может несколько отклоняться от нуля (например, может быть несколько ниже нуля дБ (по причине синтеза сигнала, не зависящего от входного сигнала)).

SNR квантователя с заполнением шумом можно корректировать на основе одного или нескольких дополнительных параметров. Например, дисперсию квантователя с заполнением шумом можно корректировать, задавая дисперсию синтезированного сигнала (т.е. дисперсию коэффициентов, которые были квантованы с использованием квантователя с заполнением шумом) в соответствии с предварительно определенной функцией коэффициента усиления предсказателя. В качестве альтернативы или в дополнение, дисперсию синтезированного сигнала можно задавать посредством флага, передаваемого в битовом потоке. В частности, дисперсию квантователя с заполнением шумом можно корректировать посредством одной из двух предварительно определенных функций коэффициента усиления предсказателя (в дальнейшем представленных в данном документе ниже), где одна из этих функций может быть выбрана для воспроизведения синтезированного сигнала в зависимости от флага (например, в зависимости от флага сохранения дисперсии). Например, дисперсию сигнала, генерируемого квантователем с заполнением шумом, можно корректировать таким способом, чтобы отношение SNR этого квантователя с заполнением шумом находилось в пределах диапазона [-3,0-0 дБ]. SNR при 0 дБ, как правило, является преимущественным в виду MMSE (минимальной среднеквадратичной ошибки). С другой стороны, воспринимаемое качество можно повысить, используя менее высокие отношения SNR (например, вплоть до -3,0 дБ).

Указанные один или несколько квантователей с добавлением псевдослучайного шума предпочтительно представляют собой квантователи с добавлением субтрактивного псевдослучайного шума. В частности, квантователь с добавлением псевдослучайного шума из указанных одного или нескольких квантователей с добавлением псевдослучайного шума может содержать модуль применения псевдослучайного шума, сконфигурированный для определения первого коэффициента с добавленным псевдослучайным шумом путем применения к указанному первому коэффициенту значения псевдослучайного шума (также именуемого числом псевдослучайного шума). Кроме того, квантователь с добавлением псевдослучайного шума может содержать скалярный квантователь, сконфигурированный для определения первого индекса квантования путем присвоения первого коэффициента с добавленным псевдослучайным шумом одному из интервалов этого скалярного квантователя. Как таковой квантователь с добавлением псевдослучайного шума может генерировать первый индекс квантования на основе первого коэффициента. Аналогичным образом можно квантовать один или несколько других коэффициентов из указанного блока коэффициентов.

Квантователь с добавлением псевдослучайного шума из одного или нескольких квантователей с добавлением псевдослучайного шума также может содержать обратный скалярный квантователь, сконфигурированный для присвоения первого восстанавливаемого значения первому индексу квантования. Кроме того, квантователь с добавлением псевдослучайного шума может содержать модуль удаления псевдослучайного шума, сконфигурированный для определения первого коэффициента с удаленным псевдослучайным шумом путем удаления значения псевдослучайного шума (то есть того же самого значения псевдослучайного шума, которое было применено модулем применения псевдослучайного шума) из первого восстанавливаемого значения.

Кроме того, квантователь с добавлением псевдослучайного шума может содержать модуль применения коэффициента последующего усиления, сконфигурированный для определения первого квантованного коэффициента путем применения коэффициента последующего усиления квантователя к первому коэффициенту с удаленным псевдослучайным шумом. Применяя коэффициент последующего усиления к первому коэффициенту с удаленным псевдослучайным шумом можно повысить производительность квантователя с добавлением псевдослучайного шума в отношении MSE. Коэффициент последующего усиления квантователя может иметь вид

,

где - дисперсия одного или нескольких коэффициентов блока коэффициентов, и где - величина шага квантователя для скалярного квантователя квантователя с добавлением псевдослучайного шума.

Как таковой, квантователь с добавлением псевдослучайного шума может быть сконфигурирован для выполнения обратного квантования с целью получения квантованного коэффициента. Это можно использовать в локальном декодере кодера, что облегчает предсказание в замкнутом цикле, например, тогда, когда цикл предсказания в кодере поддерживается в синхронном режиме с циклом предсказания в декодере.

Модуль применения псевдослучайного шума может быть сконфигурирован для вычитания значения псевдослучайного шума из указанного первого коэффициента, а модуль удаления псевдослучайного шума может быть сконфигурирован для добавления значения псевдослучайного шума к первому восстанавливаемому значению. В качестве альтернативы, модуль применения псевдослучайного шума может быть сконфигурирован для добавления значения псевдослучайного шума к первому коэффициенту, а модуль удаления псевдослучайного шума может быть сконфигурирован для вычитания значения псевдослучайного шума из первого восстанавливаемого значения.

Модуль квантования также может содержать генератор псевдослучайного шума, сконфигурированный для генерирования блока значений псевдослучайного шума. С целью облегчения синхронизации между кодером и декодером, эти значения псевдослучайного шума могут представлять собой псевдослучайные числа. Блок значений псевдослучайного шума может содержать ряд значений псевдослучайного шума, соответственно, для ряда элементов разрешения по частоте. Как таковой, генератор псевдослучайного шума может быть сконфигурирован для генерирования значения псевдослучайного шума для каждого из коэффициентов блока коэффициентов, подлежащего квантованию, независимо от того, должен ли конкретный коэффициент квантоваться с использованием одного из квантователей с добавлением псевдослучайного шума, или нет. Это является преимущественным для поддержания синхронности между генератором псевдослучайного шума, используемым в кодере, и генератором псевдослучайного шума, используемым в соответствующем декодере.

Скалярный квантователь квантователя с добавлением псевдослучайного шума имеет предварительно определенную величину шага квантователя. Как таковой, скалярный квантователь квантователя с добавлением псевдослучайного шума может представлять собой квантователь с равномерным шагом. Значения псевдослучайного шума могут принимать значения из предварительно определенного интервала псевдослучайного шума. Этот предварительно определенный интервал псевдослучайного шума может иметь ширину, меньшую или равную предварительно определенной величине шага квантователя. Кроме того, блок значений псевдослучайного шума может состоять из реализаций случайной переменной, равномерно распределенной в пределах предварительно определенного интервала псевдослучайного шума. Например, генератор псевдослучайного шума сконфигурирован для генерирования блока значений псевдослучайного шума, извлекаемых из нормированного интервала псевдослучайного шума (например, [0, 1) или [-0,5, 0,5)). Как таковая, ширина нормированного интервала псевдослучайного шума может быть равна единице. Блок значений псевдослучайного шума можно затем умножить на предварительно определенную величину шага конкретного квантователя с добавлением псевдослучайного шума. Поступая таким образом, можно получить реализацию псевдослучайного шума, пригодную для использования с квантователем, имеющим величину шага. В частности, поступая таким образом, получают квантователь, удовлетворяющий т.н. условиям Шухмана (L. Schuchman, "Dither signals and their effect on quantization noise", IEEE TCOM, pp. 162-165, декабрь 1964 г.).

Генератор псевдослучайного шума может быть сконфигурирован для выбора М предварительно определенных реализаций псевдослучайного шума, где М - целое число больше единицы. Кроме того, генератор псевдослучайного шума может быть сконфигурирован для генерирования блока значений псевдослучайного шума на основе выбранной реализации псевдослучайного шума. В частности, в некоторых реализациях количество реализаций псевдослучайного шума может быть ограниченным. Например, количество М предварительно определенных реализаций псевдослучайного шума может составлять 10, 5, 4 или менее. Это может быть преимущественным в отношении последующего энтропийного кодирования индексов квантования, которые были получены с использованием указанных одного или нескольких квантователей с добавлением псевдослучайного шума. В частности, использование ограниченного количества М реализаций псевдослучайного шума позволяет обучать энтропийный кодер для индексов квантования на основе ограниченного количества реализаций псевдослучайного шума. Поступая таким образом, вместо арифметического кода можно использовать мгновенный код (такой, как, например, многомерное кодирование методом Хаффмана), что может быть преимущественным в выражении оперативной сложности.

Квантователь без добавления псевдослучайного шума из одного или нескольких квантователей без добавления псевдослучайного шума может представлять собой скалярный квантователь с предварительно определенной равномерной величиной шага квантователя. Как таковые, один или несколько квантователей без добавления псевдослучайного шума могут представлять собой детерминированные квантователи, не использующие (псевдо-) случайный шум.

Как описывалось выше, набор квантователей может быть упорядоченным. Это может быть преимущественным в виду эффективного процесса распределения битов. В частности, упорядочение набора квантователей позволяет выбирать квантователь из набора квантователей на основе целочисленного индекса. Набор квантователей может быть упорядочен так, чтобы увеличение в SNR между смежными квантователями было, по меньшей мере, приблизительно постоянным. Иными словами, разность SNR между двумя квантователями может иметь вид разности отношений SNR, связанных с парой смежных квантователей из упорядоченного набора квантователей. Разности SNR для всех пар смежных квантователей из ряда упорядоченных квантователей может находиться в пределах предварительно определенного интервала разностей SNR с центром около предварительно определенной целевой разности SNR. Ширина предварительно определенного интервала разностей SNR может быть меньше чем 10% или 5% предварительно определенной целевой разности SNR. Целевая разность SNR может быть задана таким образом, чтобы операции в относительно широком общем диапазоне SNR мог воспроизводить относительно небольшой набор квантователей. Например, в типичных применениях набор квантователей может облегчать работу в пределах интервала от SNR 0 дБ до SNR 30 дБ. Предварительно определенная целевая разность SNR может быть приравнена к 1,5 дБ или 3 дБ, посредством чего общий диапазон SNR в 30 дБ может быть охвачен набором квантователей, содержащим 10-20 квантователей. Таким образом, увеличение целочисленного индекса квантователя из упорядоченного набора квантователей напрямую переводится в соответствующее увеличение SNR. Это взаимно-однозначное соответствие является преимущественным для реализации эффективного процесса распределения битов, распределяющего квантователь с конкретным SNR конкретной полосе частот в соответствии с заданным ограничением битовой скорости передачи данных.

Модуль квантования может быть сконфигурирован для определения указателя SNR, служащего признаком SNR, приписанного первому коэффициенту. Это отношение SNR, приписанное первому коэффициенту, можно определить, используя процесс распределения скорости передачи данных (также именуемый процессом распределения битов). Как указывалось выше, отношение SNR, приписанное первому коэффициенту, может прямо идентифицировать квантователь из набора квантователей. Как таковой, модуль квантования может быть сконфигурирован для выбора первого квантователя из набора квантователей на основе этого указателя SNR. Кроме того, модуль квантования может быть сконфигурирован для квантования первого коэффициента с использованием этого первого квантователя. В частности, модуль квантования может быть сконфигурирован для определения первого индекса квантования для первого коэффициента. Этот первый индекс квантования может подвергаться энтропийному кодированию и может быть передан в качестве данных коэффициентов в битовом потоке в соответствующий модуль обратного квантования (соответствующего декодера). Кроме того, модуль квантования может быть сконфигурирован для определения первого квантованного коэффициента исходя из первого коэффициента. Этот первый квантованный коэффициент можно использовать в предсказателе кодера.

Блок коэффициентов может быть связан с огибающей спектра блока (например, с текущей огибающей или с квантованной текущей огибающей, как описывается ниже). В частности, блок коэффициентов можно получить путем выравнивания блока коэффициентов преобразования (полученного из сегмента входного звукового сигнала) с использованием огибающей спектра блока. Огибающая спектра блока может служить признаком ряда значений спектральной энергии для ряда элементов разрешения по частоте. В частности, эта огибающая спектра блока может служить признаком относительной важности коэффициентов из блока коэффициентов. Как таковую, огибающую спектра блока (или огибающую, полученную, исходя из этой огибающей спектра блока, такую, как описываемая ниже огибающая распределения) можно использовать в целях распределения скорости передачи данных. В частности, от огибающей спектра блока может зависеть указатель SNR. Также указатель SNR может зависеть от параметра смещения, предназначенного для смещения огибающей спектра блока. В ходе процесса распределения скорости передачи данных параметр смещения можно увеличивать/уменьшать до тех пор, пока данные коэффициентов, генерируемые из квантованного и кодированного блока коэффициентов удовлетворяют предварительно определенному ограничению битовой скорости передачи данных (например, параметр смещения можно выбрать максимально возможным так, чтобы кодированный блок коэффициентов не превышал предварительно определенное количество битов). Таким образом, параметр смещения может зависеть от предварительно определенного количества битов, доступных для кодирования блока коэффициентов.

Указатель SNR, служащий признаком SNR, приписанного первому коэффициенту, можно определить, смещая значение, полученное из огибающей спектра блока, связанной с элементом разрешения по частоте этого первого коэффициента, с использованием параметра смещения. В частности, для определения указателя SNR можно использовать формулу распределения битов, описываемую в настоящем документе. Эта формула распределения битов может представлять собой функцию огибающей распределения, полученной исходя из огибающей спектра блока и из параметра смещения.

Как таковой, указатель SNR может зависеть от огибающей распределения, полученной исходя из огибающей спектра блока. Эта огибающая распределения может иметь разрешающую способность распределения (например, разрешающую способность 3 дБ). Эта разрешающая способность распределения предпочтительно зависит от разности SNR между смежными квантователями из набора квантователей. В частности, разрешающая способность распределения и разность SNR могут соответствовать друг другу. В одном из примеров, разность SNR составляет 1,5 дБ, а разрешающая способность распределения составляет 3 дБ. Выбирая соответствующую разрешающую способность распределения и разность SNR (например, выбирая разрешающую способность вдвое больше разности SNR в области дБ), можно упростить процесс распределения битов и/или процесс выбора квантователя (например, используя формулу распределения битов, описываемую в настоящем документе).

Ряд коэффициентов блока коэффициентов можно присвоить ряду полос частот. Полоса частот может содержать один или несколько элементов разрешения по частоте. Таким образом, одной и той же полосе частот может быть присвоено более одного коэффициента из указанного ряда коэффициентов. Как правило, количество элементов разрешения по частоте, приходящееся на полосу частот, увеличивается с повышением частоты. В частности, структура полосы частот (например, количество элементов разрешения по частоте, приходящихся на полосу частот) может следовать психоакустическим соображениям. Модуль квантования может быть сконфигурирован для выбора квантователя из набора квантователей для каждой полосы частот из ряда полос частот так, что коэффициенты, присвоенные одной и той же полосе частот квантуются с использованием одного и того же квантователя. Квантователь, используемый для квантования конкретной полосы частот, можно определить на основе одного или нескольких значений спектральной энергии огибающей блока спектра в пределах этой конкретной полосы частот. Использование структуры полосы частот в целях квантования может быть преимущественным в отношении психоакустической производительности схемы квантования.

Модуль квантования может быть сконфигурирован для приема дополнительной информации, служащей признаком какого-либо свойства блока коэффициентов. Например, дополнительная информация может содержать коэффициент усиления предсказателя, определенный предсказателем, заключенным в кодере, содержащем этот модуль квантования. Этот коэффициент усиления предсказателя может служить признаком тонального содержимого этого блока коэффициентов. В качестве альтернативы или в дополнение, дополнительная информация может содержать коэффициент спектрального отражения, полученный на основе этого блока коэффициентов и/или на основе огибающей спектра блока. Этот коэффициент спектрального отражения может служить признаком фрикативного содержимого этого блока коэффициентов. Модуль квантования может быть сконфигурирован для извлечения дополнительной информации из данных, доступных, как в кодере, так и в декодере, содержащих модуль квантования, и в соответствующем декодере, содержащем соответствующий модуль обратного квантования. Поэтому передача этой дополнительной информации из кодера в декодер может не требовать дополнительных битов.

Модуль квантования может быть сконфигурирован для определения набора квантователей в зависимости от этой дополнительной информации. В частности, от этой дополнительной информации может зависеть количество квантователей с добавлением псевдослучайного шума в наборе квантователей. В еще более частном случае, количество квантователей с добавлением псевдослучайного шума, заключенных в наборе квантователей, может уменьшаться при увеличении коэффициента усиления предсказателя, и наоборот. Делая набор квантователей зависящим от этой дополнительной информации, можно повысить перцепционную производительность схемы квантования.

Дополнительная информация может содержать флаг сохранения дисперсии. Этот флаг сохранения дисперсии может служить признаком того, каким образом следует корректировать дисперсию блока коэффициентов. Иными словами, флаг сохранения дисперсии может служить признаком обработки, подлежащей выполнению декодером, способной оказывать влияние на дисперсию блока коэффициентов, подлежащего восстановлению квантователем.

Например, в зависимости от флага сохранения дисперсии можно определить набор квантователей. В частности, от флага сохранения дисперсии может зависеть коэффициент усиления шума квантователя с заполнением шумом. В качестве альтернативы или в дополнение, один или несколько квантователей с добавлением псевдослучайного шума могут охватывать некоторый диапазон SNR, и этот диапазон SNR может быть определен в зависимости от флага сохранения дисперсии. Кроме того, от флага сохранения дисперсии может зависеть коэффициент у последующего усиления. В качестве альтернативы или в дополнение, коэффициент у последующего усиления квантователя с добавлением псевдослучайного шума может быть определен в зависимости от параметра, представляющего собой предварительно определенную функцию коэффициента усиления предсказателя.

Флаг сохранения дисперсии можно использовать для адаптации степени зашумленности квантователей к качеству предсказания. Например, в зависимости от параметра, представляющего собой предварительно определенную функцию коэффициента усиления предсказателя, можно определять коэффициент у последующего усиления квантователя с добавлением псевдослучайного шума. В качестве альтернативы или в дополнение, этот коэффициент у последующего усиления можно определить посредством сравнения сохраняющего дисперсию коэффициента последующего усиления, масштабированного посредством предварительно определенной функции коэффициента усиления предсказателя, с коэффициентом последующего усиления с оптимальной среднеквадратичной ошибкой и выбора наибольшего из этих двух коэффициентов усиления. В частности, указанная предварительно определенная функция коэффициента усиления предсказателя может уменьшать дисперсию восстановленного сигнала по мере увеличения коэффициента усиления предсказателя. Как результат, можно повысить воспринимаемое качество кодека.

Согласно одной из дальнейших особенностей, описывается модуль обратного квантования (также именуемый в настоящем документе декодером спектра), сконфигурированный для деквантования первого индекса квантования из блока индексов квантования. Иными словами, модуль обратного квантования может быть сконфигурирован для определения восстанавливаемых значений для блока коэффициентов на основе данных коэффициентов (например, на основе индексов квантования). Следует отметить, что все характерные признаки и особенности, которые были описаны в настоящем документе в контексте модуля квантования, также применимы и к соответствующему модулю обратного квантования. В частности, они применимы к характерным признакам, относящимся к конструкции и замыслу набора квантователей, к зависимости этого набора квантователей от дополнительной информации, к процессу распределения битов и т.д.

Индексы квантования могут быть связаны с блоком коэффициентов, содержащим ряд коэффициентов для ряда соответствующих элементов разрешения по частоте. В частности, эти индексы квантования могут быть связаны с квантованными коэффициентами (или восстанавливаемыми значениями) из соответствующего блока квантованных коэффициентов. Как описывается в контексте соответствующего блока квантования, указанный блок квантованных коэффициентов может соответствовать блоку остаточных коэффициентов предсказания или может быть из него получен. В более общем смысле, этот блок квантованных коэффициентов может быть получен из блока коэффициентов преобразования, который был получен из сегмента звукового сигнала с использованием преобразования из временной области в частотную область.

Модуль обратного квантования может быть сконфигурирован для создания набора квантователей. Как описывалось выше, этот набор квантователей может быть адаптирован или сгенерирован на основе дополнительной информации, доступной в модуле обратного квантования и в соответствующем модуле квантования. Указанный набор квантователей, как правило, содержит ряд различных квантователей, соответственно, связанных с рядом различных отношений сигнал-шум (SNR). Кроме того, указанный набор квантователей может быть упорядочен в соответствии с увеличением/уменьшением SNR, как описывалось выше. Увеличение/уменьшение SNR между смежными квантователями может быть, по существу, постоянным.

Указанный ряд различных квантователей может содержать квантователь с заполнением шумом, соответствующий квантователю с заполнением шумом модуля квантования. В одном из предпочтительных примеров указанный ряд различных квантователей содержит единственный квантователь с заполнением шумом. Это квантователь с заполнением шумом модуля обратного квантования сконфигурирован для обеспечения восстановления первого коэффициента путем использования одной из реализаций случайной переменной, генерируемой в соответствии с предписанной статистической моделью. Поэтому следует отметить, что указанный блок индексов квантования, как правило, не содержит какие-либо индексы квантования для коэффициентов, подлежащих восстановлению квантователем с заполнением шумом. Как таковые, коэффициенты, подлежащие восстановлению с использованием квантователя с заполнением шумом, связаны с нулевой битовой скоростью передачи данных.

Кроме того, указанный ряд различных квантователей может содержать один или несколько квантователей с добавлением псевдослучайного шума. Эти один или несколько квантователей с добавлением псевдослучайного шума могут содержать один или несколько соответствующих скалярных квантователей, сконфигурированных для присвоения первого восстанавливаемого значения первому индексу квантования. Кроме того, указанные один или несколько квантователей с добавлением псевдослучайного шума могут содержа