2607264 - Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигналя и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста

Декодер звукового сигнала, кодирующее устройство звукового сигнала, способ декодирования звукового сигнала, способ кодирования звукового сигналя и компьютерная программа, использующая зависящую от высоты звука адаптацию кодируемого контекста

Иллюстрации

Показать все

Изобретение относится к средствам кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования при наличии колебаний основной частоты. Декодер звукового сигнала включает декодер контекст-ориентированного спектрального значения, сконфигурированный, чтобы декодировать кодовое слово, описывающее одно или более спектральных значений или часть представления чисел одного или более спектральных значений в зависимости от состояния контекста, чтобы получить декодированные спектральные значения. Декодер звукового сигнала также включает определитель состояния контекста, сконфигурированный, чтобы определить текущее состояние контекста в зависимости от одного или более ранних декодированных спектральных значений. Декодер звукового сигнала также включает преобразователь частотной области во временную область с деформацией времени, формируемый, чтобы обеспечить представление временной области с деформацией времени данного звукового фрейма на основе набора декодированных спектральных значений, связанных с данным звуковым фреймом, и предоставленных декодером контекст-ориентированных спектральных значений. 6 н. и 12 з.п. ф-лы, 51 ил.

Реферат

Область технического применения

Осуществления согласно изобретению связаны с декодером звукового сигнала для обеспечения декодированного представления звукового сигнала на основе кодированного представления звукового сигнала.

Дальнейшие осуществления согласно изобретению связаны с кодирующим устройством звукового сигнала для обеспечения кодированного представления входного звукового сигнала.

Дальнейшие осуществления согласно изобретению связаны со способом обеспечения декодированного представления звукового сигнала на основе кодированного представления звукового сигнала.

Дальнейшие осуществления согласно изобретению связаны со способом обеспечения кодированного представления входного звукового сигнала.

Дальнейшие осуществления согласно изобретению связаны с компьютерными программами.

Некоторые осуществления согласно изобретению связаны с концепцией адаптации контекста арифметического кодирующего устройства, использующего информацию о деформации, которая может использоваться в комбинации с модифицированным дискретным косинусным преобразованием с деформацией времени (с измененной шкалой времени) (кратко определяемое как TW-MDCT).

Предшествующий уровень техники

В дальнейшем будет дано краткое введение в область звукового кодирования с деформацией времени, концепция которого может применяться в соединении с некоторыми из осуществлений изобретения.

В последние годы были разработаны методы преобразования звукового сигнала в представление частотной области и эффективного кодирования представления частотной области, например, принимая во внимание перцепционные пороги маскирования. Эта концепция кодирования звукового сигнала особенно эффективна, если длина блока, для которого передается набор кодированных спектральных коэффициентов, длинная, и если только сравнительно небольшое число спектральных коэффициентов находится намного выше глобального порога маскирования, в то время как большое число спектральных коэффициентов находится около или ниже глобального порога маскирования и ими можно, таким образом, пренебречь (или закодированы с минимальной длиной кода). Спектр, в котором указанное условие сохраняется, иногда называется разреженным спектром.

Например, основанные на косинусе или основанные на синусе смодулированные перекрывающие преобразования часто используются для кодирования источника, ввиду их свойств сжатия энергии. Таким образом, для гармонических тонов с постоянными основными частотами (высота звука) они концентрируют энергию сигнала до низкого числа спектральных компонентов (поддиапазоны), что приводит к эффективному представлению сигнала.

Основная высота сигнала должна пониматься как самая низкая преобладающая частота, различимая в спектре сигнала. В обычной речевой модели высота-это частота инициирующего сигнала, смодулированного человеческим горлом. Если бы присутствовала только одна единственная основная частота, спектр был бы чрезвычайно простым, включающим только основную частоту и обертоны. Такой спектр может быть закодирован высокоэффективно. Для сигналов с переменной высотой, однако энергия, соответствующая каждому гармоническому компоненту, распространяется по нескольким коэффициентам преобразования, таким образом, приводя к снижению эффективности кодирования.

Чтобы преодолеть снижение эффективности кодирования, звуковой сигнал, подлежащий кодированию, фактически, подвергается повторной выборке по неоднородной временной сетке. При последующей обработке обрабатываются положения выборки, полученные посредством неоднородной повторной выборки, как если бы они представляли значения на однородной временной сетке. Эта операция обычно обозначается фразой «деформация времени». Время выборки может быть преимущественно выбрано в зависимости от временного колебания высоты, таким образом, что колебание высоты в версии с деформацией времени звукового сигнала меньше, чем колебание высоты в оригинальной версии звукового сигнала (до деформации времени). После деформации времени звукового сигнала версия с деформацией времени звукового сигнала преобразуется в частотную область. Зависящая от высоты (звука) деформация времени имеет тот эффект, что представление частотной области звукового сигнала с деформацией времени обычно проявляет сжатие энергии в значительно меньшее число спектральных компонентов, чем представление частотной области оригинала (звукового сигнала без деформации времени).

На стороне декодера представление частотной области звукового сигнала с деформацией времени преобразуется во временную область, таким образом, что представление временной области звукового сигнала с деформацией времени доступно на стороне декодера. Однако в представлении временной области, восстановленного на стороне декодера звукового сигнала с деформацией времени, исходные колебания высоты входного звукового сигнала на стороне кодирующего устройства не включены. Соответственно, применяется еще одна деформация времени посредством повторной выборки представления временной области, восстановленного на стороне декодера звукового сигнала с деформацией времени.

Чтобы получить хорошее восстановление в декодере входного звукового сигнала со стороны кодирующего устройства, желательно, чтобы деформация времени на стороне декодера была, по крайней мере, приблизительно, обратной операцией относительно деформации времени на стороне кодирующего устройства. Чтобы получить соответствующую деформацию времени, желательно иметь доступную информацию в декодере, которая обеспечивает регулирование деформации времени на стороне декодера.

Поскольку обычно требуется передавать такую информацию от кодирующего устройства звукового сигнала декодеру звукового сигнала, желательно сохранять скорость передачи битов, требуемую для этой передачи, небольшой, в тоже время, обеспечивая надежное восстановление требуемой информации о деформации времени на стороне декодера.

Кроме того, эффективность кодирования при кодировании или декодировании спектральных значений иногда увеличивается при использовании зависящего от контекста кодирующего устройства или зависящего от контекста декодера.

Однако было обнаружено, что эффективность кодирования звукового кодирующего устройства или звукового декодера часто сравнительно низка при наличии колебания основной частоты или высоты, даже при применении концепции деформации времени.

Ввиду этой ситуации существует потребность иметь концепцию, которая позволяет получить высокую эффективность кодирования даже при наличии колебания основной частоты.

Краткая сущность изобретения

Осуществление согласно изобретению создает декодер звукового сигнала для обеспечения декодированного представления звукового сигнала на основе кодированного представления звукового сигнала, включающего кодированное представление спектра и кодированную информацию о деформации времени. Декодер звукового сигнала включает декодер контекст-ориентированных спектральных величин, формируемый, чтобы декодировать кодовое слово, описывающее одно или более спектральных значений или, по крайней мере, часть представления чисел одного или более спектральных значений в зависимости от состояния контекста, чтобы получить декодированные спектральные значения. Декодер звукового сигнала также включает определитель состояния контекста, формируемый, чтобы определить текущее состояние контекста в зависимости от одного или более ранее декодированных спектральных значений. Декодер звукового сигнала также включает преобразователь частотной области во временную область с деформацией времени, формируемый, чтобы обеспечить представление временной области с деформацией времени звукового фрейма на основе набора декодированных спектральных значений, связанных с данным звуковым фреймом, и предоставленных определителем контекст-ориентированных спектральных значений и в зависимости от информации о деформации времени. Опеределитель состояния контекста сконфигурирован, чтобы адаптировать определение состояния контекста к изменению основной частоты между последующими фреймами.

Данное осуществление согласно изобретению основывается на обнаружении того, что эффективность кодирования, которая достигается посредством декодера контекст-ориентированных спектральных значений в присутствии звукового сигнала, имеющего изменяемую во времени основную частоту, улучшается, если состояние контекста адаптируется к изменению основной частоты между последующими фреймами, потому что изменение основной частоты с течением времени (которое эквивалентно колебанию высоты во многих случаях) имеет тот эффект, что спектр данного звукового фрейма обычно подобен частотно-масштабированной версии спектра предыдущего звукового фрейма (предшествующего данному звуковому фрейму), таким образом, что адаптация определения контекста в зависимости от изменения основной частоты позволяет использовать указанное подобие для повышения эффективности кодирования.

Другими словами, было обнаружено, что эффективность кодирования (или эффективность декодирования) контекст-ориентированного кодирования спектральных значений сравнительно низкая в присутствии существенного изменения основной частоты между двумя последующими фреймами, и что эффективность кодирования может быть повышена посредством адаптации определения состояния контекста в такой ситуации. Адаптация определения состояния контекста позволяет использовать общие черты между спектрами предыдущего звукового фрейма и текущего звукового фрейма, в то же время, учитывая систематические различия между спектрами предыдущего звукового фрейма и текущего звукового фрейма, такие как, например, масштабирование частоты спектра, которое типично появляется при наличии изменения основной частоты с течением времени (то есть между двумя звуковыми фреймами).

Суммируя вышесказанное, осуществление согласно изобретению помогает повысить эффективность кодирования, не запрашивая добавочную дополнительную информацию или скорость передачи битов (предполагая, что информация, описывающая изменение основной частоты между последующими фреймами, доступна, так или иначе, в звуковом битовом потоке при использовании свойства деформации времени кодирующего устройства или декодера звукового сигнала).

В предпочтительном осуществлении преобразователь частотной области во временную область с деформацией времени включает стандартный (без временной деформации) преобразователь частотной области во временную область, формируемый, чтобы обеспечить представление временной области данного звукового фрейма на основе набора декодированных спектральных значений, связанное с данным звуковым фреймом и предоставленное декодером контекст-ориентированных спектральных значений и ресэмплером (синтезатором повторной выборки) деформации времени, формируемым, чтобы осуществлять повторную выборку представления временной области данного звукового фрейма, или его обработанной версии, в зависимости от информации о деформации времени, чтобы получить повторно выбранное (с деформацией времени) представление временной области данного звукового фрейма. Такое выполнение преобразователя частотной области во временную область с деформацией времени легко осуществить, потому что оно основано на «стандартном» преобразователе частотной области во временную область и включает, как функциональное расширение, ресэмплер (синтезатор повторной выборки) с деформацией времени, функция которого может быть независимой от функции преобразователя частотной области во временную область. Соответственно, преобразователь частотной области во временную область может быть снова использован как в режиме работы, в котором деформация времени (или устранение деформации времени) является неактивной, так и в режиме работы, в котором деформация времени (или устранение деформации времени) является активной.

В предпочтительном осуществлении информация о деформации времени описывает колебание высоты с течением времени. В этом осуществлении определитель состояния контекста сконфигурирован, чтобы получить информацию о растяжении частоты (то есть информацию о масштабировании частоты) из информации о деформации времени. Кроме того, определитель состояния контекста предпочтительно сконфигурирован, чтобы растянуть или сжать прошлый контекст, связанный с предыдущим звуковым фреймом, вдоль оси частоты в зависимости от информации о растяжении частоты, чтобы получить адаптированный контекст для контекст-ориентированного декодирования одного или более спектральных значений текущего звукового фрейма. Было обнаружено, что информация о деформации времени, которая описывает колебание высоты звука с течением времени, является подходящей для получения информации о растяжении частоты. Кроме того, было обнаружено, что растяжение или сжатие прошлого контекста, связанного с предыдущим звуковым фреймом вдоль оси частоты, обычно приводит к растянутому или сжатому контексту, который позволяет получить значащую информацию о состоянии контекста, которая хорошо адаптируется к спектру текущего звукового фрейма и, следовательно, способствует повышению эффективности кодирования.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы получить первую информацию о средней частоте первого звукового фрейма из информации о деформации времени, и получить вторую информацию о средней частоте по второму звуковому фрейму, следующему за первым звуковым фреймом, из информации о деформации времени. В этом случае определитель состояния контекста сконфигурирован, чтобы вычислить соотношение между второй информацией о средней частоте по второму звуковому фрейму и первой информацией о средней частоте по первому звуковому фрейму, чтобы определить информацию о растяжении частоты. Было обнаружено, что обычно не представляет трудности получить информацию о средней частоте из информации о деформации времени, и было также обнаружено, что соотношение между первой и второй информацией о средней частоте обеспечивает эффективное, в вычислительном отношении, получение информации о растяжении частоты.

В другом предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы получить первую информацию о среднем контуре деформации времени по первому звуковому фрейму из информации о деформации времени, и чтобы получить вторую информацию о среднем контуре деформации времени по второму звуковому фрейму, следующему за первым звуковым фреймом, из информации о деформации времени. В этом случае определитель состояния контекста сконфигурирован, чтобы вычислить соотношение между первой информацией о среднем контуре деформации времени по первому звуковому фрейму и второй информацией о среднем контуре деформации времени по второму звуковому фрейму, чтобы определить информацию о растяжении частоты. Было обнаружено, что особенно эффективное вычислительном отношении, вычислить информацию о средних величинах контура деформации времени по первому и второму звуковому фрейму (которые могут перекрываться), и что соотношение между указанной первой информацией о среднем контуре деформации времени и указанной второй информацией о среднем контуре деформации времени предоставляет достаточно точную информацию о растяжении частоты.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы получить первую и вторую информацию о средней частоте или первую и вторую информацию о среднем контуре деформации времени из общего контура деформации времени, простирающегося по множеству последовательных звуковых фреймов. Было обнаружено, что концепция установления общего контура деформации времени, простирающегося по множеству последовательных звуковых фреймов, не только облегчает точное и без искажений вычисление времени повторной выборки, а также обеспечивает очень хорошую основу для оценки изменения основной частоты между двумя последующими звуковыми фреймами. Соответственно, общий контур деформации времени был определен как очень хорошее средство распознавания изменения относительной частоты с течением времени между различными звуковыми фреймами.

В предпочтительном осуществлении декодер звукового сигнала включает вычислитель контура деформации времени, формируемый, чтобы вычислить информацию о контуре деформации времени, описывающую временную эволюцию относительной высоты по множеству последовательных звуковых фреймов на основе информации о деформации времени. В этом случае определитель состояния контекста сконфигурирован, чтобы использовать информацию о контуре деформации времени для получения информации о растяжении частоты. Было обнаружено, что информация о контуре деформации времени, которая может, например, быть определена для каждой выборки звукового фрейма, составляет очень хорошую основу для адаптации определения состояния контекста.

В предпочтительном осуществлении декодер звукового сигнала включает вычислитель положения повторной выборки. Вычислитель положения повторной выборки сконфигурирован, чтобы вычислить положения повторной выборки для использования ресэмплером (синтезатором повторной выборки)с деформацией времени на основе информации о контуре деформации времени, таким образом, что временное изменение положений повторной выборки определяется информацией о контуре деформации времени. Было обнаружено, что обычное использование информации о контура деформации времени для определения информации о растяжении частоты и для определения положений повторной выборки имеет тот эффект, что растянутый контекст, который получается посредством применения информации о растяжении частоты, хорошо адаптируется к характеристикам спектра текущего звукового фрейма, где звуковой сигнал текущего звукового фрейма является, по крайней мере приблизительно, продолжением звукового сигнала предыдущего звукового сигнала, восстановленного посредством операции повторной выборки с использованием вычисленных положений повторной выборки.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы получить числовое значение текущего контекста в зависимости от множества ранее декодированных спектральных значений (которые могут быть включены в или описаны структурой памяти контекста), и чтобы выбрать правило отображения, описывающее отображение кодового значения на коде символа, представляющем одно или более спектральных значений, или часть представления чисел одного или более спектральных значений, в зависимости от числового значения текущего контекста. В этом случае декодер контекст-ориентированных спектральных значений сконфигурирован, чтобы декодировать кодовое значение, описывающее одно или более спектральных значений, или, по крайней мере, часть представления чисел одного или более спектральных значений, используя правило отображения, выбранное определителем состояния контекста. Было обнаружено, что адаптация контекста, при которой числовое значение текущего контекста получается из множества ранее декодированных спектральных значений, и при которой правило отображения выбирается в соответствии с указанным числовым (текущим) значением контекста, получает значительное преимущество от адаптации определения состояния контекста, например, числового (текущего)значения контекста, потому что можно избежать выбора в значительной степени несоответствующего правила отображения при использовании этой концепции. Напротив, если получение состояния контекста, то есть числового текущего значения контекста, не будет адаптировано в зависимости от изменения основной частоты между последующими фреймами, неправильный выбор правила отображения будет часто происходить при наличии изменения основной частоты, таким образом, что эффективность кодирования будет понижена. Такого понижения эффективности кодирования можно избежать посредством описанного механизма.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы настроить и обновить предварительную структуру памяти контекста, таким образом, чтобы входы предварительной структуры памяти контекста описывали одно или более спектральных значений первого звукового фрейма, где входные коэффициенты входов предварительной структуры памяти контекста указывают на элемент разрешения по частоте или на набор смежных элементов разрешения по частоте преобразователя частотной области во временную область, с которым связаны соответствующие входы (например, для обеспечения представления временной области первого звукового фрейма). Определитель состояния контекста далее сконфигурирован, чтобы получить частотно-масштабированную структуру памяти контекста на основе предварительной структуры памяти контекста таким образом, что данный вход или под вход предварительной структуры памяти контекста, имеющей первый коэффициент частотности, отображается на соответствующем входе или под входе частотно-масштабированной структуры памяти контекста, имеющей второй коэффициент частотности. Второй коэффициент частотности связывается с другим элементом или другим набором смежных элементов разрешения по частоте преобразователя частотной области во временную область, чем первый коэффициент частотности.

Другими словами, вход предварительной структуры памяти контекста, которая получается на основе одного или более спектральных значений, которые соответствуют i-му спектральному элементу преобразователя частотной области во временную область (или набор i-х спектральных элементов преобазователя частотной области во временную область), отображается на входе частотно-масштабированной структуры памяти контекста, которая связывается с j-м элементом разрешения по частоте (или набор j-х элементов разрешения по частоте) преобразователя частотной области во временную область, где j отличается от i. Было обнаружено, что эта концепция отображения входов предварительной структуры памяти контекста на входах частотно-масштабированной структуры памяти контекста предоставляет особо эффективный, в вычислительном отношении, способ адаптации определения состояния контекста к изменению основной частоты. Масштабирование частоты контекста может быть осуществлено с незначительным усилием, используя эту концепцию. Соответственно, получение числового значения текущего контекста из частотно-масштабированной структуры памяти контекста может быть идентичным получению числового значения текущего контекста из обычной (например, предварительной) структуры памяти контекста в отсутствие существенного колебания высоты (звука). Таким образом, описанная концепция обеспечивает выполнение адаптации контекста в имеющемся звуковом декодере с минимальным усилием.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы получить значение состояния контекста, описывающее текущее состояние контекста для декодирования кодового слова, описывающего одно или более спектральных значений второго звукового фрейма или, по крайней мере, часть представления чисел одного или более спектральных значений второго звукового фрейма, связывавшего третий коэффициент частотности, используя значения частотно-масштабированной структуры памяти контекста, коэффициенты частотности значений частотно-масштабированной структуры памяти контекста которой находятся в предварительно определенных отношениях с третьим коэффициентом частотности. В этом случае третий коэффициент частотности обозначает элемент разрешения по частоте или набор смежных элементов разрешения по частоте декодера частотной области во временную область, с которым связано одно или более спектральных значений звукового фрейма, который будет декодирован посредством использования текущего значения состояния контекста.

Было обнаружено, что использование предварительно определенного (и, предпочтительно, фиксированного) относительного окружения (в переводе на элементы разрешения по частоте) одного или более спектральных значений, которые будут декодированы для получения значения состояния контекста (например, числовое значение текущего контекста), поддерживает вычисление указанного значения состояния контекста разумно простым. При использовании частотно-масштабированной структуры памяти контекста в качестве входа для получения значения состояния контекста, колебание основной частоты может считаться эффективным.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы установить каждое множество входов частотно-масштабированной структуры памяти контекста, имеющей соответствующий целевой (объектный) коэффициент частотности, на значение соответствующего входа предварительной структуры памяти контекста, имеющей соответствующий исходный коэффициент частотности. Определитель состояния контекста сконфигурирован, чтобы определить соответствующие коэффициенты частотности входа частотно-масштабированной структуры памяти контекста и соответствующего входа предварительной структуры памяти контекста таким образом, что соотношение между соответствующими коэффициентами частотности определяется изменением основной частоты между текущим звуковым фреймом, с которым связаны входы предварительной структуры памяти контекста, и последующим звуковым фреймом, контекст декодирования которого определяется входам и частотно-масштабированной структуры памяти контекста. При использовании такой концепции для получения входов частотно-масштабированной структуры памяти контекста сложность может оставаться небольшой, в то же время имеется возможность адаптировать частотно-масштабированную структуру памяти контекста к изменению основной частоты.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы настроить предварительную структуру памяти контекста таким образом, что каждое множество входов предварительной структуры памяти контекста основывается на множестве спектральных значений первого звукового фрейма, где входные коэффициенты входов предварительной структуры памяти контекста указывают на набор смежных элементов разрешения по частоте преобразователя частотной области во временную область, с которым связаны соответствующие входы (относительно первого звукового фрейма). Определитель состояния контекста сконфигурирован, чтобы извлечь предварительные индивидуальные значения элементов разрешения по частоте контекста, связанные с индивидуальными коэффициентами элементов разрешения по частоте, из входов предварительной структуры памяти контекста. Кроме того, определитель состояния контекста сконфигурирован, чтобы получить частотно-масштабированные индивидуальные значения элементов разрешения по частоте контекста, связанные с индивидуальными коэффициентами элементов разрешения по частоте, таким образом, что данное предварительное индивидуальное значение элементов разрешения по частоте контекста, имеющее первый коэффициент элементов разрешения по частоте, отображается на соответствующем значении частотно-масштабированного индивидуального элемента разрешения по частоте контекста, имеющем второй коэффициент элементов разрешения по частоте, таким образом, что получается отображение индивидуального элемента разрешения по частоте предварительных индивидуальных значений элементов разрешения по частоте контекста. Определитель состояния контекста далее сконфигурирован, чтобы объединить множество частотно-масштабированных индивидуальных значений элементов разрешения по частоте контекста в объединенный вход частотно-масштабированной структуры памяти контекста. Соответственно, можно адаптировать частотно-масштабированную структуру памяти контекста к изменению основной частоты на уровне мелких структурных единиц, даже если множество элементов разрешения по частоте суммировано в единственном входе структуры памяти контекста. Таким образом, может быть достигнута особо точная адаптация контекста к изменению основной частоты.

Другое осуществление согласно изобретению создает кодирующее устройство звукового сигнала для обеспечения кодированного представления входного звукового сигнала, включающего кодированное представление спектра и кодированную информацию о деформации времени. Кодирующее устройство звукового сигнала включает поставщик представления частотной области, формируемый, чтобы обеспечить представление частотной области, представляющее версию входного звукового сигнала с деформацией времени; деформация времени в соответствии с информацией о деформации времени. Кодирующее устройство звукового сигнала далее включает кодирующее устройство контекст-ориентированного спектрального значения, формируемое, чтобы кодировать кодовое слово, описывающее одно или более спектральных значений представления частотной области, или, по крайней мере, часть представления чисел одного или более спектральных значений представления частотной области, в зависимости от состояния контекста, чтобы получить кодированные спектральные значения кодированного спектрального представления. Декодер звукового сигнала также включает определитель состояния контекста, формируемый, чтобы определить текущее состояние контекста в зависимости от одного, или более ранее закодированных спектральных значений. Определитель состояния контекста сконфигурирован, чтобы адаптировать определение контекста к изменению основной частоты между последующими фреймами.

Это кодирующее устройство звукового сигнала основывается на тех же самых идеях и полученных данных, что и вышеописанный декодер звукового сигнала. Кроме того, кодирующее устройство звукового сигнала может быть дополнено любой из характеристик и функциональных возможностей, рассмотренных относительно декодера звукового сигнала, где ранее закодированные спектральные значения играют роль ранее декодированных спектральных значений при вычислении состояния контекста.

В предпочтительном осуществлении определитель состояния контекста сконфигурирован, чтобы получить числовое значение текущего контекста в зависимости от множества ранее закодированных спектральных значений и выбрать правило отображения, описывающее отображение одного или более спектральных значений, или части представления чисел одного или более спектральных значений, на кодовое значение в зависимости от числового значения текущего контекста. В этом случае кодирующее устройство контекст-ориентированного спектрального значения сконфигурировано, чтобы обеспечить кодовое значение, описывающее одно или более спектральных значений, или, по крайней мере, часть представления чисел одного или более спектральных значений, используя правило отображения, выбранное определителем состояния контекста.

Другое осуществление согласно изобретению создает способ обеспечения декодированного представления звукового сигнала на основе кодированного представления звукового сигнала.

Другое осуществление согласно изобретению создает способ обеспечения кодированного представления входного звукового сигнала.

Другое осуществление согласно изобретению создает компьютерную программу для выполнения одного из указанных способов.

Способы и компьютерная программа основываются на тех же самых соображениях, что и выше обсуждавшийся декодер звукового сигнала и кодирующее устройство звукового сигнала.

Кроме того, кодирующее устройство звукового сигнала, способы и компьютерные программы могут быть дополнены любой из характеристик и функциональных возможностей, обсуждавшихся выше, и описаны ниже относительно декодера звукового сигнала.

Краткое описание чертежей

Осуществления согласно данному изобретению будут впоследствии описаны со ссылкой на приложенные чертежи, где:

фиг.1а показывает блок-схему кодирующего устройства звукового сигнала согласно осуществлению изобретения;

фиг.1b показывает блок-схему декодера звукового сигнала согласно осуществлению изобретения;

фиг.2а показывает блок-схему кодирующего устройства звукового сигнала согласно другому осуществлению изобретения;

фиг.2b показывает блок-схему декодера звукового сигнала согласно другому осуществлению изобретения;

фиг.2с показывает блок-схему арифметического кодирующего устройства для использования в звуковых кодирующих устройствах согласно осуществлениям изобретения;

фиг.2d показывает блок-схему арифметического декодера для использования в декодерах звукового сигнала согласно осуществлениям изобретения;

фиг.3а показывает графическое представление контекст-адаптивного арифметического кодирования (кодирование/декодирование);

фиг.3b показывает графическое представление контуров относительной высоты (звука);

фиг.3с показывает графическое представление растягивающего эффекта измененного дискретного косинусного преобразования с деформацией времени (ТВТ-MDCT);

фиг.4а показывает блок-схему определителя состояния контекста для использования в кодирующих устройствах звукового сигнала и декодерах звукового сигнала согласно осуществлениям данного изобретения;

фиг.4b показывает графическое представление сжатия частоты контекста, которое может выполняться определителем состояния контекста согласно фиг.4а;

фиг.4с показывает представление псевдоуправляющей программы алгоритма для растяжения или сжатия контекста, который может применяться в осуществлениях согласно изобретению;

фиг.4d и 4е показывают представление псевдоуправляющей программы алгоритма для растяжения или сжатия контекста, который может использоваться в осуществлениях согласно изобретению;

фиг.5а, 5b показывают детальный фрагмент блок-схемы декодера звукового сигнала, согласно осуществлению изобретения;

фиг.6а, 6b показывают детальный фрагмент блок-схемы устройства отображения для обеспечения декодированного представления звукового сигнала согласно осуществлению изобретения;

фиг.7а показывает легенду определений элементов данных и справочных элементов, которые используются в звуковом декодере согласно осуществлению изобретения;

фиг.7b показывает легенду определений констант, которые используются в звуковом декодере согласно осуществлению изобретения;

фиг.8 показывает табличное представление отображения коэффициента кодового слова на соответствующее декодированное значение деформации времени;

фиг.9 показывает представление псевдоуправляющей программы алгоритма для линейного интерполирования между равномерно распределенными узлами деформации;

фиг.10а показывает представление псевдоуправляющей программы вспомогательной функции "warp_time_inv";

фиг.10b показывает представление псевдоуправляющей программы вспомогательной функции "warp_inv_vec";

фиг.11 показывает представление псевдоуправляющей программы алгоритма для вычисления вектора положения выборки и длины перехода;

фиг.12 показывает табличное представление значений длины окна синтеза N в зависимости от последовательности окон и длины фрейма основного кодирующего устройства;

фиг.13 показывает матричное представление допустимых последовательностей окон;

фиг.14 показывает представление псевдоуправляющей программы алгоритма для управления окнами и для внутреннего наложения - добавления последовательности окон типа "EIGHT_SHORT_SEQUENCE" (последовательность восьми коротких);

фиг.15 показывает представление псевдоуправляющей программы алгоритма для управления окнами и внутреннего наложения - добавления других последовательностей окон, которые не являются последовательностями окон типа "EIGHT_SHORT_SEQUENCE" (последовательность восьми коротких);

фиг.16 показывает представление псевдоуправляющей программы алгоритма для

Патент 2607264