2630887 - Звуковые кодирующее устройство и декодирующее устройство

Звуковые кодирующее устройство и декодирующее устройство

Иллюстрации

Показать все

Изобретение относится к средствам звукового кодирования и декодирования. Технический результат заключается в повышении качества кодирования за счет обеспечения плавного перехода между кодированием во временной области и кодированием в частотной области. Речевой кодер содержит модуль кадрирования, сконфигурированный для приема набора блоков; при этом указанный набор блоков содержит ряд последовательных блоков коэффициентов преобразования МДКП; при этом указанный набор блоков служит признаком дискретных значений речевого сигнала; при этом блок коэффициентов преобразования содержит ряд коэффициентов преобразования для соответствующего ряда элементов разрешения по частоте. Кроме этого, кодер содержит модуль оценивания огибающей, сконфигурированный для определения текущей огибающей на основе ряда последовательных блоков коэффициентов преобразования; при этом указанная текущая огибающая служит признаком ряда значений спектральной энергии для соответствующего ряда элементов разрешения по частоте. В дополнение кодер содержит модуль интерполяции огибающих, сконфигурированный для определения ряда интерполированных огибающих, исходя из ряда последовательных блоков коэффициентов преобразования соответственно на основе текущей огибающей. 6 н. и 14 з.п. ф-лы, 10 ил.

Реферат

ОБЛАСТЬ ТЕХНИЧЕСКОГО ПРИМЕНЕНИЯ

Настоящий документ относится к системе звукового кодирования и декодирования (именуемой системой звукового кодека). В частности, настоящий документ относится к системе звукового кодека на основе преобразования, особенно хорошо подходящей для голосового кодирования/декодирования.

ПРЕДПОСЫЛКИ

Перцепционные звуковые кодеры общего назначения достигают относительно высоких эффективностей кодирования путем использования таких преобразований, как модифицированное дискретное косинусное преобразование (MDCT) с размерами блоков дискретных значений, охватывающими несколько десятков миллисекунд (например, 20 мс). Одним из примеров такой системы звукового кодека на основе преобразования является Advanced Audio Coding (AAC) или High Efficiency (HE)-AAC. Однако при использовании таких систем звуковых кодеков на основе преобразования для голосовых сигналов качество голосовых сигналов в направлении более низких битовых скоростей передачи данных ухудшается быстрее, чем таковое для музыкальных сигналов, особенно в случае сухих (нереверберирующих) речевых сигналов. Поэтому системы звуковых кодеков на основе преобразования в своей сущности не являются хорошо подходящими для кодирования голосовых сигналов или для кодирования звуковых сигналов, содержащих голосовую составляющую. Иными словами, системы звуковых кодеков на основе преобразования проявляют асимметрию в отношении эффективности кодирования, достигаемой для музыкальных сигналов, по сравнению с эффективностью кодирования, достигаемой для голосовых сигналов. К этой асимметрии можно обратиться, предусматривая дополнения к кодированию на основе преобразования, в котором эти дополнения нацелены на улучшение формирования спектра или совпадения сигналов. Примерами таких дополнений являются предварительное/последующее формирование, временное ограничение шума (TNS) и MDCT с деформацией шкалы времени. Кроме того, к этой асимметрии можно обратиться путем добавления классического речевого кодера во временной области, основывающегося на фильтрации с краткосрочным предсказанием (LPC) и долгосрочном предсказании (LTP).

Можно показать, что улучшения, достигаемые путем снабжения дополнениями кодирования на основе преобразования, как правило, недостаточны для выравнивания пробела в производительности между кодированием музыкальных сигналов и речевых сигналов. С другой стороны, добавление классического речевого кодера во временной области заполняет этот пробел в производительности, однако лишь в той мере, в которой асимметрия производительности обращается в противоположном направлении. Это вызвано тем, что такие классические речевые кодеры во временной области моделируют систему речеобразования человека и были оптимизированы для кодирования речевых сигналов.

В виду вышесказанного звуковой кодек на основе преобразования можно использовать совместно с классическим речевым кодеком во временной области, при этом классический речевой кодек во временной области используется для речевых сегментов звукового сигнала, и при этом кодек на основе преобразования используется для остальных сегментов этого звукового сигнала. Однако сосуществование кодеков во временной области и в области преобразования в единой системе кодека требует надежных инструментальных средств для переключения между различными кодеками на основе свойств звукового сигнала. В дополнение, это фактическое переключение между кодеком во временной области (для речевого содержимого) и кодеком в области преобразования (для остального содержимого) может быть затруднительным для реализации. В частности, может быть затруднительно обеспечить плавный переход между кодеком во временной области и кодеком в области преобразования (и наоборот). Кроме того, для того чтобы сделать кодек во временной области более устойчивым к внешним воздействиям при неизбежном случайном кодировании неречевых сигналов, например, при кодировании поющего голоса с инструментальным фоном, могут потребоваться модификации этого кодека во временной области. Настоящий документ направлен на вышеупомянутые технические проблемы систем звуковых кодеков. В частности, настоящий документ описывает систему звукового кодека, транслирующую только критические характерные признаки речевого кодека и посредством этого достигающую равномерной производительности для речи и музыки, в то же время, оставаясь в пределах архитектуры кодека на основе преобразования. Иными словами, настоящий документ описывает звуковой кодек на основе преобразования, особенно хорошо подходящий для кодирования речевых или голосовых сигналов.

КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Согласно одному из аспектов, описывается речевой кодер на основе преобразования. Этот речевой кодер сконфигурирован для кодирования речевого сигнала в битовый поток. Следует отметить, что впоследствии описываются различные аспекты этого речевого кодера на основе преобразования. Ясно указывается, что эти аспекты могут различными способами сочетаться друг с другом. В частности, аспекты, описываемые в зависимости от различных независимых пунктов формулы изобретения, могут сочетаться с другими независимыми пунктами формулы изобретения. Кроме того, аспекты, описываемые в контексте кодера, аналогичным образом применимы и к соответствующему декодеру.

Речевой кодер может содержать модуль кадрирования, сконфигурированный для приема набора блоков. Этот набор блоков может соответствовать сдвинутому набору блоков, описываемому в подробном описании настоящего документа. В качестве альтернативы, этот набор блоков может соответствовать текущему набору блоков, описываемому в подробном описании настоящего документа.

Этот набор блоков содержит ряд последовательных блоков коэффициентов преобразования, и этот ряд последовательных блоков служит признаком дискретных значений речевого сигнала. В частности, этот набор блоков может содержать четыре или большее количество блоков коэффициентов преобразования. Блок из этого ряда последовательных блоков мог быть определен, исходя из речевого сигнала с использованием модуля преобразования, сконфигурированного для преобразования предварительно определенного количества дискретных значений речевого сигнала из временной области в частотную область. В частности, этот модуль преобразования может быть сконфигурирован для выполнения такого преобразования из временной области в частотную область, как модифицированное дискретное косинусное преобразование (MDCT). Как таковой, блок коэффициентов преобразования может содержать ряд коэффициентов преобразования (также именуемых частотными коэффициентами или спектральными коэффициентами) для соответствующего ряда элементов разрешения по частоте. В частности, блок коэффициентов преобразования может содержать коэффициенты MDCT.

Количество элементов разрешения по частоте, или размер блока, как правило, зависит от размера преобразования, выполняемого модулем преобразования. В одном из предпочтительных примеров блоки из указанного ряда последовательных блоков соответствуют так называемым коротким блокам, содержащим, например, 256 элементов разрешения по частоте. В дополнение к коротким блокам, модуль преобразования может быть сконфигурирован для генерирования так называемых длинных блоков, содержащих, например, 1024 элементов разрешения по частоте. Эти длинные блоки могут быть использованы звуковым кодером для кодирования стационарных сегментов входного звукового сигнала. Однако ряд последовательных блоков, используемых для кодирования речевого сигнала (или речевого сегмента, заключенного во входном звуковом сигнале), может содержать только короткие блоки. В частности, блоки коэффициентов преобразования могут содержать 256 коэффициентов преобразования в 256 элементов разрешения по частоте.

В более общих выражениях, количество элементов разрешения по частоте, или размер блока, может быть таким, чтобы блок коэффициентов преобразования охватывал диапазон 3—7 миллисекунд речевого сигнала (например, 5 мс речевого сигнала). Размер блока можно выбирать так, чтобы речевой кодер мог действовать в синхронном режиме с кадрами видеоизображения, кодируемыми видеокодером. Модуль преобразования может быть сконфигурирован для генерирования блоков коэффициентов преобразования, содержащих разное количество элементов разрешения по частоте. Например, модуль преобразования может быть сконфигурирован для генерирования блоков, содержащих 1920, 960, 480, 240, 120 элементов разрешения по частоте при частоте дискретизации 48 кГц. Для речевого кодера можно использовать размер блока, охватывающий диапазон 3—7 мс речевого сигнала. В приведенном выше примере для речевого кодера можно использовать блок, содержащий 240 элементов разрешения по частоте.

Речевой кодер также может содержать модуль оценивания огибающей, сконфигурированный для определения текущей огибающей на основе ряда последовательных блоков коэффициентов преобразования. Эту текущую огибающую можно определить на основе ряда последовательных блоков из этого набора блоков. Можно учитывать дополнительные блоки, например, блоки из набора блоков, непосредственно предшествующего этому набору блоков. В качестве альтернативы или в дополнение, можно учитывать так называемые блоки предварительного просмотра. В целом, это может быть предпочтительно для обеспечения непрерывности между последовательными наборами блоков. Текущая огибающая может служить признаком ряда значений спектральной энергии для соответствующего ряда элементов разрешения по частоте. Иными словами, текущая огибающая может иметь такой же размер, как каждый блок в ряду последовательных блоков. Иными словами, для ряда блоков (т.е. для более чем одного блока) речевого сигнала можно определить единственную огибающую. Это является преимущественным для цели создания представительной статистики в отношении спектральных данных, заключенных в ряду последовательных блоков.

Текущая огибающая может служить признаком ряда значений спектральной энергии для соответствующего ряда полос частот. Полоса частот может содержать один или несколько элементов разрешения по частоте. В частности, одна или несколько полос частот могут содержать более одного элемента разрешения по частоте. Количество элементов разрешения по частоте, приходящихся на полосу частот, может увеличиваться при повышении частоты. Иными словами, количество элементов разрешения по частоте, приходящихся на полосу частот, может зависеть от психоакустических соображений. Модуль оценивания огибающей может быть сконфигурирован для определения значения спектральной энергии для конкретной полосы частот на основе коэффициентов преобразования из ряда последовательных блоков, находящихся в пределах данной конкретной полосы частот. В частности, модуль оценивания огибающей может быть сконфигурирован для определения значения спектральной энергии для конкретной полосы частот на основе среднеквадратичного значения коэффициентов преобразования из ряда последовательных блоков, находящихся в пределах данной конкретной полосы частот. Как таковая, текущая огибающая может служить признаком средней огибающей спектра для огибающих спектра ряда последовательных блоков. Кроме того, текущая огибающая может иметь полосную разрешающую способность по частоте.

Речевой кодер также может содержать модуль интерполяции огибающих, сконфигурированный для определения ряда интерполированных огибающих, соответственно, для ряда последовательных блоков коэффициентов преобразования на основе текущей огибающей. В частности, этот ряд интерполированных огибающих можно определить на основе квантованной текущей огибающей, также доступной и в соответствующем декодере. Действуя таким образом, обеспечивают то, что указанный ряд интерполированных огибающих можно определять одинаковым образом в речевом кодере и в соответствующем речевом декодере. Таким образом, характерные признаки модуля интерполяции огибающих, описываемые в контексте речевого кодера, также применимы и к речевому декодеру, и наоборот. В целом, модуль интерполяции огибающих может быть сконфигурирован для определения на основе текущей огибающей приближения огибающей спектра (т.е. интерполированной огибающей) каждого блока из ряда последовательных блоков.

Речевой кодер также может содержать модуль выравнивания, сконфигурированный для определения ряда блоков выровненных коэффициентов преобразования путем выравнивания соответствующего ряда блоков коэффициентов преобразования, соответственно, с использованием соответствующего ряда интерполированных огибающих. В частности, для выравнивания, т.е. для удаления формы спектра, коэффициентов преобразования, заключенных в данном конкретном блоке, можно использовать интерполированную огибающую для данного конкретного блока (или огибающую, полученную исходя из нее). Следует отметить, что этот процесс выравнивания отличается от операции отбеливания, применяемой к данному конкретному блоку коэффициентов преобразования. То есть выровненные коэффициенты преобразования нельзя интерпретировать как коэффициенты преобразования отбеленного сигнала во временной области, обычно вырабатываемые посредством анализа LPC (кодирования с линейным предсказанием) классического речевого кодера. Общим является только аспект создания сигнала с относительно равномерным спектром мощности. Однако процесс получения такого равномерного спектра мощности отличается. Как будет описано в настоящем документе, использование оценочной огибающей спектра для выравнивания блока коэффициентов преобразования является преимущественным, поскольку эту оценочную огибающую спектра можно использовать в целях распределения битов.

Речевой кодер на основе преобразования также может содержать модуль определения коэффициента усиления огибающей, сконфигурированный для определения ряда коэффициентов усиления огибающей, соответственно, для ряда блоков коэффициентов преобразования. Кроме того, речевой кодер на основе преобразования может содержать модуль уточнения огибающей, сконфигурированный для определения ряда скорректированных огибающих путем сдвига ряда интерполированных огибающих в соответствии с рядом коэффициентов усиления огибающей, соответственно. Модуль определения коэффициента усиления огибающей может быть сконфигурирован для определения первого коэффициента усиления огибающей для первого блока коэффициентов преобразования (из ряда последовательных блоков) так, чтобы дисперсия выровненных коэффициентов преобразования из соответствующего первого блока выровненных коэффициентов преобразования, полученных с использованием первой скорректированной огибающей, уменьшалась по сравнению с дисперсией выровненных коэффициентов преобразования из соответствующего первого блока выровненных коэффициентов преобразования, полученного с использованием первой интерполированной огибающей. Эту первую скорректированную огибающую можно определить путем сдвига первой интерполированной огибающей с использованием первого коэффициента усиления огибающей.

Эта первая интерполированная огибающая может представлять собой интерполированную огибающую из ряда интерполированных огибающих для первого блока коэффициентов преобразования из ряда блоков коэффициентов преобразования.

В частности, модуль определения коэффициента усиления огибающей может быть сконфигурирован для определения первого коэффициента усиления огибающей для первого блока коэффициентов преобразования так, чтобы дисперсия выровненных коэффициентов преобразования из соответствующего блока выровненных коэффициентов преобразования, полученного с использованием первой скорректированной огибающей, была равна единице. Модуль выравнивания может быть сконфигурирован для определения ряда блоков выровненных коэффициентов преобразования путем выравнивания соответствующего ряда блоков коэффициентов преобразования с использованием соответствующего ряда скорректированных огибающих, соответственно. Как результат, каждый блок выровненных коэффициентов преобразования может иметь дисперсию, равную единице.

Модуль определения коэффициента усиления огибающей может быть сконфигурирован для вставки данных коэффициентов усиления, служащих признаком ряда коэффициентов усиления огибающей, в битовый поток. Как результат, соответствующий декодер имеет возможность определять ряд скорректированных огибающих таким же образом, как кодер.

Речевой кодер может быть сконфигурирован для определения битового потока на основе ряда блоков выровненных коэффициентов преобразования. В частности, речевой кодер может быть сконфигурирован для определения данных коэффициентов на основе ряда блоков выровненных коэффициентов преобразования, причем эти данные коэффициентов вводят в битовый поток.

Ниже описываются примеры средств для определения данных коэффициентов на основе ряда блоков выровненных коэффициентов преобразования.

Речевой кодер на основе преобразования может содержать модуль квантования огибающей, сконфигурированный для определения квантованной текущей огибающей путем квантования текущей огибающей. Кроме того, этот модуль квантования огибающей может быть сконфигурирован для вставки данных огибающей в битовый поток, при этом данные огибающей служат признаком этой квантованной текущей огибающей. Как результат, соответствующий декодер может быть осведомлен о квантованной текущей огибающей путем декодирования данных огибающей. Модуль интерполяции огибающих может быть сконфигурирован для определения ряда интерполированных огибающих на основе квантованной текущей огибающей. Действуя таким образом, можно обеспечить то, что кодер и декодер будут сконфигурированы для определения одного и того же ряда интерполированных огибающих.

Речевой кодер на основе преобразования может быть сконфигурирован для действия в ряде различных режимов. Эти различные режимы могут включать режим короткого шага и режим длинного шага. Когда речевой кодер на основе преобразования действует в режиме короткого шага, модуль кадрирования, модуль оценивания огибающей и модуль интерполяции огибающих могут быть сконфигурированы для обработки набора блоков, содержащего ряд последовательных блоков коэффициентов преобразования. Таким образом, в режиме короткого шага кодер может быть сконфигурирован для подразделения сегмента/кадра звукового сигнала на последовательность последовательных блоков, которые последовательно обрабатываются кодером.

С другой стороны, когда речевой кодер на основе преобразования действует в режиме длинного шага, модуль кадрирования, модуль оценивания огибающей и модуль интерполяции огибающих могут быть сконфигурированы для обработки набора блоков, содержащего лишь единственный блок коэффициентов преобразования. Таким образом, в режиме длинного шага кодер может быть сконфигурирован для обработки полного сегмента/кадра звукового сигнала без подразделения на блоки. Это может быть преимущественным для коротких сегментов/кадров звукового сигнала и/или для музыкальных сигналов. В режиме длинного шага модуль оценивания огибающей может быть сконфигурирован для определения текущей огибающей этого единственного блока коэффициентов преобразования, заключенного в наборе блоков. Модуль интерполяции огибающих может быть сконфигурирован для определения интерполированной огибающей для этого единственного блока коэффициентов преобразования как текущей огибающей этого единственного блока коэффициентов преобразования. Иными словами, описываемая в настоящем документе интерполяция огибающих в режиме длинного шага может быть обойдена, а текущая огибающая указанного единственного блока может быть приравнена интерполированной огибающей (для дальнейшей обработки).

Согласно другому аспекту, описывается речевой декодер на основе преобразования, сконфигурированный для декодирования битового потока с целью создания восстановленного речевого сигнала. Как уже указывалось выше, этот декодер может содержать компоненты, аналогичные компонентам соответствующего кодера. Декодер может содержать модуль декодирования огибающей, сконфигурированный для определения квантованной текущей огибающей исходя из данных огибающей, заключенных в битовом потоке. Как указывалось выше, эта квантованная текущая огибающая, как правило, служит признаком ряда значений спектральной энергии для соответствующего ряда элементов разрешения по частоте полос частот. Кроме того, битовый поток может содержать данные (например, данные коэффициентов), служащие признаком ряда последовательных блоков восстановленных выровненных коэффициентов преобразования. Этот ряд последовательных блоков восстановленных выровненных коэффициентов преобразования, как правило, связан с соответствующим рядом последовательных блоков выровненных коэффициентов преобразования в кодере. Этот ряд последовательных блоков может соответствовать ряду последовательных блоков из набора блоков, например, из описываемого ниже сдвинутого набора блоков. Блок восстановленных выровненных коэффициентов преобразования может содержать ряд восстановленных выровненных коэффициентов преобразования для соответствующего ряда элементов разрешения по частоте.

Декодер также может содержать модуль интерполяции огибающих, сконфигурированный для определения ряда интерполированных огибающих, соответственно, для ряда блоков восстановленных выровненных коэффициентов преобразования на основе квантованной текущей огибающей. Модуль интерполяции огибающих декодера, как правило, действует таким же образом, как модуль интерполяции огибающих кодера. Модуль интерполяции огибающих может быть сконфигурирован для определения ряда интерполированных огибающих также на основе квантованной предыдущей огибающей. Эта квантованная предыдущая огибающая может быть связана с рядом предыдущих блоков восстановленных коэффициентов преобразования, непосредственно предшествующих этому ряду блоков восстановленных коэффициентов преобразования. Как таковая, квантованная предыдущая огибающая могла быть получена декодером как данные огибающей для предыдущего набора блоков коэффициентов преобразования (например, в случае так называемого Р-кадра). В качестве альтернативы или в дополнение, данные огибающей для этого набора блоков могут служить признаком квантованной предыдущей огибающей в дополнение к тому, что они служат признаком квантованной текущей огибающей (например, в случае так называемого I-кадра). Это делает возможным декодирование I-кадра в отсутствие знания о предыдущих данных.

Модуль интерполяции огибающих может быть сконфигурирован для определения значения спектральной энергии для конкретного элемента разрешения по частоте, исходя из первой интерполированной огибающей, путем интерполирования значений спектральной энергии для данного конкретного элемента разрешения по частоте квантованной текущей огибающей и квантованной предыдущей огибающей в первый промежуточный момент времени. Первая интерполированная огибающая связана с первым блоком ряда последовательных блоков восстановленных выровненных коэффициентов преобразования или соответствует этому первому блоку. Как описывалось выше, квантованная предыдущая и квантованная текущая огибающие, как правило, представляют собой полосные огибающие. Значения спектральной энергии для конкретной полосы частот, как правило, являются постоянными для всех элементов разрешения по частоте, заключенных в этой полосе частот.

Модуль интерполяции огибающих может быть сконфигурирован для определения значения спектральной энергии для конкретного элемента разрешения по частоте первой интерполированной огибающей путем квантования интерполяции между значениями спектральной энергии для данного конкретного элемента разрешения по частоте квантованной текущей огибающей и квантованной предыдущей огибающей. Как таковой, ряд интерполированных огибающих может представлять собой ряд квантованных интерполированных огибающих.

Модуль интерполяции огибающих может быть сконфигурирован для определения значения спектральной энергии для конкретного элемента разрешения по частоте второй интерполированной огибающей путем интерполирования значений спектральной энергии для данного конкретного элемента разрешения по частоте квантованной текущей огибающей и квантованной предыдущей огибающей во второй промежуточный момент времени. Вторая интерполированная огибающая может быть связана со вторым блоком из ряда блоков восстановленных выровненных коэффициентов преобразования или может соответствовать этому второму блоку. Второй блок восстановленных выровненных коэффициентов преобразования может следовать за первым блоком восстановленных выровненных коэффициентов преобразования, а указанный второй промежуточный момент времени может следовать за указанным первым промежуточным моментом времени. В частности, разность между вторым промежуточным моментом времени и первым промежуточным моментом времени может соответствовать промежутку времени между вторым блоком восстановленных выровненных коэффициентов преобразования и первым блоком восстановленных выровненных коэффициентов преобразования.

Модуль интерполяции огибающих может быть сконфигурирован для одной или нескольких следующих интерполяций: линейной интерполяции, геометрической интерполяции и гармонической интерполяции. Кроме того, модуль интерполяции огибающих может быть сконфигурирован для выполнения интерполяции в логарифмической области.

Кроме того, декодер может содержать модуль обратного выравнивания, сконфигурированный для определения ряда блоков восстановленных коэффициентов преобразования путем придания формы спектра соответствующему ряду блоков восстановленных выровненных коэффициентов преобразования, соответственно, с использованием соответствующего ряда интерполированных огибающих. Как указывалось выше, битовый поток может служить признаком ряда коэффициентов усиления огибающей (в данных коэффициентов усиления), соответственно, для ряда блоков восстановленных выровненных коэффициентов преобразования. Речевой декодер на основе преобразования также может содержать модуль уточнения огибающей, сконфигурированный для определения ряда скорректированных огибающих путем применения ряда коэффициентов усиления огибающей, соответственно, к ряду интерполированных огибающих. Модуль обратного выравнивания может быть сконфигурирован для определения ряда блоков восстановленных коэффициентов преобразования путем придания формы спектра соответствующему ряду блоков восстановленных выровненных коэффициентов преобразования с использованием соответствующего ряда скорректированных огибающих, соответственно.

Декодер может быть сконфигурирован для определения восстановленного речевого сигнала на основе ряда блоков восстановленных коэффициентов преобразования.

Согласно еще одному аспекту, описывается речевой кодер на основе преобразования, сконфигурированный для кодирования речевого сигнала в битовый поток. Этот кодер может содержать любой из описываемых в настоящем документе характерных признаков и/или компонентов, относящихся к кодеру. В частности, этот кодер может содержать модуль кадрирования, сконфигурированный для приема ряда последовательных блоков коэффициентов преобразования. Этот ряд последовательных блоков содержит текущий блок и один или несколько предыдущих блоков. Как указывалось выше, этот ряд последовательных блоков служит признаком дискретных значений речевого сигнала.

Кроме того, указанный кодер может содержать модуль выравнивания, сконфигурированный для определения текущего блока и одного или нескольких предыдущих блоков выровненных коэффициентов преобразования путем выравнивания соответствующего текущего блока и одного или нескольких предыдущих блоков коэффициентов преобразования с использованием соответствующей текущей огибающей блока и соответствующих одной или нескольких предыдущих огибающих блоков, соответственно. Эти огибающие блоков могут соответствовать вышеупомянутым скорректированным огибающим.

В дополнение, кодер содержит предсказатель, сконфигурированный для определения текущего блока оценочных выровненных коэффициентов предсказателя на основе одного или нескольких предыдущих блоков восстановленных коэффициентов преобразования и на основе одного или нескольких параметров предсказателя. Указанные один или несколько блоков восстановленных коэффициентов преобразования могли быть получены, соответственно, исходя из одного или нескольких предыдущих блоков выровненных коэффициентов преобразования (например, с использованием предсказателя).

Указанный предсказатель может содержать экстрактор, сконфигурированный для определения текущего блока оценочных коэффициентов преобразования на основе одного или нескольких предыдущих блоков восстановленных коэффициентов преобразования и на основе одного или нескольких параметров предсказателя. Как таковой, экстрактор может действовать в невыровненной области (т.е. экстрактор может действовать на блоках коэффициентов преобразования, имеющих форму спектра). Это может быть преимущественным в отношении модели сигнала, используемой экстрактором для определения текущего блока оценочных коэффициентов преобразования.

Кроме того, предсказатель может содержать формирователь спектра, сконфигурированный для определения текущего блока оценочных выровненных коэффициентов преобразования на основе текущего блока оценочных коэффициентов преобразования, на основе, по меньшей мере, одного из одной или нескольких предыдущих огибающих блоков и на основе, по меньшей мере, одного или нескольких параметров предсказателя. Как таковой, формирователь спектра может быть сконфигурирован для преобразования текущего блока оценочных коэффициентов преобразования в выровненную область с целью создания текущего блока оценочных выровненных коэффициентов преобразования. Как описывается в контексте соответствующего декодера, с этой целью формирователь спектра может использовать ряд скорректированных огибающих (или ряд огибающих блоков).

Как указывалось выше, предсказатель (в частности, экстрактор) может содержать предсказатель на основе модели, использующий модель сигнала. Эта модель сигнала может содержать один или несколько параметров модели, а один или несколько параметров предсказателя могут служить признаком одного или нескольких параметров модели. Использование предсказателя на основе модели может быть преимущественным для обеспечения средств, эффективных с точки зрения битовой скорости передачи данных, для описания коэффициентов предсказания, используемых предсказателем поддиапазонов (или предсказателем элементов разрешения по частоте). В частности, можно определить полный набор коэффициентов предсказания, используя лишь небольшое количество параметров модели, которые можно передавать в качестве данных предсказателя в соответствующий декодер эффективным с точки зрения битовой скорости передачи данных образом. Как таковой, предсказатель на основе модели может быть сконфигурирован для определения одного или нескольких параметров модели для модели сигнала (например, с использованием алгоритма Дарбина-Левинсона). Кроме того, предсказатель на основе модели может быть сконфигурирован для определения коэффициента предсказания, подлежащего применению к первому восстановленному коэффициенту преобразования в первом элементе разрешения по частоте предыдущего блока восстановленных коэффициентов преобразования на основе модели сигнала и на основе одного или нескольких параметров модели. В частности, можно определить ряд коэффициентов предсказания для ряда восстановленных коэффициентов преобразования. Действуя таким образом и применяя коэффициент предсказания к первому восстановленному коэффициенту преобразования, можно определить оценку первого оценочного коэффициента преобразования в первом элементе разрешения по частоте текущего блока оценочных коэффициентов преобразования. В частности, действуя таким образом, можно определить оценочные коэффициенты преобразования из текущего блока оценочных коэффициентов преобразования.

Например, модель сигнала может содержать одну или несколько синусоидальных составляющих модели, а один или несколько параметров модели могут служить признаком частоты этой одной или нескольких синусоидальных составляющих модели. В частности, эти один или несколько параметров модели могут служить признаком основной частоты мультисинусоидальной модели сигнала. Такая основная частота может соответствовать задержке во временной области.

Предсказатель может быть сконфигурирован для определения одного или нескольких параметров предсказателя так, чтобы уменьшать (например, минимизировать) среднеквадратичное значение коэффициентов ошибок предсказания из текущего блока коэффициентов ошибок предсказания. Это можно выполнить, используя, например, алгоритм Дарбина-Левинсона. Предсказатель может быть сконфигурирован для вставки данных предсказателя, служащих признаком одного или нескольких параметров предсказателя, в битовый поток. Как результат, соответствующий декодер имеет возможность определять текущий блок оценочных выровненных коэффициентов преобразования таким же образом, как и кодер.

Кроме того, кодер может содержать разностный модуль, сконфигурированный для определения текущего блока коэффициентов ошибок предсказания на основе текущего блока выровненных коэффициентов преобразования и на основе текущего блока оценочных выровненных коэффициентов преобразования. Битовый поток можно определить на основе текущего блока коэффициентов ошибок предсказания. В частности, признаком текущего блока коэффициентов ошибок предсказания могут служить данные коэффициентов из битового потока.

Согласно одному из дальнейших аспектов, описывается речевой декодер на основе преобразования, сконфигурированный для декодирования битового потока с целью создания восстановленного речевого сигнала. Этот декодер может содержать любой из описываемых в настоящем документе характерных признаков и/или компонентов. В частности, указанный декодер может содержать предсказатель, сконфигурированный для определения текущего блока оценочных выровненных коэффициентов преобразования на основе одного или нескольких предыдущих блоков восстановленных коэффициентов преобразования и на основе одного или нескольких параметров предсказателя, полученных из (данных предсказателя) битового потока. Как описывается в контексте соответствующего кодера, предсказатель может содержать экстрактор, сконфигурированный для определения текущего блока оценочных коэффициентов преобразования на основе, по меньшей мере, одного из одного или нескольких предыдущих блоков восстановленных коэффициентов преобразования и на основе, по меньшей мере, одного из одного или нескольких параметров предсказателя. Кроме того, предсказатель может содержать формирователь спектра, сконфигурированный для определения текущего блока оценочных выровненных коэффициентов преобразования на основе текущего блока оценочных коэффициентов преобразования, на основе одной или нескольких предыдущих огибающих блоков (например, предыдущих скорректированных огибающих) и на основе одного или нескольких параметров предсказателя.

Эти один или несколько параметров предсказателя могут содержать параметр Т запаздывания блока. Этот параметр запаздывания блока может служить признаком количества блоков, предшествующих текущему блоку оценочных выровненных коэффициентов преобразования. В частности, параметр Т запаздывания блока может служить признаком периодичности речевого сигнала. Как таковой, параме

Звуковые кодирующее устройство и декодирующее устройство

Патент 2630887