Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
Иллюстрации
Показать всеИзобретение относится к кодированию и декодированию огибающей аудиосигнала. Технический результат – улучшение кодирования и декодирования огибающей аудиосигналов. Устройство содержит интерфейс ввода для приема кодирующих значений и генератор огибающей для генерации огибающей аудиосигнала, сконфигурированный для генерации агрегирующей функции в зависимости от кодирующих значений, причем агрегирующая функция содержит множество точек агрегации, каждая из которых содержит значение аргумента и значение агрегации, причем агрегирующая функция монотонно возрастает и каждое из кодирующих значений указывает одно из значения аргумента и значения агрегации одной из точек агрегации агрегирующей функции, и для генерации огибающей аудиосигнала так, что огибающая аудиосигнала содержит множество точек огибающей, каждая из которых содержит значение аргумента и значение огибающей, при этом точка огибающей аудиосигнала присваивается каждой из точек агрегации агрегирующей функции так, что значение аргумента точки огибающей равно значению аргумента точки агрегации, и так, что значение огибающей каждой из точек огибающей аудиосигнала зависит от значения агрегации одной точки агрегации агрегирующей функции. 6 н. и 12 з.п. ф-лы, 19 ил.
Реферат
Настоящее изобретение относится к устройству и способу для кодирования, обработки и декодирования огибающей аудиосигнала, и, в частности, к устройству и способу кодирования, обработки и декодирования огибающей аудиосигнала с использованием квантования и кодирования распределения.
Кодирование с линейным предсказанием (LPC) является классическим инструментом для моделирования спектральной огибающей основной полосы частот в речевых кодеках. Наиболее распространенная область для квантования LPC моделей - область линейных спектральных частот (LSF). Она основывается на разложении LPC многочлена на два многочлена, корни которого расположены на единичной окружности, так что они могут быть описаны только лишь их углами или частотами.
Задача настоящего изобретения - предоставление улучшенных концепций для кодирования и декодирования огибающей аудиосигнала. Задача настоящего изобретения решается с помощью устройства по пункту 1 формулы изобретения, с помощью устройства по пункту 9 формулы изобретения, с помощью способа по пункту 15 формулы изобретения, с помощью способа по пункту 16 формулы изобретения и с помощью компьютерной программы по пункту 17 формулы изобретения.
Предоставлено устройство для генерации огибающей аудиосигнала из одного или более кодирующих значений. Устройство содержит интерфейс ввода для приема одного или более кодирующих значений и генератор огибающей для генерации огибающей аудиосигнала в зависимости от одного или более кодирующих значений. Генератор огибающей сконфигурирован для генерации агрегирующей функции в зависимости от одной или более кодирующих величин, причем агрегирующая функция содержит множество точек агрегации, причем каждая точка агрегации содержит значение аргумента и значение агрегации, причем агрегирующая функция монотонно возрастает, и причем каждое из одного или более кодирующих значений указывает по меньшей мере одно из значения аргумента и значения агрегации одной из точек агрегации агрегирующей функции. Кроме того, генератор огибающей сконфигурирован для генерации огибающей аудиосигнала так, что огибающая аудиосигнала содержит множество точек огибающей, причем каждая из точек огибающей содержит значение аргумента и значение огибающей, и причем точка огибающей аудиосигнала присвоена каждой из каждой из точек агрегации агрегирующей функции так, что значение аргумента указанной точки огибающей равно значению аргумента указанной точки агрегации. Более того, генератор огибающей сконфигурирован для генерации огибающей аудиосигнала так, что значение огибающей каждой из точек огибающей аудиосигнала зависит от значения агрегации по меньшей мере одной точки агрегации агрегирующей функции.
В соответствии с вариантом осуществления, генератор огибающей может, например, быть сконфигурирован для определения агрегирующей функции путем определения одной из точек агрегации для каждого из одного или более кодирующих значений в зависимости от указанного кодирующего значения, и путем применения интерполяции для получения агрегирующей функции в зависимости от точки агрегации каждого из одного или более кодирующих значений.
В варианте осуществления, генератор огибающей может, например, быть сконфигурирован для определения первой производной агрегирующей функции на множестве точек агрегации агрегирующей функции.
В соответствии с вариантом осуществления, генератор огибающей может, например, быть сконфигурирован для генерации агрегирующей функции в зависимости от кодирующих значений так, чтобы агрегирующая функция имела непрерывную первую производную.
В варианте осуществления, генератор огибающей может, например, быть сконфигурирован для определения огибающей аудиосигнала путем применения:
,
где указывает производную агрегированной огибающей сигнала в k-ом кодирующем значении, где c(k) - агрегированное значение k-ой агрегированной точки агрегирующей функции, и где f(k) - значение аргумента k-ой агрегированной точки агрегирующей функции.
В соответствии с вариантом осуществления, интерфейс ввода может быть сконфигурирован для приема одного или более разделяющих значений в качестве одного или более кодирующих значений. Генератор огибающей может быть сконфигурирован для генерации агрегирующей функции в зависимости от одного или более разделяющих значений, причем каждое из одного или более разделяющих значений указывает значение агрегации одной из точек агрегации агрегирующей функции. Кроме того, генератор огибающей может быть сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что одна или более разделяющих точек разделяют восстановленную огибающую аудиосигнала на два или больше сегментов огибающей аудиосигнала, причем предварительно определенное правило присвоения определяет значение сегмента огибающей аудиосигнала для каждого сегмента огибающей сигнала из двух или более сегментов огибающей сигнала в зависимости от указанного сегмента огибающей сигнала. Более того, генератор огибающей может быть сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что для каждого из двух или более сегментов огибающей сигнала абсолютное значение данного сегмента огибающей сигнала больше, чем половина абсолютного значения сегмента огибающей сигнала каждого из других сегментов огибающей сигнала.
Кроме того, предусмотрено устройство для определения одного или более кодирующих значений для кодирования огибающей аудиосигнала. Устройство содержит агрегатор для определения агрегированного значения для каждого из множества значений аргумента, причем множество значений аргумента упорядочены так, что первое значение аргумента множества значений аргумента или предшествует, или следует за вторым значением аргумента множества значений аргумента, когда указанное второе значение аргумента отличается от первого значения аргумента, причем значение огибающей присваивается каждому из значений аргумента, причем значение огибающей зависит от огибающей аудиосигнала, и причем агрегатор сконфигурирован для определения агрегированного значения для каждого значения аргумента множества значений аргумента в зависимости от значения огибающей указанного значения аргумента и в зависимости от значения огибающей каждого из множества значений аргумента, которое предшествует указанному значению аргумента. Кроме того, устройство содержит кодирующий блок для определения одного или более кодирующих значений в зависимости от одного или более агрегированных значений из множества значений аргумента.
В соответствии с вариантом осуществления, агрегатор может, например, быть сконфигурирован для определения агрегированного значения для каждого значения аргумента множества значений аргумента путем суммирования значения огибающей указанного значения аргумента и значений огибающей значений аргумента, которые предшествуют указанному значению аргумента.
В варианте осуществления, значение огибающей каждого из значений аргумента может, например, указывать значение энергии огибающей аудиосигнала, имеющей огибающую аудиосигнала в качестве огибающей сигнала.
В соответствии с вариантом осуществления, значение огибающей каждого из значений аргумента может, например, указывать n-ую мощность спектрального значения огибающей аудиосигнала, имеющей огибающую аудиосигнала в качестве огибающей сигнала, где n - четное целое число больше нуля.
В варианте осуществления, значение огибающей каждого из значений аргумента может, например, указывать n-ую мощность амплитудного значения огибающей аудиосигнала, представленного во временной области, и имеющую огибающую аудиосигнала в качестве огибающей сигнала, где n - четное целое больше нуля.
В соответствии с вариантом осуществления, блок кодирования может, например, быть сконфигурирован для определения одного или более кодирующих значений в зависимости от одного или более агрегированных значений аргумента и в зависимости от числа кодирующих значений, которое указывает, как много значений должны быть определены блоком кодирования как одно или более кодирующих значений.
В варианте осуществления, блок кодирования может, например, быть сконфигурирован для определения одного или более кодирующих значений в соответствии с
,
где c(k) указывает k-ое кодирующее значение для определения блоком кодирования, где j указывает j-ое значение аргумента из множества значений аргумента, где a(j) указывает агрегированное значение, присвоенное j-ому значению аргумента, где max(a) указывает максимальное значение, являющееся одним из агрегированных значений, которое присвоено одному из значений аргумента, причем ни одно из агрегированных значений, которые присвоены одному из значений аргумента, не превышает максимальное значение, и где указывает минимальное значение, являющееся одним из значений аргумента, для которого минимально.
Кроме того, предусматривается способ для генерации огибающей аудиосигнала из одного или более кодирующих значений. Способ содержит:
- прием одного или более кодирующих значений; и
- генерацию огибающей аудиосигнала в зависимости от одного или более кодирующих значений.
Генерация огибающей аудиосигнала сопровождается генерацией агрегирующей функции в зависимости от одного или более кодирующих значений, причем агрегирующая функция содержит множество точек агрегации, причем каждая из точек агрегации содержит значение аргумента и значение агрегации, причем агрегирующая функция монотонно возрастает, и причем каждое из одного или более кодирующих значений указывает по меньшей мере одно из значения аргумента и значения агрегации одной из точек агрегации агрегирующей функции. Кроме того, генерация огибающей аудиосигнала проводится так, что огибающая аудиосигнала содержит множество точек огибающей, причем каждая из точек огибающей содержит значение аргумента и значение огибающей, и причем точка огибающей аудиосигнала присваивается каждой из точек агрегации агрегирующей функции так, что значение аргумента указанной точки огибающей равно значению аргумента указанной точки агрегации. Более того, генерация огибающей аудиосигнала проводится так, что значение огибающей каждой из точек огибающей аудиосигнала зависит от значения агрегации по меньшей мере одной точки агрегации агрегирующей функции.
Более того, предоставляется способ для определения одного или более кодирующих значений для кодирования огибающей аудиосигнала. Способ содержит:
- определение агрегированного значения для каждого из множества значений аргумента, причем множество значений аргумента упорядочено так, что первое значение аргумента из множества значений аргумента или предшествует, или следует за вторым значением аргумента из множества значений аргумента, когда указанное второе значение отличается от первого значения аргумента, причем значение огибающей присваивается каждому из значений аргумента, причем значение огибающей каждого из значений аргумента зависит от огибающей аудиосигнала, и причем агрегатор сконфигурирован для определения агрегированного значения для каждого значения аргумента из множества значений аргумента в зависимости от значения огибающей указанного значения аргумента и в зависимости от значения огибающей каждого из множества значений аргумента, которые предшествуют указанному значению аргумента. И:
- определение одного или более кодирующих значений в зависимости от одного или более агрегированных значений множества значений аргумента.
Более того, предусмотрена компьютерная программа для реализации одного из вышеописанных способов при исполнении на компьютере или сигнальном процессоре.
Предоставляется устройство для декодирования для получения восстановленной огибающей аудиосигнала. Устройство содержит восстановитель огибающей сигнала для генерации восстановленной огибающей аудиосигнала в зависимости от одной или более разделяющих точек и интерфейс вывода для вывода восстановленной огибающей аудиосигнала. Восстановитель огибающей сигнала сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что упомянутые одна или более разделяющих точек разделяют восстановленную огибающую аудиосигнала на два или более сегмента огибающей сигнала, причем предварительно определенное правило присвоения определяет значение сегмента огибающей сигнала для каждого сегмента огибающей сигнала двух или более сегментов огибающей сигнала в зависимости от указанного сегмента огибающей сигнала. Кроме того, восстановитель огибающей сигнала сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что для каждой из двух или более сегментов огибающей сигнала абсолютное значение данного сегмента огибающей сигнала больше, чем половина абсолютного значения сегмента огибающей сигнала каждого из других сегментов огибающей сигнала.
В соответствии с вариантом осуществления, восстановитель огибающей сигнала может, например, быть сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что для каждого из двух или более сегментов огибающей сигнала абсолютное значение данного сегмента огибающей сигнала больше чем 90% абсолютного значения сегмента огибающей сигнала каждого из других сегментов огибающей сигнала.
В варианте осуществления, восстановитель огибающей сигнала может, к примеру, быть сконфигурирован для формирования восстановленной огибающей сигнала так, что для каждого из двух или более сегментов огибающей сигнала абсолютное значение данного сегмента огибающей сигнала больше чем 99% абсолютного значения сегмента огибающей сигнала каждого из других сегментов огибающей сигнала.
В другом варианте осуществления, восстановитель 110 огибающей сигнала может, например, быть сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что значение сегмента огибающей сигнала каждого из двух или более сегментов огибающей сигнала равно значению сегмента огибающей сигнала каждого из других сегментов огибающей сигнала из двух или более сегментов огибающей сигнала.
В соответствии с вариантом осуществления, значение сегмента огибающей сигнала каждого сегмента огибающей сигнала из двух или более сегментов огибающей сигнала может, например, зависеть от одного или более значений энергии или от одного или более значений мощности указанного сегмента огибающей сигнала. Или значение сегмента огибающей сигнала каждого сегмента огибающей сигнала из двух или более сегментов огибающей сигнала, зависит от любого другого значения, подходящего для восстановления исходного или целевого уровня огибающей звукового сигнала.
Масштабирование огибающей может быть выполнено различными способами. В частности, оно может соответствовать энергии сигнала или спектральной массе или подобию (фактическому размеру), или это может быть коэффициентом масштабирования или усиления (относительный размер). Соответственно, она может быть закодирована как относительное или абсолютное значение, или она может быть закодирована при помощи разности от предыдущего значения, или сочетанием предыдущих значений. В некоторых случаях масштабирование может также быть нерелевантным или выведенным из других имеющихся данных. Огибающая должна быть восстановлена до исходного или требуемого уровня. Таким образом, в общем случае, значение сегмента огибающей сигнала зависит от любого значения, подходящего для восстановления исходного или целевого уровня огибающей звукового сигнала.
В варианте осуществления, устройство может, например, дополнительно содержать декодер разделяющих точек для декодирования одной или более закодированных точек, в соответствии с правилом декодирования, для получения положения каждой из одной или более разделяющих точек. Декодер разделяющих точек может, например, быть сконфигурирован для анализа общего числа положений, указывающего общее число возможных положений разделяющих точек, числа разделяющих точек, указывающего число одной или более разделяющих точек, и номера состояния разделяющих точек. Кроме того, декодер разделяющих точек может, например, быть сконфигурирован для генерации указания положения каждой из упомянутых одной или более разделяющих точек с использованием общего числа положений, числа разделяющих точек и номера состояния разделяющих точек.
В соответствии с вариантом осуществления, восстановитель огибающей сигнала может, например, быть сконфигурирован для генерации восстановленной огибающей аудиосигнала в зависимости от общего значения энергии, указывающего общую энергию восстановленной огибающей аудиосигнала, или в зависимости от любого другого значения, подходящего для восстановления исходного или заданного уровня огибающей аудиосигнала.
Кроме того, предусмотрено устройство для декодирования для получения восстановленной огибающей аудиосигнала в соответствии с другим вариантом осуществления. Устройство содержит восстановитель огибающей сигнала для генерации восстановленной огибающей аудиосигнала в зависимости от одной или более разделяющих точек, и интерфейс вывода для вывода восстановленной огибающей аудиосигнала. Восстановитель аудиосигнала сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что одна или более разделяющих точек делит восстановленную огибающую аудиосигнала на два или более сегмента огибающей аудиосигнала, причем предварительно определенное правило присвоения определяет значение сегмента огибающей сигнала для каждого сегмента огибающей сигнала из двух или более сегментов огибающей сигнала в зависимости от указанного сегмента огибающей сигнала. Предварительно определенное значение сегмента огибающей присваивается каждому из двух или более сегментов огибающей сигнала. Восстановитель огибающей сигнала сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что для каждого сегмента из двух или более сегментов огибающей сигнала абсолютное значение сегмента огибающей сигнала указанного сегмента огибающей сигнала больше чем 90% абсолютного значения предварительно определенного значения сегмента огибающей, присвоенного указанному сегменту огибающей сигнала, и так, что абсолютное значение сегмента огибающей сигнала указанного сегмента огибающей сигнала меньше чем 110% абсолютного значения предварительно определенного значения сегмента огибающей, присвоенного указанному сегменту огибающей сигнала.
В варианте осуществления, восстановитель огибающей сигнала сконфигурирован для генерации восстановленной огибающей аудиосигнала так, что значение сегмента огибающей сигнала каждого из двух или более сегментов огибающей сигнала равно предварительно определенному значению сегмента огибающей, присвоенному указанному сегменту огибающей сигнала.
В варианте осуществления, предварительно определенные значения сегмента огибающей по меньшей мере двух сегментов огибающей сигнала отличаются друг от друга.
В другом варианте осуществления, предварительно определенное значение сегмента огибающей каждого из сегментов огибающей сигнала отличается от предварительно определенного значения сегмента огибающей каждого из других сегментов огибающей сигнала.
Кроме того, предусмотрено устройство для восстановления аудиосигнала. Устройство содержит устройство для декодирования в соответствии с одним из вышеописанных вариантов осуществления для получения восстановленной огибающей аудиосигнала, и генератор сигнала для генерации аудиосигнала в зависимости от огибающей аудиосигнала и в зависимости от дополнительных характеристик сигнала аудиосигнала, дополнительных характеристик сигнала, отличающихся от огибающей аудиосигнала.
Более того, предусмотрено устройство для кодирования огибающей аудиосигнала. Устройство содержит интерфейс огибающей аудиосигнала для приема огибающей аудиосигнала, и определитель разделяющей точки для определения, в зависимости от предварительно определенного правила присвоения, значения сегмента огибающей сигнала для, по меньшей мере, одного сегмента огибающей аудиосигнала из двух или более сегментов огибающей аудиосигнала для каждой из по меньшей мере двух конфигураций разделяющих точек. Каждая из, по крайней мере, двух конфигураций разделяющих точек содержит одну или более разделяющих точек, причем упомянутая одна или более разделяющие точки из двух или более конфигураций разделяющих точек разделяют огибающую аудиосигнала на два или более сегмента огибающей аудиосигнала. Определитель разделяющей точки сконфигурирован выбирать одну или более разделяющих точек одной из по меньшей мере двух конфигураций разделяющих точек как одну или более выбранные разделяющие точки для кодирования огибающей аудиосигнала, причем определитель разделяющей точки сконфигурирован выбирать одну или более разделяющих точек в зависимости от значения сегмента огибающей сигнала каждого из по меньшей мере одного сегмента огибающей аудиосигнала из двух или более сегментов огибающей аудиосигнала каждой из по меньшей мере двух конфигураций разделяющих точек.
В соответствии с вариантом осуществления, значение сегмента огибающей сигнала каждого сегмента огибающей сигнала из двух или более сегментов огибающей сигнала может, например, зависеть от одного или более значений энергии или одного или более значений мощности указанного сегмента огибающей сигнала. Или значение сегмента огибающей сигнала каждого сегмента огибающей сигнала из двух или более сегментов огибающей сигнала зависит от любого другого значения, подходящего для восстановления исходного или целевого уровня огибающей аудиосигнала.
Как уже было сказано, масштабирование огибающей может быть осуществлено различными способами. А именно, она может соответствовать энергии или спектральной массе или подобию (абсолютный размер) сигнала, или это может быть коэффициент масштабирования или усиления (относительный размер). Соответственно, она может быть закодирована как абсолютная или относительная величина, или она может быть закодирована с помощью разности к предыдущему значению или комбинации предыдущих значений. В некоторых случаях масштабирование также может быть нерелевантным или выведенным из других доступных данных. Огибающая должна быть восстановлена до исходного или целевого уровня. Таким образом, в общем, значение сегмента огибающей сигнала зависит от любого значения, подходящего для восстановления исходного или целевого уровня огибающей звукового сигнала.
В варианте осуществления, устройство может, например, дополнительно содержать кодер разделяющих точек для кодирования положения каждой из одной или более разделяющих точек для получения одной или более закодированных точек. Кодер разделяющих точек может, например, быть сконфигурирован для кодирования каждой из одной или более разделяющих точек с помощью кодирования номера состояния разделяющих точек. Кроме того, кодер разделяющих точек может, например, быть сконфигурирован для предоставления общего числа положений, указывающего общее число возможных положений разделяющих точек, и числа разделяющих точек, указывающего число одной или более разделяющих точек. Порядковый номер разделяющих точек, общее число позиций и число разделяющих точек вместе указывают положение каждой из одной или более разделяющих точек.
В соответствии с вариантом осуществления, устройство может, например, дополнительно содержать определитель энергии для определения общей энергии огибающей аудиосигнала и для кодирования общей энергии огибающей аудиосигнала. Или, устройство может, например, быть дополнительно сконфигурировано для определения любого другого значения, подходящего для восстановления исходного или целевого уровня огибающей аудиосигнала.
Кроме того, предусмотрено устройство для кодирования аудиосигнала. Устройство содержит устройство для кодирования согласно одному из вышеописанных вариантов осуществления для кодирования огибающей аудиосигнала из аудиосигнала, и кодер вторичной характеристики сигнала для кодирования дополнительной характеристики сигнала из аудиосигнала, причем дополнительная характеристика сигнала отличается от огибающей аудиосигнала.
Дополнительно, предусмотрен способ декодирования для получения восстановленной огибающей аудиосигнала. Способ содержит:
- генерацию восстановленной огибающей аудиосигнала в зависимости от одной или более разделяющих точек. И:
- вывод восстановленной огибающей аудиосигнала.
Генерация восстановленной огибающей аудиосигнала проводится так, что одна или более разделяющих точек делят восстановленную огибающую аудиосигнала на два или более сегмента огибающей аудиосигнала, причем предварительно определенное правило присвоения определяет значение сегмента огибающей сигнала для каждого сегмента огибающей сигнала из двух или более сегментов огибающей в зависимости от указанного сегмента огибающей сигнала. Кроме того, генерация восстановленной огибающей аудиосигнала проводится так, что для каждого из двух или более сегментов огибающей, абсолютное значение данного сегмента огибающей сигнала больше, чем половина абсолютного значения сегмента огибающей сигнала каждого из других сегментов огибающей сигнала.
Кроме того, предусмотрено устройство для кодирования аудиосигнала. Устройство содержит устройство для кодирования согласно одному из вышеописанных вариантов осуществления для кодирования огибающей аудиосигнала, и кодер вторичной характеристики сигнала для кодирования дополнительной характеристики сигнала из аудиосигнала, дополнительная характеристика сигнала отличается от огибающей аудиосигнала.
Дополнительно, предусмотрен способ декодирования для получения восстановленной огибающей аудиосигнала. Способ содержит:
- генерацию восстановленной огибающей аудиосигнала в зависимости от одной или более разделяющих точек. И:
- вывод восстановленной огибающей аудиосигнала.
Генерация восстановленной огибающей аудиосигнала проводится так, что одна или более разделяющих точек делят восстановленную огибающую аудиосигнала на два или более сегмента огибающей аудиосигнала. Предварительно определенное значение сегмента огибающей присваивается каждому из двух или более сегментов огибающей. Более того, генерация восстановленной огибающей аудиосигнала проводится так, что для каждого сегмента огибающей сигнала из двух или более сегментов огибающей сигнала абсолютное значение сегмента огибающей сигнала указанного сегмента огибающей сигнала больше чем 90% абсолютного значения предварительно определенного значения сегмента огибающей, присвоенного указанному сегменту огибающей сигнала, и так, что абсолютное значение сегмента огибающей сигнала указанного сегмента огибающей сигнала меньше чем 110% абсолютного значения предварительно определенного значения сегмента огибающей, присвоенного указанному сегменту огибающей сигнала.
Более того, предусмотрен способ для кодирования огибающей аудиосигнала. Способ содержит:
- прием огибающей аудиосигнала.
- определение, в зависимости от предварительно определенного правила присвоения, значения сегмента огибающей сигнала для по меньшей мере одного сегмента огибающей аудиосигнала из двух или более сегментов огибающей аудиосигнала для каждой из по меньшей мере двух конфигураций разделяющих точек, причем каждая из по меньшей мере двух конфигураций разделяющих точек содержит одну или более разделяющих точек, причем упомянутая одна или более разделяющих точек каждой из двух или более конфигураций разделяющих точек разделяют огибающую аудиосигнала на два или более сегмента огибающей аудиосигнала. И:
- выбор одной или более разделяющих точек из одной из по меньшей мере двух конфигураций разделяющих точек как одну или более выбранную разделяющую точку для кодирования огибающей аудиосигнала, причем выбор одной или более разделяющих точек проводится в зависимости от значения сегмента огибающей сигнала каждого из, по меньшей мере, одного сегмента огибающей сигнала из двух или более сегментов огибающей аудиосигнала каждой из, по меньшей мере, двух конфигураций разделяющих точек.
Кроме того, предусмотрена компьютерная программа для реализации одного из вышеописанных способов при исполнении на компьютере или сигнальном процессоре.
Эвристическое, но немного не точное, описание линейных спектральных частот 5 (LSF5) заключается в том, что они описывают распределение энергии сигнала вдоль частотной оси. С высокой вероятностью, LSF5 будет находиться на частотах, где сигнал имеет много энергии. Варианты осуществления основываются на решении взять данное эвристическое описание буквально и квантовать фактическое распределение энергии сигнала. Поскольку методы LSFs применяют эту идею только приближенно, согласно вариантам осуществления, принцип LSF опускается, и вместо этого квантуется распределение частот, таким образом, что из этого распределения может быть построена гладкая форма огибающей. Этот изобретательский замысел в дальнейшем именуется как квантование распределения.
Варианты осуществления основываются на квантовании и кодировании спектральных огибающих, используемых в речи и кодировании звука. Варианты осуществления могут, например, быть применены к огибающим центральной полосы частот, а также к способам расширения полосы частот.
В соответствии с вариантами осуществления, стандартные методики моделирования огибающей, такие как полосы частот с коэффициентами масштабирования [3, 4] и модели с линейным предсказанием [1] могут, например, быть заменены и/или улучшены.
Целью вариантов осуществления является получение квантования, которое совмещает преимущества как подходов с линейным предсказанием, так и подходов, основанных на полосах частот с коэффициентами масштабирования, исключая их недостатки.
В соответствии с вариантами осуществления, предоставлены принципы, которые, с одной стороны, имеют гладкую, но довольно точную спектральную огибающую, а с другой стороны, могут быть закодированы малым числом битов (опционально с фиксированной битовой скоростью), и более того, реализованы с приемлемой вычислительной сложностью.
Далее, варианты осуществления настоящего изобретения описаны более детально со ссылкой на чертежи, на которых:
Фиг.1 иллюстрирует устройство для декодирования для получения восстановленной огибающей аудиосигнала в соответствии с вариантом осуществления,
Фиг.2 иллюстрирует устройство в соответствии с еще одним вариантом осуществления, в котором устройство дополнительно содержит декодер разделяющих точек,
Фиг.3 иллюстрирует устройство для кодирования огибающей аудиосигнала в соответствии с вариантом осуществления,
Фиг.4 иллюстрирует устройство для кодирования огибающей аудиосигнала в соответствии с другим вариантом осуществления, в котором устройство дополнительно содержит кодер разделяющих точек,
Фиг.5 иллюстрирует устройство для кодирования огибающей аудиосигнала в соответствии с другим вариантом осуществления, в котором устройство для кодирования огибающей аудиосигнала дополнительно содержит определитель энергии,
Фиг.6 иллюстрирует три огибающие сигнала, описанные блоками с постоянной энергией в соответствии с вариантами осуществления,
Фиг.7 иллюстрирует совокупное представление спектра с Фиг.6 в соответствии с вариантами осуществления, и
Фиг.8 иллюстрирует интерполированную огибающую спектральной массы в исходном представлении, а также в представлении области совокупной массы,
Фиг.9 иллюстрирует процесс декодирования для декодирования положений разделяющих точек в соответствии с вариантом осуществления,
Фиг.10 иллюстрирует псевдокод, осуществляющий декодирование положений разделяющих точек в соответствии с вариантом осуществления,
Фиг.11 иллюстрирует процесс кодирования для кодирования разделяющих точек в соответствии с вариантом осуществления,
Фиг.12 иллюстрирует псевдокод, осуществляющий кодирование положений разделяющих точек в соответствии с вариантом осуществления настоящего изобретения,
Фиг.13 иллюстрирует декодер разделяющих точек в соответствии с вариантом осуществления,
Фиг.14 иллюстрирует устройство для кодирования аудиосигнала в соответствии вариантом осуществления,
Фиг.15 иллюстрирует устройство для восстановления аудиосигнала в соответствии с вариантом осуществления,
Фиг.16 иллюстрирует устройство для генерации огибающей аудиосигнала из одного или более кодирующих значений в соответствии с вариантом осуществления,
Фиг.17 иллюстрирует устройство для определения одного или более кодирующих значений для кодирования огибающей аудиосигнала в соответствии с вариантом осуществления,
Фиг.18 иллюстрирует агрегирующую функцию в соответствии с первым примером, и
Фиг.19 иллюстрирует агрегирующую функцию в соответствии со вторым примером.
Фиг.3 иллюстрирует устройство для кодирования огибающей аудиосигнала в соответствии с вариантом осуществления.
Устройство содержит интерфейс 210 огибающей аудиосигнала для приема огибающей аудиосигнала.
Кроме того, устройство содержит определитель 220 разделяющей точки для определения, в зависимости от предварительно определенного правила присвоения, значения сегмента огибающей сигнала для по меньшей мере одного сегмента огибающей аудиосигнала из двух или более сегментов огибающей аудиосигнала для каждой из по меньшей мере двух конфигураций разделяющих точек.
Каждая из по меньшей мере двух конфигураций разделяющих точек содержит одну или более разделяющих точек, причем упомянутая одна или более разделяющих точек каждой из двух или более конфигураций разделяющих точек разделяет огибающую аудиосигнала на два или более сегмента огибающей аудиосигнала. Определитель 220 разделяющей точки сконфигурирован выбирать одну или более разделяющих точек из одной из по меньшей мере двух конфигураций разделяющих точек как одну или более выбранную разделяющую точку для кодирования огибающей аудиосигнала, причем определитель 220 разделяющей точки сконфигурирован для выбора одной или более разделяющих точек в зависимости от значения сегмента огибающей сигнала каждого из по меньшей мере одного сегмента огибающей аудиосигнала из двух или более сегментов огибающей аудиосигнала из каждой из по меньшей мере двух конфигураций разделяющих точек.
Конфигурация разделяющих точек содержит одну или более разделяющих точек и определяется ее разделяющими точками. Например, огибающая аудиосигнала может содержать 20 сэмплов (отсчетов): 0, …, 19, и конфигурация с двумя разделяющими точками может быть определена ее первой разделяющей точкой в расположении сэмла 3, и ее второй разделяющей точкой в расположении сэмпла 8, например, конфигурация разделяющих точек может быть указана кортежем (3; 8). Если только одна разделяющая точка должна быть определена, тогда одна разделяющая точка указывает конфигурацию разделяющих точек.
Соответствующая одна или более разделяющих точек должны быть определены как одна или более выбранные разделяющие точки. Для этой цели, рассматриваются по меньшей мере две конфигурации разделяющих точек, каждая из которых содержит одну или более разделяющих точек. Одна или более разделяющих точек выбираются из наиболее подходящей конфигурации разделяющих точек. Является ли конфигурация разделяющих точек более подходящей, чем другая, определяется в зависимости от определенного значения сегмента огибающей сигнала, которое, в свою очередь, зависит от предварительно опр