Кодирование спектральных коэффициентов спектра аудиосигнала
Иллюстрации
Показать всеИзобретение относится к кодированию спектральных коэффициентов спектра аудиосигнала, используемого в различных аудиокодеках на основе преобразования. Технический результат – повышение эффективности кодирования спектральных коэффициентов спектра аудиосигнала за счет кодирования/декодирования спектрального коэффициента, подлежащего кодированию/декодированию в данный момент времени, путем энтропийного кодирования/декодирования. В данном устройстве регулировка относительного спектрального расстояния между предварительно кодированным/декодированным спектральным коэффициентом и кодированным/декодированным в данный момент времени спектральным коэффициентом зависит от информации относительно формы спектра. Информация относительно формы спектра может содержать меру тона или периодичности аудиосигнала, меру межгармонического расстояния спектра аудиосигнала и/или относительные местоположения формант и/или впадин спектральной огибающей спектра, и на основе этого знания спектральную окрестность, которая используется для того, чтобы сформировать контекст спектральных коэффициентов, подлежащих кодированию/декодированию в данный момент времени, можно адаптировать к определенной форме спектра. 8 н. и 14 з.п. ф-лы, 22 ил.
Реферат
Область техники, к которой относится изобретение
Настоящая заявка относится к схеме кодирования спектральных коэффициентов спектра аудиосигнала, используемого, например, в различных аудиокодеках на основе преобразования.
Предшествующий уровень техники
Основанное на контексте арифметическое кодирование является эффективным способом кодирования с пониженным уровнем шума спектральных коэффициентов кодера на основе преобразования [1]. Контекст использует взаимную информацию между спектральным коэффициентом и уже кодированными коэффициентами, находящимися в их окрестности. Контекст является доступным, как на стороне кодера, так и на стороне декодера и не нуждается в какой-либо дополнительной информации, которую необходимо передавать. Таким образом, основанное на контексте энтропийное кодирование имеет потенциал для обеспечения более высокого выигрыша по сравнению с энтропийным кодированием без запоминания. Однако на практике построение контекста серьезно ограничивается среди прочего требованиями к памяти, сложностью вычислений и устойчивостью к образованию канальных ошибок. Эти ограничения ограничивают эффективность основанного на контексте энтропийного кодирования и приводят к более низкому выигрышу от кодирования, особенно для тональных сигналов, где контекст должен быть очень ограниченным для использования гармонической структуры сигнала.
Более того, при кодировании на основе преобразования аудиосигнала с низкой задержкой для уменьшения алгоритмической задержки используются окна с низким перекрытием. Как прямое следствие этого, потери при модифицированном дискретном косинусном преобразовании (MDCT) важны для тональных сигналов, и они приводят к более высокому шуму квантования. Тональные сигналы можно обрабатывать, комбинируя преобразования с предсказанием в частотной области, как это делается для MPEG2/4-AAC [2], или с предсказанием во временной области [3].
Сущность изобретения
Было бы выгодно иметь концепцию кодирования, которая повышает эффективность кодирования. Соответственно, задача настоящего изобретения состоит в том, чтобы обеспечить концепцию кодирования для спектральных коэффициентов спектра аудиосигнала, которая позволила бы повысить эффективность кодирования. Эта цель достигается с помощью предмета находящихся на рассмотрении независимых пунктов формулы изобретения.
Основной результат настоящей заявки состоит в том, что эффективность кодирования при кодировании спектральных коэффициентов спектра аудиосигнала можно увеличить путем кодирования/декодирования спектрального коэффициента, подлежащего кодированию/декодированию в данный момент времени, за счет энтропийного кодирования/декодирования, и при этом выполнить энтропийное кодирование/декодирование в зависимости, контекстно-адаптивным образом, от предварительно кодированного/декодированного спектрального коэффициента, в то же время регулируя относительное спектральное расстояние между предварительно кодированным/декодированным спектральным коэффициентом и кодированным/декодированным в данный момент времени спектральным коэффициентом в зависимости от информации относительно формы спектра. Информация относительно формы спектра может содержать меру тона или периодичности аудиосигнала, меру межгармонического расстояния спектра аудиосигнала и/или относительные местоположения формант и/или впадин спектральной огибающей спектра, и на основе этого знания спектральную окрестность, которая используется для того, чтобы сформировать контекст спектральных коэффициентов, подлежащих кодированию/декодированию в данный момент времени, можно адаптировать к определенной таким образом форме спектра, тем самым, повышая эффективность энтропийного кодирования.
Краткое описание чертежей
Преимущественные реализации являются предметом зависимых пунктов формулы изобретения, и предпочтительные варианты осуществления настоящей заявки описаны ниже со ссылкой на фигуры, на которых:
на фиг.1 показана схематичная диаграмма, иллюстрирующая кодер спектральных коэффициентов и его режим работы при кодировании спектральных коэффициентов спектра аудиосигнала;
на фиг.2 показана схематичная диаграмма, иллюстрирующая декодер спектральных коэффициентов, соответствующий кодеру спектральных коэффициентов (фиг.1);
на фиг.3 показана блок-схема возможной внутренней структуры кодера спектральных коэффициентов (фиг.1) в соответствии с вариантом осуществления;
на фиг.4 показана блок-схема возможной внутренней структуры спектрального коэффициента декодера (фиг.2) в соответствии с вариантом осуществления;
на фиг.5 схематично показан график спектра, коэффициенты которого должны кодироваться/декодироваться для того, чтобы проиллюстрировать адаптацию относительного спектрального расстояния в зависимости от меры тона или периодичности аудиосигнала или меры межгармонического расстояния;
на фиг.6 показана схематичная диаграмма, иллюстрирующая спектр, спектральные коэффициенты которого должны кодироваться/декодироваться в соответствии с вариантом осуществления, где спектр спектрально сформирован согласно перцептивно взвешенному синтезирующему фильтру на основе LP, а именно его противоположности, и иллюстрирующая адаптацию относительного спектрального расстояния в зависимости от меры межформатного расстояния в соответствии с вариантом осуществления;
фиг.7 схематично иллюстрирует участок спектра для того, чтобы проиллюстрировать шаблон контекста, окружающий спектральный коэффициент, подлежащий кодированию/декодированию в данный момент времени, и адаптацию шаблонов контекста, разбросанных по спектру в зависимости от информации относительно формы спектра в соответствии с вариантом осуществления;
на фиг.8 показана схематичная диаграмма, иллюстрирующая отображение из одного или более значений контрольных спектральных коэффициентов шаблона 81 контекста с использованием скалярной функции для того, чтобы получить оценку распределения вероятностей, которая должна использоваться для кодирования/декодирования текущего спектрального коэффициента в соответствии с вариантом осуществления;
фиг.9a схематично иллюстрирует использование неявной сигнализации для того, чтобы синхронизировать адаптацию относительного спектрального расстояния между кодером и декодером;
на фиг.9b показана схематичная диаграмма, иллюстрирующая использование явной сигнализации для того, чтобы синхронизировать адаптацию относительного спектрального расстояния между кодером и декодером;
на фиг.10a показана блок-схема аудиокодера на основе преобразования в соответствии с вариантом осуществления;
на фиг.10b показана блок-схема аудиодекодера на основе преобразования, соответствующая кодеру (фиг.10a);
на фиг.11a показана блок-схема аудиокодера на основе преобразования, использующего формирование спектра в частотной области в соответствии с вариантом осуществления;
на фиг.11b показана блок-схема аудиодекодера на основе преобразования, соответствующего кодеру (фиг.11a);
на фиг.12a показана блок-схема аудиодекодера с возбуждением c кодированным преобразованием на основе линейного предсказания в соответствии с вариантом осуществления;
на фиг.12b показан аудиодекодер с возбуждением с кодированным преобразованием на основе линейного предсказания, соответствующий кодеру (фиг.12a);
на фиг.13 показана блок-схема аудиокодера на основе преобразования в соответствии с дополнительным вариантом осуществления;
на фиг.14 показана блок-схема аудиодекодера на основе преобразования, соответствующего варианту осуществления (фиг.13);
на фиг.15 показана схематичная диаграмма, иллюстрирующая традиционный контекст или шаблон контекста, охватывающий окрестность спектрального коэффициента, подлежащего кодированию/декодированию в данный момент времени;
на фиг.16a-c показаны модифицированные конфигурации шаблонов контекста или отображенный контекст в соответствии с вариантами осуществления настоящей заявки;
фиг.17 схематично иллюстрирует график гармонического спектра для того, чтобы проиллюстрировать преимущество использования отображенного контекста, показанного на любом из фиг.16a-16c по сравнению с определением шаблона контекста (фиг.15) для гармонического спектра;
на фиг.18 показана блок-схема последовательности операций алгоритма оптимизации относительного спектрального расстояния D для отображения контекста в соответствии с вариантом осуществления.
Подробное описание изобретения
На фиг.1 показан кодер 10 спектральных коэффициентов в соответствии с вариантом осуществления. Кодер выполнен с возможностью кодирования спектральных коэффициентов спектра аудиосигнала. Фиг.1 иллюстрирует последовательные спектры в виде спектрограммы 12. Чтобы быть более точными, спектральные коэффициенты 14 иллюстрированы в виде прямоугольников, размещенных спектровременным образом вдоль временной оси t и частотной оси f. Несмотря на то что возможно, чтобы спектровременное разрешение поддерживалось постоянным, Фиг. 1 иллюстрирует, что спектровременное разрешение может изменяться во времени с одним таким моментом времени, изображенным на фиг.1 поз.16. Эта спектрограмма 12 может быть результатом преобразования на основе спектрального разложения, применяемого к аудиосигналу 18 в различные моменты времени, такого как преобразование с перекрытием, такое, например, как преобразование на основе критической дискретизации, такое как MDCT, или некоторое другое преобразование на основе действительнозначной критической дискретизации. В данном случае спектрограмму 12 можно принимать с помощью кодера 10 спектральных коэффициентов в виде спектра 20, состоящего из последовательности коэффициентов преобразования, каждый из которых принадлежит к одному и тому же моменту времени. Таким образом, спектры 20 представляют собой спектральные срезы спектрограммы, и проиллюстрированы на фиг.1 в виде отдельных столбцов спектрограммы 12. Каждый спектр состоит из последовательности коэффициентов 14 преобразования и был получен из соответствующего временного кадра 22 аудиосигнала 18 с использованием, например, некоторой функции 24 окна. В частности, временные кадры 22 последовательно размещаются в вышеупомянутые моменты времени и ассоциируются с временной последовательностью спектров 20. Как показано на фиг.1, эти спектры могут перекрывать друг друга, как это могут делать соответствующие окна 24 преобразования. То есть термин "спектр", используемый в данном документе, обозначает спектральные коэффициенты, принадлежащие к одному и тому же моменту времени, и, таким образом, представляет собой частотное разложение. Термин "спектрограмма" представляет собой частотно-временное разложение последовательных спектров, где слово "спектры" является формой множественного числа слова "спектр". Иногда, тем не менее, термин "спектр" используется в качестве синонима для спектрограммы. Термин "коэффициент преобразования" используется в качестве синонима для термина "спектральный коэффициент", если исходный сигнал находится во временной области, и преобразование представляет собой преобразование частоты.
Как только что было описано выше, кодер 10 спектральных коэффициентов предназначен для кодирования спектральных коэффициентов 14 спектрограммы 12 аудиосигнала 18, и с этой целью кодер может применять, например, предварительно определенный порядок кодирования/декодирования, в котором проходят, например, спектральные коэффициенты 14 вдоль спектровременного пути, по которому производится, например, сканирование по спектру спектральных коэффициентов 14 от низкой до высокой частоты в пределах одного спектра 20 и затем продолжается в отношении спектральных коэффициентов следующего по времени спектра 20, как показано на фиг.1 поз.26.
В способе, изложенном более подробно ниже, кодер 10 выполнен с возможностью кодирования спектрального коэффициента, подлежащего кодированию в данный момент времени и показанного в виде маленького крестика на фиг.1, посредством энтропийного кодирования, которое зависит, контекстно-адаптивным образом, от одного или более предварительно кодированных спектральных коэффициентов, показанных в качестве примера на фиг.1 в виде маленького кружка. В частности, кодер 10 выполнен таким образом, чтобы регулировать относительное спектральное расстояние между предварительно кодированным спектральным коэффициентом и спектральным коэффициентом, кодированным в данный момент времени, в зависимости от информации относительно формы спектра. Что касается зависимости и информации относительно формы спектра, то подробности изложены ниже наряду с соображениями относительно преимуществ, возникающих в результате адаптации относительного спектрального расстояния 28 в зависимости от только что упомянутой информации.
Другими словами, кодер 10 спектральных коэффициентов последовательно кодирует спектральные коэффициенты 14 в потоке 30 данных. Как будет описано более подробно ниже, кодер 10 спектральных коэффициентов может представлять собой часть кодера на основе преобразования, который в дополнение к спектральным коэффициентам 14 кодирует в потоке 30 данных дополнительную информацию таким образом, чтобы поток 30 данных позволял восстанавливать аудиосигнал 18.
На фиг.2 показан декодер 40 спектральных коэффициентов, соответствующий кодеру 10 спектральных коэффициентов (фиг.1). Функциональные возможности декодера 40 спектральных коэффициентов являются по существу противоположными функциональным возможностям кодера 10 спектральных коэффициентов (фиг.1): декодер 40 спектральных коэффициентов декодирует спектральные коэффициенты 14 спектра 12, используя, например, последовательно порядок 26 декодирования. При декодировании спектрального коэффициента, подлежащего кодированию в данный момент времени и показанного в качестве примера на фиг.2 в виде маленького крестика, путем энтропийного декодирования, декодер 40 спектральных коэффициентов выполняет энтропийное декодирование, которое зависит, контекстно-адаптивным образом, от одного или более предварительно декодированных спектральных коэффициентов, также показанных на фиг.2 в виде маленького кружка. При этом, декодер 40 спектральных коэффициентов регулирует относительное спектральное расстояние 28 между предварительно декодированным спектральным коэффициентом и спектральным коэффициентом, подлежащим декодированию в данный момент времени, в зависимости от вышеупомянутой информации относительно формы спектра 12. Таким же образом, как было указано выше, декодер 40 спектральных коэффициентов может представлять собой часть декодера на основе преобразования, выполненного с возможностью восстановления аудиосигнала 18 из потока 30 данных, из которого декодер 40 спектральных коэффициентов декодирует спектральные коэффициенты 14, используя энтропийное декодирование. Последний декодер на основе преобразования может, в качестве части операции восстановления, подвергать спектр 12 обратному преобразованию, такому, например, как обратное преобразование с перекрытием, которое, например, приводит к восстановлению последовательности перекрывающихся и обработанных с помощью окна временных кадров 22, которая в процессе перекрытия и добавления удаляет, например, наложение спектров, которое возникает из-за преобразования на основе спектрального разложения.
Как будет описано более подробно ниже, преимущества, возникающие в результате регулировки относительного спектрального расстояния 28 в зависимости от информации относительно формы спектра 12, опираются на возможность улучшения оценки распределения вероятностей, используемой для энтропийного кодирования/декодирования текущего спектрального коэффициента x. Чем лучше оценка распределения вероятностей, тем выше эффективность энтропийного кодирования, то есть более высокое сжатие. "Оценка распределения вероятностей" представляет собой оценку фактического распределения вероятностей текущего спектрального коэффициента 14, то есть функцию, которая назначает вероятность каждому значению области значений, которая может принимать текущий спектральный коэффициент 14. Из-за зависимости адаптации расстояния 28 от формы спектра 12 оценку распределения вероятностей можно определить для того, чтобы обеспечить более точное соответствие фактическому распределению вероятностей, так как использование информации о форме спектра 12 дает возможность получить оценку распределения вероятностей из спектральной окрестности текущего спектрального коэффициента x, что позволяет произвести более точную оценку распределения вероятностей текущего спектрального коэффициента x. Подробности, связанные с этим, представлены ниже вместе с примерами информации о форме спектра 12.
Прежде чем перейти к конкретным примерам вышеупомянутой информации о форме спектра 12, на фиг.3 и 4 показаны возможные внутренние структуры кодера 10 спектральных коэффициентов и декодера 40 спектральных коэффициентов, соответственно. В частности, как показано на фиг.3, кодер 10 спектральных коэффициентов может состоять из модуля 42 получения оценки распределения вероятностей и механизма 44 энтропийного кодирования, где аналогичным образом декодер 40 спектральных коэффициентов может состоять из модуля 52 получения оценки распределения вероятностей и механизма 54 энтропийного декодирования. Модули 42 и 52 получения оценки распределения вероятностей работают таким же образом: они получают, на основе значения одного или более предварительно декодированных/кодированных спектральных коэффициентов o, оценку 56 распределения вероятностей для энтропийного декодирования/кодирования текущего спектрального коэффициента x. В частности, механизм 44/54 энтропийного кодирования/декодирования принимает оценку распределения вероятностей из модуля 42/52 получения и выполняет энтропийное кодирование/декодирование относительно текущего спектрального коэффициента x, соответственно.
Механизм 44/54 энтропийного кодирования/декодирования может использовать, например, кодирование с переменной длиной, такое как кодирование Хаффмана, для кодирования/декодирования текущего спектрального коэффициента x, и в связи с этим механизм 44/54 может использовать различные таблицы кодирования с переменной длиной (VLC) для различных оценок 56 распределения вероятностей. В качестве альтернативы механизм 44/54 может использовать арифметическое кодирование/декодирование по отношению к текущему спектральному коэффициенту x с оценкой 56 распределения вероятностей, управляющей разбиением текущего интервала вероятности, представляющего внутреннее состояние механизмов 44/54 арифметического кодирования/декодирования, причем каждому частичному интервалу присваивается различное возможное значение из целевого диапазона значений, который может допускаться текущим спектральным коэффициентом x. Как будет описано более подробно ниже, механизм энтропийного кодирования и механизм 44 и 54 энтропийного декодирования могут использовать механизм выхода для того, чтобы отобразить полный диапазон значений спектрального коэффициента 14 в ограниченный целочисленный интервал, то есть целевой диапазон, такой как [0…2N-1]. Набор целочисленных значений в целевом диапазоне, то есть {0,…,2N-1}, определяет наряду со знаком перехода) {esc} алфавит символов механизма 44/54 арифметического кодирования/декодирования, то есть {0,…,2N-1, esc}. Например, при необходимости механизм 44 энтропийного кодирования подвергает входящий спектральный коэффициент x делению на 2 так часто, сколько потребуется, если понадобится, чтобы ввести спектральный коэффициент x в вышеупомянутый целевой интервал [0…2N-1] с кодированием, для каждого деления, символа перехода в потоке 30 данных вслед за арифметическим кодированием остатка деления – или исходное спектральное значение в случае отсутствия необходимости деления – в потоке 30 данных. Механизм 54 энтропийного декодирования будет, в свою очередь, реализовывать механизм перехода следующим образом: он будет декодировать текущий коэффициент x преобразования из потока 30 данных как последовательность из 0, 1 или большего количества символов перехода esc, следующих за знаком отсутствия перехода, то есть как одну из последовательностей {a}, {esc, a}, {esc, esc, a}, …, с обозначением символа отсутствия перехода. Механизм 54 энтропийного декодирования будет путем арифметического декодирования символа отсутствия перехода получать значение а в пределах целевого интервала [0…2N-1], например, и будет получать значение коэффициента x путем вычисления значения текущего спектрального коэффициента, которое будет равно в a+2 раз больше числа символов перехода.
Существуют различные возможности по отношению к использованию оценки 56 распределения вероятностей и применения ее в последовательности символов, используемой для представления текущего спектрального коэффициента x: оценку распределения вероятностей можно применить, например, в любом символе, передаваемом в пределах потока 30 данных для спектрального коэффициента x, то есть символ отсутствия перехода, а также любой символ перехода в случае, если это необходимо. В качестве альтернативы оценка 56 распределения вероятностей используется только для первого, или первых двух или первых n<N из последовательности 0 или более символов перехода, за которыми следует символ отсутствия перехода с использованием, например, некоторой оценки распределения вероятностей по умолчанию для любого последующего одного из последовательности символов, такого как равновероятностное распределение.
На фиг.5 показан примерный спектр 20 из спектрограммы 12. В частности, величина спектральных коэффициентов графически изображена на фиг.5 в относительных единицах вдоль оси y, тогда как горизонтальная ось x соответствует частоте в относительных единицах. Как уже отмечалось, спектр 20 на фиг.5 соответствует спектральному срезу выше спектрограммы аудиосигнала в определенный момент времени, где спектрограмма 12 состоит из последовательности таких спектров 20. Фиг.5 также иллюстрирует спектральное положение текущего спектрального коэффициента x.
Как будет описано более подробно ниже, хотя спектр 20 может быть невзвешенным спектром аудиосигнала в соответствии с вариантами осуществления, изложенными дополнительно ниже, например, спектр 20 уже перцептивно взвешивается с использованием передаточной функции, которая соответствует обратному действию функции перцептивного синтезирующего фильтра. Однако настоящая заявка не ограничивается конкретным случаем, изложенным дополнительно ниже.
На фиг.5 показан спектр 20 с некоторой периодичностью по оси частот, которая показана в виде более или менее эквидистантного размещения локальных максимумов и минимумов в спектре вдоль направления частот. Только для цели иллюстрации на фиг.5 показана мера 60 тона или периодичности аудиосигнала, которая определяется спектральным расстоянием между локальными максимумами спектра, между которыми располагается текущий спектральный коэффициент x. Естественно, меру 60 можно установить или определить иным образом в качестве средней тона между локальными максимумами и/или локальными минимумами или частотным расстоянием, эквивалентным максимуму задержки времени, измеренному в автокорреляционной функции сигнала 18 временной области.
В соответствии с вариантом осуществления мера 60 является, или содержится в, информацией о форме спектра. Кодер 10 и декодер 40 или, чтобы быть более точным, модуль 42/52 получения оценки распределения вероятностей может, например, регулировать относительное спектральное расстояние между предыдущим спектральным коэффициентом o и текущим спектральным коэффициентом x в зависимости от этой меры 60. Например, относительное спектральное расстояние 28 может варьироваться в зависимости от меры 60 таким образом, что расстояние 28 увеличивается при увеличении меры 60. Например, было бы предпочтительно установить расстояние 28 равным мере 60, или чтобы оно было его целым кратным.
Как будет описано ниже более подробно, существуют различные возможности относительно того, как информация о форме спектра 12 становится доступной декодеру. В общем, эту информацию, такую как мера 60, можно передать в декодер явным образом только с помощью кодера 10 или модуля 42 получения оценки распределения вероятностей, который фактически определяет информацию о форме спектра, или определение информации о форме спектра выполняется параллельно на сторонах кодера и декодера на основании предварительно декодированного участка спектра или может быть получено из другой информации, уже считанной в битовом потоке.
Используя другую терминологию, мера 60 может также интерпретироваться как "мера межгармонического расстояния", так как вышеупомянутые локальные максимумы или горбы в спектре могут образовывать гармоники друг с другом.
На фиг.6 представлен другой пример информации о форме спектра, на основе которой можно регулировать спектральное расстояние 28 – исключительно или наряду с другой мерой, такой, как мера 60, как описано выше. В частности, фиг.6 иллюстрирует примерный случай, где спектр 12, представленный спектральными коэффициентами, кодированными/декодированными кодером 10 и декодером 40, спектральный срез которого показан на фиг.6, взвешивается с использованием инверсии функции перцептивно взвешенного синтезирующего фильтра. Таким образом, исходный спектр и окончательно восстановленный спектр аудиосигнала показаны на фиг.6 поз.62. Предыскаженная версия обозначена поз.64 и показана пунктирной линией. Линейное предсказание, оцененное спектральной огибающей предыскаженной версии 64, показано штрихпунктирной линией 66, и его перцептивно модифицированная версия, то есть передаточная функция перцептивно обусловленного синтезирующего фильтра показана на фиг.6 поз.68 штрихпунктирной с двумя точками линией. Спектр 12 может представлять собой результат фильтрации предыскаженной версии первоначального спектра аудиосигнала 62 с инверсией функции 68 перцептивно взвешенного синтезирующего фильтра. В любом случае кодер и декодер могут иметь доступ к спектральной огибающей 66, которая, в свою очередь, может иметь более или менее выраженные форманты 70 или впадины 72. В соответствии с альтернативным вариантом осуществления настоящей заявки информация относительно формы спектра определяется, по меньшей мере, частично на основании относительных местоположений этих формант 70 и/или впадин 72 спектральной огибающей 66 спектра 12. Например, спектральное расстояние 74 между формантами 70 можно использовать для установки вышеупомянутого относительного спектрального расстояния 28 между текущим спектральным коэффициентом x и предыдущим спектральным коэффициентом o. Например, расстояние 28 можно предпочтительно установить равным или целочисленно кратным расстоянию 74, при этом, однако, возможны также и другие альтернативные варианты.
Вместо огибающей на основе LP, как иллюстрировано на фиг.6, спектральную огибающую можно также определить различным образом. Например, огибающую можно определить и передать в потоке данных посредством коэффициентов масштабирования. Можно также использовать и другие способы передачи огибающей.
Из-за регулировки расстояния 28 способом, представленным выше со ссылкой на фиг.5 и 6, значение "контрольного" спектрального коэффициента o представляет собой по существу лучшую подсказку для оценки распределения вероятностей для текущего спектрального коэффициента x по сравнению с другими спектральными коэффициентами, которые находятся, например, спектрально ближе к текущему спектральному коэффициенту x. В связи с этим следует отметить, что моделирование контекста является в большинстве случаев компромиссом между сложностью энтропийного кодирования с одной стороны и эффективностью кодирования с другой стороны. Таким образом, в вариантах осуществления, описанных до сих пор, предложена адаптация относительного спектрального расстояния 28 в зависимости от информации о форме спектра таким образом, что, например, расстояние 28 увеличивается при увеличении меры 60 и/или при увеличении межформантного расстояния 74. Однако число предыдущих коэффициентов o, на основе которых выполняется контекстная адаптация энтропийного кодирования/декодирования, может быть постоянным, то есть не может увеличиваться. Число предыдущих спектральных коэффициентов o, на основе которых выполняется контекстная адаптация, может, например, быть постоянным независимо от изменения информации относительно формы спектра. Это означает, что адаптация относительного спектрального расстояния 28 способом, представленным выше, ведет к более лучшему или более эффективному энтропийному кодированию/декодированию без значительного увеличения затрат на выполнение моделирования контекста. Только адаптация непосредственно спектрального расстояния 28 увеличивает затраты на моделирование контекста.
Для того чтобы более подробно проиллюстрировать только что упомянутую проблему, ссылка сделана на фиг.7, на которой показан спектровременной участок спектрограммы 12, причем спектровременной участок включает в себя текущий спектральный коэффициент 14, подлежащий кодированию/декодированию. Кроме того, фиг.7 иллюстрирует шаблон показанных в качестве примера пяти предварительно кодированных/декодированных спектральных коэффициентов o, на основе которых выполняется моделирование контекста для энтропийного кодирования/декодирования текущего спектрального коэффициента x. Шаблон располагается в местоположении текущего спектрального коэффициента x и показывает соседние контрольные спектральные коэффициенты o. Спектральный разброс положений по спектру этих контрольных спектральных коэффициентов o адаптируется в зависимости от вышеупомянутой информации о форме спектра. Это проиллюстрировано на фиг.7 с помощью двусторонней стрелки 80 и заштрихованных маленьких кружков, которые в качестве примера иллюстрируют положения контрольных спектральных коэффициентов в случае, например, масштабирования спектрального разброса спектральных положений контрольных спектральных коэффициентов в зависимости от адаптации 80. То есть на фиг.7 показано, что число контрольных спектральных коэффициентов, вносящих свой вклад в моделирование контекста, то есть число контрольных спектральных коэффициентов шаблона, окружающего текущий спектральный коэффициент x и идентифицирующего контрольные спектральные коэффициенты o, поддерживается постоянным, независимо от любого изменения информации о форме спектра. Между этими контрольными спектральными коэффициентами и текущим спектральным коэффициентом адаптируется согласно поз.80 только относительное спектральное расстояние и по существу расстояние между самими контрольными спектральными коэффициентами. Однако следует отметить, что число контрольных спектральных коэффициентов o не обязательно поддерживается постоянным. В соответствии с вариантом осуществления число контрольных спектральных коэффициентов может увеличиваться при увеличении относительного спектрального расстояния. Однако возможна и обратная ситуация.
Следует отметить, что на фиг.7 показан примерный случай, где моделирование контекста для текущего спектрального коэффициента x также включает в себя предварительно кодированные/декодированные спектральные коэффициенты, соответствующие более раннему спектру/временному кадру. Однако этот случай следует также рассматривать только в качестве примера, и можно пренебречь зависимостью от таких предшествующих по времени предварительно кодированных/декодированных спектральных коэффициентов в соответствии с дополнительным вариантом осуществления. Фиг.8 иллюстрирует, как модуль 42/52 получения оценки распределения вероятностей может, на основе одного или более контрольных спектральных коэффициентов o, определить оценку распределения вероятностей для текущего спектрального коэффициента. Как показано на фиг.8, с этой целью один или более контрольных спектральных коэффициентов o можно подвергнуть действию скалярной функции 82. На основе скалярной функции, например, один или более контрольных спектральных коэффициентов o отображаются в индекс, индексирующий оценку распределения вероятностей, которая будет использоваться для текущего спектрального коэффициента x из набора имеющихся оценок распределения вероятностей. Как уже упомянуто выше, имеющиеся оценки распределения вероятностей могут, например, соответствовать различным разбиениям интервала вероятностей для алфавита символов в случае арифметического кодирования или различным таблицам кодирования переменной длительности в случае использования кодирования переменной длительности.
Прежде чем продолжить описание возможного объединения вышеописанных кодеров/декодеров спектральных коэффициентов в соответствующие кодеры/декодеры на основе преобразования, ниже будет обсуждено несколько возможностей относительно того, как могут видоизменяться варианты осуществления, описанные до сих пор. Например, механизм перехода, кратко описанный выше по отношению к фиг.3, и фиг.4, был выбран только в целях иллюстрации и может быть опущен в соответствии с альтернативным вариантом осуществления. В варианте осуществления, описанном ниже, используется механизм перехода. Более того, как станет ясно из описания более конкретных вариантов осуществления, описанных ниже, вместо того, чтобы кодировать/декодировать спектральные коэффициенты по отдельности, их можно кодировать/декодировать в блоках из кортежей из n элементов, то есть в блоках из n непосредственно прилегающих по спектру спектральных коэффициентов. В этом случае определение относительного спектрального расстояния можно также выполнить в блоках из таких кортежей из n элементов или в блоках из отдельных спектральных коэффициентов. Что касается скалярной функции 82, показанной на фиг.8, то следует отметить, что скалярная функция может представлять собой арифметическую функцию или логическую операцию. Более того, можно предпринять специальные меры для этих контрольных скалярных коэффициентов o, которые, например, являются недоступными, например, из-за превышения частотного диапазона спектра или, например, расположения на участке спектра, дискретизированного спектральными коэффициентами со спектровременным разрешением, отличным от спектровременного разрешения, при котором спектр дискретизируется в момент времени, соответствующий текущему спектральному коэффициенту. Значения недоступных контрольных спектральных значений o можно заменить на значения по умолчанию, например, и затем ввести их в скалярную функцию 82 вместе с другими (имеющимися) контрольными спектральными коэффициентами. Другой способ, касающийся того, как энтропийное кодирование/декодирование может работать при использовании адаптации спектрального расстояния, описанного выше, заключается в следующем: например, текущий спектральный коэффициент может подвергаться бинаризации. Например, спектральный коэффициент x можно отобразить в последовательность элементов дискретизации, которые затем подвергаются энтропийному кодированию с использованием адаптации относительного спектрального расстояния. При декодировании элементы дискретизации будут последовательно подвергаться энтропийному декодированию до тех пор, пока не встретится правильная последовательность элементов дискретизации, которую можно затем повторно отобразить в соответствующие значения текущего спектрального коэффициента x.
Дополнительно, адаптацию контекста в зависимости от одного или более предыдущих спектральных коэффициентов o можно реализовать способом, который отличается от способа, изображенного на фиг.8. В частности, скалярную функцию 82 можно использовать для индексации одного из набора доступных контекстов, и каждый контекст может иметь связанную с ними оценку распределения вероятностей. В этом случае оценку распределения вероят