Аудио декодер, аудио кодер, способ для декодирования аудио сигнала, способ кодирования звукового сигнала, компьютерная программа и аудио сигнал
Иллюстрации
Показать всеИзобретение относится к области кодирования и декодирования аудио сигналов. Технический результат заключается в обеспечении адаптации правил отображения информации энтропийного декодирования к статике сигнала. Технический результат достигается за счет аудио декодера для получения декодированной аудио информации на основе энтропийно-кодированной аудио информации, который включает в себя контекстно-зависимый энтропийный декодер, предназначенный для декодирования энтропийно-кодированной аудио информации в зависимости от контекста, который основывается на ранее декодированной аудио информации в несброшенном состоянии. Контекстно-зависимый энтропийный декодер предназначен для выбора отображения информации для извлечения декодированной аудио информации из кодированной аудио информации в зависимости от контекста. Контекстно-зависимый энтропийный декодер состоит из контекстного ресеттера, предназначенного для сброса контекста для выбора отображения информации до контекста по умолчанию, который не зависит от ранее декодированной аудио информации, в ответ на служебную информацию в кодированной аудио информации. 7 н. и 12 з.п. ф-лы, 21 ил.
Реферат
Предпосылки создания изобретения
Использование данного изобретения связано с аудио декодером, аудио кодером, методом для декодирования аудио сигнала, методом для кодирования аудио сигнала и соответствующей компьютерной программой. Некоторые варианты использования изобретения связаны с аудио сигналом.
Некоторые воплощения изобретения связаны с концепцией аудио кодирования / декодирования, в котором служебная информация используется для перенастройки контекста энтропии кодирования / декодирования.
Некоторые варианты использования связаны с контролем за настройкой арифметического кодера.
Традиционные концепции кодирования звука включают схемы кодирования энтропии (например, для кодирования спектральных коэффициентов представления сигнала в частотной области) для того, чтобы уменьшить избыточность. Как правило, энтропийное кодирование применяется к квантованным спектральным коэффициентам в схемах кодирования, основанных на частотной области, или к квантованным сэмплам временной области в схемах кодирования, основанных на временной области. Эти схемы энтропийного кодирования обычно используют передачу кодового слова вместе с соответствующим индексом кодовой книги, что позволяет декодеру находить нужную страницу кодовой книги для декодирования кодированного информационного слова, соответствующего переданному кодовому слову на указанной странице кодовой книги.
Подробнее такие способы кодирования звука рассматриваются, например, в международном стандарте ISO / IEC 14496-3:2005 (Е), часть 3: аудио, часть 4: общие способы кодирования звука: (GA)-AAC, Twin VQ, В SAC, в которых описываются так называемые концепции "энтропия / кодирование".
Тем не менее, было установлено, что значительное количество данных в битрейте обусловлено необходимостью регулярной передачи подробной информации о выборе кодовой книги (например, sect_cb).
Соответственно, задачей настоящего изобретения является создание битрейт-эффективной концепции для адаптации правил отображения информации энтропийного декодирования к статистике сигнала.
Краткое описание изобретения
Это достигается с помощью аудио декодера в соответствии с п.1, аудио кодера в соответствии с п.12, метода декодирования аудио сигнала в соответствии с п.11, метода кодирования аудио сигнала в соответствии с п.16, компьютерной программы в соответствии с п.17 и кодированного аудио сигнала в соответствии с п.18.
Примером воплощения изобретения является аудио декодер для получения декодированной аудио информации на основе кодированной аудио информации. Аудио декодер включает в себя контекстно-зависимый энтропийный декодер, который предназначен для декодирования энтропийно-кодированных аудио данных в зависимости от контекста. Декодер основывается на ранее декодированных аудио без перенастройки. Энтропийный декодер предназначен для того, чтобы выбирать отображение информации (например, сводная таблица частот или Huffmann-кодовая книга) для получения декодированной аудио информации из кодированной аудио информации в зависимости от контекста. Кроме того, контекстно-зависимый энтропийный декодер также включает в себя контекстный ресеттер, который предназначен для настройки контекста для выбора отображения информации по умолчанию, которая не зависит от ранее декодированной аудио информации, в зависимости от служебной информации в кодированной аудио информации.
Этот вариант использования изобретения основан на том, что во многих случаях битрейт-эффективным является получение контекста, который определяет отображение энтропийно-кодированной аудио информации в декодированной аудио информации (например, обратившись к кодовой книге, или путем определения распределения вероятностей), в зависимости от контекста, который основан на ранее декодированных элементах аудио информации, а соответственно, могут быть использованы корреляции в пределах энтропийно-кодированных данных. Например, если буфер содержит большую интенсивность в первом звукокадре, тогда существует высокая вероятность того, что тот же буфер снова содержит большую интенсивность в следующем звукокадре после первого звукокадра. Таким образом, становится очевидным, что выбор отображения информации на основе контекста учитывает снижение битрейта по сравнению со случаем, когда передается подробная информация для выбора отображения информации для получения декодированной аудио информации из кодированной аудио информации.
Тем не менее, также было установлено, что вывод контекста из ранее декодированной аудио информации иногда приводит к ситуации, когда выбирается неподходящее отображение информации (для получения декодированной аудио информации из кодированной аудио информации), которое приводит к неоправданно высокому расходу битов для кодирования аудио информации. Эта ситуация будет иметь место, если, например, спектральное распределение энергии последующих звукокадров существенно различается так, что новое спектральное распределение энергии в последующем звукокадре сильно отклоняется от распределения, которое можно было бы ожидать на основании знания о спектральном распределении в предыдущем звукокадре.
В соответствии с основной идеей изобретения, в таких случаях, когда битрейт будет значительно ухудшаться из-за выбора неподходящего отображения информации (для получения декодированной аудио информации из кодированной аудио информации), контекст перенастраивается в соответствии со служебной информацией из кодированной аудио информации, обеспечивая тем самым выбор отображения информации по умолчанию (в связи с контекстом по умолчанию), что в свою очередь приводит к умеренной затрате бит для кодирования / декодирования аудио информации.
Подводя итог сказанному выше, основной идеей изобретения является то, что битрейт-эффективное кодирование аудио информации может быть достигнуто путем совместного использования контекстно-зависимого энтропийного декодера, который в обычном режиме (не в состоянии перенастройки работы) использует ранее кодированную аудио информацию для получения контекста и для выбора соответствующего отображения, с механизмом сброса в зависимости от служебной информации для сброса контекста, потому что такая концепция позволяет с минимальными усилиями поддерживать соответствующий контекст декодирования, который хорошо адаптирован к аудио контенту в обычной ситуации (когда аудио-контент соответствует ожиданиям, на основании которых построен контекстно-зависимый выбор правила отображения информации) и позволяет избежать чрезмерного увеличения битрейта в нестандартной ситуации (когда аудио-контент сильно отличается от ожиданий).
В предпочтительном варианте использования изобретения, контекстный ресеттер настроен выборочно перенастраивать контекстно-зависимый энтропийный декодер при переходе между последовательными временными частями (например, звукокадрами), имеющими сопряженные спектральные данные одного и того же спектрального разрешения (например, количество частот бункеров). Этот вариант использования основан на идее, что сброс контекста может иметь благоприятный эффект (в плане снижения требуемого битрейта), даже если спектральное разрешение остается неизменным. Другими словами, было установлено, что возможно выполнить сброс контекста независимо от изменения спектрального разрешения, так как было установлено, что контекст может быть неподходящим, даже если не нужно менять спектральное разрешение (например, за счет перехода от "длинного окна" в кадре к множеству «коротких окон» в кадре). Другими словами, было установлено, что контекст может быть неподходящим (что повышает желание сбросить контекст) даже в той ситуации, когда нежелательно переходить от низкого временного разрешения (например, длинные окна, в сочетании с высоким спектральным разрешением) к высокому временному разрешению (например, короткие окна, в сочетании с малым спектральным разрешением).
В предпочтительном варианте использования изобретения аудио декодер настроен на получение, в качестве кодированной аудио информации, информации, описывающей спектральные значения в первом звукокадре и во втором звукокадре после первого звукокадра. В этом случае аудио декодер предпочтительно содержит трансформатор спектральной области во временную область, предназначенный для того, чтобы перекрывать и добавлять первый оконный сигнал во временной области, который основан на спектральных значениях первого звукокадра, и второй оконный сигнал во временной области, который основан на спектральных значениях второго звукокадра. Аудио декодер предназначен для того, чтобы отдельно настраивать вид окна для получения первого оконного сигнала во временной области и окна для получения второго оконного сигнала во временной области. Аудио декодер также предпочтительно настроить на выполнение, в зависимости от служебной информации, сброса контекста между декодированием спектральных значений первого звукокадра и декодированием спектральных значений второго звукокадра, даже если вторая форма окна идентична первой форме окна, например, если контекст, используемый для декодирования кодированной аудио информации второго звукокадра, не зависит от декодированной аудио информации первого звукокадра в случае сброса.
Этот вариант использования изобретения позволяет сбросить контекст между декодированием (при помощи отображения информации, выбранной на основе контекста) спектральных значений первого звукокадра и декодированием (при помощи отображения информации, выбранной на основе контекста) спектральных значений второго звукокадра, даже если оконные сигналы во временной области первого и второго звукокадров накладываются друг на друга и расширяются, и даже если одинаковые формы окон выбираются для получения первого оконного сигнала во временной области и второго оконного сигнала во временной области из спектральных значений первого звукокадра и второго звукокадра. Таким образом, сброс контекста может дать дополнительную степень свободы, которую может использовать контекстный ресеттер даже между декодированием спектральных значений тесно связанных звукокадров, оконные сигналы временной области которых получены с использованием идентичных оконных форм и наложены друг на друга и добавлены друг к другу.
Таким образом, предпочтительно, чтобы сброс контекста не зависел от используемых форм окон, а также не зависел от того, что оконные сигналы временной области последующих кадров принадлежат смежному аудио-контенту, т.е. накладываются друг на друга и добавляются.
В предпочтительном варианте использования изобретения энтропийный декодер настроен на сброс, в зависимости от служебной информации, контекста между декодированием аудио информации смежных кадров аудио информации, имеющей одинаковое частотное разрешение. В этом варианте сброс контекста происходит независимо от изменения частотного разрешения.
В еще одном предпочтительном варианте использования изобретения аудио декодер настраивается на получение служебной информации о сбросе контекста для передачи сигнала о сбросе контекста. В этом случае аудио декодер также настроен на дополнительное получение служебной информации о форме окна для корректировки вида окна и для получения первого и второго оконных сигналов временной области независимо от выполнения сброса контекста.
В предпочтительном варианте использования изобретения аудио декодер настроен на прием, в качестве служебной информации о сбросе контекста, однобитового флага контекстного сброса на каждый звукокадр кодированной аудио информации. В этом случае аудио декодер предпочтительно настроен на прием, в дополнение к флагу сброса контекста, служебной информации, описывающей спектральное разрешение спектральных значений, представленных кодированной аудио информацией или длиной временного окна, для управления окнами значений временной области, представленных кодированной аудио информацией. Контекстный ресеттер настроен для выполнения сброса контекста в ответ на однобитовый флаг сброса контекста на переходе между двумя звукокадрами кодированной аудио информации, представляющей спектральные значения идентичных спектральных разрешений. В этом случае однобитовый флаг сброса контекста обычно приводит к одному сбросу контекста между декодированием кодированной аудио информации последующих звукокадров.
В другом предпочтительном варианте использования изобретения аудио декодер настроен на прием, в качестве служебной информации о сбросе контекста, однобитового флага контекстного сброса на каждый звукокадр кодированной аудио информации. Кроме того, аудио декодер настроен на прием кодированной аудио информации, содержащей множество наборов спектральных значений на каждый звукокадр (например, такой, что один звукокадр подразделяется на множество субкадров, с которыми связаны отдельные короткие окна). В этом случае контекстно-зависимый энтропийный декодер настроен на декодирование энтропийно-кодированной аудио информации последующего набора спектральных значений заданного звукокадра в зависимости от контекста, который основывается на ранее декодированной аудио информации из предыдущего набора спектральных значений заданного звукокадра в несброшенном состоянии. Тем не менее, контекстный ресеттер настроен на сброс контекста по умолчанию перед декодированием первого набора спектральных значений заданного звукокадра, а также между декодированием любых двух последующих наборов спектральных значений заданного звукокадра в ответ на однобитовый флаг сброса контекста (то есть только тогда, когда однобитовый флаг сброса контекста активен), так, что активация однобитового флага сброса контекста заданного звукокадра вызывает сброс контекста множество раз при декодировании множества наборов спектральных значений звукокадра.
Этот вариант использования изобретения основан на идее о неэффективности, с точки зрения битрейта, выполнять только один сброс контекста звукокадра, содержащего множество «коротких окон», для которых кодируются отдельные наборы спектральных значений. Звукокадр, включающий в себя множество наборов спектральных значений, обычно содержит разрыв аудио-контента, так, что желательно для уменьшения битрейта сбросить контекст между каждым из последующих наборов спектральных значений. Установлено, что такое решение более эффективно, чем одноразовый сброс контекста (например, только в начале кадра), и отдельная передача сигнала о сбросе контекста (например, с помощью дополнительных однобитовых флагов) множество раз в пределах (нескольких коротких окон) кадра.
В предпочтительном варианте использования изобретения аудио декодер настроен также получать служебную информацию о группировании при использовании так называемых "коротких окон" (то есть при передаче нескольких наборов спектральных значений, которые накладываются друг на друга и добавляются с помощью нескольких окон короче, чем звукокадр). В этом случае аудио декодер предпочтительно настроен группировать два или более набора спектральных значений для комбинации с общей информацией о коэффициенте масштабирования в зависимости от служебной информации о группировании. В этом случае контекстный ресеттер предпочтительно настроен на сброс контекста по умолчанию между декодированием множества спектральных значений, группированных вместе в зависимости от однобитового флага сброса контекста. Этот вариант основан на открытии, что в некоторых случаях может быть широкий разброс между декодированными аудио значениями (например, декодированными спектральными значениями) группированных последовательностей наборов спектральных значений, даже если начальные масштабные коэффициенты применяются к последующим наборам спектральных значений. Например, если есть устойчивое, но значительное изменение частоты между последующими наборами спектральных значений, то коэффициенты масштабирования последующих наборов спектральных значений могут быть равными (например, если изменение частоты не превышает полосы коэффициента масштабирования), при этом, тем не менее, необходимо сбросить контекст при переходе между различными наборами спектральных значений. Таким образом, описанный вариант использования изобретения делает возможным битрейт-эффективное кодирование и декодирование даже при наличии такого изменения частоты переходов аудио сигнала. Кроме того, эта концепция обеспечивает эффективную работу при кодировании быстрых изменений значений в присутствии коррелирующих спектральных значений. В этом случае сброса контекста можно избежать, отключив флаг сброса контекста, даже если различные коэффициенты масштабирования связаны с последующим набором спектральных значений (которые в данном случае не сгруппированы, поскольку коэффициенты масштабирования различаются).
В другом варианте использования изобретения аудио декодер настроен на прием, в качестве служебной информации для сброса контекста, однобитового флага сброса контекста на каждый звукокадр кодированной аудио информации. В этом случае аудио декодер также настроен на прием, в качестве кодированной аудио информации, последовательности кодированных звукокадров, последовательности кодированных кадров, включающих звукокадры в линейно предсказанной области. Звукокадр линейно-предсказанной области содержит, например, выборочное число частей с преобразованием кодированного возбуждения для возбуждения аудио синтезатора в линейно-предсказанной области. Этот контекстно-зависимый энтропийный декодер настроен для декодирования спектральных значений частей с преобразованием кодированного возбуждения в зависимости от контекста, который основывается на ранее декодированной аудио информации в несброшенном состоянии. Контекстный ресеттер настроен на сброс, в зависимости от служебной информации, контекста по умолчанию перед декодированием набора спектральных значений первой части с преобразованием кодированного возбуждения данного звукокадра, пропуская сброс контекста по умолчанию между декодированием наборов спектральных значений различных частей с преобразованием кодированного возбуждения (т.е. в пределах) заданного звукокадра. Этот вариант основан на открытии, что сочетание контекстно-зависимого декодирования и сброса контекста влечет за собой снижение битрейта при кодировании преобразования кодированного возбуждения для линейно-предсказанной области аудио синтезатора. Кроме того, было установлено, что временная детализация сброса контекста при кодировании преобразования кодированного возбуждения обычно может быть выбрана большей, чем временная детализация сброса контекста при наличии перехода (коротких окон) к чистому кодированию частотной области (например, Advanced-Audio-Coding-type audio coding аудио).
В другом предпочтительном варианте использования изобретения, аудио декодер настроен на получение кодированной аудио информации, содержащей множество наборов спектральных значений на каждый звукокадр. В этом случае аудио декодер также предпочтительно настроен на получение служебной информации о группировании. Этот аудио декодер настроен на группирование двух или более наборов спектральных значений для комбинации с общей информацией о коэффициненте масштабирования в зависимости от служебной информации о группировании. В предпочтительном варианте контекстный ресеттер настроен на сброс контекста по умолчанию в ответ на (то есть в зависимости от) служебную информацию о группировании. Контекстный ресеттер настроен на сброс контекста между декодированием наборов спектральных значений последующих групп, и на избежание сброса контекста между декодированием наборов спектральных значений в одной группе (т.е. в пределах одной группы). Этот вариант использования изобретения основан на открытии, что необязательно использовать выделенную служебную информацию о сбросе контекста, если есть сигнализация наборов пространственных значений, обладающих высоким сходством (и сгруппированных на этом основании). В частности, было установлено, что во многих случаях уместен сброс контекста каждый раз, когда коэффициент масштабирования меняется (например, при переходе от одного набора спектральных значений к другому набору спектральных значений в пределах окна, в частности, если наборы спектральных значений не сгруппированы, или при переходе из одного окна в другое окно). Если, однако, желательно сбросить контекст между двумя наборами спектральных значений, с которыми связаны одни и те же коэффициенты масштабирования, по-прежнему имеется возможность принудительно сбросить контекст с помощью сигнала о наличии новой группы. Это можно сделать за счет повторной передачи идентичных коэффициентов масштабирования, но это принесет положительный результат, если пропущенный сброс контекста вызвал бы значительное ухудшение эффективности кодирования. Тем не менее, оценка служебной информации о группировании для сброса контекста может быть эффективной концепцией, чтобы избежать необходимости передачи выделенной служебной информации о сбросе контекста, в то же время позволяя сброс контекста, когда это целесообразно. В тех случаях, когда контекст должен быть сброшен, даже если можно использовать ту же информацию о коэффициенте масштабирования, существуют недостатки с точки зрения битрейта (вызванные необходимостью использования дополнительных групп и ретранслирования информации о коэффициентах масштабирования), эти недостатки в битрейте можно компенсировать сокращением битрейта в других кадрах.
Другой вариант использования изобретения приводит к созданию аудио кодера для получения кодированной аудио информации на основе входной аудио информации. Аудио кодер включает в себя контекстно-зависимый энтропийный кодер, предназначенный для кодирования заданной аудио информации из входной аудио информации в зависимости от контекста, который основывается на смежной аудио информации, временно или пространственно смежной к заданной аудио информации в несброшенном состоянии. Этот контекстно-зависимый энтропийный кодер также настроен на выбор отображения информации для получения кодированной аудио информации из входной аудио информации в зависимости от контекста. Этот контекстно-зависимый энтропийный кодер также включает в себя контекстный ресеттер, настроенный на сброс контекста для выбора отображения информации контекста по умолчанию, который не зависит от ранее декодированной аудио информации, в пределах непрерывной части входной аудио информации в ответ на появление условия для сброса контекста. Этот контекстно-зависимый энтропийный кодер также настроен предоставлять служебную информацию кодированной аудио информации, указывающую на присутствие условий для сброса контекста. Этот вариант использования изобретения основывается на открытии, что сочетание контекстно-зависимого энтропийного кодирования и периодичного сброса контекста, о котором сигнализирует соответствующая служебная информация, делает возможным битрейт-эффективное кодирование входной аудио информации.
В предпочтительном варианте использования изобретения аудио кодер настроен для выполнения регулярного сброса контекста по крайней мере один раз за n кадров входной аудио информации. Было установлено, что регулярный сброс контекста влечет за собой возможность синхронизировать аудио сигнал очень быстро, потому что сброс контекста вводит временные ограничения на межкадровые зависимости (или, по крайней мере, способствует таким ограничениям межкадровых зависимостей).
В другом предпочтительном варианте использования изобретения аудио кодер настроен на переключение между множеством различных режимов кодирования (например, режим кодирования частотной области и режим кодирования линейно-предсказанной области). В этом случае аудио кодер предпочтительно может быть настроен для выполнения сброса контекста в ответ на изменение между двумя режимами кодирования. Этот вариант основан на открытии, что смена между двумя режимами кодирования, как правило, связана с существенным изменением входного аудио сигнала так, что обычно существует только очень ограниченная корреляция между аудио-контентом до переключения режима кодирования и после переключения режима кодирования.
В другом предпочтительном варианте использования изобретения аудио кодер настроен на расчет или оценку первого числа битов, необходимых для кодирования определенной аудио информации (например, конкретного кадра или части входной аудио информации, или, по крайней мере, одного или нескольких конкретных спектральных значений входной аудио информации) входной аудио информации в зависимости от несброшенного контекста, который основывается на смежной аудио информации, временно или спектрально прилегающей к определенной аудио информации, и на расчет или оценку второго числа битов, необходимых для кодирования определенной аудио информации, используя контекст по умолчанию (например, состояние контекста, до которого контекст сбрасывается). Аудио кодер также настроен на сравнение первого числа битов и второго числа битов для решения, нужно ли предоставлять кодированную аудио информацию, соответствующую определенной аудио информации на основе несброшенного контекста или на основе контекста по умолчанию. Кодер также настроен сигнализировать результат указанного решения, используя служебную информацию. Этот вариант использования изобретения основан на открытии, что иногда трудно решить априори, является ли выгодным, с точки зрения битрейта, сброс контекста. Сброс контекста может привести к выбору отображения информации (для получения кодированной аудио информации из определенной входной аудио информации), которое лучше подходит (в плане обеспечения более низким битрейтом) для кодирования определенной аудио информации или подходит хуже (в плане обеспечения более высоким битрейтом) для кодирования определенной аудио информации. В некоторых случаях было установлено, что выгодно решать, следует ли сбросить контекст или нет, путем определения числа битов, необходимых для кодирования, используя оба варианта: со сбросом и без сброса контекста.
Дальнейшие варианты использования изобретения помогают создать метод для получения декодированной аудио информации на основе кодированной аудио информации и метод получения кодированной аудио информации на основе входной аудио информации.
Дальнейшие варианты использования изобретения помогают создать соответствующие компьютерные программы.
Дальнейшие варианты использования изобретения помогают создать аудио сигнал.
Краткое описание чертежей
Использования изобретения будут далее описаны со ссылкой на прилагаемые чертежи, на которых:
Фиг.1 показывает блок-схему аудио декодера в соответствии с одним из вариантов использования изобретения;
Фиг.2 показывает блок-схему аудио декодера в соответствии с другим вариантом использования изобретения;
Фиг.3а показывает графическое представление, в виде синтаксиса информации, входящей в состав потока канала частотной области, который может быть получен изобретенным аудио кодером и который может быть использован изобретенным аудио декодером;
Фиг.3b показывает графическое представление, в виде синтаксиса информации, представляющей арифметически кодированные спектральные данные потока канала частотной области на фиг.3а;
Фиг.4 показывает графическое представление, в виде синтаксиса арифметически кодированных данных, которые могут состоять из арифметически кодированных спектральных данных, представленных на фиг.3b, или данных преобразования кодированного возбуждения, представленных на фиг.11b;
Фиг.5 показывает алгоритм, определяющий элементы информации и справочные элементы, используемые в синтаксисе на фиг.3а, 3b и 4;
Фиг.6 показывает блок-схему последовательности процесса метода обработки звукокадра, который может быть использован в варианте осуществления изобретения;
Фиг.7 показывает графическое представление контекста для расчета состояния для выбора отображения информации;
Фиг.8 показывает алгоритм, определяющий элементы данных и справочные элементы, используемые для арифметического декодирования арифметически кодированной спектральной информации, например, с помощью алгоритма на фиг.9а до 9f;
Фиг.9а показывает псевдокод программы - в форме языка программирования Си - метода сброса контекста арифметического кодирования;
Фиг.9b показывает псевдокод программы метода отображения контекста арифметического декодирования между кадрами или окнами одинакового спектрального разрешения, а также между кадрами или окнами различного спектрального разрешения;
Фиг.9с показывает псевдокод программы метода получения значения переменной состояния из контекста;
Фиг.9d показывает псевдокод программы метода получения индекса сводной таблицы частот из значения, описывающего состояние контекста;
Фиг.9е показывает псевдокод программы метода арифметического декодирования арифметически кодированных спектральных значений;
Фиг.9f показывает псевдокод программы метода обновления контекста после/следующего за декодированием фрагмента спектральных значений;
Фиг.10а показывает графическое представление сброса контекста в присутствии звукокадров, имеющих связанные с ними "длинные окна" (одно длинное окно на звукокадр);
Фиг.10b показывает графическое представление сброса контекста для звукокадров, имеющих связанное с ними множество «коротких окон» (например, восемь коротких окон на звукокадр);
Фиг.10с показывает графическое представление сброса контекста при переходе между первым звукокадром, имеющим связанное с ним "длинное окно запуска", и звукокадром, имеющим связанное с ним множество «коротких окон»;
Фиг.11a показывает графическое представление, в виде синтаксиса информации, содержащейся в потоке канала линейного предсказания области;
Фиг.11b показывает графическое представление информации кодирования преобразования кодированного возбуждения, которое (кодирование) является частью потока канала линейного предсказания области на фиг.11а;
Фиг.11с и 11d показывают алгоритм, определяющий информационные элементы и справочные элементы, используемые в синтаксисе представления на фиг.11а и 11b;
Фиг.12 показывает графическое представление сброса контекста для звукокадров, содержащих кодирование возбуждения линейно-предсказанной области;
Фиг.13 показывает графическое представление сброса контекста на основе информации о группировании;
Фиг.14 показывает блок-схему аудио кодера согласно одному из вариантов использования изобретения;
Фиг.15 показывает блок-схему аудио кодера согласно другому варианту осуществления изобретения;
Фиг.16 показывает блок-схему аудио кодера согласно другому варианту осуществления изобретения;
Фиг.17 показывает блок-схему аудио кодера согласно еще одному варианту использования изобретения;
Фиг.18 показывает блок-схему последовательности процесса метода получения декодированной аудио информации согласно одному из вариантов использования изобретения;
Фиг.19 показывает блок-схему последовательности процесса метода получения кодированной аудио информации согласно одному из вариантов использования изобретения;
Фиг.20 показывает блок-схему последовательности процесса метода контекстно-зависимого арифметического декодирования фрагментов спектральных значений, который может использоваться в изобретенных аудио декодерах;
Фиг.21 показывает блок-схему последовательности процесса метода контекстно-зависимого арифметического кодирования фрагментов спектральных значений, который может использоваться в изобретенных аудио кодерах.
Подробное описание вариантов использования изобретения
1. Аудио декодер
1.1. Аудио декодер - основная реализация
Фиг.1 показывает блок-схему аудио декодера в соответствии с одним из вариантов использования изобретения. Аудио декодер 100 на фиг.1 настроен на получение энтропийно-кодированной аудио информации 110 и на представлении на ее основе декодированной аудио информации 112. Аудио декодер 100 содержит контекстно-зависимый энтропийный декодер 120, который настроен на декодирование энтропийно-кодированной аудио информации 110 в зависимости от контекста 122, который основан на ранее декодированной аудио информации в несброшенном состоянии. Энтропийный декодер 120 также настроен на выбор отображения информации 124 для получения декодированной аудио информации 112 из кодированной аудио информации 110 в зависимости от контекста 122. Контекстно-зависимый энтропийный декодер 120 также включает в себя контекстный ресеттер 130, который настроен на получение/прием служебной информации 132 из энтропийно-кодированной аудио информации 110 и на получение/производство на ее основе сигнала контекстного ресеттера 134. Контекстный ресеттер 130 настроен на сброс контекста 122 для выбора отображения информации 124 до контекста по умолчанию, который не зависит от ранее декодированной аудио информации, в ответ на соответствующую служебную информацию 132 из энтропийно-кодированной аудио информации 110.
Таким образом, в действии контекстный ресеттер 130 сбрасывает контекст 122 всякий раз, когда обнаруживает служебную информацию о контекстном сбросе
(например, флаг контекстного сброса), связанную с энтропийно-кодированной аудио информацией 110. Сброс контекста 122 до контекста по умолчанию может привести к тому, что отображение информации по умолчанию (например, по умолчанию Huffmann-кодовой книги, в случае Huffmann кодирования, и по умолчанию (сводной) частотной информации "cum_freq" в случае арифметического кодирования) выбирается для извлечения декодированной аудио информации 112 (например, декодированных спектральных значений a, b, c, d) из энтропийно-кодированной аудио информации 110 (включающей, например, кодированные спектральные значения a, b, c, d).
Соответственно, в несброшенном состоянии контекст 122 зависит от ранее декодированной аудио информации, например спектральных значений ранее декодированных звукокадров. Следовательно, выбор отображения информации (который осуществляется на основе контекста) для декодирования текущего звукокадра (или для декодирования одного или нескольких спектральных значений текущего звукокадра), как правило, зависит от декодированной аудио информации из ранее декодированного кадра (или ранее декодированного "окна").
Напротив, если контекст сбрасывается, влияние ранее декодированной аудио информации (например, декодированных спектральных значений) из ранее декодированных звукокадров на выбор отображения информации для декодирования текущего звукокадра устраняется. Таким образом, после сброса энтропийное декодирование текущего звукокадра (или по крайней мере некоторых спектральных значений), как правило, больше не зависит от аудио информации (например, спектральных значений) ранее декодированного звукокадра. Тем не менее, декодирование аудио-контента (например, одного или нескольких спектральных значений) текущего звукокадра может (или не может) включать некоторые зависимости от ранее декодированной аудио информации того же звукокадра.
Соответственно, рассмотрение контекста 122 может улучшить отображение информации 124, используемой для извлечения декодированной аудио информации 112 из кодированной аудио информация 110 в отсутствии условия для сброса. Контекст 122 может быть сброшен, если служебная информация 132 указывает на условие сброса для того, чтобы избежать обработки неподходящего контекста, который, как правило, приводит к увеличению битрейта. Соответственно, аудио декодер 100 делает возможным декодирование энтропийно-кодированной аудио информации с высокой эффективностью битрейта.
1.2. Использование изобретения для декодирования единого кодирования звука и речи
1.2.1. Обзор декодера
Далее будет представлен обзор аудио декодера, который делае