2591661 - Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума

Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума

Иллюстрации

Показать все

Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудио, включающего речевые и неречевые части, за счет повышения эффективности кодирования переходов между данными частями. Декодировщик аудиосигнала включает в себя спектральный процессор, предназначенный для формирования спектра из набора спектральных коэффициентов, или их предварительно обработанных версий, в зависимости от набора параметров области линейного предсказания для части аудиоконтента, закодированной в режиме линейного предсказания, и выполнения процедуры формирования спектра из набора закодированных спектральных коэффициентов, или их предварительно обработанных версий, в зависимости от параметров набора коэффициентов масштабирования для части аудиоконтента, закодированной в частотной области. 6 н. и 21 з.п. ф-лы, 19 ил.

Реферат

Многорежимный декодировщик аудиосигнала для получения декодированного представления аудиоконтента [содержания] из кодированного представления аудиоконтента, содержащего определитель спектральных значений, настроенный на получение набора декодированных спектральных коэффициентов для нескольких частей аудиоконтента. Декодировщик аудиосигнала также включает в себя спектральный процессор, предназначенный для формирования спектра из набора спектральных коэффициентов, или их предварительно обработанных версий, в зависимости от набора параметров области линейного предсказания для части аудиоконтента, закодированной в режиме линейного предсказания, и выполнения процедуры формирования спектра из набора закодированных спектральных коэффициентов, или их предварительно обработанных версий, в зависимости от параметров набора коэффициентов масштабирования для части аудиоконтента, закодированной в частотной области. Декодировщик аудиосигнала содержит преобразователь частотной области во временную область, настроенный на получение представления аудиоконтента во временной области на основе сформированного спектра в виде набора декодированных спектральных коэффициентов для части аудиоконтента, закодированной в режиме линейного предсказания, а также получения представления аудиоконтента во временной области на основе сформированного спектра в виде набора декодированных спектральных коэффициентов для части аудиоконтента, закодированной в частотной области. Также описан кодировщик аудиосигнала.

Область техники

Воплощения в соответствии с настоящим изобретением относятся к многорежимным декодировщикам аудиосигнала для обеспечения декодированного представления аудиоконтента на основе закодированного представления аудиоконтента.

Дополнительные варианты в соответствии с изобретением относятся к способам обеспечения декодированного представления аудиоконтента на основе закодированного представления аудиоконтента.

Дальнейшие варианты в соответствии с изобретением связаны со способом создания закодированного представления аудиоконтента на основе входного представления аудиоконтента.

Дальнейшие варианты в соответствии с изобретением связаны с компьютерными программами, реализующими названные способы.

Предпосылки создания изобретения

Далее в целях облегчения понимания изобретения будут объяснены некоторые предпосылки создания изобретения и его преимущества.

В течение последнего десятилетия, большие усилия были направлены на создание возможностей для цифрового хранения и распространения аудиоконтента. Одним из важных достижений на этом пути является создание международного стандарта ISO/IEC 14496-3. Часть 3 данного стандарта связана с кодированием и декодированием аудиоконтента, а подраздел 4 части 3 связан с общим аудиокодированием. ISO/IEC 14496, часть 3, подраздел 4 определяет концепцию кодирования и декодирования обычного аудиоконтента. Кроме того, были предложены дальнейшие варианты для улучшения качества и/или уменьшения необходимой скорости передачи данных [битрейта].

Кроме того, было установлено, что аудиокодирование в частотной области не является оптимальным для аудиоконтента, содержащего речь. В последнее время был предложен единый аудио/речевой кодировщик, который эффективно сочетает в себе обе методики, а именно речевое и аудиокодирование (см., например, в работе [1].)

В таких аудиокодировщиках некоторые звуковые фреймы кодируются в частотной области, а другие аудиофреймы кодируются способом линейного предсказания.

Однако было установлено, что трудно осуществить переход между фреймами, закодированными в различных областях, без значительных потерь битрейта.

В связи с этим существует необходимость создания концепции для кодирования и декодирования аудиоконтента, включающего как речь, так и звуковые сигналы общего вида, которая позволила бы эффективно реализовать переходы между закодированными частями различных типов.

Сущность изобретения

Воплощение в соответствии с изобретением создает многорежимное декодирование аудиосигнала для формирования представления декодированного аудиоконтента на основе закодированного представления аудиоконтента. Декодировщик аудиосигнала включает в себя определитель спектральных значений, настроенный на получение набора декодированных спектральных коэффициентов для нескольких частей аудиоконтента. Многорежимный декодировщик аудиосигналов также имеет в своем составе спектральный процессор, настроенный на создание сформированного спектра в виде набора декодированных спектральных коэффициентов, или его предварительно обработанной версии, в зависимости от набора параметров области линейного предсказания для части аудиоконтента, закодированной в способом линейного предсказания, и настроенный на создание сформированного спектра из набора декодированных спектральных коэффициентов, или их предварительно обработанных версий, вне зависимости от набора параметров коэффициента масштабирования для части аудиоконтента, закодированной в частотной области. Многорежимный декодировщик аудиосигналов также содержит преобразователь частотной области во временную область, настроенный на получение представления аудиоконтента во временной области на основе сформированного спектра в виде набора декодированных спектральных коэффициентов для части аудиоконтента, закодированной в режиме линейного предсказания, а также на получение представления контента во временной области на основе сформированного спектра в виде набора декодированных спектральных коэффициентов для части аудиоконтента, закодированной в частотной области.

Многорежимный декодировщик аудиосигнала создан на идее от том, что могут быть получены эффективные переходы между частями аудиоконтента, закодированными в различных режимах формирования спектра в частотной области так, что спектр формируется в виде набора декодированных спектральных коэффициентов как для части аудиоконтента, закодированного в частотной области, так и для части аудиоконтента, закодированного в режиме линейного предсказания. При использовании такого подхода представление во временной области, полученное на основе сформированного спектра в виде набора декодированных спектральных коэффициентов для части аудиоконтента, закодированной способом линейного предсказания 'в той же области' (например, выходные значения после преобразования из частотной области во временную область преобразуются в такой же тип), в то время как представление во временной области получается на основе сформированного спектра в виде набора декодированных спектральных коэффициентов, для части аудиоконтента, закодированной в частотной области. Таким образом, представление части аудиоконтента во временной области, закодированной в режиме линейного предсказания и части аудиоконтента, закодированной в частотной области, могут быть эффективно объединены и не будут иметь неприемлемых искажений. Например, характеристики отмены алиасинга [перекрытия] типичного преобразователя из частотной области во временную область могут быть использованы для преобразования сигналов из частотной области во временную область, которые находятся в одной и той же области (например, оба сигнала представляют собой аудиоконтенты из одной и той же области аудиоконтента). Таким образом, между частями аудиоконтента, закодированными в различных режимах, может быть получено хорошее качество переходов, не требующее значительного битрейта для осуществления таких переходов.

В предпочтительном варианте, многорежимный декодировщик аудиосигналов дополнительно содержит блок перекрытия, настроенный на перекрытие и сложение представления части аудиоконтента во временной области, закодированного в режиме линейного предсказания, с частью аудиоконтента, закодированного в частотной области. За счет перекрытия частей аудиоконтента, закодированных в различных областях, достигается преимущество, которое можно получить с помощью введения сформированного спектра в виде набора декодированных спектральных коэффициентов в преобразователь из частотной области во временную область, что может быть реализовано в обоих режимах многорежимного декодировщика аудиосигнала. При выполнении формирования спектра перед преобразованием из частотной области во временную область в обоих режимах многорежимного декодировщика аудиосигнала, представления частей аудиоконтента во временной области, закодированных в различных режимах, обычно имеют очень хорошие характеристики перекрытия и сложения, которые позволяют получить хорошее качество переходов, не требующее дополнительной информации.

В предпочтительном варианте, преобразователь из частотной области во временную область настроен на получение представления аудиоконтента во временной области для части аудиоконтента, закодированного в режиме линейного предсказания с использованием преобразования с перекрытием, и получения представления аудиоконтента во временной области для части аудиоконтента, закодированного в частотной области с использованием режима преобразования с перекрытием. Предпочтительно, чтобы в этом случае блок перекрытия был настроен на перекрытие во временной области представления последовательных частей аудиоконтента, закодированных в различных режимах. Таким образом, могут быть получены плавные переходы. В связи с тем, что для обоих режимов формирование спектра применяется в частотной области, представления во временной области, осуществленные преобразователем из частотной области во временную область, в обоих режимах совместимы и позволяют получить хорошее качество перехода. Использование преобразования с перекрытием позволяет получить улучшенный компромисс между качеством и эффективностью битрейта при переходах, потому что преобразования с перекрытием позволяют получить плавные переходы даже при наличии ошибок дискретизации, исключая при этом значительные затраты битрейта.

В предпочтительном варианте, преобразователь из частотной области во временную область настроен на применение преобразования с перекрытием для одного и того же типа преобразований с получением представления аудиоконтента во временной области для частей аудиоконтента, закодированных в различных режимах. В этом случае блок перекрытия настроен на перекрытие и сложение представлений во временной области последовательных частей аудиоконтента, закодированных в различных режимах, так что алиасинг во временной области, вызванный преобразованием с перекрытием уменьшается или устраняется при использовании перекрытия и сложения. Эта концепция основана на том, что для обоих режимов при преобразовании из частотной области во временную область выходные сигналы получаются в той же области (области аудиоконтента), и при применении как параметров коэффициентов масштабирования, так и параметров линейного предсказания в частотной области. Таким образом, может быть достигнуто исключение алиасинга, которое получается обычным образом при применении преобразований с перекрытием последовательных преобразований одного и того же типа и частично перекрывающимися частями представления аудиосигнала.

В предпочтительном варианте, блок перекрытия настроен на перекрытие и сложение первой части аудиоконтента, закодированной в первом режиме, как это обеспечивается при синтезе преобразования перекрытия, или амплитудно-масштабированной и спектрально неискаженной его версии, и представления во временной области последующей второй части аудиоконтента, закодированной во втором режиме, как это предусмотрено при синтезе преобразования перекрытия, или его амплитудно-масштабированной и спектрально неискаженной версии. При синтезе преобразования перекрытия (например, при фильтрации и т.п.) исключается любая обработка выходных сигналов, которая не являлась бы общей для различных режимов кодирования, использующихся для последовательных (частично перекрывающих друг друга) частей аудиоконтента, что можно осуществить с помощью характеристик отмены алиасинга при преобразовании с перекрытием.

В предпочтительном варианте, преобразователь из частотной области во временную область настроен на представление во временной области частей аудиоконтента, закодированных независимым образом так, что полученные представления во временной области являются такими областями, в которых используется линейная комбинация без применения операции фильтрации при формировании сигнала к одному или обоим представлениям, улучшенным во временной области. Иными словами, выходные сигналы при преобразовании частотной области во временную область являются представлениями во временной области самих аудиоконтентов для обоих режимов (при отсутствии сигналов возбуждения для операции фильтрации при преобразовании области возбуждения во временную область).

В предпочтительном варианте, преобразователь из частотной области во временную область настроен для выполнения модифицированного обратного дискретного косинусного преобразования и получения, в результате, представления во временной области аудиоконтента части аудиосигнала, как для части аудиоконтента, закодированного в режиме линейного предсказания, так и для части аудиоконтента, закодированного в режиме частотной области.

В предпочтительном варианте, многорежимный декодировщик аудиосигнала содержит определитель коэффициентов LPC-фильтра, настроенный на получение декодированных коэффициентов LPC-фильтра на основе представления закодированных коэффициентов LPC-фильтра для части аудиоконтента, закодированного в режиме линейного предсказания. В этом случае, многорежимный декодировщик аудиосигналов также включает в себя преобразователь коэффициентов фильтра, настроенный на преобразование декодированных коэффициентов LPC-фильтра в спектральное представление для получения значений коэффициентов усиления, связанных с различными частотами. Таким образом, коэффициенты LPC-фильтра могут использоваться в качестве параметров области линейного предсказания. Многорежимный декодировщик аудиосигналов также включает в себя определитель коэффициентов масштабирования, настроенный на получение декодированных значений коэффициентов масштабирования (которые используются в качестве параметров коэффициента масштабирования) на основе закодированного представления значений коэффициентов масштабирования части аудиоконтента, закодированной в частотной области. Спектральный процессор включает в себя преобразователь спектра, настроенный на суммирование набора декодированных спектральных коэффициентов, связанных с частью аудиоконтента, закодированного в режиме линейного предсказания, или его предварительно обработанной версии, со значениями коэффициента усиления в режиме линейного предсказания, для получения обработанной версии коэффициентов усиления (и, следовательно, сформированного спектра) спектральных коэффициентов (декодированных), в которой вклад декодированных спектральных коэффициентов, или их предварительно обработанных версий, масштабируется в зависимости от значений коэффициентов усиления. Кроме того, преобразователь спектра настроен на суммирование набора декодированных спектральных коэффициентов, связанных с частью аудиоконтента, закодированного в частотной области, или его предварительно обработанной версии, с декодированными значениями коэффициента масштабирования, для получения обработанной версии коэффициентов масштабирования (сформированного спектра) спектральных коэффициентов (декодированных), в которой вклад декодированных спектральных коэффициентов, или их предварительно обработанных версий, масштабируется в зависимости от значений коэффициентов масштабирования.

С использованием этого подхода, в обоих режимах многорежимного декодирования аудиосигнала может быть получено ограничение собственного шума при условии, что преобразователь из частотной области во временную область обеспечивает выходной сигнал с хорошими переходными характеристиками для переходов между частями аудиосигнала, закодированного в различных режимах.

В предпочтительном варианте, преобразователь коэффициентов настроен на преобразование декодированных коэффициентов LPC-фильтров, которые представляют собой импульсные отклики во временной области кодирующего фильтра с линейным предсказанием (LPC-фильтр), в спектральное представление нечетного дискретного преобразования Фурье. Фильтр преобразователя коэффициентов настроен на получение значения усиления в режиме линейного предсказания из спектрального представления декодированных коэффициентов LPC-фильтра так, что значения усиления зависят от магнитуды коэффициентов спектрального представления. Таким образом, при формировании спектра, которое выполняется в режиме линейного предсказания, также производится ограничение шума с помощью фильтр кодирования с линейным предсказанием. Таким образом, шум дискретизации в декодированном спектральном представлении (или его предварительно обработанной версии) изменяется таким образом, чтобы шум дискретизации был сравнительно небольшим для 'важных' частот, для которых имеется сравнительно большое спектральное представление декодированных коэффициентов LPC-фильтра.

В предпочтительном варианте, преобразователь коэффициентов фильтра и сумматор настроены таким образом, чтобы вклад этих декодированных спектральных коэффициентов, или их предварительно обработанных версий, чтобы усиленная версия данного спектрального коэффициента определялась значением усиления, связанного с данным декодированным спектральным коэффициентом, в режиме линейного предсказания.

В предпочтительном варианте, определитель спектральных значений настроен на использование деквантования [цифроаналогового преобразования] для дискретизированных декодированных спектральных значений и получения декодированных и деквантованных [аналоговых] спектральных коэффициентов. В этом случае преобразователь спектра настроен на выполнение ограничения шумов дискретизации с регулировкой эффективного шага дискретизации для данного декодированного спектрального коэффициента в зависимости от значения усиления в режиме линейного предсказания, связанного с данным декодированным спектральным коэффициентом. Соответственно, ограничение шума, которое проводится в спектральной области, адаптировано к характеристикам сигнала, представленного коэффициентами LPC- фильтра.

В предпочтительном варианте, многорежимный декодировщик аудиосигнала настроен на использование стартового фрейма на промежуточном этапе режима линейного предсказания при переходе от фрейма в частотной области к комбинированному фрейму режима линейного предсказания/режима линейного предсказания с возбуждением по алгебраической кодовой книге [CELP-модель]. В этом случае декодировщик аудиосигнала настроен на получение набора декодированных спектральных коэффициентов для стартового фрейма режима линейного предсказания. Кроме того, аудиодекодировщик настроен на формирование спектра из набора декодированных спектральных коэффициентов для стартового фрейма режима линейного предсказания, или его предварительно обработанной версии, в зависимости от набора параметров связанной с ним области линейного предсказания. Декодировщик аудиосигнала также настроен на получение представления во временной области для стартового фрейма режима линейного предсказания на основе сформированного спектра в виде набора декодированных спектральных коэффициентов. Аудиодекодировщик также настроен на применение стартового окна, имеющего сравнительно плавную огибающую левого фронта и сравнительно резкий спад огибающей правого фронта представления во временной области для стартового фрейма режима линейного предсказания. В этом случае создается переход между фреймом в режиме частотной области и комбинированным фреймом режима линейного предсказания/линейного предсказания с возбуждением по алгебраической кодовой книге, который имеет хорошие характеристики перекрытия и сложения с предыдущим фреймом в частотной области и который, в то же время, делает коэффициенты области линейного предсказания доступными для использования в последующим комбинированным фреймом режима линейного предсказания/линейного предсказания с возбуждением по алгебраической кодовой книге.

В предпочтительном варианте, многорежимный декодировщик аудиосигнала настроен на перекрытие правосторонней части представления во временной области для фрейма в режиме частотной области, предшествующего первому фрейму режима линейного предсказания, с левосторонней частью представления во временной области для стартового фрейма режима линейного предсказания, чтобы получить сокращение или отмену алиасинга во временной области. Этот вариант основан на идее получения хороших характеристик отмены алиасинга во временной области путем проведения формирования спектра в режиме линейного предсказания для стартового фрейма в частотной области, так как формирование спектра предыдущего фрейма в частотной области также осуществляется в частотной области.

В предпочтительном варианте, аудиодекодировщик сигнала настроен на использование параметров области линейного предсказания, связанных с первым фреймом режима линейного предсказания для инициализации декодировщика с возбуждением по алгебраической кодовой книге в режиме линейного предсказания и декодирования, по крайней мере части фрейма, в комбинированном режиме линейного предсказания/линейного предсказания с возбуждением по алгебраической кодовой книге. Таким образом, исключается необходимость передачи дополнительного набора параметров области линейного предсказания, которая существует в некоторых традиционных подходах. Точнее, первый фрейм режима линейного предсказания позволяет создать плавный переход от предыдущего фрейма в режиме частотной области, даже при сравнительно большой области перекрытия, а также позволяет инициализировать декодировщик в режиме линейного предсказания с возбуждением по алгебраической кодовой книге (ACELP). Таким образом, могут быть получены переходы с хорошим качеством звука и очень высокой степенью эффективности.

Другой вариант, согласно изобретению, представляет многорежимный кодировщик аудиосигнала для обеспечения закодированного представления аудиоконтента на основе представления входного аудиоконтента. Кодировщик содержит преобразователь из частотной области во временную область для обработки представления входного аудиоконтента и получения представления аудиоконтента в частотной области. Кодировщик дополнительно содержит спектральный процессор, настроенный на выполнение формирования спектра, или его предварительно обработанной версии, в виде набора спектральных коэффициентов в зависимости от набора параметров области линейного предсказания для части аудиоконтента, закодированного в области линейного предсказания. Спектральный процессор также настроен на выполнение формирования спектра, или его предварительно обработанной версии, в виде набора спектральных коэффициентов в зависимости от набора параметров коэффициентов масштабирования для части аудиоконтента, которая кодируется в режиме частотной области.

Описанный выше многорежимный кодировщик аудиосигнала основан на идее о том, что можно получить эффективное аудиокодирование, которое позволяет выполнить простое аудиодекодирование с небольшими искажениями, если входное представление аудиоконтента преобразуется в частотную область (также называемой временно-частотной областью) как для части аудиоконтента, закодированной в режиме линейного предсказания, так и для и части аудиоконтента, закодированной в частотной области. Кроме того, было установлено, что ошибки дискретизации можно уменьшить при использовании формирования спектра (или его предварительно обработанной версии) в виде набора спектральных коэффициентов как для части аудиоконтента, закодированной в режиме линейного предсказания, так и для части аудиоконтента, закодированной в частотной области. Если для получения сформированного спектра в различных режимах (в частности, параметров области линейного предсказания в режиме линейного предсказания и параметров коэффициентов масштабирования в режиме частотной области) используются параметры различных типов, то в этом случае может быть одновременно применено как ограничение шума для характеристик обрабатываемой в данный момент части аудиоконтента, так и преобразование из временной области в частотную область к одним и тем же (участкам) аудиосигнала в различных режимах.

Следовательно, многорежимный кодировщик аудиосигнала способен обеспечить хорошую производительность при кодировании аудиосигналов, имеющих как аудиоучастки общего вида, так и аудиоучастки речевого типа путем избирательного применения формирования спектра соответствующего типа для набора спектральных коэффициентов. Другими словами, формирование спектра на основе набора параметров области линейного предсказания может быть применено к набору спектральных коэффициентов аудиофрейма, который имеет признаки речи, а формирование спектра на основе набора параметров коэффициентов масштабирования может быть применено к набору спектральных коэффициентов аудиофрейма, который был определен как аудио общего, а не речевого, типа.

Подводя итог, многорежимный кодировщик аудиосигнала позволяет кодировать аудиоконтент, имеющий изменяющиеся мгновенные характеристики (речевого типа для одних участков и общего типа для других участков), причем представление аудиоконтента во временной области преобразуется в частотную область таким же образом, как и участки аудиоконтента, закодированные в различных режимах. Различные характеристики для различных участков аудиоконтента подразумевают использование формирования спектра на основе различных параметров (параметров области линейного предсказания, либо параметров коэффициентов масштабирования) для получения спектрально сформированных спектральных коэффициентов или последовательной дискретизации.

В предпочтительном варианте преобразователь из временной области в частотную область настраивается на преобразование представления аудиоконтента участка аудиосигнала во временной области в представление аудиоконтента в частотной области как для участков аудиоконтента, закодированных в режиме линейного предсказания, так и для участков аудиоконтента, закодированных в частотной области. При выполнении преобразования из временной области в частотную область (например, при операциях преобразования, подобных операции преобразования MDCT или операции разделения по частоте с использованием набора фильтров) для одного и того же входного сигнала, как для режима частотной области, так и для режима линейного предсказания, эта операция может быть выполнена с особенно высокой эффективностью в блоке перекрытия и сложения декодировщика, что облегчает восстановление сигнала в декодировщике и избавляет от необходимости передачи дополнительных данных в случае, когда существует переход между различными режимами.

В предпочтительном варианте осуществление преобразования из временной области в частотную область настроено на применение анализа преобразований перекрытия для преобразований одинакового типа и получения представлений в частотной области для частей аудиоконтента, закодированных в различных режимах. Кроме того, использование преобразований перекрытия для преобразований одинакового типа позволяет просто восстановить аудиоконтент с отсутствием блочных искажений. В частности, можно использовать критическую выборку без значительных затрат.

В предпочтительном варианте, спектральный процессор настроен на выборочное применение сформированного спектра (или его предварительно обработанной версии) в виде набора спектральных коэффициентов, в зависимости от набора параметров области линейного предсказания, полученных с использованием соответствующего анализа участка аудиоконтента, закодированного в режиме линейного предсказания, или в зависимости от набора параметров коэффициентов масштабирования, полученных с помощью анализа психоакустической модели участка аудиоконтента, закодированного в частотной области. При таком подходе может быть достигнуто соответствующее ограничение шума как для участков аудиоконтента речевого типа, для которых корреляционный анализ позволяет получить значительное ограничение шума, так и для участков аудиоконтента общего типа, для которых значительное ограничение шума можно получить при анализе с использованием психоакустической модели.

В предпочтительном варианте, кодировщик аудиосигнала содержит селектор режима, настроенный на анализ аудиоконтента для определения, как следует кодировать участок аудиоконтента - в режиме линейного предсказания или в режиме частотной области. Таким образом, может быть выбрана соответствующая концепция ограничения шума, с исключением неэффективного в некоторых случаях режима преобразования из временной области в частотную область.

В предпочтительном варианте, многорежимный кодировщик аудиосигнала настроен на кодирование аудиофрейма, который находится между фреймом в частотной области и первым фреймом в комбинированных режимах линейного предсказания/линейного предсказания с возбуждением по алгебраической кодовой книге, в качестве стартового фрейма в режиме линейного предсказания. Для получения оконного представления во временной области многорежимный кодировщик аудиосигнала настроен на применение стартового окна, имеющего сравнительно пологий левосторонний склон и сравнительно резкий правосторонний склон в представлении во временной области для стартового фрейма в режиме линейного предсказания. Многорежимный кодировщик аудиосигнала также настроен на получение представления в частотной области на основе оконного представления во временной области для стартового фрейма в режиме линейного предсказания. Многорежимный кодировщик аудиосигнала также настроен на получение набора параметров области линейного предсказания для стартового фрейма в режиме линейного предсказания и использование, в зависимости от набора параметров области линейного предсказания, спектрально сформированного представления в частотной области для оконного представления во временной области стартового фрейма в режиме линейного предсказания, или его предварительно обработанной версии. Кодировщик аудиосигнала также настроен на кодирование набора параметров области линейного предсказания и формирование спектра с представлением в частотной области оконного представления во временной области для стартового фрейма в режиме линейного предсказания. Таким образом, получается закодированная информация о переходном аудиофрейме, которая может быть использована для восстановления аудиоконтента, причем закодированная информация о переходном аудиофрейме позволяет создать гладкий левосторонний переход и, в то же время, позволяет инициализировать в декодировщике режим ACELP декодирования последующего аудиофрейма. Затраты, вызванные переходом между различными режимами многорежимного кодировщика сигнала сведены к минимуму.

В предпочтительном варианте, многорежимный кодировщик аудиосигнала настроен на использование параметров области линейного предсказания, связанных с первым фреймом режима линейного предсказания, для инициализации режима линейного предсказания с возбуждением по алгебраической кодовой книге для кодирования, по крайней мере, части фрейма в комбинированном режиме линейного предсказания/линейного предсказания с возбуждением по алгебраической кодовой книге, следующего за стартовым фреймом режима линейного предсказания. Таким образом, параметры области линейного предсказания, полученные для режима линейного предсказания стартового фрейма, и закодированные в потоке битов, представляющих аудиоконтент, повторно используются для кодирования последующего аудиофрейма, в котором используется ACELP режим. Это повышает эффективность кодирования, а также позволяет эффективно декодировать без дополнительной информации по инициализации ACELP.

В предпочтительном варианте, многорежимный кодировщик аудиосигнала включает в себя определитель коэффициентов LPC-фильтра, настроенный на анализ части аудиоконтента, или его предварительно обработанной версии, которая будет кодироваться в режиме линейного предсказания, и определение коэффициентов LPC-фильтра, связанных с частью аудиоконтента, которая должна быть закодирована в режиме линейного предсказания. Многорежимный кодировщик аудиосигнала также содержит преобразователь коэффициентов фильтра, настроенный на преобразование декодированных коэффициентов LPC-фильтра в спектральное представление, с целью получения значений усиления в режиме линейного предсказания, связанных с различными частотами. Многорежимный кодировщик аудиосигнала также включает в себя определитель коэффициентов масштабирования, настроенный на анализ части аудиоконтента, или его предварительно обработанной версии, которая будет закодирована в частотной области, для определения коэффициентов масштабирования, связанных с частью аудиоконтента, которая будет закодирована в частотной области. Многорежимный кодировщик аудиосигнала также включает в себя суммирующее устройство, настроенное на суммирование в частотной области представления части аудиоконтента, или его обработанной версии, которая должна быть закодирована в режиме линейного предсказания, со значениями усиления в режиме линейного предсказания и получение значений усиления спектральных компонент (также называемых коэффициентами), причем вклад спектральных компонент (или спектральных коэффициентов) представления аудиоконтента в частотной области, взвешивается в зависимости от значений усиления в режиме линейного предсказания. Сумматор также настроен на суммирование представления части аудиоконтента в частотной области, или его обработанной версии, которая должна быть закодирована в частотной области, с масштабными коэффициентами для получения значений усиления спектральных составляющих, причем вклад спектральных компонент (или спектральных коэффициентов) представления аудиоконтента в частотной области взвешивается в зависимости от коэффициентов масштабирования.

В этом варианте коэффициенты усиления обработанных спектральных составляющих представляют собой набор спектральных коэффициентов (или спектральных составляющих) сформированного спектра.

Другой вариант, согласно изобретению создает способ для обеспечения декодированного представления аудиоконтента на основе его закодированного представления.

Еще один вариант, согласно изобретению создает способ получения закодированного представления аудиоконтента на основе представления входного аудиоконтента.

Еще один вариант, согласно изобретению, представляет собой компьютерную программу для выполнения одного или нескольких указанных способов.

Способы и компьютерная программа основаны на тех же результатах, что и представленная выше аппаратная часть.

Краткое описание рисунков

Далее будут описаны воплощения изобретения со ссылкой на приложенные чертежи, на которых:

на фиг.1 показана блок-схема кодировщика аудиосигнала, в соответствии с воплощением изобретения;

на фиг.2 показана блок-схема базового кодировщика аудиосигнала;

на фиг.3 показана блок-схема кодировщика аудиосигнала в соответствии с воплощением изобретения;

на фиг.4 показан результат интерполяции LPC коэффициентов для ТСХ окна;

на фиг.5 показан код компьютерной программы для получения значений усиления области линейного предсказания на основе декодированных коэффициентов LPC фильтра;

на фиг.6 показан

Патент 2591661