Звуковое кодирующее устройство, звуковой декодер, кодированная звуковая информация, способы кодирования и декодирования звукового сигнала и компьютерная программа
Иллюстрации
Показать всеИзобретение относится к технике связи. Технический результат - исключение артефактов, возникающих при обработке ограниченных во времени фреймов. Для этого звуковой декодер для предоставления декодированной звуковой информации на основе кодированной звуковой информации включает основанный на применении окна сигнальный преобразователь, формируемый, чтобы отображать частотно-временное представление, которое описывается кодированной звуковой информацией, на представлении временного интервала. Основанный на применении окна сигнальный преобразователь формируется, чтобы выбрать окно из множества окон, включающих окна различных наклонов перехода и окна различных длин преобразования, на основе информации об окне. Звуковой декодер включает селектор окон, формируемый, чтобы оценить информацию об окне кодового слова переменной длины для выбора окна для обработки данной части частотно-временного представления, связанного с данным фреймом звуковой информации. 6 н. и 9 з.п. ф-лы, 23 ил.
Реферат
Осуществления согласно изобретению связаны со звуковым кодирующим устройством для предоставления кодированной звуковой информации на основе входной звуковой информации и со звуковым декодером для предоставления декодированной звуковой информации на основе кодированной звуковой информации. Дальнейшие осуществления согласно изобретению связаны с кодированной звуковой информацией. Другие дальнейшие осуществления согласно изобретению связаны со способом предоставления декодированной звуковой информации на основе кодированной звуковой информации и со способом предоставления кодированной звуковой информации на основе входной звуковой информации. Дальнейшие осуществления связаны с компьютерными программами для выполнения изобретательных способов.
Осуществление изобретения связано с предложенным обновлением синтаксиса битового потока на основе объединенного речевого и звукового кодирования (USAC).
Далее будут объяснены предпосылки изобретения, чтобы облегчить понимание изобретения и его преимуществ. В последнее десятилетие были предприняты большие усилия по созданию возможности сохранения и распределения звукового содержания в цифровой форме. Одно важное достижение в этом смысле - определение международного стандарта ISO/IEC 14496-3. Часть 3 этого стандарта связана с кодированием и декодированием звукового содержания, а подраздел 4 части 3 связан с общим звуковым кодированием. ISO/IEC 14496 часть 3, подраздел 4 определяет концепцию кодирования и декодирования общего звукового содержания. Кроме того, были предложены дальнейшие усовершенствования для улучшения качества и/или снижения необходимой скорости передачи битов.
Однако согласно концепции, описанной в указанном стандарте, звуковой сигнал временного интервала преобразуется в частотно-временное представление. Преобразование из временного интервала в частотно-временную область обычно выполняется посредством использования преобразующих блоков, которые также обозначаются как «фреймы» сэмплов временного интервала. Было обнаружено, что выгодно использовать перекрывающиеся фреймы, которые смещаются, например, наполовину фрейма, потому что перекрывание позволяет эффективно избежать (или, по крайней мере, уменьшить) артефакты. Кроме того, было обнаружено, что организация окон должна выполняться, чтобы избежать артефактов, возникающих при обработке ограниченных по времени фреймов. Кроме того, организация окон позволяет оптимизировать процесс наложения и добавления последующих смещенных во времени, но перекрывающихся фреймов.
Однако было выявлено, что достаточно проблематично эффективно представить края, то есть резкие переходы или так называемые кратковременные электрические помехи в пределах звукового содержания, используя окна постоянной длины, потому что энергия перехода будет распределена по всей длине окна, что приводит к слышимым артефактам. Соответственно, было предложено переключение между окнами различных длин, таким образом, чтобы приблизительно постоянные части звукового содержания кодировались посредством использования длинных окон и, таким образом, чтобы переходные части (например, части, включающие помеху) звукового содержания кодировались посредством использования более коротких окон.
Однако в системе, которая позволяет выбирать между различными окнами для преобразования звукового содержания из временного интервала в частотно-временную область, конечно, необходимо сообщать декодеру, какое окно должно использоваться для декодирования закодированного звукового содержания данного фрейма.
В обычных системах, например в звуковом декодере, согласно международному стандарту ISO/IEC 14496-3, часть 3, подраздел 4, элемент данных, называемый "window_sequence", который показывает последовательность окон, используемую в текущем фрейме, вписывается двумя битами в битовый поток в так называемом "ics_info" элементе битового потока. Принимая во внимание последовательность окон предыдущего фрейма, сообщается о восьми различных последовательностях окон.
Исходя из вышеизложенного обсуждения, можно заметить, что битовая нагрузка кодированного битового потока, представляющая звуковую информацию, создается необходимостью сообщать тип используемого окна.
Ввиду этой ситуации желательно создать концепцию, которая обеспечивает более эффективное, относительно скорости передачи битов, информирование о типе окна, используемого для преобразования между представлением временного интервала звукового содержания и представлением частотно-временной области звукового содержания.
Эта проблема решается посредством звукового кодирующего устройства по п.1, звукового декодера по п.9, кодированной звуковой информации по п.12, способа предоставления декодированной звуковой информации по п.14, способа предоставления кодированной звуковой информации по п.15 и компьютерной программы по п.16.
Осуществление согласно изобретению создает звуковой декодер для предоставления декодированной звуковой информации на основе кодированной звуковой информации. Звуковой декодер включает основанный на применении окон сигнальный преобразователь, формируемый, чтобы отображать частотно-временное представление, описываемое кодированной звуковой информацией, на представлении временного интервала звукового содержания. Основанный на применении окон сигнальный преобразователь формируется, чтобы выбрать окно из множества окон, включающего окна различных наклонов перехода, и окна различных длин преобразования, на основе информации об окне. Звуковой декодер включает селектор окон, формируемый, чтобы оценить информацию об окне кодового слова переменной длины, чтобы выбрать окно для обработки данной части (например, фрейма) частотно-временного представления, связанного с данным фреймом звуковой информации.
Это осуществление изобретения основывается на обнаружении того, что скорость передачи битов, необходимая для хранения или передачи информации, указывающей, какой тип окна должен использоваться для преобразования представления частотно-временной области звукового содержания в представление временного интервала, может быть уменьшена посредством использования информации об окне кодового слова переменной длины. Было обнаружено, что информация об окне кодового слова переменной длины является подходящей, потому что информация, необходимая для выбора соответствующего окна, является подходящей для такого представления кодового слова переменной длины.
Например, при использовании информации об окне кодового слова переменной длины можно использовать тот факт, что имеется зависимость между выбором наклона перехода и выбором длины преобразования, потому что короткая длина преобразования обычно не используется для окна, имеющего один или два длинных наклона перехода. Соответственно, можно избежать передачи избыточной информации при использовании информации об окне кодового слова переменной длины, таким образом, повышая эффективность скорости передачи битов кодированной звуковой информации.
В качестве следующего примера следует заметить, что обычно существует корреляция между формами окон смежных фреймов, что также может использоваться для селективного уменьшения длины кодового слова информации об окне для случаев, когда тип окна дополнительных смежных окон (смежных с окном, рассматриваемым в настоящее время) ограничивает выбор типов окон для текущего фрейма.
Чтобы суммировать вышесказанное, использование информации об окне кодового слова переменной длины обеспечивает экономию скорости передачи битов без значительного увеличения сложности звукового декодера и без изменения формы исходящей волны звукового декодера (по сравнению с информацией об окне кодового слова постоянной длины). Кроме того, синтаксис кодированной звуковой информации может даже быть упрощен в некоторых случаях, что будет подробно обсуждено далее.
В предпочтительном осуществлении звуковой декодер включает анализатор битового потока, формируемый, чтобы анализировать битовый поток, представляющий кодированную звуковую информацию, и чтобы извлекать из битового потока одноразрядную информацию о длине наклона окна, и выборочно извлекать из битового потока одноразрядную информацию о длине преобразования, в зависимости от значения одноразрядной информации о длине наклона окна. В этом случае, селектор окна предпочтительно формируется, чтобы, в зависимости от информации о длине наклона окна, выборочно использовать или пренебрегать информацией о длине преобразования, чтобы выбрать окно для обработки данной части частотно-временного представления.
При использовании этой концепции может быть получено разделение между информацией о длине наклона окна и информацией о длине преобразования, которое способствует упрощению отображения в некоторых случаях. Кроме того, разделение информации об окне на обязательный бит длины наклона окна и бит длины преобразования, присутствие которого зависит от состояния бита длины наклона окна, обеспечивает очень эффективное уменьшение скорости передачи битов, которое может быть получено при сохранении достаточно простого синтаксиса битового потока. Соответственно, сложность анализатора битового потока сохраняется достаточно низкой.
В предпочтительном осуществлении селектор окон формируется, чтобы выбрать тип окна для обработки текущей части частотно-временной информации (например, текущий звуковой фрейм) в зависимости от типа окна, выбранного для обработки предыдущей части (например, предыдущего звукового фрейма) частотно-временной информации, таким образом, что длина левостороннего наклона окна для обработки текущей части частотно-временной информации согласуется с длиной правостороннего наклона окна, выбранного для обработки предыдущей части частотно-временной информации. При использовании этой информации скорость передачи битов, необходимая для выбора типа окна для обработки текущей части частотно-временной информации, является чрезвычайно малой, поскольку информация для выбора типа окна кодируется с чрезвычайно низкой сложностью. В частности, не обязательно «тратить» бит для кодирования длины левостороннего наклона окна, связанного с текущей частью частотно-временной информации. Соответственно, при использовании информации о длине правостороннего наклона окна, использовавшейся для обработки предыдущей части частотно-временной информации, могут использоваться два бита (например, обязательный бит длины наклона окна и факультативный бит длины преобразования) для выбора соответствующего окна из множества, состоящего более чем из четырех окон, которые могут быть выбраны. Таким образом, можно избежать ненужной избыточности и повысить эффективность скорости передачи битов кодированного битового потока.
В предпочтительном осуществлении селектор окон формируется, чтобы выбирать между первым типом окна и вторым типом окна в зависимости от значения одноразрядной информации о длине наклона окна, если длина правостороннего наклона окна для обработки предыдущей части частотно-временной информации получает "длинное" значение (показывающее большую длину наклона окна по сравнению с "коротким" значением, показывающим более короткую длину наклона окна) и если предыдущая часть частотно-временной информации, текущая часть частотно-временной информации и последующая часть частотно-временной информации - все кодируются в базовом режиме (в основной моде) частотной области.
Селектор окон также предпочтительно формируется, чтобы выбрать третий тип окна в ответ на первое значение (например, значение, равное "единице") одноразрядной информации о длине наклона окна, если длина правостороннего наклона окна для обработки предыдущей части частотно-временной информации получает "короткое" значение (как обсуждалось выше) и если предыдущая часть частотно-временной информации, текущая часть частотно-временной информации и последующая часть частотно-временной информации - все кодируются в базовом режиме (в основной моде) частотной области.
Кроме того, селектор окон также предпочтительно формируется, чтобы выбирать между четвертым типом окна и последовательностью окон (которая может рассматриваться как пятый тип окна) в зависимости от одноразрядной информации о длине преобразования, если одноразрядная информация о длине наклона окна получает второе значение (например, значение, равное "нулю"), показывающее короткий правосторонний наклон окна, и если длина правостороннего наклона окна для обработки предыдущей части частотно-временной информации получает "короткое" значение (как обсуждалось выше), и если предыдущая часть частотно-временной информации, текущая часть частотно-временной информации и последующая часть частотно-временной информации - все кодируются в базовом режиме (в основной моде) частотной области.
Для этого случая первый тип окна включает (сравнительно) большую длину левостороннего наклона окна, (сравнительно) большую длину правостороннего наклона окна и (сравнительно) большую длину преобразования; второй тип окна включает (сравнительно) большую длину левостороннего наклона окна, (сравнительно) короткую длину правостороннего наклона окна и (сравнительно) большую длину преобразования; третий тип окна включает (сравнительно) короткую длину левостороннего наклона окна, (сравнительно) большую длину правостороннего наклона окна и (сравнительно) большую длину преобразования; и четвертый тип окна включает (сравнительно) короткую длину левостороннего наклона окна, (сравнительно) короткую длину правостороннего наклона окна и (сравнительно) большую длину преобразования. «Последовательность окон» (или пятый тип окна) определяет последовательность или наложение множества подокон, связанных с одиночной частью (например, фрейм) частотно-временной информации; каждое множество подокон имеет (сравнительно) короткую длину преобразования, (сравнительно) короткую длину левостороннего наклона окна и (сравнительно) короткую длину правостороннего наклона окна. При использовании такого подхода в общей сложности пять типов окна (включая тип «последовательность окон») могут быть выбраны с использованием только двух битов, где одноразрядная информация (а именно, одноразрядная информация о длине наклона окна) является достаточной для сообщения об обычной последовательности множества окон, имеющих сравнительно большие длины и левостороннего, и правостороннего наклона окна. Наоборот, двухбитовая информация об окне необходима только при компоновке последовательности коротких окон («последовательность окон» или «пятый тип окна») и в течение расширенных во времени (на множестве фреймов) серий фреймов «последовательности окон».
Чтобы суммировать, вышеописанная концепция выбора типа окна из множества, состоящего, например, из пяти различных типов окон, обеспечивает значительное уменьшение необходимой скорости передачи битов. В то время как, традиционно, три выделенных бита необходимы, чтобы выбрать тип окна, например, из пяти типов окон, согласно данному изобретению для выполнения такого выбора необходим только один или два бита. Таким образом, может быть достигнута существенная экономия битов, что уменьшает необходимую скорость передачи битов и/или обеспечивает шанс улучшить качество звука.
В предпочтительном осуществлении селектор окна формируется, чтобы выборочно оценить бит длины преобразования информации об окне кодового слова переменной длины, только если тип окна для обработки предыдущей части (например, фрейма) частотно-временной информации имеет длину правостороннего наклона окна, соответствующую длине левостороннего наклона окна короткой последовательности окон, и если одноразрядная информация о длине наклона окна, связанная с текущей частью (например, текущий фрейм) частотно-временной информации, определяет длину правостороннего наклона окна, соответствующую длине правостороннего наклона окна короткой последовательности окна.
В предпочтительном осуществлении селектор окна далее формируется, чтобы получать информацию о предыдущем базовом режиме (основной моде), связанную с предыдущей частью (например, фрейм) звуковой информации и описывающую базовый режим (основную моду), использовавшийся для кодирования предыдущей части (например, фрейм) звуковой информации. В этом случае, селектор окна формируется, чтобы выбрать окно для обработки текущей части (например, фрейм) частотно-временного представления в зависимости от информации о предыдущем базовом режиме (основной моде), а также в зависимости от информации об окне кодового слова переменной длины, связанной с текущей частью частотно-временного представления. Таким образом, базовый режим (основная мода) предыдущего фрейма может использоваться, чтобы выбрать соответствующее окно для перехода (например, в форме операции наложения и добавления) между предыдущим фреймом и текущим фреймом. Снова, использование информации об окне кодового слова переменной длины очень выгодно, потому что снова можно сэкономить значительное количество битов. Особенно хорошая экономия может быть получена, если число типов окна, которое доступно (или допустимо) для кодированного звукового фрейма, например, в области линейного предсказания, является небольшим. Таким образом, часто имеется возможность использовать короткое кодовое слово из более длинного кодового слова и более короткого кодового слова при переходе между двумя различными базовыми режимами (основными модами) (например, между базовым режимом (основной модой) области линейного предсказания и базовым режимом (основной модой) частотной области).
В предпочтительном осуществлении селектор окна далее формируется, чтобы получать информацию о последующем базовом режиме (основной моде), связанную с последующей частью (или фреймом) звуковой информации и описывающую базовый режим (основную моду), использующийся для кодирования последующего фрейма звуковой информации. В этом случае, звуковой селектор предпочтительно формируется, чтобы выбирать окно для обработки текущей части (например, фрейм) частотно-временного представления в зависимости от информации о последующем базовом режиме (основной моде), а также в зависимости от информации об окне кодового слова переменной длины, связанной с текущей частью частотно-временного представления. Снова, информация об окне кодового слова переменной длины может использоваться в комбинации с информацией о последующем базовом режиме (основной моде), чтобы определить тип окна с требованием счета битов низкого уровня.
В предпочтительном осуществлении селектор окна формируется, чтобы выбирать окна, имеющие укороченный правосторонний наклон, если информация о последующем базовом режиме (основной моде) показывает, что последующий фрейм звуковой информации кодируется посредством использования базового режима (основной моды) области линейного предсказания. Таким образом, адаптация окон к переходу между базовым режимом (основной модой) частотной области и базовым режимом (основной модой) временного интервала может быть произведена без дополнительных усилий по передаче сигналов.
Другое осуществление согласно изобретению создает звуковое кодирующее устройство для предоставления кодированной звуковой информации на основе входной звуковой информации. Звуковое кодирующее устройство включает основанный на применении окон сигнальный преобразователь, формируемый, чтобы обеспечить последовательность параметров - звукового сигнала (например, представление частотно-временной области входной звуковой информации) на основе множества частей, реализуемых посредством организации окна (например, перекрывающиеся или неперекрывающиеся фреймы) входной звуковой информации. Основанный на применении окна сигнальный преобразователь предпочтительно формируется, чтобы адаптировать форму окна для получения реализуемых посредством организации окна частей входной звуковой информации в зависимости от характеристик входной звуковой информации. Основанный на применении окна сигнальный преобразователь формируется, чтобы переключаться между использованием окон, имеющих (сравнительно) более длинный наклон перехода, и окон, имеющих (сравнительно) более короткий наклон перехода, и также переключаться между использованием окон, имеющих две или более различные длины преобразования. Основанный на применении окна сигнальный преобразователь также формируется, чтобы определить тип окна, использовавшийся для преобразования текущей части (например, фрейма) входной звуковой информации в зависимости от типа окна, использовавшегося для преобразования предыдущей части (например, фрейма) входной звуковой информации и звукового содержания текущей части входной звуковой информации. Кроме того, звуковое кодирующее устройство формируется, чтобы кодировать информацию об окне, описывающую тип окна, использовавшегося для преобразования текущей части входной звуковой информации, посредством использования кодового слова переменной длины. Это звуковое кодирующее устройство обеспечивает преимущества, уже обсужденные в отношении изобретательного звукового декодера. В частности, имеется возможность уменьшить скорость передачи битов кодированной звуковой информации, избегая использования сравнительно длинного кодового слова в некоторых или всех ситуациях, когда это возможно.
Другое осуществление согласно изобретению создает кодированную звуковую информацию. Кодированная звуковая информация включает кодированное частотно-временное представление, описывающее звуковое содержание множества реализуемых посредством организации окна частей звукового сигнала. Окна различных наклонов перехода (например, длины наклона перехода) и различных длин преобразования связаны с различными реализуемыми посредством организации окна частями звукового сигнала. Кодированная звуковая информация также включает кодированную информацию об окне, кодирующую типы окон, использовавшихся для получения кодированных частотно-временных представлений множества реализуемых посредством организации окна частей звукового сигнала. Кодированная информация об окне является информацией о переменной длине окна, кодирующей один или более типов окон посредством использования первого, меньшего числа битов, и кодирующей один или более других типов окон посредством использования второго, большего числа битов. Эта кодированная звуковая информация предоставляет преимущества, уже обсужденные выше относительно изобретательного звукового декодера и изобретательного звукового кодирующего устройства.
Другое осуществление согласно изобретению создает способ предоставления декодированной звуковой информации на основе кодированной звуковой информации. Способ включает оценку информации об окне кодового слова переменной длины для выбора окна из множества окон, включающих окна различных наклонов перехода (например, различные длины наклона перехода) и окна различных длин преобразования, для обработки данной части частотно-временного представления, связанного с данным фреймом звуковой информации. Способ также включает отображение данной части частотно-временного представления, которое описывается кодированной звуковой информацией, на представлении временного интервала посредством использования выбранного окна.
Другое осуществление согласно изобретению создает способ предоставления кодированной звуковой информации на основе входной звуковой информации. Способ включает предоставление последовательности параметров звукового сигнала (например, представление частотно-временной области) на основе множества реализуемых посредством организации окна частей входной звуковой информации. Чтобы предоставить последовательность параметров звукового сигнала, выполняется переключение между использованием окон, имеющих более длинный наклон перехода, и окон, имеющих более короткий наклон перехода, а также между использованием окон, имеющих две или более различные длины преобразования, чтобы адаптировать формы окна для получения реализуемых посредством организации окна частей входной звуковой информации в зависимости от характеристик входной звуковой информации. Способ также включает кодирование информации об окне, описывающей тип окна, использовавшегося для преобразования текущей части входной звуковой информации, посредством использования кодового слова переменной длины.
Кроме того, осуществления согласно изобретению создают компьютерные программы для реализации указанных способов.
Краткое описание рисунков
Осуществления изобретения будут впоследствии описаны со ссылкой на приложенные рисунки, где:
Фиг.1 показывает блок-схему звукового кодирующего устройства согласно осуществлению изобретения;
Фиг.2 показывает блок-схему звукового декодера согласно осуществлению изобретения;
Фиг.3 показывает схематическое представление различных типов окна, которые могут использоваться в соответствии с изобретательной концепцией;
Фиг.4 показывает графическое представление допустимых переходов между окнами различных типов окна, которые могут быть применены в схеме осуществлений согласно изобретению;
Фиг.5 показывает графическое представление последовательности различных типов окна, которые могут быть произведены изобретательным кодирующим устройством или которые могут быть обработаны изобретательным звуковым декодером;
Фиг.6 показывает таблицу, представляющую предложенный синтаксис битового потока согласно осуществлению изобретения;
Фиг.6b показывает графическое представление отображения типа окна текущего фрейма на "windowjength" информации (о длине окна) и "transfbrm_length" информации (о длине преобразования);
Фиг.6с показывает графическое представление отображения для получения типа окна текущего фрейма на основе информации о предыдущем базовом режиме (основной моде), "window_length" информации (о длине окна) предыдущего фрейма, "window_length" информации (о длине окна) текущего фрейма и "transfbrm_length" информации (о длине преобразования) текущего фрейма;
Фиг.7а показывает таблицу, представляющую синтаксис "window_length" информации (о длине окна);
Фиг.7b показывает таблицу, представляющую синтаксис "transform_length" информации (о длине преобразования);
Фиг.7с показывает таблицу, представляющую новый синтаксис битового потока и переходы;
Фиг.8 показывает таблицу, дающую краткий обзор всех комбинаций "window_length" информации (о длине окна) и "transform_length" информации (о длине преобразования);
Фиг.9 показывает таблицу, представляющую экономию битов, которая может быть получена при использовании осуществления изобретения;
Фиг.10а показывает представление синтаксиса, так называемого блока исходных данных USAC;
Фиг.10b показывает представление синтаксиса, так называемого одноканального элемента;
Фиг.10 с показывает представление синтаксиса, так называемого двухканального элемента;
Фиг.10d показывает представление синтаксиса, так называемой информации ICS (системы информации и связи);
Фиг.10е показывает представление синтаксиса, так называемого потока канала частотной области;
Фиг.11 показывает блок-схему способа предоставления кодированной звуковой информации на основе входной звуковой информации; и
Фиг.12 показывает блок-схему способа предоставления декодированной звуковой информации на основе кодированной звуковой информации.
Детальное описание осуществлений
Краткий обзор звукового кодирующего устройства
Далее будет описано звуковое кодирующее устройство, в котором может быть применена изобретательная концепция. Однако следует заметить, что звуковое кодирующее устройство, описанное со ссылкой на фиг.1, должно рассматриваться только как пример звукового кодирующего устройства, в котором может быть применено изобретение. Однако даже при том, что сравнительно простое звуковое кодирующее устройство обсуждается со ссылкой на фиг.1, следует заметить, что изобретение может также применяться в намного более сложных звуковых кодирующих устройствах, например, в звуковых кодирующих устройствах, которые могут переключаться между различными базовыми режимами (основными модами) кодирования (например, между кодированием частотной области и кодированием области линейного предсказания). Однако, ради простоты, это кажется полезным для понимания основных идей простого звукового кодирующего устройства частотной области.
Звуковое кодирующее устройство, показанное на фиг.1, очень похоже на звуковое кодирующее устройство, описанное в международном стандарте ISO/IEC 14496-3:2005 (Е), часть 3, подраздел 4, а также в документах, на которые там имеется ссылка. Соответственно, ссылка должна быть сделана на указанный стандарт, документы, процитированные там и обширную литературу, имеющую отношение к звуковому кодированию MPEG.
Звуковое кодирующее устройство 100, показанное на фиг.1, формируется, чтобы получать входную звуковую информацию 110, например звуковой сигнал временного интервала. Звуковое кодирующее устройство 100 далее включает дополнительный препроцессор 120, формируемый, чтобы факультативно предварительно обрабатывать входную звуковую информацию 110, например, посредством субдискретизации входной звуковой информации 110 или посредством регулирования коэффициента усиления входной звуковой информации 110. Звуковое кодирующее устройство 100 также включает, в качестве ключевого компонента, основанный на применении окна сигнальный преобразователь 130, который формируется, чтобы получить входную звуковую информацию 110, или ее предварительно обработанную версию 122, и чтобы преобразовать входную звуковую информацию 110 или ее предварительно обработанную версию 122 в частотную область (или частотно-временную область), чтобы получить последовательность параметров звукового сигнала, которые могут быть спектральными значениями в частотно-временной области. С этой целью, основанный на применении окна сигнальный преобразователь 130 включает устройство управления окнами/преобразователь 136, который может формироваться, чтобы преобразовать блоки сэмплов (например, «фреймы») входной звуковой информации 110, 122 в совокупности спектральных значений 132. Например, устройство управления окнами/преобразователь 136 может формироваться, чтобы обеспечить одну совокупность спектральных значений для каждого блока сэмплов (то есть для каждого «фрейма») входной звуковой информации. Однако блоки сэмплов (то есть «фреймы») входной звуковой информации 110, 122 предпочтительно могут быть перекрывающимися, так чтобы смежные во времени блоки сэмплов (фреймы) входной звуковой информации 110, 122 совместно использовали множество сэмплов. Например, два последовательных во времени блока сэмплов (фреймы) могут перекрываться приблизительно 50% сэмплов. Соответственно, устройство управления окнами/преобразователь 136 может формироваться, чтобы выполнить так называемое перекрывающее преобразование, например модифицированное дискретное косинусное преобразование (MDCT). Однако, выполняя модифицированное дискретное косинусное преобразование, устройство управления окнами/преобразователь 136 может применять окно к каждому блоку сэмплов, посредством этого взвешивая центральные сэмплы (упорядоченные во времени поблизости от временного центра блока сэмплов) сильнее, чем периферийные сэмплы (упорядоченные во времени поблизости от ведущего и заднего конца блока сэмплов). Управление окнами может помочь избежать артефактов, которые возникают из сегментации входной звуковой информации 110, 122 на блоки. Таким образом, применение окон до или вовремя преобразования из временного интервала в частотно-временную область обеспечивает гладкий переход между последующими блоками сэмплов входной звуковой информации 110, 122. Детали относительно взвешивания снова могут быть найдены в международном стандарте ISO/IEC 14496, часть 3, подраздел 4 и в документах, на которые там делается ссылка. В очень простой версии звукового кодирующего устройства число 2N сэмплов звукового фрейма (определены как блок сэмплов) будут преобразованы в совокупность N спектральных коэффициентов, независимо от характеристик сигнала. Однако было обнаружено, что такая концепция, в которой используется постоянная длина преобразования 2N сэмплов звуковой информации 110, 122 независимо от характеристик входной звуковой информации 110, 122, приводит к серьезной деградации переходов, потому что в случае перехода, энергия перехода распространяется по всему фрейму при декодировании звуковой информации. Однако было обнаружено, что улучшение кодирования краев может быть получено, если выбирается более короткая длина преобразования (например, 2N/8=N/4 сэмплов на преобразование). Однако было также обнаружено, что выбор более короткой длины преобразования обычно увеличивает необходимую скорость передачи битов, даже если получается меньшее количество спектральных значений для более короткой длины преобразования, по сравнению с большей длиной преобразования. Соответственно, рекомендуется переключаться от большей длины преобразования (например, 2N сэмплов на преобразование) на короткую длину преобразования (например, 2N/8=N/4 сэмплов на преобразование) поблизости от перехода (также обозначаемого как край) звукового содержания и переключаться обратно на большую длину преобразования (например, 2N-сэмплов на преобразование) после перехода. Переключение длины преобразования связано с изменением окна, применяемого для управления окнами сэмплов входной звуковой информации 110, 122, до или вовремя преобразования.
Относительно этой проблемы следует заметить, что во многих случаях звуковое кодирующее устройство может использовать более двух различных окон. Например, так называемая "only_long_sequence" (только длинная последовательность) может использоваться для кодирования текущего звукового фрейма, если оба, и предыдущий фрейм (предшествующий рассматриваемому в настоящее время фрейму), и последующий фрейм (следующий за рассматриваемым в настоящее время фреймом) кодируются посредством использования большой длины преобразования (например, 2N сэмплов). Наоборот, так называемая "long_start_sequence" (длинная начальная последовательность) может использоваться в фрейме, который преобразуется посредством использования большой длины преобразования, которому предшествует фрейм, преобразованный посредством использования большой длины преобразования и за которым следует фрейм, преобразованный посредством использования короткой длины преобразования. В фрейме, который преобразуется посредством использования короткой длины преобразования, может быть применена так называемая "eight_short_sequence" (последовательность восьми коротких) последовательность окон, которая включает восемь коротких и перекрывающихся (под-) окон. Кроме того, так называемая "long_stop_sequence" (долгая конечная последовательность) последовательность окон может применяться для преобразования фрейма, который предшествует предыдущему фрейму, преобразованному посредством использования короткой длины преобразования, и за которым следует фрейм, преобразованный посредством использования большой длины преобразования. Детали относительно возможных последовательностей окон описаны в ISO/IEC 14496-3:2005 (Е), часть 3, подраздел 4. Кроме того, ссылка делается на фиг.3, 4, 5, 6, что далее будет объяснено более подробно.
Однако следует заметить, что в некоторых осуществлениях может использоваться один или более дополнительных типов окон. Например, может применяться так называемая "stop_start_sequence" (конечная начальная последовательность) последовательность окон, если текущему фрейму предшествует фрейм, в котором используется короткая длина преобразования, и если за текущим фреймом следует фрейм, в котором используется короткая длина преобразования.
Соответственно, основанный на применении окна сигнальный преобразователь 130 включает определитель последовательности окон 138, который формируется, чтобы предоставить информацию о типе окна 140 устройству управления окнами/п