2612584 - Управление фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках

Управление фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках

Иллюстрации

Показать все

Изобретение относится к средствам для управления фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках. Технический результат заключается в повышении качества аудиосигнала. Декодер содержит блок декодирования и блок регулировки фазы. Блок декодирования приспособлен для декодирования закодированного аудиосигнала для получения декодированного аудиосигнала. Блок регулировки фазы приспособлен для регулировки декодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала. Блок регулировки фазы выполнен с возможностью приема управляющей информации в зависимости от вертикальной фазовой когерентности закодированного аудиосигнала. Кроме того, блок регулировки фазы приспособлен для регулировки декодированного аудиосигнала на основании управляющей информации. 7 н. и 11 з.п. ф-лы, 9 ил.

Реферат

Настоящее изобретение относится к устройству и к способу генерации выходного аудиосигнала и, в частности, к устройству и к способу реализации управления фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках.

Обработка аудиосигналов становится все более и более важной. В частности, перцепционное аудиокодирование распространилось как основное, обеспечивающее возможность цифровой технологии для всевозможных областей применения, которые предоставляют потребителям звуковую и мультимедийную информацию с использованием каналов передачи или запоминания с ограниченной пропускной способностью. Необходимы модемные перцепционные аудиокодеки для доставки аудио удовлетворительного качества на все более и более низких скоростях передачи битов (битрейтах). В свою очередь, необходимо смириться с некоторыми искажениями вследствие кодирования, которые являются наиболее приемлемыми для большинства слушателей.

Одним из этих искажений является потеря фазовой когерентности по частоте ("вертикальной" фазовой когерентности), см. [8]. Для многих стационарных сигналов результирующее ухудшение субъективного качества аудиосигнала обычно весьма мало. Однако, в гармонических тональных звуках, состоящих из многих спектральных компонентов, воспринимаемых слуховой системой человека как одиночный составной объект, результирующее искажение восприятия является нежелательным.

Типичными сигналами, в которых важно сохранение вертикальной фазовой когерентности (VPC), являются следующие: вокализованная речь, медные инструменты или смычковые инструменты, например, ‘инструменты’, которые, по их характеру физической генерации звука создают звук, богатый его обертонами и синхронизированный по фазе между гармоническими обертонами. В особенности, на очень низких скоростях передачи битов, при которых ресурсы битов чрезвычайно ограничены, использование современных кодеков часто существенно ослабляет VPC спектральных компонентов. Однако, в упомянутых выше сигналах VPC является важным перцептивным слуховым ориентиром, и высокий VPC сигнала следует сохранять.

Ниже рассмотрено перцепционное аудиокодирование согласно современному уровню развития техники. На современном уровне развития техники при перцепционном аудиокодировании придерживаются нескольких общих тем, включая использование обработки во временной/частотной области, уменьшение избыточности (энтропийное кодирование) и устранение несоответствия путем явного использования перцепционных эффектов (см. [1]). Как правило, входной сигнал анализируют блоком анализирующих фильтров, который преобразовывает сигнал во временной области в спектральное представление, например, во временное/частотное представление. Преобразование в спектральные коэффициенты позволяет производить выборочную обработку составляющих сигнала в зависимости от их частотного состава, например, различные инструменты с их индивидуальными структурами обертонов.

Параллельно входной сигнал анализируют на предмет его перцепционных свойств. Например, может быть вычислен порог маскирования, зависящий от времени и частоты. Порог маскирования, зависящий от времени/частоты, может быть доставлен в блок квантования посредством целевого порога кодирования в виде значения абсолютной энергии или соотношения маска/сигнал (MSR) для каждой полосы частот и каждого временного кадра кодирования.

Спектральные коэффициенты, доставленные блоком анализирующих фильтров, квантуют для уменьшения скорости передачи данных, необходимой для представления сигнала. Этот этап подразумевает потери информации и вводит в сигнал искажение вследствие кодирования (ошибку, шум). Для минимизации слышимого влияния этого шума кодирования величинами шага квантователя управляют в соответствии с целевыми порогами кодирования для каждой полосы частот и каждого кадра. В идеальном случае шум кодирования, введенный в каждую полосу частот, является более низким, чем порог кодирования (маскирования), и, следовательно, ухудшение субъективного аудио не заметно (устранение несоответствия). Это управление шумом квантования по частоте и время в соответствии с психоакустическими требованиями приводит к сложному эффекту формирования шума, и это является тем, что делает кодер перцепционным аудиокодером.

После этого современные аудиокодеры выполняют энтропийное кодирование, например, кодирование по алгоритму Хаффмана (Huffman) или арифметическое кодирование, квантованных спектральных данных. Энтропийное кодирование является этапом кодирования без потерь, который дополнительно экономит скорость передачи битов.

Наконец, все закодированные спектральные данные и соответствующие дополнительные параметры, например, побочная информация, такая как, например, установочные параметры квантователя для каждой полосы частот, упаковывают вместе в поток битов, который является окончательным закодированным представлением, предназначенным для сохранения или передачи файла.

Теперь рассмотрим расширение полосы частот согласно современному уровню развития техники. При перцепционном аудиокодировании на основании блоков фильтров основная часть используемой скорости передачи битов обычно затрачивается на квантованные спектральные коэффициенты. Таким образом, на очень низких скоростях передачи битов может иметься недостаточное количество битов для представления всех коэффициентов с точностью, необходимой для достижения для воспроизведения без ухудшения восприятия. Таким образом, требования к низкой скорости передачи битов фактически устанавливают предел для полосы частот аудиосигнала, которая может быть получена путем перцепционного аудиокодирования.

Расширение полосы частот (см. [2]) устраняет это давнее фундаментальное ограничение. Основная идея расширения полосы частот состоит в дополнении перцепционного кодека с ограниченной полосой дополнительным высокочастотным процессором, который передает и восстанавливает пропущенное высокочастотное информационное содержимое в компактном параметрическом виде. Высокочастотное информационное содержимое может быть сгенерировано на основании модуляции модулирующего сигнала путем модуляции с одной боковой полосой, см., например [3], или на основании применения способов изменения высоты звука, как, например, в вокодере из [4].

Специально для низких скоростей передачи битов были разработаны схемы параметрического кодирования, которые кодируют синусоидальные компоненты (синусоиды) посредством компактного параметрического представления (см., например, [9], [10], [11] и [12]). В зависимости от конкретного кодера, оставшийся остаток дополнительно подвергают параметрическому кодированию или кодированию формы сигнала.

Ниже рассмотрено параметрическое пространственное аудиокодирование согласно современному уровню развития техники. Подобно расширению полосы частот аудиосигналов, при пространственном аудиокодировании (SAC) покидают область кодирования формы сигнала и вместо этого сосредотачиваются на доставке удовлетворяющей восприятию копии исходного пространственного звукового образа. Звуковая сцена, воспринятая слушателем-человеком, по существу, определяется различиями между сигналами в ухе слушателя (так называемыми интерауральными разностями) вне зависимости от того, состоит ли сцена из реальных источников звука или воспроизводится ли она через два или более громкоговорителей, проецирующих фантомный звук. Вместо дискретного кодирования аудиосигналов отдельных входных каналов система, основанная на SAC, захватывает пространственное изображение многоканального аудиосигнала в компактный набор параметров, которые могут использоваться для синтезирования высококачественного многоканального представления из переданного сигнала понижающего микширования (см., например, [5], [6] и [7]).

Вследствие его параметрического характера, пространственное аудиокодирование не является сохраняющим форму волны. Вследствие этого трудно добиться совершенно неухудшенного качества для аудиосигналов всех типов. Тем не менее, пространственное аудиокодирование является чрезвычайно мощным подходом, который обеспечивает значительный выигрыш при низких и промежуточных скоростях передачи битов.

Цифровые аудиоэффекты, такие как, например, эффекты растяжения по времени или изменения высоты звука, обычно получают путем применения способов во временной области, таких как синхронизированное наложение - добавление (SOLA), или путем применения способов в частотной области, например, путем использования вокодера. Кроме того, на современном уровне развития техники были предложены гибридные системы, которые применяют обработку SOLA в субполосах (поддиапазонах). Вокодеры и гибридные системы обычно повержены искажению, именуемому "расфазировкой" ("phasiness"), которое может быть приписано потере вертикальной фазовой когерентности. Некоторые публикации относятся к усовершенствованиям качества звука в алгоритмах растяжения по времени путем сохранения вертикальной фазовой когерентности там, где это важно (см., например, [14] и [15]).

Использование современных перцепционных аудиокодеков часто ослабляет вертикальную фазовую когерентность (VPC) спектральных составляющих аудиосигнала, в особенности, при низких скоростях передачи битов при применении способов параметрического кодирования. Однако, в некоторых сигналах VPC является важным перцептивным ориентиром. В результате, ухудшается качество восприятия таких звуков.

Современные аудиокодеры обычно ухудшают качество восприятия аудиосигналов вследствие пренебрежения важными свойствами фазы сигнала, который должен быть кодирован (см., например, [1]). Грубое квантование спектральных коэффициентов, переданных в аудиокодере, уже может изменять VPC декодированного сигнала. Кроме того, в особенности вследствие применения способов параметрического кодирования, таких как, например, расширение полосы частот (см. [2], [3] и [4]), параметрическое многоканальное кодирование (см., например, [5], [6] и [7]) или параметрическое кодирование синусоидальных компонентов (см. [9], [10], [11] и [12]), фазовая когерентность по частоте часто ухудшается.

Результатом является глухой звук, который, как кажется, приходит с далекого расстояния и, таким образом, вызывает небольшую вовлеченность слушателя [13]. Имеется множество типов составляющей сигнала, где важна вертикальная фазовая когерентность. Типичными сигналами, где важна VPC, являются, например, тональные сигналы с богатым содержанием гармонических обертонов, такие как, например, вокализованная речь, медные инструменты или смычковые инструменты.

Задачей настоящего изобретения является создание улучшенных концепций для обработки аудиосигналов и, в частности, для создания улучшенных концепций для управления фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках. Задача настоящего изобретения решена декодером по п. 1, кодером по п. 8, устройством по п. 14, системой по п. 15, способом декодирования по п. 16, способом кодирования по п. 17, способом обработки аудиосигнала по п. 18 и компьютерной программой по п. 19.

Предложен декодер для декодирования закодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала. Декодер содержит блок декодирования и блок регулировки фазы. Блок декодирования приспособлен для декодирования закодированного аудиосигнала для получения декодированного аудиосигнала. Блок регулировки фазы приспособлен для регулировки декодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала. Блок регулировки фазы выполнен с возможностью приема управляющей информации в зависимости от вертикальной фазовой когерентности закодированного аудиосигнала. Кроме того, блок регулировки фазы приспособлен для регулировки декодированного аудиосигнала на основании управляющей информации.

В варианте осуществления изобретения блок регулировки фазы может быть выполнен с возможностью регулировки декодированного аудиосигнала, когда управляющая информация указывает, что регулировка фазы активирована.

Блок регулировки фазы может быть выполнен с возможностью не регулировать декодированный аудиосигнал, когда управляющая информация указывает, что регулировка фазы деактивирована.

В другом варианте осуществления изобретения блок регулировки фазы может быть выполнен с возможностью приема управляющей информации, при этом управляющая информация содержит значение силы, указывающее силу регулировки фазы. Кроме того, блок регулировки фазы может быть выполнен с возможностью регулировки декодированного аудиосигнала на основании этого значения силы.

Согласно еще одному варианту осуществления изобретения, декодер может дополнительно содержать блок анализирующих фильтров для разложения декодированного аудиосигнала на множество субполосовых сигналов множества субполос. Блок регулировки фазы может быть выполнен с возможностью определения множества первых значений фазы множества субполосовых сигналов. Кроме того, блок регулировки фазы может быть приспособлен для регулировки закодированного аудиосигнала путем модифицирования по меньшей мере некоторых из множества первых значений фазы для получения вторых значений фазы отрегулированного по фазе аудиосигнала.

В другом варианте осуществления изобретения блок регулировки фазы может быть выполнен с возможностью регулировки по меньшей мере некоторых из значений фазы путем применения следующих формул:

pxʹ(f)=px(f)-dp(f), и

dp(f)=α*(p0(f)+const),

где f - частота, указывающая одну из субполос, которая имеет частоту f в качестве центральной частоты, где px(f) - одно из первых значений фазы одного из субполосовых сигналов одной из субполос, имеющей частоту f в качестве центральной частоты, где pxʹ(f) - одно из вторых значений фазы одного из субполосовых сигналов одной из субполос, имеющей частоту f в качестве центральной частоты, где const - первый угол в диапазоне -π ≤ const ≤ π, где α - вещественное число в диапазоне 0 ≤ α ≤ 1; и где p0(f) - второй угол в диапазоне -π ≤ p0(f) ≤ π, где второй угол p0(f) назначен упомянутой одной из субполос, имеющей частоту f качестве центральной частоты. В альтернативном варианте вышеупомянутая регулировка фазы также может быть выполнена путем умножения комплексного субполосового сигнала (например, комплексных спектральных коэффициентов дискретного преобразования Фурье) на экспоненциальный фазовый член e^-jdp(f)), где j - мнимая единица.

Согласно другому варианту осуществления изобретения, декодер может дополнительно содержать блок синтезирующих фильтров. Отрегулированным по фазе аудиосигналом может являться отрегулированный по фазе аудиосигнал спектральной области, представленный в спектральной области. Блок синтезирующих фильтров может быть выполнен с возможностью преобразования отрегулированного по фазе аудиосигнала спектральной области из спектральной области во временную область для получения отрегулированного по фазе аудиосигнала временной области.

В варианте осуществления изобретения декодер может быть выполнен с возможностью декодирования управляющей информации для VPC.

Кроме того, согласно другому варианту осуществления изобретения, декодер может быть выполнен с возможностью применения управляющей информации для получения декодированного сигнала с лучше сохраненной VPC, чем в обычных системах.

Кроме того, декодер может быть выполнен с возможностью манипулирования VPC, управляемого измерениями в декодере, и/или информацией активизации, содержащейся в потоке битов.

Кроме того, предложен кодер для кодирования управляющей информации на основании входного аудиосигнала. Кодер содержит блок преобразования, генератор управляющей информации и блок кодирования. Блок преобразования приспособлен для преобразования входного аудиосигнала из временной области в спектральную область для получения преобразованного аудиосигнала, содержащего множество субполосовых сигналов, назначенных множеству субполос. Генератор управляющей информации приспособлен для генерации управляющей информации так, чтобы управляющая информация указывала вертикальную фазовую когерентность преобразованного аудиосигнала. Блок кодирования приспособлен для кодирования преобразованного аудиосигнала и управляющей информации.

В варианте осуществления изобретения блок преобразования кодера содержит блок кохлеарных фильтров для преобразования входного аудиосигнала из временной области в спектральную область для получения преобразованного аудиосигнала, содержащего множество субполосовых сигналов.

Согласно еще одному варианту осуществления изобретения, генератор управляющей информации может быть выполнен с возможностью определения субполосовой огибающей для каждого из множества субполосовых сигналов для получения множества огибающих субполосовых сигналов. Кроме того, генератор управляющей информации может быть выполнен с возможностью генерации объединенной огибающей на основании множества огибающих субполосовых сигналов. Кроме того, генератор управляющей информации может быть выполнен с возможностью генерации управляющей информации на основании объединенной огибающей.

В другом варианте осуществления изобретения генератор управляющей информации может быть выполнен с возможностью генерации характеристического числа на основании объединенной огибающей. Кроме того, генератор управляющей информации может быть выполнен с возможностью генерации управляющей информации так, чтобы упомянутая управляющая информация указывала, что регулировка фазы активирована, когда характеристическое число превышает пороговое значение. Кроме того, генератор управляющей информации может быть выполнен с возможностью генерации управляющей информации так, чтобы упомянутая управляющая информация указывала, что регулировка фазы деактивирована, когда характеристическое число меньше или равно пороговому значению.

Согласно еще одному варианту осуществления изобретения, генератор управляющей информации может быть выполнен с возможностью генерации управляющей информации путем вычисления отношения среднего геометрического объединенной огибающей к среднему арифметическому объединенной огибающей.

В альтернативном варианте может быть выполнено сравнение максимального значения объединенной огибающей со средним значением объединенной огибающей. Например, может быть сформировано отношение "максимальное/среднее", например, отношение максимального значения объединенной огибающей к среднему значению объединенной огибающей.

В варианте осуществления изобретения генератор управляющей информации может быть выполнен с возможностью генерации управляющей информации так, чтобы упомянутая управляющая информация содержала значение силы, указывающее степень вертикальной фазовой когерентности субполосовых сигналов.

Кодер согласно варианту осуществления изобретения может быть выполнен с возможностью проведения измерения VPC на стороне кодера посредством, например, измерений фазы и/или производной фазы по частоте.

Кроме того, кодер согласно варианту осуществления изобретения может быть выполнен с возможностью проведения измерения перцепционной особенности вертикальной фазовой когерентности.

Кроме того, кодер согласно варианту осуществления изобретения может быть выполнен с возможностью выполнения получения информации об активации из результатов измерений особенности фазовой когерентности и/или VPC.

Кроме того, кодер согласно варианту осуществления изобретения может быть выполнен с возможностью извлечения частотно-временных адаптивных меток VPC или управляющей информации.

Кроме того, кодер согласно варианту осуществления изобретения может быть выполнен с возможностью определения компактного представления управляющей информации для VPC.

В вариантах осуществления изобретения управляющая информация для VPC может быть передана в потоке битов.

Кроме того, предложено устройство для обработки первого аудиосигнала для получения второго аудиосигнала. Это устройство содержит генератор управляющей информации и блок регулировки фазы. Генератор управляющей информации приспособлен для генерации управляющей информации так, чтобы управляющая информация указывала вертикальную фазовую когерентность первого аудиосигнала. Блок регулировки фазы приспособлен для регулировки первого аудиосигнала для получения второго аудиосигнала. Кроме того, блок регулировки фазы приспособлен для регулировки первого аудиосигнала на основании управляющей информации.

Кроме того, предложена система. Эта система содержит кодер согласно одному из описанных выше вариантов осуществления изобретения и по меньшей мере один декодер согласно одному из описанных выше вариантов осуществления изобретения. Кодер выполнен с возможностью преобразования входного аудиосигнала для получения преобразованного аудиосигнала. Кроме того, кодер выполнен с возможностью кодирования преобразованного аудиосигнала для получения закодированного аудиосигнала. Кроме того, кодер выполнен с возможностью кодирования управляющей информации, указывающей вертикальную фазовую когерентность преобразованного аудиосигнала. Кроме того, кодер выполнен с возможностью подачи закодированного аудиосигнала и управляющей информации в упомянутый по меньшей мере один декодер. По меньшей мере один декодер выполнен с возможностью декодирования закодированного аудиосигнала для получения декодированного аудиосигнала. Кроме того, по меньшей мере один декодер выполнен с возможностью регулировки декодированного аудиосигнала на основании закодированной управляющей информации для получения отрегулированного по фазе аудиосигнала.

В вариантах осуществления изобретения VPC может быть измерена на стороне кодера, передана как соответствующая компактная побочная информация совместно с закодированным аудиосигналом, и VPC сигнала восстанавливают в декодере. Согласно альтернативным вариантам осуществления изобретения, манипуляции с VPC выполняют в декодере под управлением управляющей информации, сгенерированной в декодере, и/или под управлением информации об активации, переданной из кодера в побочной информации. Обработка VPC может быть избирательной по частоте-времени, так что VPC восстанавливают только тогда, когда это полезно для восприятия.

Кроме того, предложен способ декодирования закодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала. Этот способ декодирования содержит следующее:

- принимают управляющую информацию, при этом управляющая информация указывает вертикальную фазовую когерентность закодированного аудиосигнала,

- декодируют закодированный аудиосигнал для получения декодированного аудиосигнала, и

- регулируют декодированный аудиосигнал для получения отрегулированного по фазе аудиосигнала, на основании управляющей информации.

Кроме того, предложен способ кодирования управляющей информации, на основании входного аудиосигнала. Этот способ кодирования содержит следующее:

- преобразовывают входной аудиосигнал из временной области в спектральную область для получения преобразованного аудиосигнала, содержащего множество субполосовых сигналов, назначенных множеству субполос,

- генерируют управляющую информацию так, что упомянутая управляющая информация указывает вертикальную фазовую когерентность преобразованного аудиосигнала, и

- кодируют преобразованный аудиосигнал и управляющую информацию.

Кроме того, предложен способ обработки первого аудиосигнала для получения второго аудиосигнала. Этот способ обработки содержит следующее:

- генерируют управляющую информацию так, что упомянутая управляющая информация указывает вертикальную фазовую когерентность первого аудиосигнала, и

- регулируют первый аудиосигнал на основании управляющей информации для получения второго аудиосигнала.

Кроме того, предложена компьютерная программа для реализации одного из вышеописанных способов, когда компьютерная программа выполняется в компьютере или в процессоре сигналов.

В вариантах осуществления изобретения предложены средства сохранения вертикальной фазовой когерентности (VPC) сигналов, когда обработка сигналов, кодирование или способ передачи оказали негативное влияние на VPC.

В некоторых вариантах осуществления изобретения предложенная в изобретении система измеряет VPC входного сигнала до его кодирования, передает надлежащую компактную побочную информацию вместе с закодированным аудиосигналом и восстанавливает VPC сигнала в декодере на основании переданной компактной побочной информации. В альтернативном варианте в способе, предложенном в изобретении, осуществляют манипуляции с VPC в декодере под управлением управляющей информации, сгенерированной в декодере и/или под управлением информации об активации, переданной из кодера в побочной информации.

В других вариантах осуществления изобретения VPC ухудшенного сигнала может быть обработана для восстановления его исходной VPC с использованием способа регулирования VPC, управление которой осуществляют путем анализа самого ухудшенного сигнала.

В обоих случаях упомянутая обработка может быть избирательной по частоте-времени, вследствие чего VPC восстанавливают только в том случае, когда это полезно для восприятия.

Улучшенное качество звука перцепционных аудио кодеров обеспечено при умеренных издержках на побочную информацию. Помимо перцепционных аудио кодеров, измерение и восстановление VPC также является полезным для цифровых аудио эффектов на основании фазовых вокодеров, таких как растяжение по времени или изменение высоты звука.

Варианты осуществления изобретения изложены в зависимых пунктах формулы изобретения.

Ниже описаны варианты осуществления изобретения со ссылкой на чертежи, на которых:

на Фиг. 1a проиллюстрирован декодер для декодирования закодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала, согласно варианту осуществления изобретения;

на Фиг. 1b проиллюстрирован декодер для декодирования закодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала, согласно другому варианту осуществления изобретения;

на Фиг. 2 проиллюстрирован кодер для кодирования управляющей информации на основании входного аудиосигнала согласно варианту осуществления изобретения;

на Фиг. 3 проиллюстрирована система согласно варианту осуществления изобретения, содержащая кодер и по меньшей мере один декодер;

на Фиг. 4 проиллюстрирована система аудиообработки с обработкой VPC согласно варианту осуществления изобретения;

на Фиг. 5 изображены перцепционный аудиокодер и декодер согласно варианту осуществления изобретения;

на Фиг. 6 проиллюстрирован генератор управления VPC согласно варианту осуществления изобретения;

на Фиг. 7 проиллюстрировано устройство обработки аудиосигнала для получения второго аудиосигнала согласно варианту осуществления изобретения, и

на Фиг. 8 проиллюстрирована система аудиообработки с обработкой VPC согласно другому варианту осуществления изобретения.

На Фиг. 1a проиллюстрирован декодер для декодирования закодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала, согласно варианту осуществления изобретения. Этот декодер содержит блок 110 декодирования и блок 120 регулировки фазы. Блок 110 декодирования приспособлен для декодирования закодированного аудиосигнала для получения декодированного аудиосигнала. Блок 120 регулировки фазы приспособлен для регулировки декодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала. Кроме того, блок 120 регулировки фазы выполнен с возможностью приема управляющей информации в зависимости от вертикальной фазовой когерентности (VPC) закодированного аудиосигнала. К тому же, блок 120 регулировки фазы приспособлен для регулировки декодированного аудиосигнала на основании управляющей информации.

В варианте осуществления изобретения из Фиг. 1a учитывают, что для некоторых аудиосигналов важно восстановить вертикальную фазовую когерентность закодированного сигнал. Например, когда участок аудиосигнала содержит вокализованную речь, медные инструменты или смычковые инструменты, то сохранение вертикальной фазовой когерентности является важным. Для этого блок 120 регулировки фазы приспособлен для приема управляющей информации, которая зависит от VPC закодированного аудиосигнала.

Например, когда участки закодированного сигнала содержат вокализованную речь, медные инструменты или смычковые инструменты, то VPC закодированного сигнал высока. В таких случаях управляющая информация может указывать, что регулировка фазы активирована.

Другие участки сигнала могут не содержать импульсоподобных тональных сигналов или переходов, и VPC таких участков сигнала может являться низкой. В таких случаях управляющая информация может указывать, что регулировка фазы деактивирована.

В других вариантах осуществления изобретения управляющая информация может содержать значение силы. Такое значение силы может указывать силу регулировки фазы, которую следует выполнить. Например, значением силы может являться значение α при условии 0 ≤ α ≤ 1. Если α=1 или является близким к 1, то это может указывать высокое значение силы. В этом случае блок 120 регулировки фазы выполняет существенные регулировки фазы. Если α является близким к 0, то блок 120 регулировки фазы выполняет лишь незначительные регулировки фазы. Если α=0, то блок 120 регулировки фазы вообще не выполняет какие-либо регулировки фазы.

На Фиг. 1b проиллюстрирован декодер для декодирования закодированного аудиосигнала для получения отрегулированного по фазе аудиосигнала, согласно другому варианту осуществления изобретения. Помимо блока 110 декодирования и блока 120 регулировки фазы, декодер из Фиг. 1b содержит блок 115 анализирующих фильтров и блок 125 синтезирующих фильтров.

Блок 115 анализирующих фильтров выполнен с возможностью разложения декодированного аудиосигнала на множество субполосовых сигналов множества субполос. Блок 120 регулировки фазы из Фиг. 1b может быть выполнен с возможностью определения множества первых значений фазы множества субполосовых сигналов. Кроме того, блок 120 регулировки фазы может быть приспособлен для регулировки закодированного аудиосигнала путем видоизменения, по меньшей мере, некоторых из множества первых значений фазы для получения вторых значений фазы отрегулированного по фазе аудиосигнала.

Отрегулированным по фазе аудиосигналом может являться отрегулированный по фазе аудиосигнал спектральной области, который представлен в спектральной области. Блок 125 синтезирующих фильтров из Фиг. 1b может быть выполнен с возможностью преобразования отрегулированного по фазе аудиосигнала спектральной области из спектральной области во временную область для получения отрегулированного по фазе аудиосигнала временной области.

На Фиг. 2 изображен соответствующий кодер для кодирования управляющей информации на основании входного аудиосигнала согласно варианту осуществления изобретения. Этот кодер содержит блок 210 преобразования, генератор 220 управляющей информации и блок 230 кодирования. Блок 210 преобразования приспособлен для преобразования входного аудиосигнала из временной области в спектральную область для получения преобразованного аудиосигнала, содержащего множество субполосовых сигналов, назначенных множеству субполос. Генератор 220 управляющей информации приспособлен для генерации управляющей информации так, что управляющая информация указывает вертикальную фазовую когерентность (VPC) преобразованного аудиосигнала. Блок 230 кодирования приспособлен для кодирования преобразованного аудиосигнала и управляющей информации.

Кодер из Фиг. 2 приспособлен для кодирования управляющей информации, которая зависит от вертикальной фазовой когерентности аудиосигнала, который должен быть кодирован. Для генерации управляющей информации блок 210 преобразования в кодере осуществляет преобразование входного аудиосигнала в спектральную область так, чтобы результирующий преобразованный аудиосигнал содержал множество субполосовых сигналов множества субполос.

После этого генератор 220 управляющей информации определяет информацию, которая зависит от вертикальной фазовой когерентности преобразованного аудиосигнала.

Например, генератор 220 управляющей информации может классифицировать конкретный участок аудиосигнала как участок сигнала, где VPC является высокой, и, например, установить значение α=1. Для других участков сигнала генератор 220 управляющей информации может классифицировать конкретный участок аудиосигнала как участок сигнала, где VPC является низкой, и, например, установить значение α=0.

В других вариантах осуществления изобретения генератор 220 управляющей информации может определять значение силы, которое зависит от VPC преобразованного аудиосигнала. Например, генератор управляющей информации может назначать значение силы, относящееся к рассматриваемому участку сигнала, где это значение силы зависит от VPC участка сигнала. На стороне декодера значение силы может быть затем использовано для определения того, следует ли выполнять только малые регулировки фазы, или следует ли выполнять сильные регулировки фазы применительно к значениям фазы в субполосе декодированного аудиосигнала для восстановления исходной VPC аудиосигнала.

На Фиг. 3 проиллюстрирован другой вариант осуществления изобретения. На Фиг. 3 приведена система. Эта система содержит кодер 310 и по меньшей мере один декодер. Несмотря на то, что на Фиг. 3 проиллюстрирован только один декодер 320, другие варианты осуществления изобретения могут содержать более одного декодера. Кодером 310 из Фиг. 3 может являться кодер из варианта осуществления изобретения, показанного на Фиг. 2. Декодером 320 из Фиг. 3 может являться декодер из варианта осуществления изобретения, показанного на Фиг. 1a, или из варианта осуществления изобретения, показанного на Фиг. 1b. Кодер 310 из Фиг. 3 выполнен с возможностью преобразования входного аудиосигнала для получения преобразованного аудиосигнала (не показан). Кроме того, кодер 310 выполнен с возможностью кодирования преобразованного аудиосигнала для получения закодированного аудиосигнала. Кроме того, кодер выполнен с возможностью кодирования управляющей информации, указывающей вертикальную фазовую когерентность преобразованного аудиосигнала. Кодер выполнен с возможностью подачи закодированного аудиосигнала и управляющей информации в упомянутый по меньшей мере один декодер.

Декодер 320 из Фиг. 3 выполнен с возможностью декодирования закодированного аудиосигнала для получения декодированного аудиосигнала (не показан). Кроме того, декодер 320 выполнен с возможностью регулирования декодированного аудиосигнала на основании закодированной управляющей информации для получения отрегулированного по фазе аудиосигнала.

Суммируя вышеизложенное, в вышеописанных вариантах осуществления изобретения стремятся сохранить вертикальную фазовую когерентность сигналов, в особенности, в участках сигнала с высокой степенью вертикальной фазовой когерентности.

Предложенные концепции улучшают качество восприятия, предоставляемое системой аудиообработки, ниже также именуемой "аудиосистемой", за счет измерения характеристики VPC сигнала, вводимого в систему аудиообработки, и за счет регулирования VPC выходного сигнала, созданного аудиосистемой, на основании измеренных характеристик VPC для формирования конечного выходного сигнала так, что достигается предполагаемая VPC конечного выходного сигнала.

На Фиг. 4 показана общая система аудиообработки, усовершенствованная посредством вышеописанного варианта осуществления изобретения. В частности, на Фиг. 4 изображена система для обработки VPC. По входному сигналу аудиосистемы 410 генератор 420 управления VPC измеряет VPC и/или ее перцепционную особенность, и генерирует управляю

Управление фазовой когерентностью для гармонических сигналов в перцепционных аудиокодеках

Патент 2612584