Усовершенствованное гармоническое преобразование
Иллюстрации
Показать всеНастоящее изобретение относится к преобразованию сигналов во времени и/или по частоте и, в частности, к кодированию звуковых сигналов. Конкретнее, настоящее изобретение относится к способам высокочастотной реконструкции (HFR), включающим гармонический преобразователь в частотной области. Техническим результатом является повышение надежности системы преобразования сигнала, а также обеспечение улучшенного гармонического преобразования при малой дополнительной сложности. Описаны способ и система для генерирования преобразованного выходного сигнала из входного сигнала с использованием коэффициента преобразования Т. Система включает окно анализа длиной La, извлекающее кадр входного сигнала, и блок анализирующей трансформации порядка М, трансформирующий дискретные значения в М комплексных коэффициентов. М зависит от коэффициента преобразования Т. Система также включает блок нелинейной обработки, изменяющий фазу комплексных коэффициентов с использованием коэффициента преобразования Т, блок синтезирующей трансформации порядка М, трансформирующий измененные коэффициенты в М измененных дискретных значений, и окно синтеза длиной Ls, генерирующее кадр выходного сигнала νa(n). 6 н. и 31 з.п. ф-лы, 12 ил.
Реферат
ОБЛАСТЬ ТЕХНИЧЕСКОГО ПРИМЕНЕНИЯ
Настоящее изобретение относится к преобразованию сигналов по частоте и/или растягиванию/сжатию сигналов во времени и, в частности, к кодированию звуковых сигналов. Иными словами, настоящее изобретение относится к модификации в шкале времени и/или в шкале частот. Конкретнее, настоящее изобретение относится к способам высокочастотной реконструкции (HFR), включающим гармонический преобразователь в частотной области.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
Технологии HFR, такие как технология репликации спектральных полос (SBR), позволяют значительно улучшать эффективность кодирования традиционных кодеков воспринимаемых цифровых звуковых сигналов. В сочетании с MPEG-4 Advanced Audio Coding (AAC) она образует чрезвычайно эффективный кодек звуковых сигналов, который уже используется в системах ХМ Satellite Radio и Digital Radio Mondiale, а также стандартизован в 3 GPP, DVD Forum и др. Комбинация ААС и SBR называется aacPlus. Она является частью стандарта MPEG-4, где носит название High Efficiency AAC Profile (IIE-AAC). Вообще, технология HFR может сочетаться с любым кодеком воспринимаемых цифровых звуковых сигналов в порядке совместимости сверху вниз и снизу вверх, что, таким образом, предоставляет возможность модернизации уже установленных систем радиовещания, таких как система MPEG Layer-2, используемая в системе Eureka DAB. Способы HFR-преобразования также могут сочетаться с речевыми кодеками, позволяя кодировать широкополосные речевые сигналы со сверхнизкими скоростями битового потока.
Базовая идея, лежащая в основе HFR, основывается на наблюдении существования сильной корреляции между характеристиками высокочастотного диапазона сигнала и характеристиками низкочастотного диапазона того же сигнала. Поэтому хорошее приближение отображения высокочастотного диапазона оригинального входного сигнала может быть достигнуто путем преобразования сигнала из низкочастотного диапазона в высокочастотный диапазон.
Концепция преобразования как способа воссоздания высокочастотной полосы из низкочастотной полосы звукового сигнала была установлена в документе WO 98/57436, который ссылкой включается в настоящее описание. При использовании данной концепции для кодирования звуковых и/или речевых сигналов может быть достигнута значительная экономия скорости битового потока. В последующем описании будет делаться отсылка к кодированию звуковых сигналов, однако следует учитывать, что описываемые способы в равной степени применимы для кодирования речевых сигналов и для унифицированного кодирования звуковых и речевых сигналов (USAC).
В системе кодирования звуковых сигналов на основе HFR сигнал низкочастотного диапазона частот подается для кодирования в базовый кодировщик, воспроизводящий форму сигнала, а более высокие частоты регенерируются на стороне декодера с использованием преобразования сигнала низкого диапазона частот и дополнительной информации, которая, как правило, кодируется с чрезвычайно низкими скоростями битового потока и описывает форму целевого спектра. При низких скоростях битового потока, когда полоса пропускания базового кодированного сигнала является узкой, приобретает возрастающую важность воспроизведение или синтез высокочастотного диапазона, т.е. высокочастотного диапазона звукового сигнала, с приятными для восприятия характеристиками.
На известном уровне техники существует несколько способов высокочастотной реконструкции с использованием, например, гармонического преобразования или растягивания временной шкалы. Один из способов основывается на фазовых вокодерах, функционирующих по принципу выполнения частотного анализа с достаточно высокой разрешающей способностью по частоте. Перед повторным синтезом сигнала выполняется его модификация в частотной области. Модификация сигнала может представлять собой операцию растягивания шкалы времени или операцию преобразования.
Одной из основных трудностей, существующих в данных способах, являются противоречивые ограничения требуемой высокой разрешающей способности по частоте для достижения высококачественного преобразования стационарных звуков, и временной характеристики системы для коротких непериодических или ударных звуков. Иными словами, в то время как использование высокой разрешающей способности по частоте является благоприятным для преобразования стационарных сигналов, эта высокая разрешающая способность по частоте, как правило, требует больших размеров окон, что является пагубным при работе с короткими непериодическими частями сигнала. Один из подходов к преодолению этой трудности может представлять собой адаптивное изменение окон преобразователя, например, путем использования переключения окон, в зависимости от характеристик входного сигнала. Как правило, длинные окна используются для стационарных частей сигнала с целью достижения высокой разрешающей способности по частоте, в то время как короткие окна используются для коротких непериодических частей сигнала с целью реализации хорошей переходной характеристики преобразователя, т.е. его хорошей разрешающей способности по времени. Однако этот подход имеет тот недостаток, что критерии анализа сигнала, такие как критерий обнаружения короткого непериодического сигнала и т.п., должны быть включены в систему преобразования. Такие критерии анализа сигнала часто включают этап принятия решения, например, решения о присутствии короткого непериодического сигнала, которое запускает переключение режима обработки сигнала. Кроме того, эти критерии, как правило, оказывают влияние на надежность системы и могут вносить артефакты сигнала при переключении режима обработки сигнала, например, при переключении между размерами окон.
Настоящее изобретение решает вышеупомянутые проблемы, относящиеся к переходной характеристике гармонического преобразования без необходимости в переключении окон. Кроме того, достигается улучшенное гармоническое преобразование при малой дополнительной сложности.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Настоящее изобретение относится к проблеме улучшения переходной характеристики гармонического преобразования, а также к разного рода усовершенствованиям известных способов гармонического преобразования. Кроме того, настоящее изобретение описывает то, как дополнительная сложность может поддерживаться на минимальном уровне при условии сохранения предлагаемых улучшений.
Помимо прочих, настоящее изобретение может включать, по меньшей мере, одну из следующих особенностей:
- передискретизацию по частоте на множитель, зависящий от порядка преобразования в рабочей точке преобразователя;
- надлежащий выбор комбинации окон анализа и синтеза; и
- обеспечение выравнивания во времени различных преобразованных сигналов в тех случаях, когда сигналы комбинируются.
Согласно одной из особенностей изобретения описана система для генерирования преобразованного выходного сигнала из входного сигнала с использованием коэффициента преобразования Т. Преобразованный выходной сигнал может представлять собой растянутую во времени и/или сдвинутую по частоте версию входного сигнала. Преобразованный выходной сигнал может быть растянут во времени в Т раз относительно входного сигнала. В альтернативном варианте частотные составляющие преобразованного выходного сигнала могут быть сдвинуты вверх посредством коэффициента преобразования Т.
Система может включать окно анализа длиной L, которое извлекает L дискретных значений входного сигнала. Как правило, L дискретных значений входных сигналов являются дискретными значениями входного сигнала, например звукового сигнала, во временной области. Извлеченные L дискретных значений называются кадром входного сигнала. Система также включает блок анализирующей трансформации порядка M=F*L, преобразующий L дискретных значений во временной области в М комплексных коэффициентов, где F - коэффициент передискретизации по частоте. М комплексных коэффициентов, как правило, являются коэффициентами в частотной области. Анализирующая трансформация может представлять собой преобразование Фурье, быстрое преобразование Фурье, дискретное преобразование Фурье, вейвлетное преобразование или анализирующий этап блока (возможно, модулированных) фильтров. Коэффициент передискретизации F основывается на коэффициенте преобразования Т или является его функцией.
Операция передискретизации также может называться дополнением нулевыми значениями окна анализа на дополнительные (F-1)*L нулевых значений. Она также может рассматриваться как выбор размера анализирующей трансформации М, который в F раз больше размера окна анализа.
Система также может включать блок нелинейной обработки, изменяющий фазу комплексных коэффициентов с использованием коэффициента преобразования Т. Изменение фазы может включать умножение фазы комплексных коэффициентов на коэффициент преобразования Т. Кроме того, система может включать блок синтезирующей трансформации порядка М, преобразующий измененные коэффициенты в М измененных дискретных значений, и окно синтеза длиной L, предназначенное для генерирования выходного сигнала. Синтезирующая трансформация может представлять собой обратное преобразование Фурье, обратное быстрое преобразование Фурье, обратное дискретное преобразование Фурье, обратное вейвлетное преобразование или синтезирующий этап блока (возможно) модулированных фильтров. В основном, анализиру например, для достижения совершенной реконструкции входного сигнала, когда коэффициент преобразования Т=1.
Согласно другой особенности изобретения коэффициент передискретизации F пропорционален коэффициенту преобразования Т. В частности, коэффициент передискретизации F может быть больше или равен (T+1)/2. Такой выбор коэффициента передискретизации F гарантирует то, что нежелательные артефакты сигнала, например, опережающее и запаздывающее эхо, которые могут являться следствием преобразования, подавлялись окном синтеза.
Следует отметить, что, в более общих выражениях, длина окна анализа может быть La, а длина окна синтеза может быть Ls. Также в этом случае может оказаться полезным выбор порядка блока трансформации М на основе порядка преобразования Т, т.е. в зависимости от порядка преобразования Т. Кроме того, может оказаться полезным выбор М таким образом, чтобы он был больше среднего длины окна анализа и окна синтеза, т.е. больше (La+Ls)/2. В одном из вариантов осуществления изобретения разность между порядком блока трансформации М и средней длиной окна пропорциональна (Т-1). В еще одном варианте осуществления изобретения М выбирается так, чтобы он был больше или равен (TLa+Ls)/2. Следует отметить, что случай, когда длины окна анализа и окна синтеза равны, т.е. La=Ls=L, является частным случаем описанного выше общего случая. В общем случае коэффициент передискретизации F может представлять собой
F ≥ 1 + ( T − 1 ) L a L s + L a .
Система также может включать блок шага анализа, сдвигающий окно анализа по входному сигналу на шаг анализа из Sa дискретных значений. В результате блока шага анализа генерируется последовательность кадров входного сигнала. Кроме того, система может включать блок шага синтеза, сдвигающий окно синтеза и/или последовательные кадры выходного сигнала на шаг синтеза из Ss дискретных значений. В результате генерируется последовательность сдвинутых кадров выходного сигнала, которые могут накладываться и складываться в блоке наложения-сложения.
Иными словами, окно анализа может извлекать или выделять L или в более общем смысле La дискретных значений входного сигнала, например, путем умножения ряда из L дискретных значений входного сигнала на ненулевые коэффициенты окна. Этот ряд из L дискретных значений можно назвать кадром входного сигнала. Блок шага анализа сдвигает окно анализа по входному сигналу и, таким образом, выбирает другой кадр входного сигнала, т.е. он генерирует последовательность кадров входного сигнала. Дискретное расстояние между последовательными кадрами задается шагом анализа. Сходным образом, блок шага синтеза по индексу сдвигает окно синтеза и/или кадры выходного сигнала, т.е. он генерирует последовательность сдвинутых кадров выходного сигнала. Дискретное расстояние между последовательными кадрами выходного сигнала задается шагом синтеза. Выходной сигнал может определяться путем наложения последовательности кадров выходного сигнала и путем сложения дискретных значений, совпадающих во времени.
Согласно еще одной особенности изобретения шаг синтеза в Т раз больше шага анализа. В этом случае выходной сигнал соответствует входному сигналу, растянутому во времени посредством коэффициента преобразования Т. Иными словами, выбирая шаг синтеза, в Т раз больший, чем шаг анализа, можно получить сдвиг во времени или растягивание о времени выходного сигнала по отношению к входному сигналу. Этот сдвиг во времени имеет порядок Т.
Иными словами, вышеупомянутую систему можно описать следующим образом: с использованием блока окна анализа, блока анализирующей трансформации и блока шага анализа с шагом анализа Sa, из выходного сигнала можно определить комплект или последовательность наборов из М комплексных коэффициентов. Шаг анализа определяет количество дискретных значений, на которое окно анализа перемещается вперед по входному сигналу. Поскольку время, проходящее между двумя последовательными дискретными значениями, задается частотой дискретизации, шаг анализа также определяет время, проходящее между двумя кадрами входного сигнала. Как следствие, время, проходящее между двумя последовательными наборами из М комплексных коэффициентов также задается шагом анализа Sa.
После прохождения блока нелинейной обработки, где фаза комплексных коэффициентов может изменяться, например, путем ее умножения на коэффициент преобразования, комплект или последовательность наборов из М комплексных коэффициентов может преобразовываться обратно во временную область. Каждый набор из М измененных комплексных коэффициентов может трансформироваться в М измененных дискретных значений с использованием блока синтезирующей трансформации. В следующей операции наложения-сложения, включающей блок окна синтеза и блок шага синтеза с шагом синтеза Ss, комплект наборов из М измененных дискретных значений может накладываться и складываться для образования выходного сигнала. В операции наложения-сложения последовательные наборы из М измененных дискретных значений могут сдвигаться на Ss дискретных значений относительно друг друга перед тем, как они умножаются на окно синтеза и затем складываются, давая выходной сигнал. Соответственно, если шаг синтеза Ss в Т раз больше шага анализа Sa, сигнал может быть в T раз растянут во времени.
Согласно следующей особенности изобретения окно синтеза выводится из окна анализа и шага синтеза. В частности, окно синтеза может иметь вид формулы:
ν s ( n ) = ν a ( n ) ( ∑ k = − ∞ ∞ ( n − k ⋅ Δ t ) ) − 1 ,
где νs(n) - окно синтеза, νa(n) - окно анализа, Δt - шаг синтеза Ss. Окно анализа и/или окно синтеза может представлять окно Гаусса, косинусное окно, окно Хэмминга, окно Харма, прямоугольное окно, окна Бартлетта, окна Блэкмана, окно, имеющее функцию ν ( n ) = sin ( π L ( n + 0,5 ) ) , 0≤n<L, где в случае различающихся длин окна анализа и окна синтеза L может представлять собой, соответственно, La или Ls.
Согласно другой особенности изобретения система также включает блок стягивания, выполняющий, например, конверсию частоты дискретизации выходного сигнала посредством порядка преобразования Т, таким образом, давая преобразованный выходной сигнал. Выбирая шаг синтеза, в Т раз больший, чем шаг анализа, описанным выше способом может быть получен растянутый во времени выходной сигнал. Если увеличить частоту дискретизации растянутого во времени выходного сигнала в Т раз, или если подвергнуть растянутый во времени выходной сигнал понижающей дискретизации в Т раз, можно получить преобразованный выходной сигнал, который соответствует входному сигналу, сдвинутому по частоте посредством коэффициента преобразования Т. Операция понижающей дискретизации может включать этап выбора только некоторого подмножества дискретных значений выходного сигнала. Как правило, сохраняется только каждое Т-е дискретное значение. В альтернативном варианте частота дискретизации может быть увеличена в Т раз, т.е. частота дискретизации интерпретируется как в Т раз большая. Иными словами, повторная дискретизация или конверсия частоты дискретизации означает, что частота дискретизации изменяется или до большего или до меньшего значения. Понижающая дискретизация подразумевает конверсию частоты дискретизации до меньшего значения.
Согласно следующей особенности изобретения система может генерировать из входного сигнала второй выходной сигнал. Система может включать второй блок нелинейной обработки, изменяющий фазу комплексных коэффициентов с использованием второго коэффициента преобразования Т2, и второго блока шага синтеза, сдвигающего окно синтеза и/или кадры второго выходного сигнала на второй шаг синтеза. Изменение фазы может включать умножение фазы на коэффициент T2. Путем изменения фазы комплексных коэффициентов с использованием второго коэффициента преобразования, трансформации вторых измененных коэффициентов в М вторых измененных дискретных значений и применения второго окна синтеза из кадра входного сигнала могут генерироваться кадры второго выходного сигнала. Путем применения второго шага синтеза к последовательности кадров второго выходного сигнала в блоке наложения-сложения может генерироваться второй выходной сигнал.
Второй выходной сигнал может стягиваться во втором блоке стягивания, например, путем выполнения конверсии частоты дискретизации второго выходного сигнала посредством второго порядка преобразования Т2. Это дает второй преобразованный выходной сигнал. Таким образом, первый преобразованный выходной сигнал может генерироваться с использованием первого коэффициента преобразования Т, а второй преобразованный выходной сигнал может генерироваться с использованием второго коэффициента преобразования Т2. Эти преобразованные выходные сигналы могут быть объединены в блоке комбинирования, давая полный преобразованный выходной сигнал. Операция объединения может включать сложение двух преобразованных выходных сигналов. Указанное генерирование и комбинирование нескольких преобразованных выходных сигналов может оказаться полезным для получения хороших приближений высокочастотной составляющей сигнала, синтез которой необходимо осуществить. Следует отметить, что с использованием ряда порядков преобразования может быть синтезировано любое количество преобразованных выходных сигналов. Преобразованные выходные сигналы этого ряда затем могут быть объединены, например сложены, в блоке комбинирования, давая полный преобразованный выходной сигнал.
Может оказаться полезным взвешивание первого и второго преобразованных выходных сигналов перед объединением в блоке комбинирования. Взвешивание может выполняться так, чтобы энергия или энергия, приходящаяся на полосу пропускания, первого и второго преобразованных выходных сигналов соответствовала энергии или, соответственно, энергии, приходящейся на полосу пропускания, входного сигнала.
Согласно еще одной особенности изобретения система может включать блок выравнивания, который применяет смещение во времени к первому и второму преобразованным выходным сигналам перед их вхождением в блок комбинирования. Это смещение во времени может включать сдвиг двух преобразованных выходных сигналов друг относительно друга во временной области. Смещение во времени может зависеть от порядка преобразования и/или длины окон. В частности, смещение во времени может определяться как
( T − 2 L 4 ) .
Согласно другой особенности изобретения описанная выше система преобразования может внедряться в систему для декодирования принимаемого мультимедийного сигнала, включающего звуковой сигнал. Система декодирования может включать блок преобразования, который соответствует описанной выше системе, где входной сигнал, как правило, представляет собой низкочастотную составляющую звукового сигнала, а выходной сигнал является высокочастотной составляющей звукового сигнала. Иными словами, входной сигнал, как правило, представляет собой низкочастотный сигнал с определенной полосой пропускания, а выходной сигнал представляет собой сигнал, как правило, с более высокочастотной полосой пропускания. Кроме того, система может включать базовый декодер, предназначенный для декодирования низкочастотной составляющей звукового сигнала из принимаемого битового потока. Указанный базовый декодер может основываться на таких схемах кодирования, как Dolby E, Dolby Digital или ААС. В частности, указанная система декодирования может представлять собой телеприставку, предназначенную для декодирования принимаемого мультимедийного сигнала, включающего звуковой сигнал и другие сигналы, такие как видеосигнал.
Следует отметить, что настоящее изобретение также описывает способ преобразования входного сигнала посредством коэффициента преобразования Т. Способ соответствует описанной выше системе и может включать любую комбинацию упомянутых выше особенностей. Он может включать этапы извлечения дискретных значений входного сигнала с использованием окна анализа длиной L, и выбора коэффициента передискретизации F в зависимости от коэффициента преобразования Т. Также он может включать этапы трансформации L дискретных значений из временной области в частотную область, дающей F*L комплексных коэффициентов, и изменения фазы комплексных коэффициентов посредством коэффициента преобразования Т. На дополнительных этапах способ может трансформировать F*L измененных комплексных коэффициентов во временную область, давая F*L измененных дискретных значений, и генерировать выходной сигнал с использованием окна синтеза длиной L. Следует отметить, что способ также может быть адаптирован к общим длинам окон анализа и синтеза, т.е. к общим La и Ls, как описано выше.
Согласно еще одной особенности изобретения способ может включать этапы сдвига окна анализа на шаг анализа из Sa дискретных значений по входному сигналу и/или путем сдвига окна синтеза и/или кадров выходного сигнала на шаг синтеза из Ss дискретных значений. Выбирая шаг синтеза в Т раз больше, чем шаг анализа, выходной сигнал может быть растянут во времени в Т раз относительно выходного сигнала. При осуществлении дополнительного этапа выполнения конверсии частоты дискретизации выходного сигнала посредством порядка преобразования T может быть получен преобразованный выходной сигнал. Этот преобразованный выходной сигнал может включать частотные составляющие, которые сдвинуты вверх в Т раз относительно соответствующих частотных составляющих входного сигнала.
Способ также может включать этапы генерирования второго выходного сигнала. Эти этапы могут реализовываться путем изменения фазы комплексных коэффициентов с использованием второго коэффициента преобразования Т2 и путем сдвига окна синтеза и/или кадров второго выходного сигнала на второй шаг синтеза, с использованием второго коэффициента преобразования Т2 и второго шага синтеза может генерироваться второй выходной сигнал. Путем выполнения конверсии частоты дискретизации второго выходного сигнала посредством второго порядка преобразования T2 может генерироваться второй преобразованный выходной сигнал. В конечном итоге, объединяя первый и второй преобразованные выходные сигналы, можно получить объединенный или полный преобразованный выходной сигнал, включающий высокочастотные составляющие сигнала, генерируемые посредством двух или большего количества преобразований с разными коэффициентами преобразования.
Согласно другим особенностям изобретения изобретение описывает программу, реализованную программно, которая адаптирована для осуществления на процессоре и для выполнения этапов способа настоящего изобретения при исполнении на вычислительном устройстве. Изобретение также описывает носитель данных, включающий программу, реализованную программно, адаптированную для осуществления на процессоре и для выполнения этапов способа изобретения при исполнении на вычислительном устройстве. Кроме того, изобретение описывает компьютерный программный продукт, включающий выполняемые команды для выполнения способа изобретения при осуществлении на компьютере.
Согласно еще одной особенности описаны другой способ и система для преобразования входного сигнала посредством коэффициента преобразования Т. Эти способ и система могут использоваться автономно или в сочетании со способами и системами, описанными выше. Любая из особенностей, описанных в настоящем документе, может быть применена к этому способу/системе и наоборот.
Способ может включать этап извлечения кадра дискретных значений входного сигнала с использованием окна анализа длиной L. Затем кадр входного сигнала может трансформироваться из временной области в частотную область, давая М комплексных коэффициентов. Фаза комплексных коэффициентов может быть изменена посредством коэффициента преобразования Т, и М измененных комплексных коэффициентов могут преобразовываться во временную область, давая М измененных дискретных значений. В конечном итоге, с использованием окна синтеза длиной L может генерироваться кадр выходного сигнала. Способ и система могут использовать окно анализа и окно синтеза, которые отличаются друг от друга. Окна анализа и синтеза могут отличаться по форме, по длине, по количеству коэффициентов, определяющих окна и/или по значениям коэффициентов, определяющих окна. Таким образом, можно получить дополнительные степени свободы при выборе окон анализа и синтеза, и, таким образом, уменьшить или исключить эффект наложения спектров в преобразованном выходном сигнале.
Согласно другой особенности окно анализа и окно синтеза являются биортогональными относительно друг друга. Окно синтеза νs(n) может иметь вид:
ν s ( n ) = c ν a ( n ) s ( n ( mod Δ t s ) ) , 0≤n≤L,
где с - константа, νs(n) - окно (311) анализа, Δts - шаг по времени окна синтеза, и s(n) имеет вид:
s ( m ) = ∑ i = 0 L / ( Δ t s − 1 ) ν a 2 ( m + Δ t s i ) , 0≤m≤Δts.
Шаг по времени окна синтеза Δts обычно соответствует шагу синтеза Ss.
Согласно следующей особенности окно анализа выбирается таким образом, чтобы его z-преобразование имело два нулевых значения на единичной окружности. Предпочтительно, только z-преобразование окна анализа имеет два нулевых значения на единичной окружности. В качестве примера, окно анализа может представлять собой квадратичное синусное окно. В другом примере окно анализа длиной L может определяться путем свертки двух синусных окон длиной L, давая квадратичное синусное окно длиной 2L-1. На последующем этапе к квадратичному синусному окну присоединяется нулевое значение, давая базовое окно длиной 2L. В конечном счете, базовое окно может подвергаться повторной дискретизации с использованием линейной интерполяции, таким образом, давая в качестве окна анализа окно с четной симметрией длиной L.
Способы и системы, описываемые в настоящем документе, могут быть реализованы как программное обеспечение, встроенное программное обеспечение и/или аппаратное обеспечение. Некоторые компоненты могут реализовываться, например, как программное обеспечение, запускаемое на процессоре обработки цифровых сигналов или микропроцессоре. Другие компоненты могут реализовываться, например, как аппаратное обеспечение и/или как специализированные интегральные схемы. Сигналы, встречающиеся в описанных способах и системах, могут храниться на таких носителях, как оперативные запоминающие устройства или оптические носители информации. Они могут передаваться через такие сети, как радиосети, спутниковые сети, беспроводные сети или проводные сети, например Интернет. Типичными устройствами, использующими способ и систему, описанные в настоящем документе, являются дополнительные внешние устройства или другое оборудование на территории пользователя, которое декодирует звуковые сигналы. На стороне кодирования способ и система могут использоваться на радиовещательных станциях, например в видео- или телевизионных системах head end.
Следует отметить, что варианты осуществления и особенности изобретения, описанные в настоящем документе, могут комбинироваться произвольно. В частности, следует отметить, что особенности, описанные для системы, также применимы и к соответствующему способу, охватываемому настоящим изобретением. Кроме того, следует отметить, что раскрытие изобретения также охватывает комбинации пунктов формулы изобретения иные, чем пункты формулы изобретения, в прямой форме даваемые обратными отсылками в зависимых пунктах формулы изобретения, т.е. пункты формулы изобретения и их технические признаки могут комбинироваться в любом порядке и любой форме.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
Ниже настоящее изобретение будет описано посредством иллюстративных примеров, не ограничивающих объем и суть изобретения, с отсылкой к сопроводительным графическим материалам, на которых:
Фиг.1 иллюстрирует импульс Дирака в некотором определенном положении в том виде, как он проявляется в окнах анализа и синтеза гармонического преобразователя;
Фиг.2 иллюстрирует импульс Дирака в другом положении в том виде, как он проявляется в окнах анализа и синтеза гармонического преобразователя;
Фиг.3 иллюстрирует импульс Дирака для положения по фиг.2 в том виде, как он будет проявляется в соответствии с настоящим изобретением;
Фиг.4 иллюстрирует принцип работы декодера звуковых сигналов, усиленного HFR;
Фиг.5 иллюстрирует принцип работы гармонического преобразователя, использующего несколько порядков;
Фиг.6 иллюстрирует принцип работы гармонического преобразователя в частотной области (FD);
Фиг.7 показывает последовательность окон анализа и синтеза;
Фиг.8 иллюстрирует окна анализа и синтеза с различающимися шагами;
Фиг.9 иллюстрирует влияние повторной дискретизации на шаг окон синтеза;
Фиг.10 и 11 иллюстрируют, соответственно, варианты осуществления кодировщика и декодера, использующих усовершенствованные схемы гармонического преобразования, описываемые в настоящем документе; и
Фиг.12 иллюстрирует вариант осуществления блока преобразования, показанного на фиг.10 и 11.
ПОДРОБНОЕ ОПИСАНИЕ
Описываемые ниже варианты осуществления изобретения являются единственно иллюстрациями принципов настоящего изобретения для усовершенствованного гармонического преобразования. Следует понимать, что специалистам в данной области очевидны модификации описываемых здесь схем и подробностей. Поэтому намерение заключается в ограничении лишь объемом нижеследующей формулы изобретения, но не конкретными деталями, представленными с целью описания и разъяснения вариантов осуществления данного изобретения.
Ниже описывается принцип гармонического преобразования в частотной области и его предлагаемые усовершенствования согласно идеям настоящего изобретения. Ключевой составляющей гармонического преобразования является растягивание во времени посредством целочисленного коэффициента преобразования Т, которое оставляет без изменений частоту синусоид. Иными словами, гармоническое преобразование основывается на растягивании во времени в Т раз сигнала, подлежащего преобразованию. Растягивание во времени выполняется так, чтобы сохранялись частоты синусоид, составляющих входной сигнал. Растягивание времени может выполняться с использованием фазового вокодера. Фазовый вокодер основывается на представлении в частотной области, которое обеспечивается блоком оконных DFT-фильтров с окном анализа νa(n) и окном синтеза νs(n). Указанная анализирующая/синтезирующая трансформация также называется кратковременным преобразованием Фурье (STFT).
Кратковременное преобразование Фурье выполняется на входном сигнале во временной области с целью получения последовательности накладывающихся спектральных кадров. Для минимизации возможных эффектов полосы боковых частот должны быть выбраны надлежащие окна анализа/синтеза, например окна Гаусса, косинусные окна, окна Хэмминга, окна Харма, прямоугольные окна, окна Бартлетта, окна Блэкмана и др. Временная задержка, с которой каждый спектральный кадр выхватывается из входного сигнала, называется размером скачка или шагом. STFT-преобразование входного сигнала называется этапом анализа и приводит к представлению входного сигнала в частотной области. Представление входного сигнала в частотной области включает ряд сигналов поддиапазонов, где каждый сигнал поддиапазона представляет определенную частотную составляющую входного сигнала.
Представление входного сигнала в частотной области затем может быть обработано желаемым способом. С целью растягивания во времени входного сигнала может быть растянут во времени каждый сигнал поддиапазона, например, путем задержки дискретных значений сигнала поддиапазона. Это достигается путем использования размера скачка синтеза, который превышает размер скачка анализа. Сигнал во временной области можно восстановить путем выполнения обратного (быстрого) преобразования Фурье на всех кадрах с последующим последовательным накоплением кадров. Эта операция на этапе синтеза называется операцией наложения-сложения. Результирующий выходной сигнал представляет собой растянутую во времени версию входного сигнала и включает те же частотные составляющие, что и входной сигнал. Иными словами, результирующий выходной сигнал имеет тот же спектральный состав, что и входной сигнал, но является более медленным, чем входной сигнал, т.е. его прогрессия является растянутой во времени.
Преобразование в более высокие частоты может быть получено последовательно или интегрированным способом путем понижающей дискретизации растянутых сигналов. В результате преобразованный сигнал имеет такую же протяженность во времени, что и начальный сигнал, однако включает частотные составляющие, которые сдвинуты вверх посредством заранее заданного коэффициента преобразования.