Гармоническое преобразование на основе блока поддиапазонов, усиленное перекрестными произведениями
Иллюстрации
Показать всеИзобретение относится к системам кодирования источников звукового сигнала. Технический результат состоит в эффективной реализации высокочастотной реконструкции (HFR) путем усиления перекрестными произведениями, где новая составляющая с частотой QΩ+rΩ0 генерируется на основе существующих составляющих с частотами Ω и Ω+Ω0. Для этого предусмотрено гармоническое преобразование на основе блока поддиапазонов, где временной блок комплекснозначных дискретных значений поддиапазонов обрабатывается путем общеизвестной модификации фаз. Суперпозиция нескольких модифицированных дискретных значений дает результирующий эффект ограничения нежелательных комбинационных составляющих, посредством чего делается возможным использование более грубой разрешающей способности по частоте и/или меньшей степени передискретизации. В одном из вариантов осуществления изобретение дополнительно содержит оконную функцию, пригодную для использования с HFR на основе блока поддиапазонов, усиленной перекрестными произведениями. Аппаратный вариант осуществления изобретения может включать блок (101) анализирующих фильтров, конфигурируемый управляющими данными (104) модуль (102) обработки поддиапазонов и блок (103) синтезирующих фильтров. 3 н. и 60 з.п. ф-лы, 9 ил.
Реферат
ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение относится к системам кодирования источников звукового сигнала, которые применяют способ гармонического преобразования для высокочастотной реконструкции (HFR) в процессорах цифровых эффектов, таких как эксайтеры, которые генерируют гармоническое искажение для добавления яркости в обрабатываемый сигнал, и в устройствах растягивания временной шкалы, которые увеличивают длительность сигнала с сохранением спектрального состава.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
В документе WO 98/57436 концепция преобразования была установлена как способ воссоздания высокочастотной полосы из низкочастотной полосы звукового сигнала. Путем использования этой концепции можно получить значительную экономию битовой скорости передачи данных при кодировании звукового сигнала. В системе кодирования звукового сигнала на основе HFR сигнал с низкочастотной полосой пропускания передается в базовый кодер формы сигнала, и более высокие частоты регенерируются с использованием преобразования и дополнительной вспомогательной информации, передаваемой с очень низкой битовой скоростью передачи данных, которая описывает целевую форму спектра на стороне декодера. Для низких битовых скоростей передачи данных, когда полоса пропускания базового кодированного сигнала является узкой, приобретает возрастающую важность воссоздание высокочастотной полосы с приятными для восприятия характеристиками. Гармоническое преобразование, определенное в документе WO №98/57436, очень хорошо выполняется для сложного музыкального материала в ситуации с низкой частотой перехода. Принцип гармонического преобразования заключается в том, что синусоида с частотой ω отображается в синусоиду с частотой Qφω, где Qφ больше 1 - целое число, определяющее порядок преобразования. Для сравнения, HFR на основе модуляции сигнала с одной боковой полосой отображает синусоиду с частотой ω в синусоиду с частотой ω+Δω, где Δω - фиксированный сдвиг частоты. Для любого данного базового сигнала с низкой полосой пропускания, в результате преобразования SSB будет возникать артефакт диссонирующего звона.
С целью достижения наилучшего возможного качества звукового сигнала способы высококачественной гармонической HFR на современном уровне техники используют для достижения требуемого качества звука блоки комплексных модулированных фильтров с очень высокой разрешающей способностью по частоте и высокой степенью передискретизации. Высокая разрешающая способность необходима для того, чтобы избежать нежелательного интермодуляционного искажения, возникающего в результате нелинейной обработки сумм синусоид. При достаточной узости поддиапазонов высококачественные способы стремятся к тому, чтобы в каждом поддиапазоне содержалось не более одной синусоиды. Высокая степень передискретизации по времени необходима для того, чтобы избежать искажений из-за недостаточной частоты дискретизации, а определенная степень передискретизации по частоте необходима для того, чтобы избежать опережающего эха для переходных сигналов. Очевидным недостатком является, то что вычислительная сложность становится при этом очень высокой.
Другой общеизвестный недостаток, связанный с гармоническими преобразованиями, проявляется для сигналов с выраженной периодической структурой. Эти сигналы представляют собой суперпозиции гармонически связанных синусоид с частотами Ω, 2Ω, 3Ω…, где Ω - основная частота. При гармоническом преобразовании порядка Qφ выходные синусоиды имеют частоты QφΩ, 2QφΩ, 3QφΩ…, что в случае Qφ, больше 1 представляет собой строгое подмножество желаемого полного гармонического ряда. В отношении результирующего качества звука, как правило, будет восприниматься «паразитный» основной тон, соответствующий преобразованной основной частоте QφΩ. Часто гармоническое преобразование приводит к «металлическому» характеру звучания кодированного и декодированного звукового сигнала.
В документе WO 2010/081892, который ссылкой включается в настоящее описание, для обращения к решению описанной выше проблемы «паразитного» основного тона в случае высококачественного преобразования был разработан способ перекрестных произведений. Для заданной частичной или полной передаваемой информации о значении основной частоты преобладающей гармонической части сигнала, подлежащего преобразованию с высокой точностью, нелинейные модификации поддиапазонов дополняются нелинейными комбинациями по меньшей мере двух различных анализируемых поддиапазонов, где расстояния между индексами анализируемых поддиапазонов связаны с основной частотой. В результате генерируются недостающие гармоники преобразованного выходного сигнала, что, однако, происходит со значительными вычислительными затратами.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В виду описанных выше недостатков имеющихся в наличии способов HFR целью настоящего изобретения является создание более эффективной реализации HFR, усиленной перекрестными произведениями. В частности, целью является создание указанного способа, который допускал бы воспроизведение звукового сигнала с высокой точностью при условии снижения вычислительных затрат по сравнению с имеющимися в доступе способами.
Настоящее изобретение достигает, по меньшей мере, одной из этих целей путем создания устройств и способов согласно независимым пунктам формулы изобретения.
В первом аспекте изобретение предусматривает систему, сконфигурированную для генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала. Система содержит:
- блок анализирующих фильтров, сконфигурированный для получения из входного сигнала некоторого количества Y сигналов анализируемых поддиапазонов, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;
- модуль обработки поддиапазонов, сконфигурированный для определения сигнала синтезируемого поддиапазона исходя из Y сигналов анализируемых поддиапазонов с использованием коэффициента Q преобразования поддиапазонов и коэффициента S растягивания поддиапазонов, где по меньшей мере один из коэффициентов Q и S больше единицы, причем модуль обработки поддиапазонов включает:
- экстрактор блоков, сконфигурированный для:
- i) формирования Y кадров, состоящих из L входных дискретных значений, где каждый кадр извлекается из указанного ряда комплекснозначных дискретных значений в сигнале анализируемого поддиапазона, и длина кадра L больше 1; и
- ii) применения величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед формированием следующего кадра, состоящего из L входных дискретных значений, посредством чего генерируется последовательность кадров входных дискретных значений;
- модуль нелинейной обработки кадров, сконфигурированный для генерирования на основе Y соответствующих кадров входных дискретных значений, сформированных в экстракторе блоков, кадра обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для по меньшей мере одного обрабатываемого дискретного значения:
- i) фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и
- ii) амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений; и
- модуль наложения и сложения, сконфигурированный для определения сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений;
и
- блок синтезирующих фильтров, сконфигурированный для генерирования растянутого во времени и/или преобразованного по частоте сигнала из сигнала синтезируемого поддиапазона.
Система может действовать при любом положительном целочисленном значении Y. Однако она действует при, по меньшей мере, Y=2.
Во втором аспекте изобретение предусматривает способ генерирования растянутого во времени и/или преобразованного по частоте сигнала из входного сигнала. Способ включает:
- получение из входного сигнала некоторого количества Y>2 сигналов анализируемых поддиапазонов, где каждый сигнал анализируемого поддиапазона включает ряд комплекснозначных анализируемых дискретных значений, каждое из которых имеет фазу и амплитуду;
- формирование Y кадров, состоящих из L входных дискретных значений, где каждый кадр извлекается из указанного ряда комплекснозначных анализируемых дискретных значений в сигнале анализируемого поддиапазона, и длина кадра L более 1;
- применение величины скачка блока из h дискретных значений к указанному ряду анализируемых дискретных значений перед получением следующего кадра, состоящего из L входных дискретных значений, посредством чего генерируется последовательность кадров входных дискретных значений;
- генерирование на основе Y соответствующих кадров входных дискретных значений кадра обрабатываемых дискретных значений путем определения фазы и амплитуды для каждого обрабатываемого дискретного значения кадра, где для, по меньшей мере, одного обрабатываемого дискретного значения:
- фаза обрабатываемого дискретного значения основывается на соответствующих фазах соответствующего входного дискретного значения по меньшей мере в одном из Y кадров входных дискретных значений; и
- амплитуда обрабатываемого дискретного значения основывается на амплитуде соответствующего входного дискретного значения в каждом из Y кадров входных дискретных значений;
- определение сигнала синтезируемого поддиапазона путем наложения и сложения дискретных значений из последовательности кадров обрабатываемых дискретных значений; и
- генерирование растянутого во времени и/или преобразованного по частоте сигнала из сигнала синтезируемого поддиапазона.
Здесь Y - произвольное целое число больше единицы. Система согласно первому аспекту действует для осуществления способа, по меньшей мере, для Y=2.
Третий аспект изобретения предусматривает компьютерный программный продукт, который включает машиночитаемый носитель данных (или информационный носитель), в памяти которого хранятся команды программного обеспечения, предназначенные для того, чтобы вызывать исполнение программируемым компьютером способа согласно второму аспекту.
Изобретение основывается на понимании того, что общая концепция HFR, усиленной перекрестными произведениями, будет обеспечивать улучшенные результаты тогда, когда обрабатываются данные, упорядоченные в блоки, которые состоят из комплексных дискретных значений поддиапазонов. Помимо прочего, это делает возможным применение к дискретным значениям покадрового сдвига по фазе, что, как было обнаружено, в некоторых ситуациях ослабляет комбинационные составляющие. Также возможно применение регулировки амплитуды, что может приводить к похожим полезным эффектам. Реализация усиленной перекрестными произведениями HFR согласно изобретению включает гармоническое преобразование на основе блока поддиапазонов, что может значительно ослаблять комбинационные составляющие. Поэтому, несмотря на сохранение высокого воспринимаемого качества, может использоваться блок фильтров (такой как блок QMF-фильтров) с более грубой разрешающей способностью по частоте и/или меньшей степенью передискретизации. При обработке на основе блока поддиапазонов временной блок комплексных дискретных значений поддиапазонов обрабатывается путем общеизвестной модификации фаз, а суперпозиция нескольких модифицированных дискретных значений при формировании выходного дискретного значения поддиапазона дает совокупный эффект подавления комбинационных составляющих, которые иначе возникают тогда, когда сигнал входного поддиапазона состоит из нескольких синусоид. Преобразование, основанное на обработке поддиапазона на основе блока, имеет намного меньшую вычислительную сложность, чем у преобразователей с высокой разрешающей способностью, и для многих сигналов достигает почти такого же качества.
Для цели данного раскрытия отметим, что в вариантах осуществления изобретения, где Y>2, модуль нелинейной обработки использует в качестве входного сигнала Y «соответствующих» кадров входных дискретных значений в том смысле, что кадры являются синхронными или почти синхронными. Например, дискретные значения в соответствующих кадрах могут относиться к промежуткам времени, имеющим значительное перекрывание по времени между кадрами. Термин «соответствующие» также используется в отношении дискретных значений для указания того, что они являются синхронными или приблизительно являются таковыми. Кроме того, термин «кадр» будет использоваться взаимозаменяемо с термином «блок». Соответственно, «величина скачка блока» может быть равна длине кадра (возможно, скорректированной в отношении понижающей дискретизации, если она применяется) или может быть меньше длины кадра (возможно, скорректированной в отношении понижающей дискретизации, если она применяется), и в этом случае последовательные кадры накладываются в том смысле, что входное дискретное значение может принадлежать более чем одному кадру. Система необязательно генерирует каждое обрабатываемое дискретное значение в кадре путем определения его фазы и амплитуды на основе фазы и амплитуды всех Y соответствующих кадров входных дискретных значений; без отступления от изобретения система может генерировать фазу и/или амплитуду некоторых обрабатываемых дискретных значений на основе меньшего количества соответствующих входных дискретных значений или на основе только одного входного дискретного значения.
В одном из вариантов осуществления изобретения, блок анализирующих фильтров представляет собой блок квадратурных зеркальных фильтров (QMF), или блок псевдо-QMF, с любым количеством звеньев и точек. Например, он может представлять собой 64-точечный блок QMF. Блок анализирующих фильтров также может выбираться из класса оконных дискретных преобразований Фурье или вейвлет-преобразований. Преимущественно, блок синтезирующих фильтров согласуется с блоком анализирующих фильтров, являясь, соответственно, блоком обратных QMF, блоком обратных псевдо-QMF и т.д. Известно, что указанные блоки фильтров могут обладать достаточно грубой разрешающей способностью по частоте и/или относительно низкой степенью передискретизации. В отличие от текущего уровня техники, изобретение может осуществляться с использованием указанных относительно более простых компонентов, необязательно страдая от понижения качества на выходе; таким образом, указанные варианты осуществления изобретения обладают экономическим преимуществом перед текущим уровнем техники.
В одном из вариантов осуществления изобретения, для блока анализирующих фильтров верно одно или несколько следующих утверждений:
- шаг анализа по времени - ΔtA;
- разнос анализируемых частот - ΔƒA;
- блок анализирующих фильтров включает N>1 анализируемых поддиапазонов, индексируемых по индексу анализируемого поддиапазона n=0, …, N-1;
- анализируемый поддиапазон связан с одной из частотных полос входного сигнала.
В одном из вариантов осуществления изобретения, для блока синтезирующих фильтров верно одно или несколько следующих утверждений:
- шаг синтеза по времени - Δts;
- разнос синтезируемых частот - Δƒs;
- блок синтезирующих фильтров включает М>1 синтезируемых поддиапазонов, индексируемых по индексу синтезируемого поддиапазона m=0, …, М-1;
- синтезируемый поддиапазон связан с одной из частотных полос сигнала, растянутого во времени и/или преобразованного по частоте.
В одном из вариантов осуществления изобретения, модуль нелинейной обработки кадров адаптирован для ввода двух кадров (Y=2) с целью генерирования одного кадра обрабатываемых дискретных значений, и модуль обработки поддиапазонов включает модуль управления перекрестной обработкой, предназначенный для генерирования данных управления перекрестной обработкой. Определяя количественные и/или качественные характеристики обработки поддиапазонов таким образом, изобретение добивается гибкости и приспособляемости. Управляющие данные могут определять поддиапазоны (например, идентифицируемые по индексам), которые отличаются по частоте от основной частоты входного сигнала. Иными словами, индексы, идентифицирующие поддиапазоны, могут отличаться на целое число, служащее приближением частного указанной основной частоты, деленной на разнос анализируемых частот. Это будет приводить к приятному с психоакустической точки зрения выходному сигналу, поскольку новые спектральные составляющие, генерируемые путем гармонического преобразования, будут совместимы с рядом натуральных гармоник.
В дальнейшем развитии предшествующего варианта осуществления изобретения индексы (входного) анализируемого и (выходного) синтезируемого поддиапазонов выбираются так, чтобы удовлетворялось приводимое ниже уравнение (16). Появляющийся в этом уравнении параметр σ делает его применимым как к неравномерно, так и к равномерно скомпонованным блокам фильтров. Если индексы поддиапазонов получаются как приближенное (например, по методу наименьших квадратов) решение уравнения (16), новая спектральная составляющая, получаемая путем гармонического преобразования, вероятно, будет совместима с рядом натуральных гармоник. Таким образом, HFR, вероятно, будет обеспечивать достоверную реконструкцию оригинального сигнала, из которого было устранено высокочастотное содержимое.
Дальнейшее развитие предшествующего варианта осуществления изобретения предусматривает способ выбора параметра r, появляющегося в уравнении (16), и представления порядка преобразования с перекрестными произведениями. Для заданного индекса m выходного поддиапазона каждое значение порядка r преобразования будет определять два индекса n, n2 анализируемых поддиапазонов. Такое дальнейшее развитие оценивает амплитуды двух указанных поддиапазонов для некоторого количества r вариантов и выбирает то значение, которое дает максимизацию минимальной из двух амплитуд анализируемых поддиапазонов. Такой способ выбора индексов может позволить избежать необходимости в воссоздании достаточной величины амплитуды путем усиления слабых составляющих входного сигнала, что на выходе может приводить к низкому качеству. В этой связи, амплитуды поддиапазонов могут рассчитываться способом, который известен сам по себе, таким как квадратный корень из квадратов входных дискретных значений, образующих кадр (блок) или часть кадра. Амплитуда поддиапазона также может рассчитываться как амплитуда центрального, или ближайшего к центральному, дискретного значения в кадре. Такой расчет может создавать простой, но в то же время адекватный количественный показатель амплитуды.
В дальнейшем развитии предшествующего варианта осуществления изобретения синтезируемый поддиапазон может принимать вклады от событий гармонического преобразования согласно как прямой обработке, так и обработке на основе перекрестных произведений. В этой связи, для определения того, подлежит ли использованию особая возможность восстановления недостающей гармоники путем обработки на основе перекрестных произведений, могут применяться критерии принятия решения. Например, указанное дальнейшее развитие может адаптироваться так, чтобы оно воздерживалось от использования одного модуля перекрестной обработки поддиапазонов в случае, когда выполняется одно из следующих условий:
a) соотношение амплитуды Ms члена анализируемого поддиапазона из прямого источника, приводящего к синтезируемому поддиапазону, и, по меньшей мере, амплитуды Мc в оптимальной паре членов из перекрестного источника, приводящих к синтезируемому поддиапазону, больше предварительно определенной постоянной;
b) синтезируемый поддиапазон уже принимает значительный вклад от модуля прямой обработки;
c) основная частота Ω0 меньше, чем разнос частот блока анализирующих фильтров ΔƒA·
В одном из вариантов осуществления изобретения, изобретение включает понижающую дискретизацию (прореживание) входного сигнала. Более того, один или несколько кадров входных дискретных значений могут определяться путем понижающей дискретизации комплекснозначных дискретных значений в поддиапазоне, которая может выполняться экстрактором блоков.
В дальнейшем развитии предшествующего варианта осуществления изобретения подлежащие применению коэффициенты понижающей дискретизации удовлетворяют приводимому ниже уравнению (15). Равенство нулю обоих коэффициентов понижающей дискретизации не допускается, поскольку это соответствует тривиальному случаю. Уравнение (15) определяет взаимосвязь коэффициентов понижающей дискретизации D1, D2 с коэффициентом S растягивания поддиапазонов и коэффициентом Q преобразования поддиапазонов, а также с фазовыми коэффициентами T1, Т2, появляющимися в выражении (13) для определения фазы обрабатываемого дискретного значения. Это обеспечивает согласованность фазы обрабатываемых дискретных значений с другими составляющими входного сигнала, добавлению к которым подлежат обрабатываемые дискретные значения.
В одном из вариантов осуществления изобретения, кадры обрабатываемых дискретных значений перед их наложением и сложением подвергаются оконной обработке. Модуль оконной обработки может быть адаптирован для применения к обрабатываемым дискретным значениям оконной функции конечной длины. Подходящие оконные функции перечисляются в прилагаемой формуле изобретения.
Автор изобретения осознал, что способы перекрестных произведений, раскрытые в документе WO №2010/08892 изначально не вполне совместимы со способами обработки на основе блока поддиапазонов. Несмотря на то, что указанный способ может удовлетворительно применяться к одному из дискретных значений в блоке, он может приводить к артефактам наложения спектров, если его напрямую распространить на другие дискретные значения блока. С этой целью один из вариантов осуществления изобретения применяет оконные функции, включающие оконные дискретные значения, которые, при их взвешивании посредством комплексных весовых коэффициентов и смещении на величину скачка, сводятся к, в значительной мере, постоянной последовательности. Величина скачка может представлять собой произведение величины скачка h блока на коэффициент растягивания поддиапазонов S. Использование указанных оконных функций ослабляет воздействие артефактов наложения спектров. В альтернативном варианте или в дополнение, указанные оконные функции также могут допускать и такие другие меры по ослаблению артефактов, как чередования фаз обрабатываемых дискретных значений.
Предпочтительно, следующие один за другим комплексные весовые коэффициенты, которые применяются к оконным дискретным значениям с целью оценивания их состояния, отличаются только на фиксированное чередование фазы. Также предпочтительно, чтобы указанное фиксированное чередование фазы было пропорционально основной частоте входного сигнала. Чередование фазы также может быть пропорционально подлежащему применению порядку преобразования перекрестных произведений и/или параметру физического преобразования, и/или разности коэффициентов понижающей дискретизации, и/или шагу анализа по времени. Чередование фазы может иметь вид уравнения (21), по меньшей мере, в приближенном смысле.
В одном из вариантов осуществления изобретения, настоящее изобретение делает возможным гармоническое преобразование, усиленное перекрестными произведениями, путем модификации синтезирующей оконной обработки в ответ на параметр основной частоты.
В одном из вариантов осуществления изобретения, последовательные кадры обрабатываемых дискретных значений складываются с определенным наложением. Для выполнения подходящего наложения кадры обрабатываемых дискретных значений надлежащим образом смещаются на величину скачка, которая представляет собой величину скачка h блока, помноженную на коэффициент S растягивания поддиапазонов. Таким образом, если наложение последовательных кадров входных дискретных значений составляет L-h, то наложение последовательных кадров обрабатываемых дискретных значений может составлять S(L-h).
В одном из вариантов осуществления изобретения, система согласно изобретению действует не только для генерирования обрабатываемого дискретного значения на основе Y=2 входных дискретных значений, но также и на основе только Y=1 дискретного значения. Таким образом, система может восстанавливать недостающие гармоники не только посредством подхода на основе перекрестных произведений (как, например, по уравнению (13)), но также и посредством прямого подхода на основе поддиапазонов (как, например, по уравнению (5) или (11)). Предпочтительно, управляющий модуль сконфигурирован для управления действием системы, в том числе и тем, какой из подходов подлежит использованию для восстановления конкретной недостающей гармоники.
В дальнейшем развитии предшествующего варианта осуществления изобретения система также адаптируется для генерирования обрабатываемого дискретного значения на основе более, чем трех дискретных значений, т.е. для Y≥3. Например, обрабатываемое дискретное значение может быть получено путем вклада в обрабатываемое дискретное значение от нескольких событий гармонического преобразования на основе перекрестных произведений, путем нескольких событий прямой обработки поддиапазонов, или путем сочетания преобразования с перекрестными произведениями и прямого преобразования. Указанная возможность адаптации способа преобразования обеспечивает производительную и многофункциональную HFR. Соответственно, данный вариант осуществления изобретения действует для осуществления способа согласно второму аспекту изобретения для Y=3, 4, 5 и т.п.
Один из вариантов осуществления изобретения сконфигурирован для определения обрабатываемого дискретного значения как комплексного числа, имеющего амплитуду, которая представляет собой среднее значение соответствующих амплитуд соответствующих входных дискретных значений. Указанное среднее значение может представлять собой (взвешенное) арифметическое, (взвешенное) геометрическое или (взвешенное) гармоническое среднее двух или большего количества входных дискретных значений. В случае Y=2 среднее основывается на двух комплексных входных дискретных значениях. Предпочтительно, амплитуда обрабатываемого дискретного значения представляет собой геометрическое средневзвешенное значение. Более предпочтительно, геометрическое значение, как показано в уравнении (13), взвешивается при помощи параметров ρ и 1-ρ. Здесь параметр ρ геометрического взвешивания амплитуд представляет собой действительное число, обратно пропорциональное коэффициенту Q преобразования поддиапазонов. Параметр ρ также может быть обратно пропорционален коэффициенту S растягивания.
В одном из вариантов осуществления изобретения система адаптируется для определения обрабатываемого дискретного значения как комплексного числа, имеющего фазу, которая представляет собой линейную комбинацию соответствующих фаз соответствующих входных дискретных значений в кадрах входных дискретных значений. В частности, линейная комбинация может включать фазы, относящиеся к двум входным дискретным значениям (Y=2). Линейная комбинация двух фаз может применять целочисленные ненулевые коэффициенты, сумма которых равна коэффициенту S растягивания, умноженному на коэффициент Q преобразования поддиапазонов. Факультативно, фаза, полученная путем указанной линейной комбинации, дополнительно корректируется посредством фиксированного параметра коррекции фазы. Фаза обрабатываемого дискретного значения может иметь вид уравнения (13).
В одном из вариантов осуществления изобретения, экстрактор блоков (или аналогичный этап в способе согласно изобретению) адаптируется для интерполяции двух или большего количества анализируемых дискретных значений из сигнала анализируемого поддиапазона с целью получения одного входного дискретного значения, которое будет включено в кадр (блок). Указанная интерполяция может делать возможной понижающую дискретизацию входного сигнала посредством нецелочисленного коэффициента. Анализируемые дискретные значения, подлежащие интерполяции, могут быть или могут не быть следующими друг за другом.
В одном из вариантов осуществления изобретения, конфигурация обработки поддиапазонов может управляться посредством управляющих данных, доставляемых извне модуля, выполняющего обработку. Управляющие данные могут относиться к мгновенным акустическим свойствам входного сигнала. Например, сама система может содержать секцию, адаптированную для определения таких мгновенных акустических свойств сигнала, как (преобладающая) основная частота сигнала. Знание основной частоты обеспечивает руководство при выборе анализируемых поддиапазонов, из которых требуется получить обрабатываемые дискретные значения. Соответственно, разнос анализируемых поддиапазонов пропорционален указанной основной частоте входного сигнала. В качестве альтернативы, управляющие данные также могут доставляться извне системы, предпочтительно, путем включения в формат кодирования, подходящий для передачи в качестве битового потока по сети цифровой связи. В дополнение к управляющим данным указанный формат кодирования может содержать информацию, относящуюся к низкочастотным составляющим сигнала (например, к составляющим в поз.701 на фиг.7). Однако в интересах экономии полосы пропускания формат, предпочтительно, не включает полную информацию, относящуюся к высокочастотным составляющим (поз.702), которые могут восстанавливаться согласно изобретению. Изобретение может, в частности, предусматривать систему декодирования с модулем приема управляющих данных, сконфигурированным для приема указанных управляющих данных, либо включенных в принимаемый битовый поток, который также кодирует входной сигнал, либо принимаемых как отдельный сигнал или битовый поток.
Один из вариантов осуществления изобретения предусматривает способ эффективного осуществления расчетов, обусловленных способом согласно изобретению. С этой целью аппаратная реализация может включать преднормализатор, предназначенный для изменения масштаба амплитуд соответствующих дискретных значений в некоторых из Y кадров, на которых будет основываться кадр обрабатываемых дискретных значений. После указанного изменения масштаба обрабатываемое дискретное значение может быть рассчитано как (взвешенное) комплексное произведение входных дискретных значений, подвергнутых изменению масштаба, и, возможно, не подвергнутых изменению масштаба. Входное дискретное значение, возникающее в произведении как коэффициент с измененным масштабом, обычно повторно не появляется как коэффициент с неизменным масштабом. За исключением, возможно, параметра в коррекции фазы можно оценить уравнение (13) как произведение комплексных входных дискретных значений (возможно, с измененным масштабом). Это предоставляет вычислительное преимущество по сравнению с обработками амплитуды и фазы обрабатываемого дискретного значения по отдельности.
В одном из вариантов осуществления изобретения система, сконфигурированная для случая Y=2, содержит два экстрактора блоков, адаптированных для формирования каждым из них одного кадра входных дискретных значений при параллельном действии.
В дальнейшем развитии вариантов осуществления изобретения, представляющих Y≥3, система может содержать ряд блоков обработки поддиапазонов, каждый из которых конфигурируется для определения сигнала промежуточного синтезируемого поддиапазона с использованием отличающегося коэффициента преобразования поддиапазонов и/или отличающегося коэффициента растягивания поддиапазонов, и/или способа преобразования, отличающегося тем, что он является основанным на перекрестном произведении или прямым. Для параллельного действия модули обработки поддиапазонов могут располагаться параллельно. В этом варианте осуществления изобретения система также может включать модуль слияния, расположенный за модулями обработки поддиапазонов и перед блоком синтезирующих фильтров. Модуль слияния может адаптироваться для слияния (например, путем смешивания) соответствующих сигналов промежуточных синтезируемых поддиапазонов с целью получения сигнала синтезируемого поддиапазона. Как уже отмечалось, промежуточный синтезируемый поддиапазон, который подвергается слиянию, может быть получен как путем прямого гармонического преобразования, так и путем преобразования на основе перекрестных произведений. Система согласно этому варианту осуществления изобретения также может содержать базовый декодер, предназначенный для декодирования битового потока во входной сигнал. Она также может включать модуль HFR-обработки, адаптированный для применения информации спектральной полосы, в особенности, путем выполнения формирования спектра. Действие модуля HFR-обработки может управляться информацией, закодированной в битовом потоке.
Один из вариантов осуществления изобретения предусматривает HFR многомерных сигналов, например, в системе, предназначенной для воспроизведения звука в стереофоническом формате, содержащем Z каналов, таких как левый, правый, центральный, окружающий и т.д. В одной из возможных реализации обработки входного сигнала с несколькими каналами обрабатываемые дискретные значения каждого канала основываются на одинаковом количестве входных дискретных значений, хотя коэффициент S растягивания и коэффициент Q преобразования для каждой полосы может варьироваться между каналами. С этой целью реализация может включать блок анализирующих фильтров, предназначенный для генерирования Y сигналов анализируемых поддиапазонов из каждого канала, модуль обработки поддиапазонов, предназначенный для генерирования Z сигналов поддиапазонов, и блок синтезирующих фильтров, предназначенный для генерирования Z растянутых во времени и/или преобразованных по частоте сигналов, которые образуют выходной сигнал.
В изменениях предшествующего варианта осуществления изобретения выходной сигнал может содержать выходные каналы, которые основываются на различных количествах сигналов анализируемых поддиапазонов. Например, может оказаться целесообразной передача большего количества вычислительных ресурсов к HFR для акустически более выраженных каналов; например, каналам, предназначенным для воспроизведения источниками звука, расположенными перед слушателем, может отдаваться предпочтение перед окружающими или задними каналами.
Следует подчеркнуть, что изобретение относится ко всем сочетаниям приведенных выше характерных признаков, даже если они излагаются в разных пунктах формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
Настоящее изобретение будет описано ниже посредством иллюстративных примеров, не ограничивающих объем или суть изобретения, со ссылкой на сопроводительные графические материалы.
Фиг.1 иллюстрирует принцип гармонического преобразования на основе блока поддиапазонов.
Фиг.2 иллюстрирует действие нелинейной обработки блока поддиапазонов с одним входным поддиапазоном.
Фиг.3 иллюстрирует действие нелинейной обработки блока поддиапазонов с двумя входными поддиапазонами.
Фиг.4 иллюстрирует действие гармонического преобразования на основе блока поддиапазонов, усиленного перекрестными произведениями.
Фиг.5 иллюстрирует пример сценария применения преобразования на основе блока поддиапазонов с использованием нескольких порядков преобр