Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона
Иллюстрации
Показать всеИзобретение относится к средствам для обработки аудио сигнала. Технический результат заключается в уменьшении влияния переходных процессов на качество звука. Устройство включает манипулятор времени для индивидуальной обработки во времени множества поддиапазонов звукового сигнала. Манипулятор времени состоит из этапа перекрытия и суммирования для перекрытия и суммирования блоков, по крайней мере, одного из множества сигналов поддиапазонов с использованием значения перекрытия и суммирования, которое отличается от улучшенного значения в модуле извлечения, детектора переходных процессов для обнаружения переходного процесса в звуковом сигнале или поддиапазонах сигнала, и множества сумматоров переходных процессов для сложения обнаруженных переходных процессов с множеством сигналов, генерируемых на этапе перекрытия и суммирования. Этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или для исключения обнаруженных переходных процессов при сложении. 3 н. и 14 з.п. ф-лы, 19 ил.
Реферат
Скорость воспроизведения звуковых сигналов может быть изменена при сохранении высоты тона, например, с помощью фазового вокодера (см., например, J.L.Flanagan, R.М.Golden, "The Bell System Technical Journal", November 1966, pp.1394-1509; United States Patent No. 6,549,884 Laroche, J. & Dolson, M.: "Phase-vocoder pitch-shifting"; Jean Laroche, Mark Dolson, "New Phase-Vocoder Techniques for Pitch- Shifting, Harmonizing And Other Exotic Effects", Proc. 1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,<">New Paltz, New York, Oct. 17-20, 1999). Таким же образом, при использовании способов переноса, может быть сохранена исходная продолжительность сигнала. Исходная продолжительность сигнала получается путем воспроизведения растянутого во времени сигнала, ускоренного с помощью коэффициента растяжения во времени. Дискретное представление сигнала во времени соответствует уменьшению выборок сигнала на коэффициент растяжения при сохранении частоты дискретизации. Традиционно, это растяжение происходит во временной области. Кроме того, то же самое может происходить и в банке фильтров, таких как псевдоквадратурных зеркальных фильтрах (pQMF). Псевдоквадратурные зеркальные фильтры (pQMF) иногда также называют QMF банком фильтров.
Серьезными проблемами при растяжении являются переходные процессы, которые "размываются" во времени при обработке на этапе растяжения во времени. Это происходит потому, что способы, такие как, например, с помощью фазового вокодера, влияют на так называемые свойства вертикальной когерентности сигнала (при получении спектрограммы по частоте и времени).
Некоторые современные способы растяжения во времени отказываются от использования переходных процессов, для того, чтобы не выполнять любое или даже небольшое растяжение во времени в течение переходного процесса. Это было описано, например, в:
- Laroche L., Dolson М.: Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol.7, no.3, pp.323-332
- Emmanuel Ravelli, Mark Sandler and Juan P. Bello: Fast implementation for nonlinear time-scaling of stereo audio; Proc. of the 8th Int. Conference on Digital Audio Effects (DAFx'05), Madrid, Spain, September 20-22, 2005 - Duxbury, С. M. Davies, and M. Sandler (2001, December). Separation of transient information in musical audio using multi resolution analysis techniques.In Proceedings of the COST G-6 Conference on Digital Audio Effects (DAFX-01), Limerick, Ireland.
Другая статья по этой теме написана Robel, A.: A NEW APPROACH ТО TRANSIENT PROCESSING IN THE PHASE VOCODER; Proc. of the 6th Int. Conference on Digital Audio Effects (DAFx-03), London, UK, September 8-1 1, 2003.
При растяжении во времени аудио сигналов с помощью фазового вокодера переходные участки сигнала "размываются" в связи с дисперсией, поскольку так называемая вертикальная когерентность в спектрограмме влияет на сигнал. Способы работы с помощью так называемого перекрытия и суммирования могут генерировать ложные сигналы эха перед и после переходных звуковых процессов. Эти проблемы могут быть урегулированы путем изменения растяжения во времени в условиях переходных процессов с отсутствием растяжения во время фактических переходных процессов и более сильного растяжения при отсутствии переходных процессов (в окружении переходных процессов). Если, однако, происходит перенос, коэффициент переноса уже не будет постоянным в условиях переходных процессов, т.е. высота тона, наложенная на участки (возможно, тональные) сигнала, искажает звук. Подобные проблемы возникают, если растяжение во времени происходит в банке фильтров, таких как pQMF.
Область этой заявки относится к способу восприятия, связанному с обработкой звуковых переходных процессов. В частности, звуковые переходные процессы могут быть удалены во время обработки сигнала с растяжением во времени. Далее при рассмотрении растяжения во времени именно применение сложения будет использовано при изменении (растяжении) сигнала для обрабатываемого участка переходного сигнала.
В соответствии с вариантами изобретения, описанными в этом документе, аппаратная часть для обработки аудио сигнала включает в себя манипулятор времени для индивидуальной обработки во времени множества поддиапазонов звукового сигнала. Манипулятор времени состоит из этапа перекрытия и суммирования для перекрытия и суммирования блоков, по крайней мере, одного из множества сигналов поддиапазонов с использованием значения перекрытия и суммирования, которое отличается от улучшенного значения в модуле извлечения, детектора переходных процессов для обнаружения переходного процесса в звуковом сигнале или поддиапазонах сигнала, и множества сумматоров переходных процессов для сложения обнаруженных переходных процессов с множеством сигналов, генерируемых на этапе перекрытия и суммирования. Этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или для исключения обнаруженных переходных процессов при сложении.
Согласно другому варианту изобретения аппаратная часть для обработки аудио сигнала включает в себя банк фильтров анализа для генерации сигналов поддиапазонов; манипулятор времени для индивидуальной обработки во времени множества сигналов поддиапазонов, манипулятор времени включает: этап перекрытия и суммирования для перекрытия и суммирования блоков поддиапазонов сигнала с использованием значения улучшенного перекрытия и суммирования, которое отличается от улучшенного значения в блоке извлечения; детектора переходных процессов для обнаружения переходного процесса в звуковом сигнале или поддиапазонах сигнала, в которых этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или для отказа от использования обнаруженных переходных процессов при сложении; и сумматор переходных процессов для добавления обнаруженных переходных процессов к сигналу, генерируемому на этапе перекрытия/сложения.
Согласно другому варианту способ обработки аудио сигнала включает в себя:
индивидуальную обработку во времени множества сигналов поддиапазонов звукового сигнала, обработку во времени, включающую:
перекрытие и суммирование блоков, соответствующих одному из множества сигналов поддиапазонов, с использованием перекрытия и суммирования улучшенного значения, отличающегося от улучшенного значения в модуле извлечения;
определение переходного процесса в звуковом сигнале или сигнале поддиапазоне;
снижение влияния либо исключение обнаруженных переходных процессов при перекрытии и сложении;
суммирование обнаруженных переходных процессов с множеством сигналов, генерируемых при выполнении перекрытия и сложения.
Другой вариант связан с компьютерной программой для осуществления способа, когда компьютерная программа выполняется на компьютере, вариант включает в себя:
Индивидуальную обработку во времени множества поддиапазонов звукового сигнала, обработку во времени, включающую:
Перекрытие и суммирование блоков, соответствующих одному из множества сигналов поддиапазонов, с использованием перекрытия и суммирования улучшенного значения, отличается от улучшенного значения в модуле извлечения;
определение переходного процесса в звуковом сигнале или поддиапазоне сигнала; либо снижение влияния обнаруженных переходных процессов или для отказа от использования обнаруженных переходных процессов при перекрытии и сложении;
суммирование обнаруженных переходных процессов с множеством сигналов, генерируемых при выполнении перекрытия и сложения.
В соответствии с другими вариантами аппаратная часть может дополнительно содержать модуль прореживания для прореживания звукового сигнала или нескольких звуковых сигналов. Манипулятор времени может быть сконфигурирован для выполнения растяжения во времени множества сигналов поддиапазонов.
Согласно еще одному варианту детектор переходных процессов может быть настроен на выделение блоков, в которых обнаружены переходные процессы и в которых множество этапов перекрытия и суммирования настроено на игнорирование отмеченных блоков.
Согласно еще одному варианту множество этапов перекрытия и суммирования может быть сконфигурировано для применения значений перекрытия и суммирования, превышающих соответствующее значение в модуле извлечения для выполнения растяжения во времени множества сигналов поддиапазонов.
Согласно еще одному варианту манипулятор времени может дополнительно содержать модуль извлечения, модуль обработки окна/регулятор фазы, и модуль вычисления фазы для расчета фазы, на основе которой модуль обработки окна/регулировщик фазы выполняет настройку извлеченного блока.
Согласно еще одному варианту сумматор переходных процессов может быть дополнительно настроен на включение участка в поддиапазон сигнала, имеющий переходной процесс, причем длина участка выбрана достаточно большой, чтобы на выходе процедуры перекрытия и суммирования был возможен кроссфейд выходного сигнала для участка, имеющего переходной процесс.
В соответствии с аналогичным вариантом изобретения сумматор переходных процессов может быть сконфигурирован для выполнения операции кроссфейда.
Согласно еще одному варианту детектор переходных процессов может быть сконфигурирован для детектирования блоков, извлеченных модулем извлечения из поддиапазонов сигнала, имеющего переходные процессы. Этап перекрытия и суммирования может быть дополнительно сконфигурирован для снижения влияния извлеченных блоков или отказа от использования извлеченных блоков при суммировании. Согласно еще одному варианту детектор переходных процессов может быть настроен на определение «центра тяжести» при выполнении расчета энергии с помощью предварительно заданного периода времени входного сигнала, поступающего для анализа в банк фильтров, или заданного периода времени для сигналов поддиапазонов.
Точное определение положения переходного процесса с целью выбора соответствующего участка может, например, быть выполнено с помощью определения движущегося «центра тяжести» энергии за соответствующий период времени. В частности, определение переходного процесса может быть выполнено частотно-избирательным образом в банке фильтров. Кроме того, период времени для участка может быть выбран в виде постоянной или переменной величины на основе информации при определении переходного процесса.
Согласно еще одному варианту аппаратная часть может дополнительно содержать банк фильтров анализа для генерации сигналов поддиапазонов.
Согласно еще одному варианту аппаратная часть может дополнительно содержать модуль прореживания, расположенный на входе или выходе банка фильтров анализа. Манипулятор времени может быть сконфигурирован для выполнения растяжения во времени множества сигналов поддиапазонов.
Согласно еще одному варианту аппаратная часть может дополнительно содержать первый банк фильтров анализа, второй банк фильтров анализа, этап повторной дискретизации перед вторым банком фильтров анализа и множество фазовых вокодеров для второго множества выходных сигналов поддиапазонов второго банка фильтров анализа, множество фазовых вокодеров, имеющих коэффициент расширения основного диапазона больше чем единица, причем на выходе фазового вокодера выполняется множество этапов перекрытия и суммирования.
Согласно еще одному варианту аппаратная часть может содержать дополнительный этап подключения между первым банком анализа и множеством фазовых вокодеров на входе этапа подключения и множество этапов перекрытия и суммирования в выходе этапа подключения, причем этап подключения выполнен с возможностью контроля положения блоков, соответствующих одному из множества сигналов поддиапазонов и обработанного в фазовом вокодере сигнала на этапе перекрытия и суммирования. Согласно еще одному варианту аппаратная часть может дополнительно содержать коррекцию амплитуды, настроенную на компенсацию амплитуды, оказывающей влияние на различные значения перекрытия.
Предложенный вариант изобретения, таким образом, выполняет различные функции с помощью аппаратной части, способов и компьютерных программ для обработки аудио сигналов в контексте расширения диапазона и в контексте других аудио приложений, которые не связаны с расширением пропускной способности. Особенности, описанные и заявленные в отдельных положениях формулы изобретения, могут быть полностью или частично объединены, но также могут использоваться отдельно друг от друга, так как отдельные аспекты уже обеспечивают преимущества в отношении восприятия качества, сложности вычислений и ресурсов процессора/памяти при реализации в компьютере или микропроцессоре.
Согласно представленному здесь описанию, и в отличие от существующих способов, обрабатываемые в окне участки, содержащие переходные процессы, могут быть отделены от обрабатываемого сигнала. Это может быть достигнуто путем суммирования только тех участков во времени, которые не включают переходные процессы, блок за блоком, во время процесса перекрытия и суммирования (OLA). В результате сигнал растягивается во времени и не содержит переходные процессы. После завершения растяжения во времени снова добавляются нерастянутые переходные процессы, которые были удалены из исходного сигнала.
Дисперсии и эффекты эха, следовательно, не влияют на субъективное качество звука при переходном процессе.
Путем вставки участка исходного сигнала, изменение тембра или высоты тона приведет к изменению частоты дискретизации. В целом, это является психоакустической маской переходного процесса. Если, в частности, происходит растяжение в целое число раз, тембр будет меняться незначительно, поскольку вне окружения переходного процесса отображается только каждая n-я гармоника (n=коэффициент растяжения).
Прилагаемые чертежи включены для облегчения дальнейшего понимания вариантов, включены в состав и составляют часть этого изобретения. Чертежи иллюстрируют варианты и вместе с описанием служат для объяснения принципов работы вариантов изобретения. Другие варианты и многие предполагаемые преимущества вариантов изобретения будет легко понять, так как они ссылаются на последующее подробное описание. Номера ссылок обозначают соответствующие или аналогичные части.
На фиг.1 показаны формы сигнала исходного сигнала, состоящего из типичной смеси звуков трубы и кастаньет.
На фиг.2 показаны дискретные преобразования Фурье (DFT) для спектрограммы с формой сигнала, показанной на фиг.1.
На фиг.3 показана QMF на основе спектрограммы на базе 64 диапазонного pQMF банка фильтров анализа, похожего на DFT спектрограмму на фиг.2.
На фиг.4 показаны матрицы обнаружения переходных процессов.
На фиг.5 показаны формы сигнала из сигнала в результате растяжения времени без использования представленного здесь описания.
На фиг.6 показаны формы сигнала для сигнала, полученного в результате растяжения во времени с использованием представленного здесь описания.
На фиг.7 показано DFT на основе спектрограммы растянутого во времени сигнала без обработки переходных процессов в соответствии с представленным здесь описанием.
На фиг.8 показано DFT на основе спектрограммы растянутого во времени сигнала с обработкой переходных процессов в соответствии с представленным здесь описанием.
На фиг.9 показана блок-схема системы аудио обработки, содержащая аппаратную часть в соответствии с представленным здесь описанием.
На фиг.10 показана блок-схема другой системы аудио обработки, содержащей аппаратную часть в соответствии с представленным здесь описанием.
Фиг.11А иллюстрирует реализацию блок-схемы обработки для обработки одного сигнала поддиапазона.
На фиг.11В иллюстрирует другую реализацию блок-схемы обработки для обработки одного сигнала поддиапазона.
На фиг. с 12A до 12E показан модуль обработки сигнала в соответствии с представленным здесь описанием.
На фиг.13 показана блок-схема устройства в соответствии с одним из вариантов представленного здесь описания.
На фиг.14 показана блок-схема устройства в соответствии с другим вариантом представленного здесь описания.
На фиг.15 показана блок-схема способа обработки аудио сигнала в соответствии с представленным здесь описанием.
Фиг.1 показывает временные участки формы аудио сигнала, состоящего из типичной смеси звуков трубы и кастаньет. Изображенные звуковые сигналы будут использованы в качестве исходного сигнала, для которого различные действия растяжения во времени выполняются без или с применением представленного здесь описания. Звук трубы соответствует периодическому сигналу с амплитудой примерно 0,08 единиц на фиг.1. Четыре удара кастаньет видны на фиг.1, четыре коротких импульса с амплитудой около 0,45 единиц. Звук трубы производит практически гармонический сигнал. Кастаньеты, однако, производят сигнал со значительным переходным процессом. В акустике и аудио, переходные процессы обычно определяются как кратковременный сигнал, который представляет собой негармоническую фазовую атаку на музыкальный звук или произнесенное слово.
Сигнал может содержать высокую степень непериодических компонентов и высокую магнитуду на более высоких частотах, чем гармоническое содержимое этого сигнала. Переходные процессы, как правило, напрямую не зависят от частоты тона, вызванного ими. На фиг.2 показано дискретное преобразование Фурье (DFT) для спектрограммы с формой сигнала по фиг.1. Фиг.3 аналогична фиг.2 и показывает 64 диапазона псевдоквадратичного зеркального банка фильтров (pQMF) для спектрограммы с формой сигнала по фиг.1. Как можно видеть из двух спектрограмм, показанных на фиг.2 и 3, исходный аудио сигнал включает в себя плотную гармоническую структуру составляющих звука (горизонтальная структура) и удары кастаньет (вертикальная структура).
На фиг.4 показана полученная из сигнала двоичная матрица обнаружения переходных процессов, частотно-избирательным образом отмечающая переходные участки сигнала. Обнаруженные переходные участки сигнала показаны белым цветом. Их можно удалить с помощью вокодера на этапе переноса, с последующим суммированием с использованием исходного сигнала. Кроме того, обнаруженные переходные процессы участков сигнала могут быть исключены из растяжения во времени и позже заменены на соответствующие участки из исходного сигнала.
Цифры от 5 до 8 показывают результат растяжения во времени без обработки новых переходных процессов в виде двух сигналов во времени и связанных с ними спектрограмм. Сравнивая сигналы во времени и спектрограммы для случаев с обработкой и без обработки переходных процессов, видно, что нежелательного размытия во времени переходного участка сигнала можно эффективно избежать с использованием представленного здесь описания. Например, вид сигнала во времени показан на фиг.5, а соответствующая спектрограмма показана на фиг.7. Из фиг.5 и 7 видно, что удары кастаньет были расширены, то есть их продолжительность стала больше, чем в исходном сигнале. Время, показанное на фиг.1, отличается от времени сигнала, показанного на фиг.6, и соответствующей спектрограммы на фиг.8, которые были получены путем использования обработки переходных процессов в соответствии с представленным здесь описанием, показывают, что удары кастаньет не претерпели существенного расширения по продолжительности, и, по существу, вид сигнала сохранился в результате обработки.
С помощью аппаратной части, способов и компьютерных программ, в соответствии с представленным здесь описанием, в результате обработки переходных процессов путем растяжения во времени и переноса удается эффективно избегать артефактов (дисперсии, эха до и после сигнала). Кроме того, независимым частотно-избирательным образом в поддиапазонах определяется, какие участки преобладают: стационарные или переходные, и соответственно правильно выбирается способ обработки переходных процессов. Также различным образом могут рассматриваться параметры определения переходных процессов при формировании периода времени вставляемого участка сигнала для оптимальной адаптации периода времени участка сигнала с переходным процессом. Способ пригоден для всех аудио приложений, в которых скорость воспроизведения звуковых сигналов или их высота тона должны быть изменены. Особенно подходящими являются приложения для расширения диапазона или относящиеся к области звуковых эффектов.
На фиг.9 показана система обработки звука, которая относится к области расширения основного диапазона пропускания звука. Тем не менее, изобретение может применяться в других областях, которые не выполняют расширение пропускной способности. Битовый поток поступает на вход в основной декодер 100. Выходной сигнал от основного декодера, т.е. звуковой сигнал с узкой полосой пропускания, поступает на вход в соответствующий модуль прореживания 102a, 102b, 102c. Уничтожаются сигналы, которые имеют уменьшенную продолжительность во времени по сравнению с выходным сигналом от основного декодера 100, являющимся входным сигналом для соответствующих этапов анализа pQMF 104a, 104b, 104c. Этапы 104a, 104b, 104c могут быть реализованы с помощью любых других банков фильтров анализа, которые не являются pQMF банками фильтров анализа. Существует много различных реализаций банка фильтров анализа, которые могут быть использованы для этой цели.
Каждый этап pQMF анализа 104a, 104b, 104c формирует на выходах множество различных сигналов поддиапазонов в различных каналах поддиапазонов, где каждый сигнал поддиапазона имеет пониженный частотный диапазон и, как правило, пониженную частоту дискретизации. В этом случае банк фильтров имеет увеличенное в 2 раза число выборок, что предпочтительно для настоящего изобретения. Тем не менее, и другой критически выбранный банк фильтров может быть использован.
Соответствующий узкополосный сигнал или выходной сигнал поддиапазона в pQMF канале анализа поступает на вход в фазовый вокодер. Хотя фиг.9 только иллюстрирует три фазовых вокодера 106a, 106b, 106c, важно видеть, что каждый индивидуальный pQMF канал анализа может иметь собственный фазовый вокодер. Алгоритм фазового вокодера также может быть реализован путем интерполяции основного диапазона или первого тонового сигнала. Фазовый вокодер для различных сигналов поддиапазонов от того же банка фильтров анализа имеет аналогичную конструкцию и отличается от фазового вокодера для сигналов поддиапазонов от других банков фильтров на коэффициент расширения диапазона, показанный на фиг.9. Коэффициент расширения диапазона равен двум в фазовом вокодере 106a. В фазовом вокодере 106b коэффициент расширения диапазона равен трем, а в фазовом вокодере 106c коэффициент расширения диапазона равен четырем.
Обратим внимание, что обычно нет необходимости в обучающей информации, представленной здесь, при выполнении любого расширения диапазона или даже нескольких различных расширений диапазона. Так, может быть исключен модуль прореживания 102a, 102b, 102c. Выходы различных фазовых вокодеров поступают на вход pQMF банка фильтров синтеза 108. При анализе с помощью банка фильтров в блоках 104a-104c реализованы различные технологии, а так как технология анализа в банке фильтров и технологии синтеза в банке фильтров согласованы друг с другом, то и синтез в банке фильтров 108 будет также осуществляться по различным технологиям.
Устройство, соответствующее представленному здесь описанию, может быть реализовано распределенным образом на одном или более этапов QMF анализа 104a, 104b, 104c и в банке QMF фильтров синтеза 108. Таким же или подобным образом, манипулятор времени, который, в соответствии с изложенным, является частью устройства, может быть распределен в нескольких QMF этапах анализа 104a, 104b, 104c и QMF банке фильтров синтеза 108. Соответственно, в одном или нескольких QMF этапах анализа 104a, 104b, 104c можно исключить блоки, содержащие обработку во времени переходных процессов, и направить исходные блоки в банк фильтров синтеза 108. Банк фильтров синтеза 108 может выполнять функции сумматора переходных процессов, путем добавления извлеченных и, как правило, неизмененных переходных процессов к сигналу, генерируемому на этапе перекрытия и суммирования в банке фильтров синтеза 108. Блок-схема на фиг.9 не показывает в явном виде детектор переходных процессов. Детектор переходных процессов может быть частью этапа QMF анализа 104a, 104b, 104c. В качестве альтернативы, детектор переходных процессов может быть выполнен в виде отдельного модуля.
Фиг.10 иллюстрирует другую реализацию, где сигнал основного диапазона по линии 110 вводится в банк фильтров анализа 112. Таким образом, низкочастотный сигнал преобразуется в множество сигналов поддиапазонов. Кроме того, предусмотрен этап переключения или подключения 114, в котором различные сигналы поддиапазонов с выхода фазового вокодера 106a, 106b или c выхода pQMF анализа основного диапазона 112 могут быть введены в любой произвольно выбранный диапазон синтеза.
Отдельные фазовые вокодеры связаны с отдельным диапазоном pQMF. На фиг.10, первый и последний pQMF диапазоны высоты тона первой гармоники, использующие коэффициент расширения диапазона, равный двум, показаны цифрой 106a. Для других гармоник высоты тона используется коэффициент расширения диапазона, равный трем, первый и последний pQMF диапазоны этой высоты тона показаны цифрой 106b.
Синтезированный сигнал может быть создан с помощью произвольно выбранного суммирования выходов фазового вокодера и выходов 112 основного диапазона pQMF анализа. Следует отметить, что этап переключения 114 может быть контролируемым этапом переключения, который управляется аудио сигналом, имеющим определенную дополнительную информацию, или который управляется определенными характеристиками сигнала. Кроме того, стадия 114 может быть простым этапом подключения без какого-либо переключения. Например, в случае, когда определенное распределение выходных сигналов от элементов 112 и 106а-106b однозначно установлено и запрограммировано. В этом случае этап 114 не будет содержать какие-либо переключатели, но будет задавать определенные сквозные соединения.
Фиг.11A иллюстрирует вариант осуществления обработки для обработки одного сигнала поддиапазона. Единый сигнал поддиапазона, возможно, подвергается какому-либо прореживанию либо до, либо после фильтрации в банке фильтров анализа, не показанному на фиг.11A. В случае если выполнено прореживание, продолжительность по времени одного сигнала поддиапазона, как правило, короче, чем продолжительность по времени до прореживания. Единственный сигнал поддиапазона является входным для модуля извлечения 1800. Модуль извлечения 1800 на фиг.11A работает с использованием улучшенного значения выборки/блока, обозначенного знаком е. Улучшенное значение выборки/блока может быть переменным или может быть иметь фиксированное значение, как показано на фиг.11A стрелкой в модуле извлечения 1800. На выходе модуля извлечения 1800 имеется множество выбранных блоков.
Эти блоки имеют большие перекрытия, так как улучшенное значение е выборки блока значительно меньше, чем длина блока в модуле извлечения. В приведенном примере модуль извлечения извлекает блок из 12 выборок. Первый блок включает в себя выборки от 0 до 11, второй блок включает в себя выборки с 1 по 12, третий блок включает в себя выборки 2 до 13 и так далее. В этом варианте улучшенное значение е выборки/блока равно 1 и представляет собой 11-кратное перекрытие. В приведенном выше примере конкретные значения представлены в качестве примера и могут меняться от приложения к приложению.
Отдельные блоки вводятся в модуль обработки окна 1802 для проведения оконных операций с блоками при использовании функции окна для каждого блока. Кроме того, вычислитель фазы 1804 определяет фазу для каждого блока. Вычислитель фазы 1804 перед оконной операцией может использовать либо отдельный блок, либо последовательность окон. Тогда, значения для регулировки фазы p x k рассчитываются и вводятся в регулировщик фазы 1806. Регулировщик фазы использует значение настройки для каждой выборки в блоке. Кроме того, коэффициент к равен коэффициенту расширения основного диапазона. Когда, например, должно быть получено расширение основного диапазона в 2 раза, то фаза p, рассчитанная для блока, извлеченного модулем извлечения 1800, умножается на коэффициент 2, и скорректированное значение p, применяемое к каждой выборке блока в регулировщике фазы 1806, умножается на 2.
Это значение/правило показано в качестве примера. Кроме того, скорректированное значение фазы для синтеза равно k*p, p+(k-l)*p. Таким образом, в этом примере поправочный коэффициент равен либо 2 при умножении, либо 1*p при сложении. Другие значения/правила могут быть применены для расчета значения корректировки фазы. В варианте воплощения единственный сигнал поддиапазона является комплексным сигналом поддиапазона, и фаза блока может быть рассчитана с помощью множества различных способов. Одним из способов является взятие выборки в середине или близко к середине блока при расчете фазы этой сложной выборки.
Хотя на фиг.11A показано, что регулировщик фазы работает последовательно с модулем обработки окна, эти два блока также могут быть взаимозаменяемыми, так что регулировка фазы выполняется для блоков, извлеченных модулем извлечения, с последующим выполнением обработки окна. Так как обе операции, т.е. оконная и регулировка фазы, выполняют вещественные или комплексные умножения, эти две операции могут быть сведены в одну операцию с использованием комплексного коэффициента умножения, который сам по себе является результатом фазовой подстройки коэффициента умножения и оконного коэффициента.
Блоки с фазовой подстройкой поступают на вход перекрытия/суммирования и блок коррекции амплитуды 1808, где оконные блоки и блоки с корректировкой фазы перекрываются и суммируются. Важно, однако, что улучшенное значение выборка/блок в блоке 1808 отличается от значения, используемого в блоке извлечения 1800. В частности, улучшенное значение выборка/блок в блоке 1808 больше, чем значение е, используемое в блоке 1800, так что получается растяжение во времени выходного сигнала в блоке 1808. Таким образом, обработанный выходной сигнал поддиапазона в блоке 1808 имеет длину, которая больше, чем у входного сигнала поддиапазона в блоке 1800. Когда должно быть получено расширение диапазона в два раза, то используется улучшенное значение выборки блока, которое в два раза превышает соответствующее значение в блоках 1800. В результате происходит растяжение во времени в два раза. Когда, однако, необходимо использовать другие коэффициенты растяжения во времени, то могут быть использованы другие улучшенные значения выборка/блок так, что выходной блок 1808 имеет необходимую продолжительность во времени.
Для решения проблем при перекрытии, предпочтительно провести коррекцию амплитуды для решения вопроса о различных перекрытиях в блоках 1800 и 1808. Эта коррекция амплитуды, однако, может быть также проведена в коэффициенте умножения в модуле обработки окна/регулировщике фазы, но коррекция амплитуды также может быть выполнена после этапа перекрытия/обработки.
В приведенном выше примере с блоком длиной 12 и улучшенным значением выборка/блок в модуль извлечения улучшенное значение выборка/блок для перекрытия/сложения в блоке 808 будет равна двум, когда выполняется расширение диапазона в два раза. В результате это приведет к перекрытию шести блоков. Если должно быть выполнено расширение диапазона в три раза, то улучшенное значение выборка/блок, используемое в блоке 1808, будет равно трем, а перекрытие уменьшится до перекрытия четырех блоков. Когда должно быть выполнено расширение диапазона в четыре раза, то блоку 1808 перекрытия/суммирования придется использовать улучшенное значение выборка/блок, равное четырем, для чего по-прежнему будет необходимо использовать перекрытие более двух блоков.
Предпочтительно, чтобы показанный на фиг.11A фазовый вокодер для отдельного сигнала поддиапазона содержал детектор переходных процессов 200 для обнаружения переходного процесса в сигнале поддиапазона, что показано соединением 201a, или для обнаружения переходного процесса в сигнале перед обработкой в банке фильтров анализа, что показано соединением 20lb. Как только детектор переходных процессов 200 обнаруживает переходные процессы, на этапе перекрытия/суммирования выполняется контроль, чтобы в процедуре перекрытия/сложения не использовать блоки, имеющие переходные процессы, как показано управляющим соединением 203. В варианте изобретения, сигнал на линии 203 управляет этапом перекрытия/суммирования, чтобы удалить все блоки, имеющие переходные процессы. Это приведет на выходе этапа к появлению сигнала, который растягивается по отношению к сигналу до этого этапа, но который не содержит никаких переходных процессов.
Растянутый сигнал без переходных процессов вводится в сумматор переходных процессов, который сконфигурирован для суммирования переходных процессов в растянутом сигнале таким образом, что на выходе формируется растянутый сигнал, имеющий вставленные переходные процессы, но эти вставленные переходные процессы не были использованы при обработке перекрытия/сложения.
В одном из вариантов участок переходных процессов вставляется в сам сигнал поддиапазона, как показано соединениями 206 и 201a. Кроме того, сигнал может быть выделен из любого другого сигнала поддиапазона или из сигнала до проведения анализа поддиапазонов, так как характеристики переходных процессов совершенно аналогичны в отдельных поддиапазонах. С другой стороны, однако, в некоторых случаях предпочтительнее использовать переходные явления, происходящие в поддиапазонах, так как частота дискретизации и другие характеристики недоступны в растянутом сигнале.
Фиг.11B показывает другой возможный вариант осуществления обработки единого сигнала поддиапазона. Поток битов из модуля извлечения 1800, с подавлением переходных процессов, вставляется в модуль обработки окна 1798, который действует на единый сигнал поддиапазона. Подавление переходных процессов в модуле обработки окна 1798 удаляет выборки или блоки, содержащие переходные процессы. Оценка, содержит ли выборка переходные процессы, осуществляется детектором переходных процессов 200. Единый сигнал поддиапазона поступает на вход для подавления переходных процессов в модуле обработки окна 1798, так что детектор переходных процессов 200 принимает единый сигнал поддиапазона в качестве входного. При обнаружении переходного процесса детектор переходных процессов 200 выдает соответствующий сигнал для подавления переходных процессов в модуле обработки окна 1798 и подавление переходных процессов заключается в подавлении выборки (выборок), которые имели/имеют переходные процессы, указанные детектором переходных процессов 200.
Поэтому выборки, отмеченные детектором переходных процессов 200, не входят в модуль извлечения 1800. Другие выборки, не содержащие переходные процессы, хранятся в блоках, которые обрабатываются модулем извлечения 1800, модулем обработки окна 1802, модулем вычисления фазы 1804, регулировщиком фазы 1806 и блоком перекрытия и суммирования 1808. Блок перекрытия и суммирования 1808 выдает растянутый сигнал без переходных процессов.
Содержащие переходные процессы выборки затем повторно суммируются с растянутым сигналом без переходных процессов в сумматоре переходных процессов 204. Сумматор переходных процессов 204 принимает управляющий сигнал от детектора переходных процессов 200 и исходный единый сигнал поддиапазона в качестве входных. Обладая этой информацией, сумматор переходных процессов может определить выборки, в которых были подавлены переходные процессы в модуле обработки окна 1798, и повторно вставляет эти выборки в растянутый сигнал без переходных процессов. На выходе из сумматора переходных процессов 204 получается обработанный сигнал поддиапазона (с большим интервалом по времени), имеющий вставленные переходные процессы.
Фиг. с 12A по 12Е иллюстрируют, как звуковой сигнал или один из множества сигналов поддиапазонов могут быть обработаны в соответствии с ранее реализованными способами и в соответствии с представленным здесь описанием. На фиг.12A показана последовательность выборок 1202. Последовательность 1202 может принадлежать к одному из множества сигналов поддиапазонов. Буква «T» обозначает выборку, в которой детектором переходных процессов были обнаружены переходные процессы.
В виде последовательности 1202 на фиг.12A показано множество извлеченных блоков 1206. Множество извлеченных блоков 1206