Устройство и способ генерирования сигнала с расширенной полосой пропускания
Иллюстрации
Показать всеИзобретение относится к устройствам обработки звукового сигнала. Технический результат заключается в расширении полосы пропускания звукового сигнала. Входной сигнал представлен для первой полосы данными первого разрешения и для второй полосы данными второго разрешения; второе разрешение ниже, чем первое разрешение. Генератор заплат генерирует первую заплату от первой полосы входного сигнала согласно первому алгоритму создания «заплат» и генерирует вторую заплату от первой полосы входного сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Объединитель объединяет первую заплату, вторую заплату и первую полосу входного сигнала для получения сигнала с расширенной полосой пропускания. Устройство для генерирования сигнала с расширенной полосой пропускания масштабирует входной сигнал согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» или масштабирует первую заплату и вторую заплату так, чтобы сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра. 7 н. и 11 з.п. ф-лы, 19 ил.
Реферат
Осуществления согласно изобретению касаются обработки звукового сигнала и, в частности, устройства и способа генерирования сигнала с расширенной полосой пропускания от входного сигнала, устройства и способа получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале и звуковом сигнале.
Перцепционно адаптированное кодирование звуковых сигналов, обеспечивающее существенное уменьшение скорости передачи данных для эффективного хранения и передачи этих сигналов, получило широкое применение во многих областях. Известно много кодирующих алгоритмов, например MPEG 1/2 Слой 3 ("МР3") или MPEG 4 ААС (Перспективное звуковое кодирование). Однако используемое для этого кодирование, в особенности при работе на самых низких скоростях передачи битов, может привести к ухудшению субъективного звукового качества, которое часто вызывается, главным образом, вынужденным ограничением полосы пропускания звукового сигнала, подлежащего передаче, на стороне кодирующего устройства.
Как известно из WO 9857436, чтобы подвергнуть звуковой сигнал ограничению полосы в такой ситуации на стороне кодирующего устройства и закодировать только нижнюю полосу звукового сигнала, используется высококачественное звуковое кодирующее устройство («основное кодирующее устройство»). Верхняя полоса, однако, характеризуется только очень грубо, то есть рядом параметров, которые воспроизводят огибающую спектра верхней полосы. Тогда на стороне декодера синтезируется верхняя полоса. С этой целью предлагается гармоническое перемещение, где нижняя полоса декодированного звукового сигнала подается на гребенку фильтров. Каналы гребенки фильтров нижней полосы соединены с каналами гребенки фильтров верхней полосы или «заплатаны», и каждый заплатанный сигнал с ограниченной полосой частот подвергается регулированию огибающей. Синтезирующая гребенка фильтров, принадлежащая гребенке фильтров для специального анализа, получает сигналы с ограниченной полосой частот звукового сигнала в нижней полосе и сигналы с ограниченной полосой частот, подвергшиеся регулированию огибающей, нижней полосы, которые гармонически вставляются в верхнюю полосу. Выходной сигнал синтезирующей гребенки фильтров является звуковым сигналом, расширенным относительно его оригинальной полосы пропускания, который передается со стороны кодирующего устройства на сторону декодера посредством основного кодирующего устройства, работающего на очень низкой скорости передачи данных. В частности, вычисления гребенки фильтров и вставка заплаты в области гребенки фильтров могут оказаться очень трудоемкими.
Упрощенные способы расширения полосы пропускания звуковых сигналов с ограниченной полосой вместо этого используют функцию копирования низкочастотных частей сигнала (LF-H4) в высокочастотный диапазон (НР-ВЧ), чтобы аппроксимировать информацию, которая отсутствует из-за ограничения полосы. Такие способы описаны в работе М.Дитца, Л.Лильерида, К.Кьерлинга и О.Кунца, «Репликация спектральной полосы, новый подход к звуковому кодированию», на 112-ом Съезде AES (Общество инженеров-звукотехников), Мюнхен, май 2002 г.; в работе С.Мелтцера, Р.Бема и Ф.Хенна, «Улучшенные звуковые кодер-декодеры с SBR (РБП - регистр буферной памяти) для цифрового радиовещания, такие как «Всемирное цифровое Радио» (DRM)», на 112-ом Съезде AES, Мюнхен, май 2002 г.; в работе Т.Циглера, А.Эрета, П.Экстранда и М.Лутцкого, «Улучшение тр3 посредством SBR: Характеристики и возможности нового mp3PRO алгоритма», на 112-ом Съезде AES, Мюнхен, май 2002 г.; Международный Стандартный ISO/IEC 14496-3:2001/FPDAM 1, «Расширение полосы пропускания», ISO/IEC, 2002, или «Способ и устройство для расширения полосы пропускания речи», Васу Айенгар и др. Патент США №5455888.
В этих способах гармоническое перемещение не выполняется, но последовательные сигналы с ограниченной полосой частот нижней полосы вводятся в последовательные каналы гребенки фильтров верхней полосы. Таким образом, достигается грубая аппроксимация верхней полосы звукового сигнала. На следующем этапе эта грубая аппроксимация сигнала ассимилируется относительно оригинала посредством постобработки, используя управляющую информацию, полученную от оригинального сигнала. Здесь, например, масштабные коэффициенты служат для адаптации огибающей спектра, для обратной фильтрации и для добавления минимального уровня шума для адаптации тональности, и дополнения синусоидальных частей сигнала для недостающих гармоник, как это также описано в стандарте MPEG-4 Высокоэффективное улучшенное звуковое кодирование (НЕ-ААС).
Кроме этого, дальнейшие способы используют фазовый вокодер для расширения полосы пропускания. При использовании фазового вокодера для спектрального расширения частотные линии перемещаются все дальше друг от друга. Если в спектре существуют промежутки, например, в результате квантизации, то они даже увеличиваются при расширении. При адаптации энергии остающиеся линии в спектре получают слишком много энергии по сравнению с соответствующими линиями в оригинальном сигнале.
Фиг.13 показывает схематическую иллюстрацию расширения полосы пропускания 1300 посредством использования фазового вокодера. В этом примере две заплаты 1312, 1314 добавлены к низкочастотной полосе 1302 сигнала. Подавленная ВЧ-составляющая 1320 сигнала, также называемая частотой разделения (Xover), является частотой низкого уровня соседней заплаты 1312, и двойная частота разделения (x-over частота) является подавленной ВЧ-составляющей соседней заплаты 1312 и подавленной НЧ-составляющей следующей заплаты 1314. Фазовый вокодер удваивает частоту частотных линий низкочастотной полосы 1302 сигнала, чтобы получить соседнюю заплату 1312, и утраивает частоты частотных линий низкочастотной полосы 1302 сигнала, чтобы получить следующую заплату 1314. Поэтому спектральная плотность соседней заплаты 1312 - только половина спектральной плотности низкочастотной полосы 1302 сигнала, а спектральная плотность следующей заплаты 1314 является только одной третьей спектральной плотности низкочастотной полосы 1302 сигнала.
Концентрация энергии в полосах (заплатах) только до нескольких частотных линий приводит к существенному изменению тембра, который отличается от оригинала. Энергия прежнего большего количества полос (частотных линии) суммируется на меньшем количестве остающихся.
Некоторые примеры фазовых вокодеров и их применений представлены в работе Фредерика Нагеля и Саши Диша «Способ гармонического расширения полосы пропускания для звуковых кодер-декодеров," ICASSP '09 и в работе М. Пукетта «Вокодер с фазовой синхронизацией». IEEE ASSP Конференция по Применению обработки звуковых и акустических сигналов, Мохонк 1995", в работе Ребеля, А.: «Переходное обнаружение и сохранение в фазовом вокодере»; citeseer.ist.psu.edu/679246.html, в работе Лароша Л., Долсона М.: «Улучшенная модификация временной шкалы звука, полученная посредством фазового вокодера», IEEE. Транс, обработка речи и звука, издание 7, №3, стр.323-332 и Патент США 6549884.
Один из подходов к заполнению промежутков показан в WO 00/45379. Он содержит способ и устройство для расширения исходных кодирующих систем, использующих высокочастотное восстановление. Это применение решает проблему недостаточного шумового содержания в восстановленном высоком диапазоне посредством адаптивного добавления минимального уровня шума. Добавление шума может заполнить промежутки, но качество звука или субъективное качество могут значительно не улучшиться.
Задача данного изобретения - обеспечить концепцию расширения полосы пропускания звуковых сигналов, которая улучшает субъективное качество сигналов с расширенной полосой пропускания.
Это достигается посредством использования устройства согласно пунктам 1 и 11 патентной формулы, звукового сигнала согласно пункту 14 и способа согласно пунктам 15 и 16.
Осуществление изобретения обеспечивает устройство для генерирования сигнала с расширенной полосой пропускания от входного сигнала. Входной сигнал предоставляется для первой полосы посредством данных первого разрешения и для второй полосы посредством данных второго разрешения; второе разрешение ниже, чем первое разрешение. Устройство включает генератор заплат и объединитель. Генератор заплат формируется, чтобы генерировать первую заплату от первой полосы входного сигнала согласно первому алгоритму создания «заплат», и формируется, чтобы генерировать вторую заплату от первой полосы входного сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Объединитель формируется, чтобы объединить первую заплату, вторую заплату и первую полосу входного сигнала, чтобы получить сигнал с расширенной полосой пропускания. Устройство для генерирования сигнала с расширенной полосой пропускания формируется, чтобы масштабировать входной сигнал согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» или чтобы масштабировать первую заплату и вторую заплату так, чтобы сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра.
Осуществления согласно данному изобретению основаны на центральной идее о том, что заплата с низкой спектральной плотностью (что означает, например, что заплата включает промежутки по сравнению с низкочастотной полосой входного сигнала) объединяется с заплатой с высокой спектральной плотностью (что означает, например, что заплата включает только несколько промежутков или не включает промежутки совсем по сравнению с низкочастотной полосой входного сигнала) для расширения полосы пропускания входного сигнала. Так как обе заплаты генерируются, основываясь на входном сигнале, высокочастотное расширение полосы пропускания низкочастотной полосы входного сигнала может обеспечить хорошую аппроксимацию оригинального звукового сигнала. Дополнительно, первая и вторая заплаты могут быть масштабированы до (посредством масштабирования входного сигнала) или после генерирования, чтобы удовлетворять критерию огибающей спектра, так как огибающая спектра оригинального звукового сигнала должна учитываться при восстановлении высокочастотной полосы входного сигнала. Таким образом, субъективное качество или звуковое качество сигнала с расширенной полосой пропускания может быть значительно улучшено.
В некоторых осуществлениях согласно изобретению первый алгоритм создания «заплат» является гармоническим алгоритмом создания «заплат». Другими словами, первая заплата генерируется так, чтобы только частоты, которые являются целыми кратными частот первой полосы входного сигнала, содержались в первой заплате. Кроме того, второй алгоритм создания «заплат» может быть смешивающим алгоритмом создания «заплат». Это означает, например, что вторая заплата может генерироваться так, чтобы вторая заплата содержала частоты, которые являются целыми кратными частот первой полосы входного сигнала и частот, которые не являются целыми кратными частот первой полосы входного сигнала. Поэтому спектральная плотность второй заплаты выше, чем спектральная плотность первой заплаты. Посредством комбинирования первой заплаты и второй заплаты недостающие частотные линии первой заплаты могут быть заполнены частотными линиями второй заплаты. Таким образом, промежутки гармонического расширения полосы пропускания согласно первому алгоритму создания «заплат» могут быть заполнены второй заплатой, и звуковое качество сигнала с расширенной полосой пропускания может быть значительно улучшено.
Некоторые осуществления согласно изобретению касаются устройства для получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале. Устройство включает определитель данных огибающей спектра, генератор управляющих данных масштабирования заплаты и выходной интерфейс. Определитель данных огибающей спектра формируется, чтобы определить данные огибающей спектра, основанные на высокочастотной полосе входного сигнала. Генератор управляющих данных масштабирования заплаты формируется, чтобы генерировать управляющие данные масштабирования заплаты для масштабирования сигнала с уменьшенной полосой пропускания в декодере, или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра. Критерий огибающей спектра основывается на данных огибающей спектра. Первая заплата генерируется от низкочастотной полосы сигнала с уменьшенной полосой пропускания согласно первому алгоритму создания «заплат», и вторая заплата генерируется от низкочастотной полосы сигнала с уменьшенной полосой пропускания согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированная согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат». Выходной интерфейс формируется, чтобы объединить низкочастотную полосу входного сигнала, данные огибающей спектра и управляющие данные масштабирования мощности для получения сигнала с уменьшенной полосой пропускания. Далее, выходной интерфейс формируется, чтобы получить сигнал с уменьшенной полосой пропускания для передачи или хранения.
Некоторые дальнейшие осуществления согласно изобретению касаются звукового сигнала, включающего первую полосу и вторую полосу. Первая полоса представлена данными первого разрешения, и вторая полоса представлена данными второго разрешения. Второе разрешение ниже, чем первое разрешение. Данные второго разрешения основываются на данных огибающей спектра второй полосы и управляющих данных масштабирования заплаты второй полосы для масштабирования звукового сигнала в декодере или для масштабирования первой заплаты и второй заплаты декодером так, чтобы сигнал с расширенной полосой пропускания, генерированный декодером, удовлетворял критерию огибающей спектра. Критерий огибающей спектра основывается на данных огибающей спектра. Первая заплата генерируется от первой полосы звукового сигнала согласно первому алгоритму создания «заплат», и вторая заплата генерируется от первой полосы звукового сигнала согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты, генерированной согласно первому алгоритму создания «заплат».
Осуществления согласно изобретению будут впоследствии рассмотрены более детально со ссылкой на приложенные рисунки, в которых:
Фиг.1 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;
Фиг.2а - схематическая иллюстрация генерированной первой заплаты;
Фиг.2b - схематическая иллюстрация генерированной первой и второй заплаты;
Фиг.3а - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;
Фиг.3b - схематическая иллюстрация синусоидального входного сигнала с ограниченным уровнем;
Фиг.3с - схематическая иллюстрация полуволнового выпрямленного синусоидального входного сигнала;
Фиг.3d - схематическая иллюстрация волнового выпрямленного синусоидального входного сигнала с ограниченным уровнем;
Фиг.4 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;
Фиг.5а - схематическая иллюстрация выполнения гребенки фильтров фазового вокодера;
Фиг.5b - детальная иллюстрация фильтра фиг.5а;
Фиг.5с - схематическая иллюстрация манипулирования сигналом с амплитудным кодированием и сигналом с частотным кодированием в канале фильтра фиг.5а;
Фиг.6 - схематическая иллюстрация выполнения преобразования фазового вокодера;
Фиг.7 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;
Фиг.8 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;
Фиг.9 - блок-схема устройства для генерирования сигнала с расширенной полосой пропускания от входного сигнала;
Фиг.10 - блок-схема устройства для получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале;
Фиг.11 - блок-схема способа генерирования сигнала с расширенной полосой пропускания от входного сигнала;
Фиг.12 - блок-схема способа получения сигнала с уменьшенной полосой пропускания, основанного на входном сигнале;
Фиг.13 - схематическая иллюстрация известного алгоритма расширения полосы пропускания.
В дальнейшем те же самые номера ссылки частично используются для объектов и функциональных узлов, имеющих те же самые или подобные функциональные свойства, и их описание относительно номера должно применяться также к другим номерам, чтобы уменьшить избыточность в описании осуществлений.
Фиг.1 показывает блок-схему устройства 100 для генерирования сигнала с расширенной полосой пропускания 122 для входного сигнала 102 согласно осуществлению изобретения. Входной сигнал 102 представлен для первой полосы данными первого разрешения и для второй полосы данными второго разрешения; второе разрешение ниже, чем первое разрешение. Устройство 100 включает генератор заплат 110, соединенный с объединителем 120. Генератор заплат 120 генерирует первую заплату 112 от первой полосы входного сигнала 102 согласно первому алгоритму создания «заплат» и генерирует вторую заплату 114 от первой полосы входного сигнала 102 согласно второму алгоритму создания «заплат». Спектральная плотность второй заплаты 114, генерированной согласно второму алгоритму создания «заплат», выше, чем спектральная плотность первой заплаты 112, генерированной согласно первому алгоритму создания «заплат». Объединитель 120 объединяет первую заплату 112, вторую заплату 114 и первую полосу входного сигнала 102, чтобы получить сигнал с расширенной полосой пропускания 122. Далее, устройство 100 для генерирования сигнала с расширенной полосой пропускания 122 масштабирует входной сигнал 102 согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» или масштабирует первую заплату 112 и вторую заплату 114 так, чтобы сигнал с расширенной полосой пропускания 122 удовлетворял критерию огибающей спектра.
Спектральная плотность означает, например, плотность различных частот или частотных линий в пределах частотного диапазона. Например, частотный диапазон от 0 Гц до 10 кГц, включающий частотные части с частотами 4 кГц и 8 кГц, имеет более низкую спектральную плотность, чем тот же самый частотный диапазон, включающий частотные части с частотами 2 кГц, 4 кГц, 6 кГц, 8 кГц и 10 кГц. Так как спектральная плотность первой заплаты 112 ниже, чем спектральная плотность второй заплаты 114, первая заплата 112 включает промежутки по сравнению со второй заплатой 114. Поэтому вторая заплата 114 может использоваться для заполнения этих промежутков. Так как обе заплаты основываются на первой полосе входного сигнала 102, обе заплаты связаны с характеристикой оригинального сигнала, соответствующего входному сигналу 102. Поэтому сигнал с расширенной полосой пропускания 122 может быть хорошей аппроксимацией оригинального сигнала, и субъективное качество или звуковое качество сигнала с расширенной полосой пропускания 122 может быть значительно улучшено при использовании описанной концепции. Таким образом, больше энергии может быть распределено между остающимися линиями и, например, можно избежать неестественного звука.
Например, первый алгоритм создания «заплат» может быть гармоническим алгоритмом создания «заплат». Поэтому генератор заплат 110 может генерировать первую заплату 112, включающую только частоты, которые являются целыми кратными частот первой полосы входного сигнала 102. Гармоническое расширение полосы пропускания может обеспечить хорошую аппроксимацию тональной структуры оригинального сигнала, но этот алгоритм создания «заплат» оставит промежутки между гармоническими частотами. Эти промежутки могут быть заполнены второй заплатой. Например, второй алгоритм создания «заплат» может быть смешивающим алгоритмом создания «заплат», что означает, что генератор заплат 110 может генерировать вторую заплату 114, включающую целые кратные частот первой полосы входного сигнала 102 (гармонические частоты) и частоты, которые не являются целыми кратными частот первой полосы входного сигнала 102 (негармонические частоты). Негармонические частоты могут использоваться для заполнения промежутков первой заплаты 112. Можно также объединить целую вторую заплату 114 (включая гармонические частоты) с первой заплатой 112. В этом примере усиление гармонических частот в результате соединения гармонических частотных частей первой заплаты 112 и второй заплаты 114 может приниматься во внимание соответствующим масштабированием первой заплаты 112 и/или второй заплаты 114.
Первая заплата 112 и вторая заплата 114 включают, по крайней мере, частично тот же самый частотный диапазон. Например, первая заплата 112 включает частотный диапазон от 4 кГц до 8 кГц, а вторая заплата 114 включает частотный диапазон от 6 кГц до 10 кГц. В некоторых осуществлениях согласно изобретению подавленная НЧ-составляющая частоты первой заплаты равна подавленной НЧ-составляющей частоты второй заплаты, а подавленная ВЧ-составляющая частоты первой заплаты 112 равна подавленной ВЧ-составляющей частоты второй заплаты 114. Например, обе заплаты включают частотный диапазон от 4 кГц до 8 кГц.
Фиг.2а и 2b показывают пример первой заплаты 112 согласно первому алгоритму создания «заплат» 212 и второй заплаты 114 согласно второму алгоритму создания «заплат» 214. Для лучшей иллюстрации фиг.2а показывает только первые заплаты 112, и фиг.2b показывает первые заплаты 112 и соответствующие вторые заплаты 114. Фиг.2а иллюстрирует пример 200 для первой полосы 202 входного сигнала 102 и двух первых заплат 112, генерированных согласно первому алгоритму создания «заплат» 212. В этом примере заплата включает ту же самую полосу пропускания, что и первая полоса 202 входного сигнала 102. Полоса пропускания может также быть различной. Подавленная ВЧ-составляющая 220 первой полосы 202 входного сигнала 102 обозначена частотой «Xover» (частота разделения). В примере, показанном на фиг.2а, заплаты начинаются на частоте, равной кратному частоты разделения Xover 220. Частотные линии в пределах первых заплат 112 являются целыми кратными частотных линий первой полосы 202 входного сигнала 102 и могут, например, генерироваться фазовым вокодером. Эти первые заплаты 112 включают промежутки в показателях недостающих частотных линий по сравнению с первой полосой 202 входного сигнала 102.
Фиг.2b дополнительно показывает пример 250 двух соответствующих вторых заплат 114. Эти заплаты генерируются согласно второму алгоритму создания «заплат» 214 и включают гармонические и негармонические частоты. Негармонические частотные линии могут использоваться для заполнения промежутков первых заплат 112. Частотные линии вторых заплат 114 могут генерироваться, например, нелинейным искажением.
Таким образом, промежутки могут заполняться не произвольно как, например, при заполнении промежутков шумом. Промежутки заполняются, основываясь на данных первого разрешения первой полосы входного сигнала и, следовательно, основываясь на оригинальном сигнале.
Первая полоса входного сигнала 102 может представлять, например, низкочастотную полосу оригинального звукового сигнала, кодируемого с высоким разрешением. Вторая полоса входного сигнала 102 может представлять, например, высокочастотную полосу оригинального звукового сигнала и может квантоваться одним или несколькими параметрами как, например, данные огибающей спектра, данные о шуме и/или недостающие гармонические данные с низким разрешением. Оригинальный звуковой сигнал может быть, например, звуковым сигналом, зарегистрированным микрофоном до обработки или кодирования.
Масштабирование входного сигнала согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» означает, например, что входной сигнал масштабируется один раз согласно первому алгоритму создания «заплат» прежде, чем генерируется первая заплата, и затем первая заплата генерируется, основываясь на масштабированном входном сигнале, и что входной сигнал масштабируется один раз согласно второму алгоритму создания «заплат» прежде, чем генерируется вторая заплата, и затем вторая заплата генерируется, основываясь на масштабированном входном сигнале, так, чтобы после объединения первой заплаты, второй заплаты и первой полосы входного сигнала сигнал с расширенной полосой пропускания удовлетворял критерию огибающей спектра. Альтернативно, первая заплата и вторая заплата масштабируются после их генерирования так, что сигнал с расширенной полосой пропускания также удовлетворяет критерию огибающей спектра. Также возможно масштабирование входного сигнала согласно первому алгоритму создания «заплат» и согласно второму алгоритму создания «заплат» вместе с масштабированием первой заплаты и второй заплаты.
Объединитель 120 может быть, например, сумматором, а сигнал с расширенной полосой пропускания 122 может быть взвешенной суммой первой заплаты 112, второй заплаты 114 и первой полосы входного сигнала 102.
Удовлетворение критерию огибающей спектра означает, например, что огибающая спектра сигнала с расширенной полосой пропускания основывается на данных огибающей спектра, содержащихся во входном сигнале. Данные огибающей спектра могут генерироваться кодирующим устройством и могут представлять вторую полосу оригинального сигнала. Таким образом, огибающая спектра сигнала с расширенной полосой пропускания может быть хорошей аппроксимацией огибающей спектра оригинального сигнала.
Устройство 100 может также включать основной декодер для декодирования первой полосы входного сигнала 102.
Генератор заплат 110 и объединитель 120 могут быть, например, специально разработанными аппаратными средствами или частью процессора или микроконтроллера, или могут быть компьютерной программой, формируемой для запуска на компьютере или микроконтроллере. Устройство 100 может быть частью декодера или звукового декодера.
Фиг.3а показывает блок-схему устройства 300 для генерирования сигнала с расширенной полосой пропускания 122 от входного сигнала 102 согласно осуществлению изобретения. В этом примере генератор заплат 110 включает фазовый вокодер 310 для генерирования первой заплаты и ограничитель амплитуды 320 для того, чтобы генерировать вторую заплату 114. Фазовый вокодер 310 и ограничитель амплитуды 320 соединены с объединителем 120. Фазовый вокодер 310 может расширять первую полосу входного звукового сигнала 102 для генерирования первой заплаты 112, включающей гармонические частоты. На этапе нелинейной обработки ограничитель амплитуды 320 может ограничивать входной сигнал 102, чтобы генерировать вторую заплату 114, включающую гармонические и негармонические частоты. Альтернативно ограничителю амплитуды 320 также полуволновый выпрямитель, волновой выпрямитель, микшер или диод, используемые в квадратной области характеристической кривой, могут использоваться для генерирования негармонических частот, основанных на входном сигнале 102, на стадии нелинейной обработки.
Фиг.3b, 3с и 3d показывают примеры сигнала с ограничением уровня и/или выпрямленного входного сигнала 102 для генерирования негармонических частот. Фиг.3b показывает схематическую иллюстрацию 350 синусоидального входного сигнала с ограничением уровня 102. При ограничении сигнала появляются точки разрыва в форме резких изменений наклона сигнала 380, и генерируются гармонические и негармонические части с более высокими частотами.
Альтернативно, фиг.3с показывает схематическую иллюстрацию 360 полуволнового выпрямленного синусоидального входного сигнала 102, также вызывающего точки разрыва 380.
Далее, возможна комбинация ограничения и выпрямления. Фиг.3d показывает схематическую иллюстрацию 370 сигнала с ограничением уровня и волнового выпрямленного синусоидального входного сигнала 102, вызывающего различные точки разрыва 380.
При ограничении и/или выпрямлении или применении других способов нелинейной обработки производящей точки разрыва 380 может генерироваться широкий спектр различных частот. Поэтому заплата, генерированная согласно такому алгоритму создания «заплат», может иметь высокую спектральную плотность.
Фиг.4 показывает блок-схему устройства 400 для генерирования сигнала с расширенной полосой пропускания 122 от входного сигнала 102 согласно осуществлению изобретения. Устройство 400 подобно устройству, показанному на фиг.3а, но дополнительно включает селектор спектральных линий 410. Фазовый вокодер 310 и ограничитель амплитуды 320 соединены с селектором спектральных линий 410, а селектор спектральных линий 410 соединен с объединителем 120. Селектор спектральных линий 410 может выбрать множество частотных линий второй заплаты 114, чтобы получить измененную вторую заплату 414, которая может быть дополнительной к первой заплате. Частотная линия второй заплаты 114 может быть выбрана, если отсутствует соответствующая частотная линия первой заплаты 112. Другими словами, селектор спектральных линий 410 выбирает частотные линии второй заплаты 114 для заполнения промежутков первой заплаты 112 и может игнорировать частоты второй заплаты 114, уже содержащиеся в первой заплате 112. Таким образом, измененная вторая заплата 414 может включать промежутки в частотах, уже содержащихся в первой заплате 112.
В этом примере объединитель 120 объединяет первую заплату 112, измененную вторую заплату 414 и первую полосу входного сигнала 102.
Селектор спектральных линий 410 может быть, например, частью генератора заплат 110 (как показано на фиг.4) или отдельным узлом.
В дальнейшем со ссылкой на Фиг.5 и 6 показаны возможные исполнения фазового вокодера 310 согласно данному изобретению. Фиг.5а показывает исполнение гребенки фильтров фазового вокодера, где звуковой сигнал подается на вход 500 и получается на выходе 510. В частности, каждый канал схематической гребенки фильтров, проиллюстрированной на фиг.5а, включает полосовой фильтр 501 и последующий осциллятор 502. Выходные сигналы всех осцилляторов из каждого канала объединяются объединителем, который, например, исполняется как сумматор и обозначается цифрой 503, чтобы получить выходной сигнал. Каждый фильтр 501 осуществляется таким образом, что он обеспечивает сигнал с амплитудным кодированием с одной стороны и сигнал с частотным кодированием с другой стороны. Сигнал с амплитудным кодированием и сигнал с частотным кодированием - сигналы времени, иллюстрирующие увеличение амплитуды в фильтре 501 с течением времени, в то время как сигнал с частотным кодированием представляет увеличение частоты сигнала, отфильтрованного фильтром 501.
Схематическое устройство фильтра 501 проиллюстрировано на фиг.5b. Каждый фильтр 501 фиг.5а может быть расположен как на фиг.5b, где, однако, только частоты fi, подаваемые двум входным микшерам 551 и сумматору 552, отличаются от канала к каналу. Микшированные выходные сигналы микшеров 551 оба отфильтрованы фильтрами нижних частот 553, где сигналы нижних частот различны, поскольку они были генерированы частотами местного осциллятора (частоты LO), которые не совпадают по фазе на 90°. Верхний фильтр нижних частот 553 обеспечивает квадратурный сигнал 554, в то время как нижний фильтр 553 обеспечивает совпадающий по фазе сигнал 555. Эти два сигнала, то есть Q и I, поставляются координатному преобразователю 556, который генерирует амплитудно-фазовое представление от прямоугольного представления. Магнитудный сигнал или амплитудный сигнал соответственно фиг.5а с течением времени выводится на выходе 557. Фазовый сигнал поставляется устройству для развертывания фазы 558. На выходе элемента 558 больше нет никакого фазового значения, которое всегда находится между 0 и 360°, но имеется фазовое значение, которое линейно увеличивается. Это «развернутое» фазовое значение поставляется фазовому/частотному преобразователю 559, который может, например, быть исполнен как простой калькулятор разности фаз, который вычитает фазу предыдущей точки во времени из фазы в данной точке во времени, чтобы получить частотное значение для данной точки во времени, или любые другие средства для получения аппроксимации фазовой производной. Это частотное значение добавляется к постоянному частотному значению fi канала фильтра i, чтобы получить изменяющееся во времени частотное значение на выходе 560. Частотное значение на выходе 560 имеет постоянную составляющую, равную fi, и переменную составляющую, равную девиации частоты, на которую данная частота сигнала в канале фильтра отклоняется от средней частоты fi.
Таким образом, как проиллюстрировано на Фиг.5а и 5b, фазовый вокодер достигает разделения спектральной информации и временной информации. Спектральная информация содержится в специальном канале или в частоте fi, которая обеспечивает прямую часть частоты для каждого канала, в то время как временная информация содержится в девиации частоты или в эволюции магнитуды с течением времени соответственно.
Фиг.5с показывает манипуляцию, как она выполняется, для генерирования первой заплаты согласно изобретению, в частности посредством использования фазового вокодера 310 и, более подробно, вставленного там, где расположены пунктирные линии проиллюстрированной схемы на фиг.5а.
Для масштабирования времени, например, амплитудные сигналы A(t) в каждом канале или частоте сигналов f(t) в каждом канале могут быть уменьшены в 10 раз или интерполированы. В целях перемещения, поскольку это полезно для данного изобретения, выполняется интерполяция, то есть временное расширение или распространение сигналов A(t) и f(t), чтобы получить сигналы распространения A'(t) и f(t), где интерполяция регулируется фактором распространения 598. Фактор распространения может быть отобран, например, так, чтобы фазовый вокодер генерировал гармонические частоты. Посредством интерполирования фазового изменения, то есть значения перед дополнением постоянной частоты сумматором 552, частота каждого индивидуального осциллятора 502 на фиг.5а не меняется. Временное изменение полного звукового сигнала замедляется, однако, фактором 2. В результате получается распространенный во времени тон, имеющий оригинальный основной тон, то есть оригинальную основную волну с ее гармониками.
Посредством выполнения обработки сигнала, проиллюстрированной на фиг.5с, звуковой сигнал может быть сокращен до его оригинальной длительности, например, посредством децимации фактора 2, в то время как все частоты одновременно удваиваются. Это приводит к перемещению основного тона фактором 2, где, однако, получается звуковой сигнал, который имеет ту же самую длину, что и оригинальный звуковой сигнал, то есть то же самое число сэмплов.
В качестве альтернативы выполнению гребенки фильтров, проиллюстрированной на фиг.5а, может также выполняться преобразование фазового вокодера, как изображено на фиг.6. Здесь, звуковой сигнал 698 подается в процессор FFT, или более широко, в процессор кратковременного преобразования Фурье (STFT) 600 в качестве последовательности временных выборок. Процессор FFT 600 осуществляется, чтобы выполнить временную обработку звукового сигнала методом окна, чтобы затем посредством последующего FFT вычислить магнитудный спектр и также фазовый спектр, где это вычисление выполняется для последовательных спектров, которые соединены с блоками звукового сигнала, которые сильно перекрываются.
В крайнем случае для каждого нового сэмпла звукового сигнала может быть вычислен новый спектр, где новый спектр также может быть вычислен, например, только для каждого двадцатого нового сэмпла. Это расстояние 'а' в сэмплах между двумя спектрами предпочтительно производится контроллером 602. Контроллер 602 далее осуществляется, чтобы снабжать процессор