Система и способ обработки звукового сигнала
Иллюстрации
Показать всеИзобретение относится к цифровой обработке аудиосигнала. Система звуковоспроизведения содержит устройство (1) ввода цифрового аудиосигнала, процессор (2, DSP) цифрового аудиосигнала и устройство (3) вывода цифрового аудиосигнала, причем процессор (2, DSP) цифрового аудиосигнала содержит фильтр (21) верхних частот с полосой пропускания (f) между первой и второй частотами, например между 300 Гц и 2 кГц, сжимающий усилитель (22) для сжатия и усиления сигнала до необходимых пределов амплитуды, и ограничитель для ограничения сигнала, превышающего уровень ограничения и предпочтительно фильтр (23) нижних частот для фильтрации сигнала, предоставляемого сжимающим усилителем, и для предоставления выходного сигнала, причем полоса пропускания (f) фильтра нижних частот находится в пределах 2 кГц - Fs/2, где Fs - частота выборки, причем 10 Fs/2 может составлять, например, 4 кГц. Параметры различных элементов, например частота отсечки, порядок полосового фильтра, усиление и т.п., предпочтительно зависят от измеряемого уровня шума. Технический результат - создание системы и способа звуковоспроизведения с улучшенной разборчивостью. 3 н. и 20 з.п. ф-лы, 1 табл., 14 ил.
Реферат
Изобретение относится к воспроизведению звука, а более конкретно - к цифровой обработке аудиосигнала.
Изобретение относится к системе воспроизведения звука, содержащей устройство ввода цифрового аудиосигнала, процессор цифрового аудиосигнала и устройство вывода цифрового аудиосигнала.
Изобретение относится также к процессору аудиосигнала для обработки поступающего аудиосигнала для получения выходного аудиосигнала. В частности, изобретение относится к схеме процессора цифрового сигнала (DSP) или соответствующей программе.
Изобретение относится также к способу обработки цифрового аудиосигнала.
Звуковоспроизводящая система, такая, например, как громкоговорящая телефонная система, включает в себя выходной преобразователь, часто называемый громкоговорителем, и устройство ввода для аудиосигнала. Громкоговоритель производит волны звукового давления в соответствии с входным аудиосигналом, который представляет требуемую волну звукового давления.
Очень важна разборчивость звука, воспринимаемого слушателем, особенно при шумовом окружении. Простейший способ увеличения разборчивости - увеличение среднего SPL (уровень звукового давления), т.е. увеличение уровня громкости. Однако простое увеличение уровня громкости не всегда приводит к увеличению разборчивости звуков. Кроме того, слишком большой выходной сигнал может привести к перегрузке громкоговорителя и к дальнейшему снижению разборчивости.
Для увеличения разборчивости звуков предлагались различные методики. Например, в патентной заявке US 2002/0015503 предлагается увеличить разборчивость раздельным ограничением коэффициентов усиления для различных частотных диапазонов.
Существующие системы и способы, однако, либо слишком сложны, требуя сложных вычислений и, соответственно, сложной схемы (аппаратный случай), либо, в случае использования программного обеспечения (программный вариант) - требуют сложную программу, либо все они предоставляют ограниченные преимущества.
Несмотря на приведенные ссылки, сохраняется необходимость в создании усовершенствованных систем и способов для повышения разборчивости.
Задача настоящего изобретения заключается именно в предоставлении системы и способа звуковоспроизведения с улучшенной разборчивостью.
С этой целью система звуковоспроизведения согласно изобретению отличается тем, что содержит цифровой сигнальный процессор, содержащий фильтр верхних частот (HP) с полосой пропускания между первой и второй частотами, предпочтительно между 300 Гц и 2 кГц, сжимающий усилитель (22) для сжатия и усиления сигнала, причем, по меньшей мере, усиление осуществляется после HP фильтрации, а также ограничитель, для ограничения HP отфильтрованного, сжатого и усиленного сигнала, превышающего уровень ограничения.
Система по изобретению основана на следующих положениях:
1. Входящий сигнал усиливается для повышения громкости.
2. Повышение уровня входящего сигнала может привести к превышению максимального уровня цифрового сигнала, и в этом случае сигнал в цифровой форме должен многократно ограничиваться, приводя к искажению исходного сигнала.
3. Низкочастотные составляющие сигнала удаляются, и это позволяет оставшиеся составляющие сигнала усиливать в среднем с большим коэффициентом усиления. Это выполняется с помощью НР фильтра, расположенного перед усилителем. Наиболее низкочастотные составляющие в отношении разборчивости относительно мало важны. Низшие частоты дают наибольший вклад в амплитуду сигнала, и их удаление значительно снижает эту амплитуду, увеличивая верхний предел усиления, т.е. предоставляя возможность большего усиления оставшихся составляющих. Особенно значителен вклад низших частот в речевой сигнал, и их ослабление позволяет значительно расширить верхний предел (т.е. усиление без достижения верхнего уровня ограничения).
Просто отсечка низших частот и увеличение выходного сигнала даст увеличение громкости до уровня наиболее приглушенных звуков. Хотя это и приводит к улучшению разборчивости, но не всегда легко воспринимаемой, особенно при больших пределах изменения громкости, т.е. сжатый динамический диапазон оказывается все же значительным. Для дальнейшего повышения разборчивости устройство содержит сжимающий усилитель для усиления и сжатия сигнала. Таким образом, динамический диапазон оказывается сжатым (при одновременном усилении). Ограничитель ограничивает сигнал, превышающий уровень ограничения, причем уровень ограничения находится в переделах сжатого динамического диапазона и тем самым понижается среднее различие громкости. Более приглушенные звуки подвергаются большему усилению, нежели громкие звуки (приводя к сжатию сигнала до пределов сжатого динамического диапазона), что улучшает разборчивость, поскольку наиболее приглушенный звук становится лучше различимым. Это выполняется с помощью сжимающего усилителя. Любой тип связи амплитуды входного сигнала с амплитудой выходного сигнала может быть выбран в виде варианта сжатия, например, с помощью соответствующей таблицы. Наиболее громкие звуки ограничиваются установкой уровня ограничения в пределах сжатого динамического диапазона, дополнительно улучшая разборчивость. Это выполняется с помощью ограничителя. Сигнал ограничивается при некоторой амплитуде (уровень ограничения) в пределах сжатого динамического диапазона, пределы которого, в частности верхний предел, могут быть установлены во время инициализации. Операция сжатия может быть осуществлена, по меньшей мере, отчасти, до или после НР фильтрации, усиление как таковое (т.е. основная часть усиления) выполняется после НР фильтрации, поскольку при этом удаляются компоненты низших частот, позволяя в среднем получить большее усиление оставшихся компонент (т.е. больший верхний предел усиления).
Идею ограничения не следует понимать как жесткое требование (т.е. как будто бы все значения, превышающие заранее определенное значение С, устанавливаются равными С), но как содержащую также и возможность мягкого ограничения, при котором на подынтервале вплоть до верхнего предела сжатого динамического диапазона используется другое, заранее определенное соотношение амплитуд входного/выходного сигналов.
Предпочтительно сжимающий усилитель отрегулирован так, чтобы не усиливать сигнал с интенсивностью ниже порогового значения.
Ниже порогового значения (некоторая минимальная амплитуда) сигнал вероятнее всего обусловлен шумом. Не будучи усиленными, такие сигналы улучшают разборчивость, поскольку шум при этом снижается. Кроме того, различие между молчанием и речью лучше различимо, что также увеличивает разборчивость. Порог может быть установлен во время инициациализации.
Предпочтительно процессор цифрового звукового сигнала содержит фильтр нижних частот для фильтрации сигнала, предоставляемого сжимающим усилителем, и предоставления выходного сигнала, причем полоса пропускания фильтра нижних частот лежит в диапазоне 2 кГц - Fs/2, где Fs - частота выборки.
Операция сжатия, а в частности и операция ограничения, могут привнести возмущающие обертоны, понижающие естественность и разборчивость излучаемого звука. Кроме того, вследствие использования фильтра верхних частот сигнал уже имеет относительно высокое содержание высокочастотных гармоник. Фильтр нижних частот отсекает или, по меньшей мере, снижает содержание обертонов, возникающих в сжимающем усилителе, тем самым делая звук более естественным и увеличивая разборчивость.
Фильтр верхних частот предпочтительно представляет собой фильтр первого или второго порядка, т.е. фильтр с относительно плавным спадом характеристики. Выгодно удалить большую часть низкочастотных компонент входящего сигнала для предоставления больших возможностей по усилению. Вместе с тем фильтр с относительно крутой характеристикой (ступенчатый фильтр - крайний вариант такого фильтра) удаляет настолько много низкочастотных компонент, что это может привести к неестественному звучанию. Предпочтительно устройство содержит средство, разрешающее пользователю изменять порядок фильтра и/или частоту отсечки. Использование фильтра верхних частот 2-го порядка дает хорошую речевую разборчивость и/или громкость, тогда как использование фильтра верхних частот 1-го порядка позволяет сохранить наиболее естественное воспроизведение исходного звука.
Предпочтительно система и/или программа содержат средство для активизации и/или установки частотной зависимости фильтра нижних частот и/или фильтра верхних частот в зависимости от среднего усиления на стадии регулировки усиления. Среднее усиление есть мера среднего уровня сигнала и, соответственно, уровня громкости излучаемого звукового сигнала. Выгодно, чтобы частота отсечки фильтра верхних частот увеличивалась с увеличением среднего уровня громкости излучаемого сигнала, а частота отсечки фильтра нижних частот снижалась с увеличением уровня громкости.
При очень высоких уровнях усиления (как это может быть при использовании устройства в зашумленной среде) регулирующее действие относительно велико, причем это относительно большое регулирующее действие привносит относительно большое искажение сигнала, т.е. большая часть энергии содержится в нежелательных, неестественных обертонах сигнала. Это приводит к резкому звучанию. Резкость звучания иногда, и даже часто, как это осознали изобретатели, приводит к тому, что слушатель держит громкоговоритель, особенно мобильного телефона, на некотором расстоянии от уха. Помимо поддержания громкоговорителя на некотором расстоянии, в нем самом значительно снижается отношение сигнал-шум, поскольку уровень сигнала снижается, а шума - увеличивается, т.е. просто то, что сам звук воспринимается как резкий, фактически означает снижение разборчивости данного сообщения. Для голосового сообщения резкость голоса часто является неотъемлемой частью сообщения, которую собеседник желает донести до слушателя, причем иногда это даже более важно, нежели конкретные слова сообщения. Таким образом, для разборчивости сообщения важно, чтобы не только сами слова были понятны, но чтобы достигалась и передача ясного, "естественного" голоса. При низких уровнях усиления эффект "резкого звучания" намного слабее. Избирательное включение или установка относительно низкой частоты отсечки фильтра нижних частот, при высоких уровнях усиления, понижает "эффект резкости звучания", а при низких уровнях усиления использование фильтра верхних частот менее необходимо и без включения фильтра верхних частот фактически можно получить более естественное звучание. Итак, при высоких уровнях усиления и сильном регулировании относительно большая часть амплитуды сигнала на высоких частотах обусловлена искусственными артефактами из-за этой регулировки, и удаление (полностью или отчасти) высших частот удаляет артефакты, делая звучание более естественным, при относительно низких уровнях усиления и относительно умеренном регулировании значительно большая часть амплитуды сигнала на высоких частотах имеет естественное происхождение и значительно в меньшей степени обусловлена искусственными артефактами, и отказ от использования фильтра нижних частот (или установки относительно высокой частоты отсечки) оказывается предпочтительным. Избирательным включением фильтра верхних частот в зависимости от усиления оказывается возможным получить улучшенное звуковоспроизведение. Вместо включения/выключения фильтра нижних частот (т.е. выбора on/off) можно сделать характеристику фильтра нижних частот зависящей от усиления, например сделать частоту отсечки 2 кГц для большого усиления (большой шум окружающей среды) и Fs/2, или, например, 4 кГц для малого усиления, или для случая отсутствия окружающего шума, или, другими словами, сделать такую характеристику, в которой частота отсечки снижается при увеличении уровня громкости.
В другом варианте устройство может иметь средство ручной установки характеристик фильтра нижних частот, например переключатель, позволяющий пользователю устанавливать частоты отсечки фильтра 2, 3 и 4 кГц в зависимости от разборчивости (плохой) или от персонального предпочтения. Подобные соображения справедливы и для фильтра верхних частот - при низких уровнях усиления необходимость в использовании фильтра верхних частот меньше, чем при высоких уровнях усиления, и при низких уровнях усиления фильтр высших частот может быть отключен или переведен на уровень низкой частоты отсечки, тогда как при высоком уровне усиления (большая громкость) фильтр верхних частот может быть включен или его частота отсечки установлена относительно высокой, или, другими словами, частота отсечки фильтра высших частот повышается при увеличении уровня громкости.
В первом варианте реализации изобретения система содержит фильтр верхних частот с последующим AGC (автоматическая регулировка усиления), с последующим ограничителем/отсекателем и предпочтительно с последующим фильтром нижних частот. Этот вариант реализации предпочтителен в случае первоочередной важности громкости сигнала. Ограничитель сканирует аудиосигнал на предмет максимумов и ослабляет часть звукового сигнала в окрестности максимума, если ослабление необходимо для установления такого предела ограничения, при котором допустимо ограничение очень громких сигналов.
Во втором варианте реализации изобретения система содержит автоматический регулятор громкости, предваряющий или предпочтительно следующий за фильтром верхних частот, обеспечивающий отрегулированный сигнал, и следующий за усилителем и ограничителем, предпочтительно следующий за фильтром нижних частот. Этот вариант реализации предпочтителен, если желательны малые вычислительные нагрузки.
(Жесткое) ограничение представляет собой простую операцию, при которой любой сигнал, превышающий пороговую интенсивность, ослабляется до упомянутой пороговой интенсивности, т.е. задается максимальная интенсивность сигнала. Преимущество такого варианта реализации заключается в том, что используется простое устройство, а недостаток - в том, что сигнал в большей степени искажен, поскольку теряются все особенности сигнала, находящиеся выше порога.
В предпочтительных вариантах реализации содержится измерительное устройство, такое как микрофон, для измерения уровня фоновых шумов. Устройство содержит адаптер для согласования одного или более параметров в зависимости от измеренного уровня фонового шума. Такими параметрами являются, например, частота отсечки и порядок фильтра верхних частот, коэффициент усиления, уровень ограничения. Предпочтительно для одного или более параметров зависимость от измеренного уровня шума нелинейная.
В рамках идеи изобретения "ограничитель", "устройство сжатия", "усилитель", "фильтр", "преобразователь", "компаратор" и т.п. понимаются в широком смысле и могут содержать любые аппаратные составляющие (такие как ограничитель, устройство сжатия, усилитель и т.п.), любые схемы или подсхемы, собранные для выполнения ограничения, сжатия, усиления и т.п. описанных функций, так же как и любые программные составляющие (компьютерную программу или подпрограмму, или набор компьютерных программ, или программный код(-ы), разработанные или программируемые для выполнения ограничения, сжатия, фильтрации и т.п. операций согласно изобретению, так же как и любая комбинация аппаратных и программных составляющих, функционирующих порознь или совместно, без ограничений в связи с приведенными ниже примерными вариантами реализации. Одна программа может объединять несколько функций.
Изобретение реализуется также в любой компьютерной программе, содержащей средство программного кода для осуществления способа согласно изобретению, когда упомянутая программа запускается на компьютере, так же как и в любом компьютерном программном продукте, содержащем средство программного кода, сохраняемом на машиночитаемом носителе для осуществления способа согласно изобретению, когда упомянутая программа запускается на компьютере, так же как и любой программный продукт, содержащий средство в программном коде для использования в телефонной системе согласно изобретению, для осуществления функций, определяемых изобретением.
Эти и другие объекты изобретения рассматриваются более подробно на примере и в связи с соответствующими чертежами, на которых:
Фиг.1 изображает блок-схему системы, включающей в себя громкоговоритель и DSP.
Фиг.2 - схема DSP согласно изобретению.
Фиг.3 - два примера фильтра верхних частот, которые могут быть использованы в изобретении.
Фиг.4 - форма колебания типичного речевого сигнала.
Фиг.5 - форма колебания после фильтрации фильтром верхних частот.
Фиг.6 - спектр колебания, приведенного на Фиг.4 и 5.
Фиг.7 - один из вариантов реализации изобретения.
Фиг.8 - функциональная блок-схема примерного AGC, обозначенного на Фиг.7.
Фиг.9 - другой вариант реализации изобретения.
Фиг.10 - более подробная схема примерного элемента AVL, обозначенного на Фиг.9.
Фиг.11 - характеристика AVL элемента на Фиг.10.
Фиг.12 - пример функциональной зависимости при сжатии.
Фиг.13 - предпочтительный вариант реализации, параметры которого согласованы в зависимости от измеренного уровня шума.
Фиг.14 -зависимость первого, второго и третьего порядка параметра Р от уровня S шума.
Настоящее изобретение описывается ниже более подробно в связи с сопровождающими чертежами, на которых показаны предпочтительные варианты реализации. Излагаемые ниже варианты реализации не следует понимать, как ограничение изобретения, которое может быть реализовано и во многих других вариантах; а представленные варианты реализации в значительной степени служат для более полного и ясного понимания изобретения и для обозначения области его применения специалистам в данной области техники. Подобные цифровые обозначения при этом относятся к подобным рассматриваемым элементам.
На Фиг.1 схематически показана звуковоспроизводящая система. Это может быть, например, сотовый радиотелефон громкой связи в режиме " hands-free" для использования в автомобиле. В случае такого сотового радиотелефона речевые сигналы, принимаемые издалека, т.е. от удаленного абонента, передаются от сотовой базовой станции (не показана) принимаются приемопередатчиком сотового телефона (не показан) и подаются на вход 1 входящего сигнала от удаленной стороны в виде входного колебания W. В этом примере предполагается, что передача осуществляется вперед и назад между системами, в этом примере телефонными системами, и сигнал принимается в цифровом виде. Если исходные сигналы - аналоговые, то система содержит A-D преобразователь для получения цифрового сигнала приема, который затем подается на вход 1.
На Фиг.1 показано, что колебательный сигнал в цифровой форме подается на вход 1, соединенный с DSP 2 (цифровой процессор звука), который соединяется с цифровым выходом 3, или который его содержит. Выходной цифровой сигнал подается и преобразуется затем в аналоговую форму D-A преобразователем 4 и усиливается усилителем 5 для использования громкоговорителем 6. Звуковая волна давления W1, отображающая речь удаленного абонента, излучается громкоговорителем 6. Соответственно, пользователь радиотелефона воспринимает звуковые колебательные сигналы давления, отображающие речь удаленного абонента.
Однако слушатель слышит не только звук, создаваемый громкоговорителем, но также и другие звуки, делающие трудно различаемым звук громкоговорителя, т.е. получается низкая разборчивость.
Повышение громкости представляется первым и очевидным способом увеличения разборчивости. Однако максимальный выходной уровень громкоговорителя часто ограничен, и простое повышение громкости часто приводит к большему шуму, а не обязательно к увеличению разборчивости сигнала.
Для улучшения разборчивости в устройстве применяется ряд совместных измерений по способу согласно изобретению.
На Фиг.2 очень схематично показан DSP (цифровой процессор звука) для использования в устройстве согласно изобретению. DSP содержит фильтр верхних частот 21 с частотой отсечки между 300 Гц и 2 кГц, предпочтительно между 500 Гц и 1500 Гц, более предпочтительно между 800 Гц и 1200 Гц. Фильтр верхних частот удаляет или снижает содержание частотных компонент ниже частоты отсечки f.
Тем самым устраняется большая часть интенсивности сигнала. Это дает возможность больше усиливать оставшийся сигнал (до появления проблем в связи с цифровым ограничением, т.е. до значения, большего максимального). Усиление выполняется сжимающим усилителем. В рамках идеи изобретения сжимающий усилитель представляет собой усилитель, усиливающий сигнал, но также и регулирующий средний уровень звука, т.е. звуки с меньшей амплитудой усиливаются больше, чем звуки большого уровня, чем уменьшается динамический диапазон. Это может быть выполнено различным образом, например устройством ограничения/отсечки, ограничителем/устройством сжатия, или с помощью AVL (автоматический регулятор напряжения) с последующим усилением и ограничением. Может быть использован ряд различных методик, включая использование табличного метода, для выполнения усиления и сжатия. Динамический диапазон, в частности его верхний предел, может быть установлен производителем или задан пользователем, например, регулятором громкости (ручкой регулировки громкости). Ниже приводятся различные примеры. По сравнению с прямым, линейным усилением сигнала (т.е. для всех уровней звука одинаковый коэффициент усиления) усиление со сжатием обуславливает большую разборчивость звука. Слова различаются легче и, таким образом, улучшается разборчивость звука. Вместе с тем при этом образуется искажение звука, поскольку нелинейное усиление звука привносит обертоны (высокочастотные компоненты на удвоенной, утроенной и т.д. частотах относительно исходной), что приводит к увеличению резкости звука. Этот звук воспринимается слушателем как неприятный и фактически существенно понижается разборчивость голосового сообщения в широком смысле, поскольку резкость произносимых слов часто оказывается важным аспектом голосового сообщения. Этот эффект присутствует даже без эффекта ограничения, которое и само привносит обертоны. Разборчивость в широком смысле имеет отношение не только к словам как таковым, но также и к сообщению, адресованному слушателю. Резкость звука, особенно при высоком среднем усилении, делает всякий звук сердитым, тем самым сильно снижая эмоциональную выразительность, которую желает донести говорящий. Применение фильтра нижних частот, как в предпочтительном варианте реализации на Фиг.2, после усилителя со сжатием снижает воспринимаемую резкость голоса, сохраняя, по меньшей мере, до некоторой степени, изначально эмоциональное содержание произносимых слов, т.е. предоставляя намного более естественный звук. Известно, что в большинстве западных языков тональность слова влияет на эмоциональное воздействие, но не на значение самого слова. Вместе с тем, имеются языки, в которых тональность слова играет более важную роль, обуславливая полностью различающиеся значения одного и того же "слова" в зависимости от тональности его произнесения. В случае использования таких языков (чего нельзя исключить) применение фильтра нижних частот становится еще более полезным. Изобретение особенно полезно при его применении совместно с системами автоматического распознавания речи, или использования в них самих, особенно в случае тех языков, для которых от тональности произнесенного слова зависит его значение. То, что сказано выше в связи с произносимыми словами, т.е. с голосом, одинаково применимо и к случаю использования звуковоспроизводящей системы для воспроизведения музыки. Для восприятия музыки помимо прослушивания нот очень важна резкость звучания. Таким образом, хотя данное изобретение наиболее важно для систем голосовых сообщений, таких как телефонные системы, оно не ограничивается такими системами, а может быть одинаково полезно для систем воспроизведения музыки.
Регулировка уровня или выполнение сжатия может быть выполнено до НР фильтрации входящего сигнала или после такой фильтрации. Усиление фактически выполняется после НР фильтрации. Ограничение выполняется после усиления или одновременно с ним. Если используется фильтр нижних частот, то он располагается после ограничителя.
На Фиг.3 приведены два примера фильтров верхних частот, используемых в системе согласно изобретению.
На левой стороне чертежа показан фильтр 1-го порядка, а на правой - фильтр второго порядка. Показанный фильтр верхних частот имеет частоту f отсечки приблизительно 1 кГц. Фильтры верхних частот первого или второго порядка (имеющие относительно умеренные наклоны в 5 -15 дБ на октаву) являются предпочтительными. Слишком большое устранение низкочастотных компонент приводит к очень неестественному голосовому звучанию (или к неестественно и неправильно звучащей музыке). Поэтому порядок фильтра верхних частот предпочтительно ограничивается значением 2. Это понижает также требуемую вычислительную мощность. Предпочтительно пользователь может изменять порядок фильтра верхних частот от 1-го до 2-го порядка и наоборот, или же система содержит автоматическое переключающее устройство в зависимости от входящего сигнала. Использование 2-го порядка приводит к высокой речевой разборчивости (в ограниченном смысле, т.е. только слова) и/или громкости сигнала, тогда как НР фильтр 1-го порядка лучше сохраняет естественный звук исходного сигнала.
НР фильтр может быть, например, биквадратным, значение частотного отклика которого показано на Фиг.3 и коэффициенты для которого приведены в таблице 1 в соответствии с выражением
Таблица 1 | ||
Коэффициенты фильтрации НР фильтра, приведенного на Фиг.3 | ||
1-го порядка | 2-го порядка | |
b0 | 0,70710678118655 | 0,56903559372885 |
b1 | -0,70710678118655 | -1,13807118745770 |
b2 | 0,00000000000000 | 0,56903559372885 |
a1 | -0,41421356237310 | -0,94280904158206 |
a2 | 0,00000000000000 | 0,33333333333333 |
Эффект от применения фильтра верхних частот можно видеть из Фиг.4, 5 и 6. На Фиг.4 показана форма колебаний типичного речевого сигнала, на Фиг.5 - форма колебаний после фильтрации фильтром верхних частот (обработано НР фильтром верхних частот первого порядка, частота отсечки 1 кГц).
На Фиг.6 показан спектр сигнала по Фиг.4 и 5, причем энергия сигнала с Фиг.4 изображена верхней кривой, а энергия сигнала после фильтра верхних частот изображена нижней кривой. Из Фиг.6 можно видеть, что энергия сигнала по Фиг.4 главным образом концентрируется на низких частотах (ниже 1 кГц).
Эти частоты дают главный вклад в специфику звучания голоса, а в речевую разборчивость - в меньшей степени. Это свойство составляет один объект изобретения.
Ослаблением низших частот амплитуда сигнала значительно понижается, как это видно из Фиг.6, образуя верхний предел для усиления оставшейся части сигнала, содержащей больше тех частот, которые дают вклад в речевую разборчивость, что также видно из Фиг.6.
Последующее сжатие и усиление речевого сигнала, даже при его ограничении, делает речевую разборчивость лучше, чем без использования НР фильтра, причем главным образом по двум причинам:
сигнал содержит относительно больше частот, дающих вклад в речевую разборчивость;
низкие частоты подвергаются менее жесткому ограничению и дают меньше ухудшающих речевую разборчивость гармоник (вызванных ограничением).
Вместе с тем устранение слишком большого количества низкочастотных компонент может привести к слишком неестественному голосовому звучанию. Поэтому НР фильтр предпочтительно представляет собой фильтр только первого порядка, например это может быть фильтр Баттерворта (первого порядка НР). Это дает преимущество в низкой потребляемой вычислительной мощности.
На Фиг.7 показаны детали системы в соответствии с вариантом реализации изобретения.
Устройство DSP содержит HP фильтр (например, такой, как показан на Фиг.3, в этом примере фильтр Баттерворта 1-го или 2-го порядка с частотой отсечки, например, 1 кГц), с последующим AGC, с последующим ограничителем, с последующим фильтром нижних частот (LP).
В этом примере все аудиопотоки могут быть монофоническими. Частота выборки может быть, например, одной из следующих: 8 кГц, 11,025 кГц, 16 кГц, 22,05 кГц, 32 кГц, 44,1 кГц или 48 кГц.
В этом примере AGC (Автоматический Контроль Усиления) действует по блокам, т.е. коэффициент усиления изменяется только по блокам. В этом случае вычислительная мощность поддерживается на минимуме.
На Фиг.8 показана функциональная блок-схема AGC. Усиление рассчитывается так, что RMS для AGC выходного блока приблизительно равно RMS для AGC входного блока. Поэтому отношение входного и выходного (это есть целевое значение) RMS сравнивается с реальным усилением, и это усиление регулируется до целевого значения. Изменения усиления, должны сглаживаться для избежания слишком сильного искажения сигнала вследствие локальных разрывов колебательного сигнала на краях блоков.
Ограничитель/отсекатель увеличивает уровень громкости при поддержании искажения сигнала в пределах границ, предпочтительно настолько малым, насколько это возможно.
В этом примере ограничитель/отсекатель основан на выборочном усилении по выборкам. В обычной методике сжатия усиление зависит от допустимого верхнего предела сигнала.
Ограничитель/отсекатель может использовать так называемый амплитудный коэффициент для вычисления допустимого усиления. Амплитудный коэффициент фактически представляет собой отношение пикового значения и текущего значения RMS сигналов. В ограничителе/отсекателе сигналы с большим амплитудным коэффициентом, например барабанный бой, отсекаются без сильного слышимого искажения. Вследствие этого усиление может оставаться на высшем уровне, снижая "накачивающий эффект" обычных устройств сжатия.
Усиление в этом примерном варианте реализации рассчитывается следующим образом:
прежде всего, рассчитывается текущее RMS значение (среднеквадратичное значение) входного сигнала. Это RMS значение сглаживается усреднением по недавней "истории" колебательного сигнала. Затем пиковое значение рассчитывается, упреждая ожидаемые амплитудные значения сигнала.
С RMS значением и пиковым (амплитудным) значением рассчитывается амплитудный коэффициент. Так называемый "депиковый" коэффициент используется для указания того, насколько жестко алгоритм способен отсекать острые сигналы (высокие значения соответствуют большей отсечке). Затем усиление рассчитывается и сравнивается с максимально дозволенным усилением, которое может быть установлено пользователем, и выбирается минимальное значение из двух. Хотя это здесь и не показано, но установка максимально дозволенного усиления может быть входным сигналом для фильтра верхних частот, причем частота отсечки (или, в общем случае, одна или несколько характеристик фильтра, отличных от частоты отсечки, а также, например, переключение фильтра от первого порядка ко второму) есть функция от установки максимально допустимого усиления.
Фильтр нижних частот LP фильтрует высокие частоты, как следствие, с более естественным звучанием. Хотя это здесь и не показано, но установка максимально дозволенного усиления может быть входным сигналом для фильтра верхних частот, причем частота отсечки (или, в общем случае, одна или несколько характеристик фильтра, отличных от частоты отсечки, а также, например, переключение фильтра от первого порядка ко второму) есть функция установки максимально дозволенного усиления.
На Фиг.7 и 8 показан вариант реализации изобретения одного типа, а Фиг.9 и 10 - другого типа.
По существу эти варианты реализации содержат 4 предпочтительно 5 элементов или этапов:
1. Блок AVL (Автоматический Регулятор Громкости): AVL - это блок обработки сигнала, поддерживающий громкость входящего сигнала на приблизительно постоянном уровне.
2. Фильтр первого порядка НР (верхних частот): этот фильтр устраняет часть нижних частот, определяя верхний предел усиления.
3. Усилитель: увеличивает SPL (Уровень Звукового Давления) сигнала.
4. Ограничитель, предпочтительно жесткий ограничитель, если предпочитается простое устройство: сигнал отсекается при некоторой амплитуде для надежного линейного функционирования аналогового усилителя (после D/A преобразования). Вместо жесткого ограничителя, который просто отсекает сигнал выше уровня отсечки, может также использоваться мягкий ограничитель, который отсекает сигнал выше уровня отсечки, но также ослабляет сигнал по уровню, близкому к уровню отсечки. Использование мягкого ограничителя до некоторой степени восстанавливает динамические параметры сигнала, увеличивая разборчивость.
5. (Предпочтительно) фильтр первого порядка LP (нижних частот): фильтр восстанавливает или, по меньшей мере, улучшает баланс между средними частотами и высокими частотами, без чего звук неестественный и звучание сигнала резкое; этот фильтр делает обрабатываемый звук более приятным для прослушивания.
В этом примере входной сигнал представляет собой речевой сигнал, но он может быть и любым звуковым сигналом.
На Фиг.10 более подробно показан элемент AVL.
На Фиг.10 показана блок-схема AVL. Деление максимальной выходной амплитуды (обозначенной на Фиг.10 как "Reference-Clipping-Lin"; "Задание уровня ограничения")на абсолютное значение максимальной амплитуды сигнала в пределах всего входного блока дает усиление, которое может быть применено к блоку без какого-либо ограничения (обозначенное как "Мгновенное усиление"). Параметр "GainUpdate"; "Коррекция усиления" составляет обычно 1/1000. Таким образом, сигнал после суммирования увеличивается в каждом блоке на величину, зависящую от "Мгновенного усиления". Таким образом, AVL усиление увеличивается быстрее для более высоких значений "Мгновенного усиления".
Поскольку возможное усиление, применяемое к входному сигналу ("AVLусиление"), должно быть не выше, чем ("Мгновенное усиление"), то минимальное значение обоих принято как ("Мин."). Минимальный блок гарантирует также то, что AVL усиление снижается немедленно, если амплитуда входящего сигнала увеличивается. Для предотвращения слишком большого усиления тихой части входного сигнала сигнал после минимального блока ограничивается (обычно 12 дБ). Следует отметить, что поскольку максимальная выходная амплитуда не обязательно равна линейному уровню в 0 дБ, то AVL усиление может быть меньше 1.
Далее, если амплитуда входного сигнала меньше некоторого значения, например меньше нижнего предела шума сигнала, то усиление не применяется. Это еще одна функциональная возможность в предпочтительных вариантах реализации, которая может быть использована также и в других типах сжимающих усилителей для предотвращения усиления малых входных сигналов, когда и шум не усиливается, что повышает разборчивость звука.
Численный пример:
Скорость выборки 8 кГц
Длина блока 80 выборок
Длина слова 16 бит
Максимальная выходная амплитуда 32768 (0 дБ)
Входной сигнал синусоидальный с амплитудой 32768 (0 дБ), частотой ≥100 Гц (по меньшей мере один синусоидальный период на блок)
Текущее AVL усиление составляет 1 (0 дБ)
Коррекция усиления = 0,001
AVL усиление ("Старое значение") ограничено 12 дБ
Итак, амплитуда входного сигнала понижается на 40 дБ (в 100 раз по линейной шкале). В приведенной ниже таблице показано изменение во времени различных сигналов внутри AVL.
Входной блок | Время (мс) | Входная амплитуда | Мгновенное усиление | Сумма | Старое значение | AVL усиление |
-2 | -20 | 32768,00 | 1 | 1 | 1,00 | |
-1 | -10 | 32768,00 | 1 | 1,00 | 1,00 | 1,00 |
0 | 0 | 327,68 | 100 | 1,10 | 1,10 | 1,10 |
1 | 10 | 327,68 | 100 | 1,20 | 1,20 | 1,20 |
2 | 20 | 327,68 | 100 | 1,30 | 1,30 | 1,30 |
3 | 30 | 327,68 | 100 | 1,40 | 1,40 | 1,40 |
4 | 40 | 327,68 |