Способ возбуждения синтезаторов речи
Иллюстрации
Показать всеРеферат
Союз Советсиик
Социалистических
Республик
ОЛ ИСАНИЕ
ИЗОБРЕТЕН ИЯ
К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ
G 10 L 1/10
9мударетвекаЫ1 кюиатвт
СССР ю делан изобретений и аткрнтий
Опубликовано 15.10.82. Бюллетень М 38 (53) УДК 621.
° 391 ° 19 (088.8) Дата опубликовании описания 18 . 10 .82 (72) Автори изобретения
В.Н. Сорокин и Е.В. Власов
1 -:, "ЕЬР
Институт проблем передачи информации (71) Заявитель (54) СПОСОБ ВОЗБУЖДЕНИЯ СИНТЕЗАТОРОВ .РЕЧИ га
Изобретение относится к автоматическому синтезу речи, а именно к ме. . тодам возбуждения синтезаторов речи источником голосовых импульсов, и
-может быть использовано в системах вывода информации в речевой форме и в системах синтетической телефонии.
Характеристики источника голосовых импульсов, как известно, оказывают решающее влияние на натуральность звучания синтезированного речевого сигнала. До настоящего времени способы и устройства голосового возбуждения синтезаторов речи опирались, главным образом, на исследования поведения воздушного потока, протекающего через голосовую щель и модулируемого колебаниями голосовых связок.
Этот источник называется источником объемной скорости.
Известен источник объемной скорости,(1 1, представляющий собой модель голосовых связок, рассматриваемых как система с сосредоточенными
2 параметрами, причем автоколебания связок возникают за счет эффекта Бернулли, создаваемого движущимся потоком воздуха. Детальные исследования движений голосовых связок показали, что они совершают изгибные колебания во всех трех измерениях: вдоль голо-. совой щели, поперек голосовой щели во фронтальной плоскости и вдоль оси голосового тракта. Колебания голосо-, вых связок во фронтальной плоскости. проявляются, в основном, в разности фаз движения верхней и нижней кромок связок. Этот эффект положен в основу так называемой двухмассовой модели голосового источника.
Р
Известна двухмассовая модель голосового источника, в которой голосовые связки определены в виде двух сосредоточенных масс, связанных друг с другом и жесткими стенками через упругие и деформирующие элементы. Выбирая определенные соотношения этих масс и
966725
1 верх. Непосредственные измерения верикальных движений связок показывают, то на интервале открытой голосовой ели они однозначно связаны с амплитуой горизонтальных движений связок, этот факт может быть использован ля упрощения вычислений.
Когда связки сомкнуты, подъем верхней поверхности происходит в результате того, что после соударения связок движение, частиц их массы по инерции продолжается, но поскольку их горизонтальное движение ограничено, то происходит растекание смещений, главным образом, в вертикальном наI правлении. Кроме того, несовпадение вертикальных координат центров тяжести связок и точки приложения равнодействующих сил при соударении приводит к возникновению вращающего мо.мента и дополнительному подъему верхних кромок связок.
Акустические следствия вертикальных смещений верхней поверхности голосовых связок можно продемонстрировать, рассмотрев волновое уравнение и его граничные условия. Обозначив через
W(t) объемную скорость воздушного потока через голосовую щель и через
H(t) - вертикальное смещение верхней поверхности голосовых связок, считая, что все точки этой .поверхности совершают синфазное движние, тогда для волнового уравнения относительно акустического давления
1 д (й ) 1др 0 (1)
S dx dx c dt граничные условия на голосовых связках есть сН4 Р сРН вЂ” К- - — 7 (2)
dx(x=O S0 dt o где х - криволинейная кордината вдоль оси голосового тракта (х = 0 на верхней. кромке голосовых связок);
- время; р -. акустическое давление;
S - площадь поперечного сечения голосового тракта; с - скорость звука в воздухе;. о - плотность воздуха; 0
S0 - площадь голосового тракта непосредственно у связок;
- длина голосовых связок;
К . - некоторый коэффициент.
Неоднородные граничные условия (2) сводятся к однородным путем перехода к новой искомой переменной р, что приводит к, появлению возбуждающей сижесткости упругих элементов, добиваются сдвига колебаний масс (2). т
Однако данная модель характеризуется неправдоподобностью параметров щ по сравнению с данными о геометрии и д характеристиках голосовых связок, а также недостаточной натуральностью д звучания синтезированной речи, проявI ляющейся в "машиноподобном" тембре.
Наиболее близкой к предлагаемой 1в является модель трехмерных упругих колебаний голосовых связок (3 J, Однако в известной модели не выявлена роль вертикальных смещений голосовых связок в возбуждении акусти- д ческих колебаний в голосовом тракте.
Цель изобретения - повышение натуральности синтезированной речи и расширение возможностей в управлении ее тембром.
Поставленная цель достигается тем, что для голосового источника возбуждения синтезаторов речи используется модель трехмерных колебаний голосовых связок, причем сигнал голосового д возбуждения формируют как сумму первой и третьей производных от сигнала, пропорционального объемной скорости воздушного потока, протекающего через голосовую щель, и второй и четвертый .Зв производных от сигнала, пропорционального вертикальному смещению верхней поверхности голосовых связок.
Источник, возбуждающий акустические колебания в трубе за счет движения верхней поверхности голосовых связок, называется поршневым.
На фиг. 1 показаны импульсы объемной скорости воздушного потока через голосовую щель; на фиг. 2 - смещение верхней поверхности голосовых связок; на фиг. 3 - синтезированные речевые сигналы, соответствующие гласному звуку "А".
На фиг. 3 обозначено: 1 - только объемный источник возбуждения, 2объемный и поршневой источники. физические причины вертикального движения верхней поверхности голосовых связок различны для интервалов, SO на которых голосовая щель открыта или закрыта. В первом случае подъем крОмки свяэОк прОисхОдит под влиянием избыточного, давления- в легких и в ре- . зультате того, что нижние кромки связок начинают расходиться раньше верх- SS них. Вследствие этого толщина верхних кромок уменьшается и под действи ем легочного давления они прогибаются
5 96672 лы F (x, t)в правой части волнового уравнения (1). Иожно показать, что конечный результат этих преобразований приводит к уравнению — (S - ) ".. — - = F(x, й)
1 d" d 1 d2
Т dx dx с dt s где возбуждающая сила F(x, t) есть
F(x t) = - (1+ — — (х-I?) f(t)У, Е (х (х Р)2 d2f(t)
2с dt 2
l dW К сРН и f(t) — — — 4 —
S0 dt О
1$ где 3 - длина голосового тракта.
Таким образом, возбуждающая функция F(x, t) зависит от первой и третьей производных по времени от объемной скорости W(t) и от второй и чет20 вертой производных по времени от вертикального смещения верхней поверх. ности голосовых связок H(t).
Аналитические оценки энергетичес кого вклада поршневого источника в
23 акустические колебания на интервале открытой голосовой щели показывают, что по порядку величины он сравним с вкладом объемного источника. Вертикальные смещения голосовых связок на интервале закрытой голосовой щели, хотя и меньше по степени их влияния, приводят к тому, что свободные затухающие акустические колебания в голосовом тракте отсутствуют. Эти результаты объясняют некоторые эксперименты по обратной фильтрации речевых сигналов, в которых обнаружено дополнительное возбуждение колебаний на интервале закрытой голосовой щели.!
5 6
Аудиторская экспертиза звуков ре" чи, синтезированных с поршневым источником. показывает улучшение нату- . ральности звучания по сравнению с объемным источником и возможность управления тембром речи эа счет соответствующего выбора параметров поршневого источника.
Формула изобретения
Способ возбуждения синтезаторов речи, использующий трехмерную модель колебаний голосовых связок, о т л ич а ю шийся тем, что, с целью повышения натуральности синтезированной речи и расширения возможности в управлении ее тембром, сигнал голосового возбуждения формируют как сумму первой и третьей производных от сигнала, пропорционального объемной скорости воздушного потока, протекающего через голосовую щель, и второй и четвертой производных от сигнала, пропорционального вертикальному смещению верхней поверхности голосовых связок.
Источники информации, принятые во внимание при экспертизе
1. Патент CIIIA Ii" 351I932, кл. 179/1, 1970 °
2. 3shlzaku К., Flanagan 3
Synthesis of voiced Sounds from a
two-mass, model of the Vocal Cords.
"BeII Syst. Techn. 3 .", 1972, ч ° 50, N 6, р. 1233-1268.
3. Т.11ле 3 . R., Ta l k i n D.Т. А theo
retical Study of the effects of чаrious laryneal configurations on the
acoustics of phonation. — "3. Acoust.
Soc. Am., 1979, ч.66, N 1, р. 60-74.
966725
Фиа!
Фиа2 г
Фиг3
Тираж 390 Подписное
ВНИИПИ Государственного комитета CCCP по делам изобретений и открытий
113035, Москва, Ж-35; Раушская наб., д. 4/5
Заказ 849/68 филиал ППП "Патент", г. Ужгород, ул. Проектная, 4
Составитель Б. Поспелов
Редактор К. Волощук Техред С. Мигунова Корректор Г. Решетник