Способ возбуждения синтезаторов речи

Иллюстрации

Показать все

Реферат

 

Союз Советсиик

Социалистических

Республик

ОЛ ИСАНИЕ

ИЗОБРЕТЕН ИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

G 10 L 1/10

9мударетвекаЫ1 кюиатвт

СССР ю делан изобретений и аткрнтий

Опубликовано 15.10.82. Бюллетень М 38 (53) УДК 621.

° 391 ° 19 (088.8) Дата опубликовании описания 18 . 10 .82 (72) Автори изобретения

В.Н. Сорокин и Е.В. Власов

1 -:, "ЕЬР

Институт проблем передачи информации (71) Заявитель (54) СПОСОБ ВОЗБУЖДЕНИЯ СИНТЕЗАТОРОВ .РЕЧИ га

Изобретение относится к автоматическому синтезу речи, а именно к ме. . тодам возбуждения синтезаторов речи источником голосовых импульсов, и

-может быть использовано в системах вывода информации в речевой форме и в системах синтетической телефонии.

Характеристики источника голосовых импульсов, как известно, оказывают решающее влияние на натуральность звучания синтезированного речевого сигнала. До настоящего времени способы и устройства голосового возбуждения синтезаторов речи опирались, главным образом, на исследования поведения воздушного потока, протекающего через голосовую щель и модулируемого колебаниями голосовых связок.

Этот источник называется источником объемной скорости.

Известен источник объемной скорости,(1 1, представляющий собой модель голосовых связок, рассматриваемых как система с сосредоточенными

2 параметрами, причем автоколебания связок возникают за счет эффекта Бернулли, создаваемого движущимся потоком воздуха. Детальные исследования движений голосовых связок показали, что они совершают изгибные колебания во всех трех измерениях: вдоль голо-. совой щели, поперек голосовой щели во фронтальной плоскости и вдоль оси голосового тракта. Колебания голосо-, вых связок во фронтальной плоскости. проявляются, в основном, в разности фаз движения верхней и нижней кромок связок. Этот эффект положен в основу так называемой двухмассовой модели голосового источника.

Р

Известна двухмассовая модель голосового источника, в которой голосовые связки определены в виде двух сосредоточенных масс, связанных друг с другом и жесткими стенками через упругие и деформирующие элементы. Выбирая определенные соотношения этих масс и

966725

1 верх. Непосредственные измерения верикальных движений связок показывают, то на интервале открытой голосовой ели они однозначно связаны с амплитуой горизонтальных движений связок, этот факт может быть использован ля упрощения вычислений.

Когда связки сомкнуты, подъем верхней поверхности происходит в результате того, что после соударения связок движение, частиц их массы по инерции продолжается, но поскольку их горизонтальное движение ограничено, то происходит растекание смещений, главным образом, в вертикальном наI правлении. Кроме того, несовпадение вертикальных координат центров тяжести связок и точки приложения равнодействующих сил при соударении приводит к возникновению вращающего мо.мента и дополнительному подъему верхних кромок связок.

Акустические следствия вертикальных смещений верхней поверхности голосовых связок можно продемонстрировать, рассмотрев волновое уравнение и его граничные условия. Обозначив через

W(t) объемную скорость воздушного потока через голосовую щель и через

H(t) - вертикальное смещение верхней поверхности голосовых связок, считая, что все точки этой .поверхности совершают синфазное движние, тогда для волнового уравнения относительно акустического давления

1 д (й ) 1др 0 (1)

S dx dx c dt граничные условия на голосовых связках есть сН4 Р сРН вЂ” К- - — 7 (2)

dx(x=O S0 dt o где х - криволинейная кордината вдоль оси голосового тракта (х = 0 на верхней. кромке голосовых связок);

- время; р -. акустическое давление;

S - площадь поперечного сечения голосового тракта; с - скорость звука в воздухе;. о - плотность воздуха; 0

S0 - площадь голосового тракта непосредственно у связок;

- длина голосовых связок;

К . - некоторый коэффициент.

Неоднородные граничные условия (2) сводятся к однородным путем перехода к новой искомой переменной р, что приводит к, появлению возбуждающей сижесткости упругих элементов, добиваются сдвига колебаний масс (2). т

Однако данная модель характеризуется неправдоподобностью параметров щ по сравнению с данными о геометрии и д характеристиках голосовых связок, а также недостаточной натуральностью д звучания синтезированной речи, проявI ляющейся в "машиноподобном" тембре.

Наиболее близкой к предлагаемой 1в является модель трехмерных упругих колебаний голосовых связок (3 J, Однако в известной модели не выявлена роль вертикальных смещений голосовых связок в возбуждении акусти- д ческих колебаний в голосовом тракте.

Цель изобретения - повышение натуральности синтезированной речи и расширение возможностей в управлении ее тембром.

Поставленная цель достигается тем, что для голосового источника возбуждения синтезаторов речи используется модель трехмерных колебаний голосовых связок, причем сигнал голосового д возбуждения формируют как сумму первой и третьей производных от сигнала, пропорционального объемной скорости воздушного потока, протекающего через голосовую щель, и второй и четвертый .Зв производных от сигнала, пропорционального вертикальному смещению верхней поверхности голосовых связок.

Источник, возбуждающий акустические колебания в трубе за счет движения верхней поверхности голосовых связок, называется поршневым.

На фиг. 1 показаны импульсы объемной скорости воздушного потока через голосовую щель; на фиг. 2 - смещение верхней поверхности голосовых связок; на фиг. 3 - синтезированные речевые сигналы, соответствующие гласному звуку "А".

На фиг. 3 обозначено: 1 - только объемный источник возбуждения, 2объемный и поршневой источники. физические причины вертикального движения верхней поверхности голосовых связок различны для интервалов, SO на которых голосовая щель открыта или закрыта. В первом случае подъем крОмки свяэОк прОисхОдит под влиянием избыточного, давления- в легких и в ре- . зультате того, что нижние кромки связок начинают расходиться раньше верх- SS них. Вследствие этого толщина верхних кромок уменьшается и под действи ем легочного давления они прогибаются

5 96672 лы F (x, t)в правой части волнового уравнения (1). Иожно показать, что конечный результат этих преобразований приводит к уравнению — (S - ) ".. — - = F(x, й)

1 d" d 1 d2

Т dx dx с dt s где возбуждающая сила F(x, t) есть

F(x t) = - (1+ — — (х-I?) f(t)У, Е (х (х Р)2 d2f(t)

2с dt 2

l dW К сРН и f(t) — — — 4 —

S0 dt О

1$ где 3 - длина голосового тракта.

Таким образом, возбуждающая функция F(x, t) зависит от первой и третьей производных по времени от объемной скорости W(t) и от второй и чет20 вертой производных по времени от вертикального смещения верхней поверх. ности голосовых связок H(t).

Аналитические оценки энергетичес кого вклада поршневого источника в

23 акустические колебания на интервале открытой голосовой щели показывают, что по порядку величины он сравним с вкладом объемного источника. Вертикальные смещения голосовых связок на интервале закрытой голосовой щели, хотя и меньше по степени их влияния, приводят к тому, что свободные затухающие акустические колебания в голосовом тракте отсутствуют. Эти результаты объясняют некоторые эксперименты по обратной фильтрации речевых сигналов, в которых обнаружено дополнительное возбуждение колебаний на интервале закрытой голосовой щели.!

5 6

Аудиторская экспертиза звуков ре" чи, синтезированных с поршневым источником. показывает улучшение нату- . ральности звучания по сравнению с объемным источником и возможность управления тембром речи эа счет соответствующего выбора параметров поршневого источника.

Формула изобретения

Способ возбуждения синтезаторов речи, использующий трехмерную модель колебаний голосовых связок, о т л ич а ю шийся тем, что, с целью повышения натуральности синтезированной речи и расширения возможности в управлении ее тембром, сигнал голосового возбуждения формируют как сумму первой и третьей производных от сигнала, пропорционального объемной скорости воздушного потока, протекающего через голосовую щель, и второй и четвертой производных от сигнала, пропорционального вертикальному смещению верхней поверхности голосовых связок.

Источники информации, принятые во внимание при экспертизе

1. Патент CIIIA Ii" 351I932, кл. 179/1, 1970 °

2. 3shlzaku К., Flanagan 3

Synthesis of voiced Sounds from a

two-mass, model of the Vocal Cords.

"BeII Syst. Techn. 3 .", 1972, ч ° 50, N 6, р. 1233-1268.

3. Т.11ле 3 . R., Ta l k i n D.Т. А theo

retical Study of the effects of чаrious laryneal configurations on the

acoustics of phonation. — "3. Acoust.

Soc. Am., 1979, ч.66, N 1, р. 60-74.

966725

Фиа!

Фиа2 г

Фиг3

Тираж 390 Подписное

ВНИИПИ Государственного комитета CCCP по делам изобретений и открытий

113035, Москва, Ж-35; Раушская наб., д. 4/5

Заказ 849/68 филиал ППП "Патент", г. Ужгород, ул. Проектная, 4

Составитель Б. Поспелов

Редактор К. Волощук Техред С. Мигунова Корректор Г. Решетник