Синтезатор речи

Иллюстрации

Показать все

Реферат

 

СИНТЕЗАТОР РЕЧИ, содержащий переключатель «тон-шум с входом управления от выделителя сигнала «тоншум , генератор основного тона с входом управления от выделителя частоты основного тона и дополнительным входом, генератор шума и трехканальный динамический формирователь огибающей мгновенного спектра с входами управления по частоте и амплитуде от выделителя формантных параметров, при этом выходы генератора основного тона и генератора шума подсоединены к переключателю «тон-шум, соединенному выходом с соответствующими входами возбуждения трехканального динамического формирователя огибающей мгновенного спектра, отличающийся тем, что, с целью повышения качества синтезированной речи, трехканальный динамический формирователь огибающей мгновенного спектра содержит в каждом канале последовательно соединенные управляемый фильтр и модулятор, выходы которых соединены с входами сумматора, а выход каждого управляемого фильтра соединен также через соответствующий резистор с дополниФ тельным входом генератора основного тона. (Л

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК

„„80„„1084870

3(50 G 10 L 1/00

ОПИСАНИЕ ИЗОБРЕТЕНИЯ"

4f еу

К А ВТОРСКОМЪГ СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТНРЫТИЙ (21) 1950498/18-10 (22) 31.07.73 (46) 07.04.84. Бюл. № 13 (72) В. С. Мартынов (53) 334.782 (088.8) (56) 1. Патент США № 3083266, кл. 179 — 1, 1962.

2. Патент США № 3190963, кл. 179 — 15.55, 1965.

3. Патент США № 3280266, кл. 179 — 15.55, 1966. (54) (57) СИНТЕЗАТОР РЕЧИ, содержащий переключатель «тон-шум» с входом управления от выделителя сигнала «тоншум», генератор основного тона с входом управления от выделителя частоты основного тона и дополнительным входом, генератор шума и трехканальный динамический формирователь огибающей мгновенного спектра с входами управления по частоте и амплитуде от выделителя формантных параметров, при этом выходы генератора основного тона и генератора шума подсоединены к переключателю «тон-шум», соединенному выходом с соответствующими входами возбуждения трехканального динамического формирователя огибающей мгновенного спектра, отличающийся тем, что, с целью повышения качества синтезированной речи, трехканальный динамический формирователь огибающей мгновенного спектра содержит в каждом канале последовательно соединенные управляемый фильтр и модулятор, выходы которых соединены с входами сумматора, а выход каждого управляемого фильтра соединен также через соответствующий резистор с дополнительным входом генератора основного тона.

1084870

Изобретение относится к электросвязи и приборостроению, в частности к вокодерной технике, и может быть использовано в синтезаторах искусственной речи.

Известно устройство для синтеза речи, представляющее собой вокодер, в котором выделяется и передается по каналу связи кроме параметрического сигнала F,(t), специальный добавочный сигнал о тонкой структуре колебаний голосовых связок (1), Недостатками этого устройства являются сложность и увеличение полосы частоты, необходимой для передачи речи.

Известна также система передачи и синтеза речи, в которой, с целью улучшения качества речи, выделяются в анализаторе и передаются по каналу связи к синтезатору управляющие сигналы частот формант для неназальных звуков, сигналы частот антиформант для назальных звуков, сигнал «Тон-шум», параметрический сигнал основного тона, сигнал амплитуды основного тона и сигнал амплитуды шума (2).

Эта система черезмерно сложна и не решает поставленную задачу, так как меры для восстановления естественности речи в ней не принимаются, т. е. голос остается

«механическим».

Наиболее близким к предлагаемому по технической сущности является синтезирующее устройство вокодера, содержащее схему формирования управляющих параметров, со случайными отклонениями, переключатель «Тон-шум», генератор основного тона с входом управления от выделителя основного тона и дополнительным входом, связанным со схемой формирования управляющих параметров со случайными отклонениями, генератор шума и трехканальный динамический формирователь огибающей мгновенного спектра, при этом выходы генератора основного тона и генератора шума подсоединены к переключателю

«тон-шум», соединенному выходом с соответствующими входами возбуждения трехканального динамического формирователя огибающей мгновенного спектра, содержащего также входы управления по частоте и амплитуде от выделителя форм антных параметров.

Недостатком этого устройства является низкое качество синтезированной речи. Это обусловлено тем, что вводимые флуктуации в последовательность возбуждающих импульсов основного тона являются случайными и никак не связаны со структурой и механизмом образования речевой волны.

Целью изобретения является повышение качества синтезированной речи.

Поставленная цель достигается тем, что в синтезаторе речи, содержащем переключатель «тон;шум» со входом управления от выделителя сигнала «тон-шум», генератор основного тона с входом управления

<0

55 от выделителя основного тона и дополнительным входом, генератор шума и трехканальный динамический формирователь огибающей мгновенного спектра с входами управления по частоте и амплитуде от выделителя формантных параметров, при этом выходы генератора основного тона и генератора шума подсоединены к переключателю «тон-шум», соединенному выходом с соответствующими входами возбуждения трехканального динамического формирователя огибающей мгновенного спектра, трехканальный динамический формирователь огибающей мгновенного спектра содержит в каждом канале последовательно соединенные управляемый фильтр и модулятор, выходы которых соединены со входами сумматора, а выход каждого управляемого фильтра соединен также через соответствующий резистор с дополнительным входом генератора основного тона.

Сущность изобретения поясняется чертежом, где представлена схема синтезатора речи.

Си нтезатор содержит переключатель тон-шум 1, генератор шума 2, генератор основного тона 3, резисторы 4, управляемые формантные фильтры 5, модуляторы 6, сумматор 7.

Устройство работает следующим образом

На синтезатор поступают параметрические сигналы Е „(t) Fð (t) Fi(t) и AK(t) в полосе 0 — 10, 0 — 35.Гц, выделенные из речевого сигнала или полученные искусственно, например, с ЭВМ.

Сигнал Р „(() с помощью переключателя

1 осуществляет переключение спектра, поступающего на возбуждение управляемых фильтров 5.

В зависимости от сигнала F gt) осуществляется подключение переключателя либо к генератору основного тона 3, либо к генератору шума 2. Сигнал Fo (t), являющийся сигналом мелодии основного тона, т. е. сглаженным, усредненным значением мгновенной частоты основного тона, управляет частотой генератора основного тона.

Сигналы Fi(t) управляют управляемыми формантными фильтрами 5.

Сформированные в управляемых фильтрах 5 сигналы, имеющие необходимые частотные составляющие спектра, далее поступают на модуляторы б, которые вносят веса в соответствии с сигналами Ai(t). Сигналы всех 3-х формант смешиваются в сумматоре 7, образуя на его выходе синтезированный речевой сигнал.

Для получения тонкой, естественной стру ктуры речи с помощью резисторов 4 вводится напряжение обратной связи. Оно подается на дополнительный вход генератора основного тона 3 и определят формирование мгновенного значения периода основн1084870

Составитель В. Суханов

Техред И. Верес Корректор В: Бутяга

Тираж 375 Подписное

ВНИИПИ Государственного комитета СССР

IIo делам изобретений и открытий ! 13035, Москва, K — 35, Раушская наб., д. 4/5

Филиал ППП <Патент>, г. Ужгород, ул. Проектная, 4

Редактор Н. Лазаренко

За каз 2022/48 ного тона. При этом значительно повышается качество синтезированной речи.

Предлагаемое изобретение может быть использовано также в синтезаторах без передачи сведений об основном тоне по каналу связи, т. е. в так называемых вокодерах на постоянном основном тоне. В этом случае также будет наблюдаться эффект улучшения качества синтезированной речи.

Использование данного технического решения в целом позволит повысить качество синтезированной речи при значительной компрессии.