Способ компиляционного синтеза речи и устройство для его осуществления

Иллюстрации

Показать все

Реферат

 

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (51) э G 10 (5/02

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ВЙОЮЗМЯ 1

ЫЙПП- УБИТ!%%.". ., ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

1 (21) 4459706/10 (22) 14.07.88 (46) 07.10.91. Бюл. М 37 (71) Инспптут технической кибернетики АН БССР (72) Б.M. Лобанов (53) 534.78(088.8) (56) Патент США N. 4398059, кл. G 10 L 5/00, 1983.

Авторское свидетельство СССР и 1599888, кл. G 10 1 5/02, 1990. (54) СПОСОБ КОМПИЛЯЦИОННОГО СИН-

ТЕЗА РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО ОСУ- .

ЩЕСТВЛЕНИЯ (57) Изобретение относится к речевой информатике и может быть использовано для

„„5Q„„1683063 А1 сжатия информации, используемой при синтезе слитной речи по тексту. Цель изобретения — сжатие запоминаемой информации и упрощение устройства. Текст, вводимый в текстовый процессор 1, далее преобразуется в последовательность слогов-дифонов и отдельных звуков. Параметры звуков и переходов между ними заранее запоминают в постоянных запоминающих устройствах 2 и

3 и считывают по мере преобразования текста в звуки выходным цифроаналоговым преобразователем 7, выполненным формантным звуковым интерфейсом, нагруженным на электроакустический агрегат 8.

2 с.п. ф-лы, 1 ил.

1683063

Составитель В. Махонин

Техред M.Ìoðãåíòàë Корректор С. Кравцова

Редактор Е. Савина

Заказ 3416 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., 4/5

Производственно-издательский комбинат "Патент", r, Ужгород, ул.Гагарина, 101

Изобретение относится к речевой информатике и приборостроению для синтеза речевых сообщений по тексту в системах акустического общения человека с автоматическими устройствами.

Цель изобретения — сжатие заранее запоминаемой информации и упрощение устройства.

При запоминании дифонные переходы кодируют постоянными времени коартикуляции этих переходов в дикторской речи, При воспроизведении текущие параметры звуков, котооые восстанавливают формантны в)новым интерфейсом, устанавливают линейнь м комбинированием параметров, соответствующих текущей, предшествующей и последующей фонемам, получаемых при последовательном транскрибировании текста. Результаты линейного комбинирования сглаживают на интервале, длительность которого не превышает длительность последующей фонемы, На чертеже показана блок-схема описываемого устройства для компиляционного синтеза речи.

Устройство содержит текстовый процессор 1, постоянные запоминающие устройства 2 и 3, буферное запоминающее устройство 4, интерполирующий процессор

5, формирователь 6, выходной цифроаналоговый преобразователь 7 и электроакустический агрегат 8. Входом устройства является вход текстового процессора 1, соединенного с постоянными запоминающими устройствами 2 и 3 и буферным оперативным запоминающим устройством 4. Интерполирующий процессор 5 и формирователь 6 связаны с буферным оперативным запоминающим устройством 4, которое через выходной цифроаналоговый преобразователь 7, выполненный формантным звуковым интерфейсом, нагруженном на электроакустический агрегат 8.

Вводимый в текстовой процессор текст преобразуется им в последовательность слогов-дифонов и отдельных звуков, Формантные параметры, элементов дифонов и звуков из постоянного запоминающего устройства 2 пересылаются в буферное запоминающее устройство 4, куда из посто5

50 янного запоминающего устройства 3 вызываются также сведения о постоянных времени коартикуляции и длительностях звуков, необходимые для комбинирования и сглаживания параметров звуков, имитирующих натуральную слитную речь, благодаря этой связанной с текстом и звуками вариации темпа и гладкости переходов от звука к звуку и от слова к слову.

Экономия в объемах запоминаемой информации по отношению к запоминанию волн переходных процессов от одного звука дифона к другому позволяет снизить потребляемую электроэнергию, рассеиваемую постоянными запоминающими устройствами синтезатора речи.

Формула изобретения

1, Способ компиляционного синтеза речи, включающий предварительное запоминание параметров отдельных звуков речи и всевозможных переходов между звуками речи и трансрибирование текста в последовательность воспроизводимых дифонов и отдельныхзвуков, отличающийся тем, что, с целью сжатия запоминаемой информации, при запоминании дифонные переходы кодируют постоянными времени коартикуляции этих переходов, а при воспроизведе —.ии параметры воспроизводимых звуков устанавливают линейным комбинированием параметров, соответствующих текущей, предшествующей и последующей фонемам, причем результаты комбинирования сглаживают на интервале длительностью последующей фонемы.

2, Устройство для компиляционного синтеза речи, содержащее текстовый процессор, соединенный с постоянными запоминающими устройствами и буферным оперативным запоминающим устройством, соединенным через выходной цифроаналоговый преобразователь с электроакустическим агрегатом, о т л и ча ю щ ее с я тем, что, с целью упрощения, в него введены интерполирующий процессор и формирователь, связанные соответствующими шинами с буферным оперативным запоминающим устройством, а выходной цифроаналоговый преобразователь выполнен формантным звуковым интерфейсом.