Способ опознания говорящего и устройство для его осуществления

Иллюстрации

Показать все

Реферат

 

1. Способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным , полученным аналогично, о т л ичающийся тем, что, с целью сокращения объема произвольного речевого материала, необходимого для опознания говорящего, при формировании признаков вьщеляют признаки среднеквадратичной частоты и среднеквадратичной амплитуды спектра, а изображение формируют в координатах декущих значений выделенных признаков, при зтом оптическую плотность каждой точки устанавливают пропорциональной текущей плотности совместной вероятности появления этих значений. 2. Устройство для опознания говорящего , содержащее блок выделения спектральных признаков, аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионньй монитор, отличающееся тем, что, с целью расщирения функциональных возможностей устройства, в него введены второй аналого-дифровой преобразователь, два коммутатора, трехвходовой селектор записи и оперативное запоминающее устройство и соединенные с ним два дешифратора адреса и синхрогенератор, блок вьщеления (Л спектральных признаков выполнен на измерителях текущих среднеквадратичной частоты и среднеквадратичной амплитуды , выходы которых через аналогоцифровые преобразователи и коммутаторы соединены с входами дешифраторов адреса, два входа селектора записи соединены с выходами аналого-цифровых преобразователей, причем третий вход а селектора записи, управляющие входы 00 коммутаторов, синхровход формирователя видеосигналов и вход считьшания оперативного запоминающего устройства соединены с соответствующими выходами синхрогенератора, а вход и выход оперативного запоминающего устройства соединены с селектором записи и с ЭЦВМ соответственно.

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК

„„SU„„1117687 А зад С 10 L 1/14

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ КОМИТЕТ OQCP

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ (21) 3555361/18-10 (22) 22.02.83 (46) 07.10.84. Бюл. Ф 35 (72). А.П. Беликов, И.А. Карасев, Н.В. Мулюкин и К.В. Тунис (71) Московский государственный педагогический институт иностранных языков им. М. Тореза (53) 534.782(088.8) (5á) 1. Авторское свидетельство СССР

В 847347, кл. G 10 Т 1/00, 1979.

2. Фант Г. Анализ и синтез речи.

Новосибирск, "Наука", 1970.

3. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу.

М., "Радио и связь", 1981, с. 66. (54) СПОСОБ ОПОЗНАНИЯ ГОВОРЯЩЕГО И

УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ. (57) 1. Способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично, о т л ич а ю шийся тем, что, с целью сокращения объема произвольного речевого материала, необходимого для опознания говорящего, при формировании признаков выделяют признаки среднеквадратичной частоты и среднеквадратичной амплитуды спектра, а изображение формируют в координатах .текущих значений выделенных признаков, при этом оптическую плотность каждой точки устанавливают пропорциональной текущей плотности совместной вероятности появления этих значений.

2. Устройство для опознания говорящего, содержащее блок выделения спектральных признаков, аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор, о т л и ч а ю щ е е с я тем, что, с целью расширения функциональных возможностей устройства, в него введены второй аналого-.цифровой преобразователь, два коммутатора, трехвходовой селектор записи и оперативное запоминающее устройство и соединенные с ним два дешифратора адре- Щ

Ф са и синхрогенератор, блок выделения спектральных признаков выполнен на измерителях текущих среднеквадратичной частоты и среднеквадратичной амплитуды, выходы которых через аналого- « цифровые преобразователи и коммутатоМа4 ры соединены с входами дешифраторов адреса, два входа селектора записи соединены с выходами аналого-цифровых преобразователей; причем третий вход 3 селектора записи, управляющие входы 1 В коммутаторов, синхровход формировате- QQ ля видеосигналов и вход считывания 3 оперативного запоминающего устройства соединены с соответствующими выходами синхрогенератора, а вход и выход оперативного запоминающего устройства соединены с селектором записи и с

ЭЦВМ соответственно.

687

1 1117

Изобретение относится к технике анализа и визуализации свойств речевых волн на экране электроннолучевой трубки и может быть использовано для опознания говорящего и выявления его языковой принадлежности, диалектных

5 особенностей и эмоционального состояния.

Известен способ обработки речевого сигнала путем формирования спектральных признаков, характеризующих текущие значения среднеквадратичной частоты и среднеквадратичной амплитуды мгновенного спектра речи. Этот способ позволяет отобразить речевой сигнал без развертки спектральных признаков во времени без потери существенной информации об особенностях артикуляции 1 ).

Ф

Недостатком способа является потеря сведений об относительных частотах проявления различных особенностей артикуляции.

Известен также способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично. Этот способ позволяет легко обучить экспертов опознанию говоря30 щего путем визуального сопоставления фрагментов изображения, полученного временной разверткой спектральных признаков речи, с фрагментами силуэтов спектральных признаков ключевых З5 звукосочетаний (2 ).

Недостатком способа является большая избыточность формируемых изображений и большой объем произвольного речевого материала, необходимого для 40 опознания говорящего.

Известно также устройство для опознания говорящего, содержащее блок вьделения спектральных признаков, 45 аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор. Это устройство позволяет экспертам сравнивать на 50 экране телевизионного монитора фрагменты изображений, полученных разверткой признаков речи, формируемых из текущих спектральных признаков и из памяти ЭЦВМ (3 j. Недостатком 55 устройства является невозможность визуализации текущего статистического описания артикуляции говорящего, реализующей предлагаемый способ опознания говорящего.

Цель изобретения — сокращение объема произвольного речевого материала, необходимого для опознания говорящего, а также расширение функциональных возможностей устройства реализующего способ опознания говорящего.

Поставленная цель достигается тем, что согласно способу опознания говорящего, основанному на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным анало гично, при формировании признаков, выделяют признаки среднеквадратичной частоты и среднеквадратнчной амплитуды спектра, а изображение формируют в координатах текущих значений выделенных признаков, при этом оптическую плотность каждой точки устанавливают пропорциональной текущей плотности совместной вероятности появления этих значений.

Кроме того, в устройство для опознания говорящего, содержащее блок вьделения спектральных признаков, аналого-цифровой преобразователь, и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор, введены второй аналого-цифровой преобразователь, два коммутатора, трехвходовой селектор записи и оперативное запоминающее устройство и соединенные с ним два дешифратора адреса и синхрогенератор, блок вьделения спектральных признаков выполнен на измерителях текущих среднеквадратичной частоты и среднеквадратичной амплитуды спектра, выходы которых через аналого-цифровые преобразователи и коммутаторы соединены с входами дешифраторов адреса, два входа селектора записи соединены с выходами аналого-цифровых преоб разователей, причем третий вход селектора записи, управляющие входы коммутаторов, синхровход формирователя видеосигналов и вход считывания оперативного запоминающего устройства соединены с соответствующими выходами синхрогенератора, а вход и выход оперативного запоминащего устройства соединены с селектором записи и с ЭЦВМ соответственно.

Формированием изображения в координатах текущих значений выделенных спектральных признаков с установлени3 1117 ем оптической плотности, пропорциональной текущей локальной плотности совместной вероятности появления этих значений, достигнуто безизбыточное пред- ставление артикуляционных укладов говорящих, взвешенное вероятностями проявления этих уклаДов, которое мало зависит от произносимого текста, Такое безизбыточное представление позволяет распознавать говорящего

S0 по 90 с его речи. При опознании по изображениям ключевых фрагментов необходимы:более 10 мин речи, включающей эти ключевые звукосочетания.

На фиг. 1-4 приведены фотографии изображений, полученных фотооптической аналоговой обработкой записей коротких фонограмм двух различных текстов, произнесенных двумя разными. дикторами; на фиг. 5 — блок-схема устройства для осуществления способа опознания говорящего.

Фиг. 1 и фиг. 2 показывают сходство изображении, полученных обработкой речи первого диктора при произне25 сенин первого и второго текстов соот.ветственно, а фиг. 3 и фиг. 4 получены обработкой произнесений. этих текстов вторым диктором. Фотографии получены экспонированием луча, перемещавшегося по экрану электроннолучевой трубки при изменениях текущей среднеквадратичной частоты, отклонявшей луч по горизонтали, и среднеквадратичной амплитуды спектра, отклонявшей луч по вертикали. Каждое прохож-. З5 дение лучем точки экрана приводит к новому экспонированию соответствующей точки фотоматериала, чем достигается пропорциональность между оптической плотностью каждой точки не- 40 гатива и числом совместных появлений соответствующих значений спектральных признаков, отклонявших луч.

Блок-схема устройства для осущест.— вления способа опознания говорящего содержит блок 1 выделения спектральных признаков, первый 2 и второй 3 аналого-цифровые преобразователи,коммутаторы 4 и.5, дешифраторы 6 и 7 адреса, оперативное запоминающее 50 устройство 8, селектор 9 записи, ЭЦВМ 10, блок 11 формирования видеосигналов, телевизионный монитор 12 и синхрогенератор 13.

Вход устройства для осуществления 55 способа опознания говорящего соединен с блоком 1 выделения спектральных признаков 1, который первым и вторым

687 4 выходами соединен с входами первого 2 и второго 3 аналого-цифрового преобразователей соответственно. Выходы преобразователей через коммутаторы

4 и 5 и дешйфраторы 6 и 7 адреса соединены с оперативным запоминающим устройством 8, селектор 9 записи которого своими первым и вторым входами соединен с соответствующими уходами коммутаторов. Выход оперативного запоминающего устройства через

ЭЦВМ 10 и блок 11 формирования видеосигналов соединен с телевизионным монитором 12. Выходы синхрогенератора 13 соединены с соответствующими синхровходами коммутаторов, селектора записи, оперативного запоминающего устройства и блока формирования видеосигналов.

Устройство для осуществления способа опознания говорящего работает следующим образом.

Речевой сигнал, поступивший на вход устройства с микрофона или магнитофона, в блоке выделения спектральных признаков преобразуется в текущие значения среднеквадратичной частоты и среднеквадратичной амплитуды спектра, которые преобразуются в цифровую форму соответствующими аналого-цифровыми преобразователями.

Каждое новое появление кодов цифрового представления спектральных признаков с помощью селектора записи, коммутаторов и дешифраторов адреса вызывает увеличение на единицу содержимого ячейки оперативного запоминающего устройства, адрес которой соответствует указанным кодам. Записываемое в оперативное запоминающее устройство накапливается в нем до тех пор, пока продолжается обработка исследуемого речевого сигнала, после чего накопленная информация вводится в

ЭЦВМ и с помощью блока формирования видеосигналов отображается на экране телевизионного монитора. На этот же экран эксперт, производящий опознание говорящего или выявление его эмоционального состояния, языковой принадлежности и диалектных особенностей, может вызвать с помощью ЭЦВМ эталонные изображения сформированные аналогичнЬ.

Предлагаемый способ опознания говорящего и устройство для его осуществления позволят ускорить экспертизу фонограмм и повысить надежность принимаемых экспертами решений

1 11 1687, 1117687

1117687 иг.

ВНИИПИ Заказ 726.2/36 Тирви 3 74 Подписыое

Филиал ШШ "Патват", r.Óèãîðîä, ул.IIpoenaaa, 4