Способ оценки качества канала передачи речевого сигнала

Иллюстрации

Показать все

Реферат

 

Изобретение относится к электросвязи . Цель изобретения - повышение достоверности оценки. Сущность данного способа сос.тоит в том, что оценка качества канала передачи речи (КПР) производится по речевому стимулу . Получение оценки объективно и максимально приближено к восприятию речевого сигнала пользователем. При этом за счет локально нелинейного изменения масштабов времени речевых (: сигналов на выходе и входе КПР достигаетсй наиболее точный выбор соответствия сигналов на выходе вводимым тестовым сигналом. При этом учитываются или исключаются искажения и помехи , вносимые в сигнал во время прохождения его по КПР, в близком соответствии процессу учета или исключения аналогичных искажений слуховой системой человека. Сравнение сигнашов на входе и выходе КПР производится с учетом динамических изменений сигнала . Дана ил. выполнения устр-ва, реализующего данный способ. 2 ил. i (Л С

СОЮЗ СОВЕТСНИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (19) (11) А1 (51) 4 Н 04 В 3/46

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР Il0 ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТНРЫТИЙ

Н А ВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4008692/24-09 (22) 08.01.86 (46) 07.07.87. Бюл. 1(р 25 (72) Н.С. Бром, В.И. Галунов, А.В.Данилов и С.Л. Коваль (53) 621.395.664(088.8) (56) АвтЬрское свидетельство СССР

1(930703, кл. Н 04 В 3/46, 1979.

ЕПВ (EP) M9 0117908, кл. Н 04 N 5/13, 1984. (54) СПОСОБ ОЦЕНКИ КАЧЕСТВА КАНАЛА

ПЕРЕДАЧИ РЕЧЕВОГО СИГНАЛА (57) Изобретение относится к электросвязи. Цель изобретения — повьппение достоверности оценки. Сущность данного способа состоит в том, что оценка качества канала передачи речи (КПР) производится по речевому стимулу. Получение оценки объективно и максимально приближено к восприятию речевого сигнала пользователем. При этом за счет локально нелинейного изменения масштабов времени речевых, сигналов на выходе и входе КПР дости" гается наиболее точный выбор соответствия сигналов на выходе вводимым тестовым сигналом. При этом учитываются или исключаются искажения и помехи, вносимые в сигнал во время прохождения его по КПР, в близком соответствии процессу учета или исключения аналогичных искажений слуховой системой человека. Сравнение сигналов на входе и выходе КПР производится с учетом динамических изменений сигнала. Дана ил. выполнении уотр-ва, реа- Щ лизующего данный способ. 2 ил.

С::

3 1322

Изобретение относится к электросвязи и может быть использовано для оценки качества передачи речевого сигнала цифровыми и аналоговыми каналами связи, качества передачи информации при записи ее на носитель и воспроизведении с него при передаче речевого сигнала через устройства обработки речевого сигнала, таких, как усилители или процессоры обработки сигналов 10 и т.п.

Цель изобретения — повышение достоверности оценки.

На фиг. 1 приведена структурная электрическая схема устройства, реа- 15 лизующего предлагаемый способ; на фиг. 2 — диаграмма, поясняющая процедуру выравнивания масштабов времение

Устройство, реализующее предлагае- 20 мый способ, содержит блок 1 формирования тестовых сигналов, первый блок 2 измерения выбранных параметров, блок 3 записи, канал передачи речи (КПР) 4, второй блок 5 измерения выбранных параметров, блок 6 сравне- . ния, блок 7 выравнивания, блох 8 выбора сигналов и решающий блок 9.

Сущность. предлагаемого способа состоит в том, что оценка качества КПР 30 производится по речевому стимулу. Получение оценки объективно и максимально приближено к восприятию речевого сигнала пользователем. При этом за счет локально нелинейного изменения масштабов времени речевых сигналов на выходе и входе КПР достигается наиболее точный выбор соответствия сигналов на выходе вводимым тестовым сигналом, причем учитываются или исклю- 4р чаются искажения и помехи, вносимые в сигнал во время. прохождения его по

КПР, в близком соответствии процессу

Учета или исключения аналогичных ис486 2 словесных, слоговых или фразовых таблиц. Речевой материал наговаривают несколько дикторов ° Произнесения записывают на магнитофон блока 1. Речевой сигнал каждого высказывания анализируют в блоке 2 измерения выбранных параметров, который состоит из устройств выделения характеристических параметров речевого сигнала, например гребенки полосовых фильтров с детекторами и ФНЧ на выходе каждого фильтра.

При этом каждый сигнал разбивают ha последовательность участков, соответствующих равным интервалам времени длиной 5-40 мс, либо на участки, соответствующие стационарным частям сигнала или выбрасыванию пауз, пропуску отдельных частей сигнала, Для каждого отдельного участка каждого сигнала измеряют характеристические параметры, выбранные в зависимости от задач и возможностей аппаратуры, например это могут быть спектральные параметры, т.е. получаемые с помощью сигнала в различных частотных полосах или это могут быть коэффициенты автокорреляционной функции и т.д. Главным свойством выбранных параметров должно быть отражение ими динамических изменений спектра речевого сигнала. Разные с точки зрения слухового восприятия человеком интервалы должны иметь разные значения соответствующих им характеристических параметров. Таким образом, для каждого сигнала образуется совокупность характеристических параметров для последовательности разнесенных во времени участков данного тестового сигнала. Полученные совокупности параметров записывают на носителе информации в блоке 3 записи. Каждый полученный в блоке 1 тестовый сигнал подается на вход оцениваемого КПР 4. Сигнал может таккажений слуховой системой человека. 45

Сравнение сигналов на входе и выходе канала проводится с учетом динамических изменений сигнала.

Устройство, реализующее предлагаемый способ, работает следующим об- gp разом.

В качестве тестового материала для оценки качества канала передачи речевого сигнала используют полученный с у помощью высококачественного микрофона речевой сигнал изолированно произнесенных речевых высказываний, например же наговариваться через микрофон дикторами и непосредственно подаваться на вход KIIP 4. Под КПР 4 понимается любое устройство обработки речевого сигнала, аппаратуры записи и воспроизведения речевого сигнала, устройства, передающие речевой сигнал (телефоны, усилители, приемопередающие устройства и т.д,). С выхода оцениваемого КПР 4 сигналы поступают в блок 5, тождественный блоку 2, где измеряют те же самые выбранные параметры для каждого участка каждого сигнала.

3 13224

Таким .образом, получают совокупности параметров для каждого сигнала на выходе КПР 4 на последовательности участков, разнесенных во времени аналогично последовательностям участков тестовых сигналов, например, на последовательности интервалов той же, длительности, которая использовалась при анализе входного тестового речевого сигнала. Полученные совокупнос- 10 ти выбранных параметров сигналов на выходе оцениваемого KIIP 4 и тестовых сигналов поступают в блок 7, ко- . торый состоит из цифрового устройства нелинейного выравнивания длины со- 15 вокунностей параметров (например, это может быть специализированная микроЭВМ).

B нем производят нелинейное выравнивание масштабов времени каждого 20 входного тестового сигнала и каждого сигнала на выходе оцениваемого канала с помощью процедуры динамического программирования.

Процедура состоит в следующем. 25

Пусть набор входного тестового сигнала описывается переменной

А = $ А(1), A(i), А(М)), где A(i) — вектор значений характерис. тических параметров для i-й части 30 входного тестового сигнала, причем части входного сигнала расположены в порядке их следования во времени.

Пусть таких частей N.Ïóñòü набор параметров сигнала на выходе КПР 4 описывается переменной

В = (B(1),В(j), В(М), где В(1) — вектор значений параметров для j é части сигнала на выходе

КПР 4. 40

Пусть таких частей M. Части расположены в порядке их следования во времени. Поскольку длина высказываний различна и могла изменяться за время прохождения через КПР 4, то M ф N.

Это значит, что перед сравнением переменных А и В их надо выравнять по длине, т.е. выравнять масштабы времени входного тестового сигнала и сигнала на выходе КПР 4. Природа речево-50 го сигнала такова, что при небольших независимых друг от друга локальных изменениях длительности отдельных звуков в пределах высказывания правильности его опознавания человеком не изменяется. Поэтому для выравнивания по длительности А и В переменных необходима процедура, позволяющая их

86

4 отдельным частям независимо друг от друга меняться по длительности. При этсм выравнивание должно проводиться, таким образом, чтобы полученные новые локально нелинейно выравненные во времени переменные совпадали друг с другом наилучшим образом среди всех возможных вариантов изменения первоначальных переменных.

Для объяснения такого способа, оптимального с точки зрения разборчивос- ти выравнивания, рассмотрим плоскость

i,j где переменные А(1.) и В(1) отложены соответственно вдоль осей i u j.

Разность между моментом времени i для

A(i) и моментом времени g для В()) обозначим как С = C(i,j). Процесс выравнивания длительностей A(N) и В(М) можно представить в виде пути на плоскости 1 1 из точки с координатами (1, 1) в точку с координатами (N, М).

При этом на пути его вертикальный участок соответствует участку выравнивания, при котором одному моменту времени j соответствует несколько моментов времени по оси i, т.е. время произнесения А на этом участке сжимается. Аналогично этому горизонтальный участок пути соответствует сжатию времени высказываний В ка данном участке. Диагональный участок пути по плоскости соответствует сохранению масштабов времени на этом участке ° Таких путей на плоскости, т.е. способов выравнивания B(i) и A(i), может быть очень много. Среди них надо выбрать такой, который среди всех возможных путей обеспечивал бы наилучшее совпадение сравниваемых A(i) и B(i). Техника поиска такого пути с помощью динамического программирования обеспечивает быстрое и алгоритмически простое решение данной задачи. Поиск наиI лучшего пути математически эквивалентен поиску минимума расстояния между выровненными по длине переменными

A(i) и B(i). Эта задача может быть решена при использовании процедуры динамического программирования. При этом находится наилучшим образом выравнивающий путь. На выравнивающем пути сравнивается в блоке б совокупность параметров сигнала на выходе

КПР 4 и запомненная совокупность параметров каждого тестового сигнала, таким образом находится мера близости между этими сигналами с учетом выравнивания их масштабов времени. Меру

6 6 ся в формировании тестовых сигналов, измерении выбранных параметров каждого тестового сигнала, запоминании измеренных параметров каждого тестового сигнала, передаче каждого тестового сигнала через оцениваемый канал передачи речевого сигнала, измерении тех же выбранных параметров тестового сигнала на выходе канала передачи речевого сигнала и сравнении результатов измерения параметров тестового сигнала на выходе канала передачи речевого сигнала с запомненными измеренными параметрами тестового сигнала, о т л ич а ю шийся тем, что, с целью повышения достоверности оценки, в качестве тестовых сигналов выбирают тестовые речевые высказывания, для каждой части которых измеряют выбранные параметры, перед сравнением выравнивают длительность каждого тестового сигнала на входе и выходе канала передачи речевого сигнала, а сравнение, измеренных параметров для каждой части тестового сигнала на выходе канала передачи речевого сигнала осуществляют с запомненными параметрами казщой из частей тестового сигнала на входе канала передачи речевого сигнала, из которых выбирают часть с наибольшим числом совпавших параметров, и оценивают качество канала передачи речевого сигнала по количеству выборов соответствующих частей тестового сигнала на входе канала передачи речевого сигнала в качестве частей с наибольшим числом совпавших парамет— ров.

5 132248 близости между переменными А и В находят по формулам. Меру близости находят между сигналом на выходе, KIIP 4 и каждым запомненным тестовым сигналом. Эту процедуру проводят для каждого сигнала на выходе КПР 4. В блоке 8, состоящем, например, из микроЭВМ "Электроника НЦ-80", для каждого выходного сигнала находят наиболее близкий к нему тестовый сигнал путем 10 поиска среди найденных мер близости минимальной меры близости. Затем по правилу ближайшего соседа для каждого сигнала на выходе КПР 4 находят среди записанных тестовых сигналов наиболее .близкий сигнал. Следовательно, каждому тестовому сигналу после

его пропускания через КПР 4 соответствует некоторый другой измененный сигнал. По числу совпадений сигналов 30 на выходе КПР 4 с соответствующими им тестовыми сигналами в решающем блоке 9 определяют точность передачи речевых высказываний оцениваемым КПР 4.

Число совпадений нормируют на общее .

25 число использованных тестовых сигналов. Полученное число называют значением разборчивости в процентах для оцениваемого КПР 4. По этому числу судят о качестве передачи речевой ин30 формации КПР 4, ориентируясь или на сравнение значений разборчивости для различных КПР или на соответствующие стандарты, принятые для оценки качест ва каналов речевой связи. 35

Формула изобретения

Способ оценки качества канала передачи речевого сигнала, эаключающий)322486 фе) я(в) 8 fi) Составитель В. Слепаков

Редактор Е. Папп Техред М.Моргентал Корректор И. Муска

Заказ 2879/56 Тираж 638 Подписное

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

1!3035, Москва, Ж-35, Раушская наб., д. 4/5

Производственно-полиграфическое предприятие, г. Ужгород, ул. Проектная, 4

Я(2) я() В

Фиг. 2