Способ имитации слухового восприятия акустического сигнала пациентом после кохлеарной имплантации

Способ относится к медицине, в частности к аудиологии и сурдологии, и предназначен для имитации слухового восприятия имплантированных пациентов и иллюстрации процесса освоения восприятия речи имплантированными пациентами людям с нормальным слухом. Способ имитации слухового восприятия акустического сигнала пациентом после кохлеарной имплантации проводят путем аналого-цифрового преобразования входного сигнала, выраженного в виде слова, разделения спектра преобразованного сигнала на частотные, четные и нечетные, полосы, суммирования нечетных полос, цифроаналогового преобразования полученного суммарного сигнала и обучения его восприятию посредством предварительного ознакомления со словом, предъявляемым для прослушивания и последующего тестирования. Разделение спектра проводят по тонотопическому закону распределения частот по оси улитки, при этом частотные полосы с нечетными номерами располагают на равном расстоянии друг от друга по длине базилярной мембраны в соответствии с нормальным тонотопическим распределением частот по оси улитки, суммируют, по крайней мере, три нечетные полосы спектра, а обучение проводят посредством неоднократного повторения слова, предъявляемого для прослушивания, до однозначного соотнесения его с известным значением слова, полученным при предварительном ознакомлении, при этом для предъявления при тестировании используют те же слова, что и при обучении. В результате такой обработки частично сохраняется речевой спектр, благодаря чему возможна демонстрация процесса освоения восприятия обедненного по спектру сигнала людям с нормальным слухом. 1 ил.

Реферат

Изобретение относится к медицине, а именно к аудиологии и сурдологии, и может найти применение в программе «Кохлеарная имплантация» для имитации слухового восприятия имплантированных пациентов и иллюстрации процесса освоения восприятия речи имплантированными пациентами людям с нормальным слухом.

В последнее десятилетие в России началось внедрение метода слуховой реабилитации глухих пациентов - кохлеарной имплантации (КИ). Для имплантации используются созданные в ряде стран системы КИ, и поэтому основным вопросом программы КИ является разработка способов слуховой реабилитации пациентов после кохлеарной имплантации.

Известно, что в процессе слуховой реабилитации детей после кохлеарной имплантации значительная роль отводится родителям. Это связано с необходимостью их непосредственного участия в реабилитации своих детей, а для их эффективной работы нужно, чтобы они достаточно глубоко понимали проблему. К сожалению, в большинстве случаев представления родителей о кохлеарной имплантации очень ограничены. Более того, имея в виду средства, вложенные в операцию, они не могут понять, почему их ребенок не может сразу заговорить и понимать обращенные к нему слова.

В том случае, когда настройка речевого процессора кохлеарного импланта проводится у 2-3 детей одновременно, родители, естественно, видят различия между детьми и не понимают причину разных достижений у разных детей. Зная об успехах некоторых, ранее имплантированных пациентов, они никак не могут понять, почему у них дело обстоит иначе. Четкое физиологическое объяснение особенностей слухового восприятия имплантированных пациентов и проистекающих отсюда проблем требует начинать изложение вопроса с азов акустики и физиологии, что едва ли возможно.

Как продемонстрировать родителям проблемы, стоящие перед их имплантированными детьми при освоении восприятия ими речи, обработанной речевым процессором КИ? Для решения этого вопроса необходимо смоделировать речевой сигнал, который воспринимают имплантированные пациенты, и предъявить его родственникам и всем тем, кто заинтересован проблемой КИ.

Для построения реальной программы реабилитации специфического контингента тугоухих пациентов, а именно больных, которым проведена кохлеарная имплантация, совершенно необходимо отчетливое представление о том, что и как они слышат. Известно, что их слуховое восприятие значительно отличается как от восприятия человека с нормальным слухом, так и от восприятия тугоухих пациентов, пользующихся слуховыми аппаратами.

Можно привести такой пример.

Из литературы известно, что человек с нормальным слухом может определить 600 градаций частоты, у больных нейросенсорной тугоухостью количество градаций в 10 раз меньше, имплантированный же пациент имеет возможность различать только небольшое количество частотных полос, которое ограничено количеством введенных в улитку электродов. В настоящее время оно не превышает 20 полос.

Таким образом, отличие в восприятии, только лишь по спектральному параметру, огромное, и по этой причине моделирование речевого сигнала, максимально приближенного к тому, который воспринимает имплантированный пациент, очень важно.

Известен способ переработки речевого сигнала, где моделируют звуковой образ, который воспринимает имплантированный пациент, путем создания ограниченного по частотному представительству речевого сигнала и оценивают разборчивость обработанной таким способом речи у людей с нормальным слухом [1].

В работе была использована 8-канальная система кохлеарной имплантации «Combi 40» австрийской фирмы «Med El». Ширина спектра речевого сигнала, обрабатываемого процессором, находится в диапазоне от 300 до 5500 Гц. Процессор импланта «Combi-40» разделяет этот спектр на 8 полос. В каждой из них измеряется энергия, и в соответствии с ее величиной формируется импульс, подаваемый на соответствующий электрод. Программа, заложенная в речевой процессор, позволяет изменять граничные (и центральные) частоты этих полос в зависимости от применяемого закона переработки. В программе импланта имеются 4 закона разделения спектра: логарифмический, линейно-логарифмический, тонотопический и линейно-ниспадающий.

В данной работе была применена компьютерная программа спектральной переработки речевого сигнала. Она дает возможность вырезать из акустического сигнала различные участки спектра. В качестве тестовых сигналов использовались частотные полосы шириной по 50 Гц, которые располагались вокруг центральных частот полосовых фильтров речевого процессора. Остальная часть спектра удалялась. Таким образом, после обработки речевого сигнала по этой программе информативными оставались только 8 частотных полос шириной по 50 Гц. Следовательно, из всего спектра речи (300-5500 Гц), обрабатываемого речевым процессором импланта, оставалось лишь 8×50=400 Гц. Таким образом, для оценки восприятия речи использовалась только 400/5200=1/13 часть спектра.

После обработки речевого сигнала в соответствии с 4-мя законами разделения спектра проводилось измерение разборчивости речи. Для этого были использованы речевые таблицы Гринберга-Зиндера, по 30 слов в каждой. Речевой сигнал с IBM РС поступает на усилитель «Амфитон» и далее на телефон TDH-39. Регуляторы тембра усилителя устанавливают в среднее положение, обеспечивая равномерное усиление всех частот речевого спектра. Испытуемый выбирает только уровень комфортной громкости речевого сигнала. До начала регистрации проводят непродолжительную тренировку (5-10 мин) для освоения нового звучания русской речи.

Измерение разборчивости речи проведено у 6 людей с нормальным слухом при монауральном предъявлении речевых стимулов на правое ухо. Все испытуемые показали 100% разборчивость речи во всех четырех вариантах переработки речевого сигнала. Исходя из того, что после обработки в речевом сигнале оставалось только 1/13, т.е. 7,7% спектра, можно заключить, что избыточность речи с точки зрения частотного представительства превышает 92,3%.

Исходя из полученных результатов о столь значительной избыточности речи (с точки зрения частотного представительства), становится понятно, почему имплантированные больные со столь малой частотной селективностью успешно осваивают новый звуковой образ слов русского языка.

Следует отметить, что в начале исследования все испытуемые терялись от столь необычного речевого сигнала - из первой тренировочной десятки слов (независимо от закона разделения спектра) они различали только 2-3. Однако достаточно быстро осваивались с измененной картиной речи и в дальнейшем тестирование уже не вызывало существенных затруднений. Для достижения 100% разборчивости речи достаточно было лишь непродолжительной тренировки.

Такое представление речевого сигнала можно рассматривать как модель восприятия лишь в первом приближении, но для демонстрации она непригодна.

Таким образом, на основании результатов, полученных этим способом, представляется возможным провести параллели между восприятием речи, обработанной гребенчатым фильтром, людей с нормальным слухом и восприятием речи имплантированными пациентами и на основании этого провести моделирование слухового восприятия пациентов после кохлеарной имплантации.

Однако следует отметить, что в описанном способе переработки речевого сигнала результат не достаточно демонстративен, поскольку не представляет труда освоить восприятие обработанной таким образом речи. В свою очередь результаты этого способа доказывают, что восприятию обедненной по спектральному содержанию речи можно обучиться. Следовательно, для создания работающей модели необходимо выбрать соответствующие параметры гребенчатого фильтра и методы предъявления речевого материала.

Известен также способ обработки сигналов, заключающийся в том, что входной сигнал после аналого-цифрового преобразования разделяют с помощью полосовых фильтров на несколько частотных полос, после выпрямления и сглаживания этих полосовых сигналов в каждой из полос измеряют энергию и в соответствии с ее значением формируют амплитуду синусоид, которые затем суммируются и после цифроаналогового преобразования поступают на выходное устройство [2].

Цель такого преобразования оценить восприятие речи, обработанной по аналогии с программой речевого процессора кохлеарного импланта.

Наиболее существенным недостатком указанного способа является то, что при таком преобразовании речевого сигнала исключается спектральное представление речевого сигнала, т.е. полностью отсутствует реальный спектр речевого сигнала.

Наиболее близким решением к заявляемому предложению является способ переработки речевого сигнала для имитации слухового восприятия имплантированных пациентов путем аналого-цифрового преобразования входного сигнала, выраженного в виде слова, разделения спектра преобразованного сигнала на частотные, четные и нечетные, полосы, суммирования нечетных полос, цифроаналогового преобразования полученного суммарного сигнала и обучения его восприятию посредством предварительного ознакомления со словом, предъявляемым для прослушивания и последующего тестирования [3].

Недостатком указанного способа является то, что при таком преобразовании речевого сигнала распределение полос недостаточно отражает спектральное представление речевого сигнала, определяемое расположением электродов в улитке имплантированного пациента, обучение не вполне соответствует тому, которое проводится у имплантированных пациентов, и тестирование производится новым речевым материалом.

Технический результат предложения заключается в демонстрации людям с нормальным слухом особенностей восприятия слов пациентами после кохлеарной имплантации для оценки проблем, стоящих перед имплантированными пациентами, а также для помощи сурдопедагогам, которые занимаются реабилитацией этих пациентов.

Этот результат достигается тем, что в способе имитации слухового восприятия акустического сигнала пациентом после кохлеарной имплантации путем аналого-цифрового преобразования входного сигнала, выраженного в виде слова, разделения спектра преобразованного сигнала на частотные, четные и нечетные, полосы, суммирования нечетных полос, цифроаналогового преобразования полученного суммарного сигнала и обучения его восприятию посредством предварительного ознакомления со словом, предъявляемым для прослушивания и последующего тестирования, согласно изобретению разделение спектра производят по тонотопическому закону распределения частот по оси улитки, при этом частотные полосы с нечетными номерами располагают на равном расстоянии друг от друга по длине базилярной мембраны в соответствии с нормальным тонотопическим распределением частот по оси улитки, суммируют, по крайней мере, три нечетные полосы спектра, а обучение проводят посредством неоднократного повторения слова, предъявляемого для прослушивания, до однозначного соотнесения его с известным значением слова, полученным при предварительном ознакомлении, при этом для предъявления при тестировании используют те же слова, что и при обучении.

Наличие отличительных признаков, а именно разделение спектра по тонотопическому закону распределения частот по оси улитки, расположение частотных полос с нечетными номерами на равном расстоянии друг от друга по длине базилярной мембраны в соответствии с нормальным тонотопическим распределением частот по оси улитки, суммирование, по крайней мере, трех нечетных полос спектра, обучение посредством неоднократного повторения слова, предъявляемого для прослушивания, до однозначного соотнесения его с известным значением слова, полученным при предварительном ознакомлении, использование для предъявления при тестировании тех же слов, что и при обучении, свидетельствует о соответствии заявляемого технического решения критерию патентоспособности «новизна».

Благодаря предложенному способу появилась возможность продемонстрировать родственникам имплантированных пациентов сложности восприятия новой по звучанию речи, непосредственно убедиться в возможности освоения этой звуковой картины и на собственном опыте оценить проблемы, стоящие перед имплантированными пациентами.

Указанный способ основан на исследованиях, которые проведены в Санкт-Петербургском НИИ ЛОР при участии шести испытуемых людей с нормальным слухом.

Проведенные исследования основывались на выводе о возникновении ощущения полосы частот при стимуляции слухового нерва электрическими импульсами [4] и на данных о возможности обучения восприятию спектрально депривированного речевого сигнала [1].

Способ осуществляют следующим образом.

Речевой сигнал подают через аналого-цифровой преобразователь на IBM PC, проводят гребенчатую фильтрацию, обработанный сигнал разделяют на четные и нечетные полосы. При этом нижняя граница первой нечетной полосы равна 200 Гц, а верхняя граница последней полосы равна 6250 Гц. Нечетные полосы имеют ширину 50 Гц и в соответствии с нормальной тонотопикой улитки они расположены на равном расстоянии друг от друга (10,4 мм) по длине базилярной мембраны.

Эти расчеты были проведены в соответствии с формулой Hartmann W. о зависимости характеристической частоты нейрона от координаты точки на базилярной мембране [5].

Сигналы трех нечетных полос суммируют и далее через цифро-аналоговый преобразователь выводят на выходное устройство.

В качестве характеристики полосовых фильтров мы использовали ширину полосы пропускания фильтра на уровне I=-20 дБ, т.е. ширину тестовых полос частот на уровне интенсивности на 20 дБ ниже максимального значения интенсивности в этой полосе.

Полоса пропускания всех фильтров была равна 170-200 Гц, т.е. используемая компьютерная программа обеспечивала крутизну спада фронтов полосового фильтра, равную 0,3-0,35 дБ/Гц, как в сторону высоких, так и низких частот.

На чертеже представлен спектр речевого сигнала, обработанного гребенчатым фильтром и использованного в нашей работе, где ось абсцисс - частота в Гц, ось ординат - уровень интенсивности в дБ затухания.

В результате проведенных исследований было обнаружено, что при первом прослушивании двух списков-таблиц, содержащих 60 слов, испытуемые опознали лишь 11,7±4,3 слов, т.е. менее 20%. Наиболее частая оценка качества звучания была такова: «Не может быть, что это слова. А если это слова, то их невозможно понять».

Следует отметить, что индивидуальные результаты испытуемых располагались в широких пределах - от 4 до 17 слов. Поскольку все испытуемые - лица с нормальным слухом, то можно сказать, что с точки зрения состояния слуховой функции при обследовании они находились в одинаковом положении.

Однако, как видно по полученным результатам, они в разной степени осваивают восприятие обработанных слов. Обнаруженный разброс результатов служит яркой иллюстрацией различных способностей разных людей осваиваться в новой звуковой картине речи. То есть при равенстве начальных условий проявляются психофизические особенности «одинаковых» по слуховой функции испытуемых.

На основании аналогии с кохлеарной имплантацией с учетом разнообразия характеристик имплантированных пациентов различия в результатах тестирования дают возможность аудиологу ответить на частый вопрос родителей: Почему различаются результаты реабилитации их детей?

При предъявлении слов с предварительным ознакомлением испытуемых о том, какое слово они будут слышать, оказалось, что обработанные слова становятся узнаваемыми. Все испытуемые опознавали слышимое как уже известное им слово, и при этом многие с удивлением говорили: «Точно оно».

Таким образом, и в оставшихся после компьютерной обработки трех полосах шириной по 50 Гц содержатся такие спектральные характеристики слова, которых достаточно для его соотнесения со словом с полным спектром.

Следует отметить, что испытуемые различались также и по способности соотнесения знаемого слова и его звукового образа, полученного после обработки. Часть испытуемых не сразу соглашалась с тем, что они слышат то слово, о котором им сказано. Некоторые признавали сходство с первого предъявления.

Для того чтобы испытуемые признали, что они слышат то же слово, о котором им сказано, разным испытуемым нужно было прослушать обработанное слово от 1 до 4 раз. То есть и в этом случае вновь проявляются различия между испытуемыми.

В отличие от низкого результата при первом предъявлении (среднее по группе - 11,7), при повторном прослушивании - после обучения - испытуемые опознали 35,8±5,6 слов. Таким образом разборчивость речи увеличилась более, чем в три раза. Столь значительное (трехкратное) (р<0,01) увеличение разборчивости речи можно объяснить двумя факторами, а именно, во-первых, некоторые слова во время одновременного предъявления запоминаются, и, во-вторых, происходит обучение восприятию новой звуковой картины речи.

По нашему мнению преобладает второй фактор, поскольку, во-первых, трудно предположить, что при однократном прослушивании испытуемый запомнил тестовые слова. Во-вторых, все испытуемые, кроме одного, сами отмечают, что они не запомнили ни одного слова и в их новом понимании слов основную роль играет только обучение.

Следует подчеркнуть, что, несмотря на значительный разброс индивидуальных результатов, между результатами первого и второго предъявления слов обнаружена сильная корреляционная связь (r=0,89). Поскольку при первом прослушивании испытуемые опирались только на слуховое восприятие, высокая корреляция позволяет заключить, что определяющий фактор при освоении новой звуковой картины речи - это не запоминание, а обучение.

Но в любом случае вполне правомочно предположить, что именно в таком ключе (обучение и запоминание новых образов) и происходит освоение восприятия речи у имплантированных постлингвальных пациентов, которые также обучаются воспринимать значительно искаженную речь, достраивая новую картину до прежней. Набирая «библиотеку» образов в процессе освоения новой картины речи, они все лучше и лучше опознают новые незнакомые слова. После накопления слухового опыта они сами говорят, что слышат как раньше. То есть здесь вновь можно провести параллели между нашим исследованием и восприятием постлингвальных имплантированных пациентов. Совершенно очевидно, что и в том и в другом случае испытуемые некоторым образом настраивают (перестраивают) свое восприятие на новую картину речи.

Различия между первыми и окончательными результатами измерений разборчивости речи у испытуемых людей служат для них яркой демонстрацией разных способностей людей понимать спектрально преобразованную речь и на основании аналогии с кохлеарной имплантацией дают возможность аудиологу объяснить родителям различия в результатах реабилитации их детей.

Особо следует отметить, что в конце исследования все испытуемые выражают удивление полученным результатам.

Как видно из полученных результатов, при использовании лишь 150*100/6000=2,5% спектра речи испытуемые люди с нормальным слухом после краткосрочного обучения начинают опознавать более половины тестовых слов. Это удивительный результат при столь бедном спектральном представлении речевого сигнала, и исходя из него и параллелей с КИ, можно понять, почему имплантированные пациенты могут понимать значительно искаженную речь.

Необходимо отметить эффективность такой демонстрации для родителей имплантированных детей. При первом прослушивании обработанных слов родители опознают немного слов и некоторые даже ужасаются тому, как слышат их дети. Но после обучения и повторного прослушивания они очень удивляются достигнутому результату и убеждаются в правильности своего выбора операции КИ. Подобная демонстрация также очень полезна для сурдопедагогов, которые занимаются реабилитацией имплантированных пациентов. Работая ранее с тугоухими пациентами, они невольно переносят свой опыт работы с ними на совершенно новый контингент больных и не учитывают особенностей восприятия имплантированных пациентов [4].

Услышав о такой демонстрации, они сами просят показать им эту программу и после проведения обследования начинают лучше понимать проблему и несколько по-иному оценивают собственные занятия с имплантированными пациентами. При обсуждении некоторых вопросов после проведенной демонстрации сурдопедагоги начинают задавать более практические вопросы.

Мы отдаем себе отчет, что предложенная программа это не абсолютная модель слухового восприятия имплантированных пациентов, но, опираясь на собственные данные и мировой опыт, находим, что проводимая нами демонстрационная программа полезна и достаточно иллюстративна.

Предлагаемый способ осуществлен в отделе патофизиологии уха Санкт-Петербургского научно-исследовательского института уха, горла, носа и речи.

Использование предлагаемого способа переработки речевого сигнала позволяет получить следующий положительный эффект.

1. Результаты исследования демонстрируют возможность проведения имитации слухового восприятия имплантированных пациентов с помощью разработанной программы.

2. Полученные результаты свидетельствуют о наличии параллелей между восприятием спектрально депривированного речевого сигнала испытуемыми с нормальным слухом и восприятием речи имплантированными пациентами.

3. Участие родителей имплантированных детей в экспериментах по восприятию обработанной речи служит для них яркой демонстрацией того, что слышит и как обучается восприятию речи, обработанной процессором кохлеарного импланта, их ребенок.

Из вышесказанного следует, что технический результат изобретения достигается новой совокупностью существенных признаков, следовательно заявляемый способ соответствует критерию патентоспособности «изобретательский уровень».

Сущность способа поясняется примером.

После объяснения сути обследования и проведения тренировки при полном спектре речевого сигнала начиналось исследование разборчивости речи, обработанной по нашей программе. При первом обследовании испытуемая П. (мать имплантированной девушки) правильно опознала 4 из 60 слов (6%) и по ее словам звучание речи было ужасное. При проведении обучения, т.е. при прослушивании с предварительным ознакомлением о том, какое слово она будет слышать, она была очень удивлена тем, что опознает знаемые слова. При повторном обследовании испытуемая опознала 24 слова (40%) и была удивлена полученным результатом. Причем она сама отметила, что не запомнила тестовые слова, а именно освоила новую картину речи. Столь разительный результат дает возможность испытуемым с нормальным слухом понять проблему освоения восприятия речи имплантированными пациентами. После первого включения импланта и в течение настройки процессора у ее дочери мать с пониманием относилась к ее проблемам и даже сама давала некоторые объяснения.

Результаты исследования и сделанные в течение эксперимента наблюдения свидетельствуют о наличии параллелей между восприятием спектрально преобразованного речевого сигнала испытуемыми с нормальным слухом и восприятием речи имплантированными пациентами и дают основания утверждать, что предлагаемый способ обработки речи может быть использован для демонстрации нормальнослышащим процесса освоения восприятия речи пациентами после проведения им операции кохлеарной имплантации.

По описанной схеме обследовано 6 испытуемых. В результате исследования было обнаружено, что после проведения обучения происходит достоверное повышение разборчивости речи (р<0,01) при предъявлении обработанного предлагаемым способом речевого сигнала в среднем по группе с 20 до 60%.

Из вышесказанного следует, что предлагаемый способ обеспечивает технический результат, не вызывает затруднений, предполагает использование освоенных материалов и стандартного оборудования, что свидетельствует о соответствии заявляемого технического решения критерию патентоспособности «промышленная применимость».

ИСТОЧНИКИ ИНФОРМАЦИИ

1. Ланцов А.А., Петров С.М., Пудов В.И. К вопросу о моделировании слухового восприятия имплантированных пациентов // Вестн. оторинолар. - 1999. - N 6. - C.21-23.

2. Loizou S., Dorman M. and Tu Z. On the number of channels needed to understand speech // J. Acoust. Soc. Amer. - 1999. - Vol.106, N 4. - P.2097-2103.

3. Петров С.М. Восприятие спектрально депривированного речевого сигнала // Физиология человека. - 2003. - 1. - С.72-74.

4. Eddington D.K., Dobelle W.H., Blackman D.E. e.a. Auditory prosthesis with multiple channel intracochlear stimulation // Ann-Otol-Rhinol-Laryngol. - 1978. - Vol.87, N 6. - Part 2. Suppl.53. - P.1-39.

5. Hartmann W. Pitch, periodicity and auditory organisation // J. Acoust. Soc. Amer. - 1996. - Vol.100, N 6. - P.3491-3502.

Способ имитации слухового восприятия акустического сигнала пациентом после кохлеарной имплантации путем аналого-цифрового преобразования входного сигнала, выраженного в виде слова, разделения спектра преобразованного сигнала на частотные, четные и нечетные, полосы, суммирования нечетных полос, цифроаналогового преобразования полученного суммарного сигнала и обучения его восприятию посредством предварительного ознакомления со словом, предъявляемым для прослушивания и последующего тестирования, отличающийся тем, что разделение спектра проводят по тонотопическому закону распределения частот по оси улитки, при этом частотные полосы с нечетными номерами располагают на равном расстоянии друг от друга по длине базилярной мембраны в соответствии с нормальным тонотопическим распределением частот по оси улитки, суммируют, по крайней мере, три нечетные полосы спектра, а обучение проводят посредством неоднократного повторения слова, предъявляемого для прослушивания, до однозначного соотнесения его с известным значением слова, полученным при предварительном ознакомлении, при этом для предъявления при тестировании используют те же слова, что и при обучении.