SoundRecover2 в детской практике: слышать то, что необходимо

В 2008 г. компания Phonak впервые представила основанный на нелинейной частотной компрессии (НЛЧК) алгоритм SoundRecover. С ним можно восстановить слышимость недоступных при обычном усилении высокочастотных звуков. Используемая в SoundRecover технология NLFC сжимает высокочастотные акустические входные сигналы, перемещая их в более низкочастотную область. Так детям обеспечивается доступность важных для развития речи высокочастотных звуков, в частности, фрикативов /ф/, /с/ и /ш/.

Обзор исследований достоинств такой обработки сигнала у детей показывает, что SoundRecover может улучшить разборчивость речи при условии выполнения надлежащей верификации. Несмотря на хорошо известные преимущества SoundRecover, завышение параметров НЛЧК (например, слишком высокий коэффициент компрессии и слишком низкая граничная частота) может привести к значительному искажению исходного речевого сигнала, вплоть до дискомфорта и неразборчивости.

Для преодоления этих ограничений было создано второе поколение НЛЧК – НЛЧК-2. Главное различие между исходной версией НЛЧК и адаптивной НЛЧК-2 состоит в том, что алгоритм НЛЧК-2 не статичен, а адаптивно реагирует на распределение энергии входного сигнала. Кроме того, НЛЧК-2 характеризуется второй граничной частотой, «защищающей» низкочастотные звуки, такие как гласные и звонкие согласные. Согласно схеме обработки сигнала НЛЧК-2, звуки, частота которых меньше нижней граничной частоты, всегда остаются неизменными (т.е. к ним применяется линейная частотная обработка). Звуки, частота которых превышает верхнюю граничную частоту, всегда подвергаются частотной компрессии. Обработка звука, частота которого лежит между нижней и верхней граничными частотами, зависит от мгновенного распределения энергии входного сигнала. В этой области система адаптивно и мгновенно решает, применять или не применять частотную компрессию.

При надлежащем значении верхней граничной частоты нижнюю граничную частоту можно установить гораздо ниже 1500 Гц, что было пределом в исходном варианте алгоритма. Соотношение формант гласных звуков не будет нарушено, т.к. адаптивный алгоритм включает частотную компрессию средне- и высокочастотных входных сигналов только при их доминировании над одновременно присутствующими низкочастотными компонентами. Кроме того, использование более низкой граничной частоты позволит применять меньшие коэффициенты компрессии, а это положительно скажется на сохранности спектральной формы средне- и высокочастотных фонем и окружающих звуков.

В данной работе исходной версии НЛЧК (применявшейся в первом поколении SoundRecover) соответствует аббревиатура НЛЧК-1, а адаптивная НЛЧК (используемая в SoundRecover2) именуется НЛЧК-2. Цель работы заключалась в оценке эффективности адаптивного алгоритма нелинейной частотной компрессии у детей.

Методика

Участники исследования

В исследовании приняли участие 14 детей, у которых ранее была обнаружена тугоухость: от малой/умеренной на низких частотах до тяжелой/глубокой на высоких частотах. Средний возраст детей составлял 11 лет и 6 месяцев (от 6 до 17 лет). Все испытуемые ранее пользовались НЛЧК-1. Родным языком для всех был английский. Показатели рецептивной и экспрессивной устной речи находились в пределах двух стандартных отклонений от возрастных норм. Из исследования были исключены дети с расстройствами спектра слуховой нейропатии, ретрокохлеарной патологией слуха, когнитивно-неврологическими нарушениями и/или неграмотностью (последняя не позволяла использовать анкетирование и задания, связанные с разборчивостью речи в закрытом выборе).

Подбор и настройка слуховых аппаратов

Всем участникам исследования был бинаурально подобран прототип заушного слухового аппарата Phonak Naida Q-90 с несколькими алгоритмами НЛЧК. В реальном ухе проводили измерение разности между реальным ухом и куплером для того, чтобы выходной сигнал слуховых аппаратов при выключенной НЛЧК максимально (в пределах ±2 дБ) соответствовал целевым значениям DSL v5.0 для входного речевого сигнала уровнем 55, 65 и 75 дБ УЗД. Во всех слуховых аппаратах было задействовано активное подавление обратной связи. Перед измерениями в реальном ухе осуществляли калибровку и замеры обратной акустической связи.

План исследования

Исследование разбили на три этапа. Длительность каждого составляла 4-6 недель. На каждом этапе участники исследования пользовались одним из трех вариантов НЛЧК: НЛЧК-1, НЛЧК-2А и НЛЧК-2В. Предполагалось, что все участники были абсолютно привычны к НЛЧК- 1, т.к. они применяли этот алгоритм ранее. Что же касается обоих вариантов НЛЧК-2, оценка их эффективности проводилась в начале и по окончании соответствующего этапа (через 4-6 недель).

1. НЛЧК-1

Параметры НЛЧК-1 у каждого участника были идентичны использовавшимся в их собственных слуховых аппаратах, настроенных согласно протоколу верификации и точной настройки. При активированной НЛЧК проводили измерения в реальном ухе, чтобы убедиться, что фонема /с/, произнесенная женским голосом на уровне 65 дБ УЗД, достаточно хорошо слышна в исходных настройках НЛЧК-1 (т.е. уровень подвергшегося компрессии сигнала достигает или превышает расчетное значение DSL v5.0 на целевой частоте). Если фонема /с/ была не слышна, выполнялась точная настройка НЛЧК-1.

НЛЧК-1 сравнивали с двумя вариантами настройки НЛЧК-2.

2. НЛЧК-2А

НЛЧК-2А настраивалась на основании аудиограммы испытуемого по следующим критериям. Максимальная выходная частота НЛЧК-2А устанавливалась в соответствии с точкой пересечения пороговой кривой с кривой максимального уровня выходного сигнала слухового аппарата при отключенной НЛЧК. Верхняя граничная частота задавалась согласно точке пересечения кривой выходного речевого сигнала уровнем 80 дБ УЗД с пороговой кривой. В результате удавалось защитить максимально широкий гармонический диапазон посредством НЛЧК-2.

3. НЛЧК-2В

Настройки НЛЧК-2В были промежуточными между НЛЧК-2А и НЛЧК-1. У каждого испытуемого максимальная выходная частота НЛЧК-2В была такой же, как для НЛЧК-1. Верхняя граничная частота была выше, чем для НЛЧК-2А. Коэффициент частотной компрессии также был более высоким. Верхняя же граничная частота была ниже, чем для НЛЧК-2А. За счет этого слышимый диапазон был почти таким же, как для НЛЧК-1 после точной настройки. Такая настройка была выбрана для проверки субъек тив ных предпочтений НЛЧК-1 и НЛЧК-2 в условиях сходного качества звука, подвергшегося частотной компрессии.

Методы оценки результатов

Разборчивость речи в открытом выборе оценивали с помощью трех показателей: тест множественного числа Университета Западного Онтарио (UWO), тест распознавания односложных слов «согласная-гласная-согласная» (СГС) и тест восприятия фонем Phonak (PPT).

Результаты

Тест множественного числа UWO

Средние показатели теста множественного числа UWO представлены на Рис. 1. Очевидно, что показатели НЛЧК-2В (спустя 4-6 недель после начала использования) были статистически значимо выше показателей НЛЧК-1 (т.е. исходного варианта SoundRecover).

Рис. 1. Средние показатели теста множественного числа UWO в различных условиях его проведения. *Статистически значимые различия: р = 0,02.

Тест распознавания СГС-слов

Средние показатели распознавания слов при пяти вариантах проведения теста представлены на Рис. 2 (уровень предъявления сигнала 50 дБА) и Рис. 3 (уровень предъявления сигнала 60 дБА).

Согласно представленным на Рис. 2 и 3 результатам, при обоих уровнях предъявления сигнала (50 и 60 дБА) средние показатели НЛЧК-2А (через 4-6 недель) и НЛЧК-2В (через 4-6 недель) были статистически значимо выше показателей НЛЧК-1 (т.е. исходного варианта SoundRecover).

Рис. 2. Средние показатели теста распознавания СГС-слов (50 дБА) в различных условиях его проведения. * и ** Статистически значимые различия: *р = 0,005, **р = 0,004.

Рис. 3. Средние показатели теста распознавания СГС-слов (60 дБА) в различных условиях его проведения. * и ** Статистически значимые различия: *р = 0,005, **р = 0,004.

Тест PPT: пороги обнаружения

Статистически значимых различий между результатами, полученными при разных вариантах НЛЧК, не было, однако для некоторых стимулов отмечено снижение порогов обнаружения до 4 дБ УЗД при использовании алгоритма НЛЧК-2В по сравнению с алгоритмами НЛЧК-1 и НЛЧК-2А.

Тест PPT: пороги распознавания

Средние пороги распознавания для различных сочетаний НЛЧК и стимулов представлены на Рис. 4. Статистически значимых различий между отдельными вариантами НЛЧК не обнаружено, однако у большинства испытуемых пороги распознавания всех изучавшихся фонем снижались (т.е. улучшались) при использовании НЛЧК-2В спустя 4-6 недель после начала исследования.

Рис. 4. Средние пороги распознавания четырех стимулов в тесте PPT для НЛЧК-1 и НЛЧК-2 (после периода адаптации).

Обсуждение

Согласно результатам настоящего исследования, адаптивный алгоритм НЛЧК обеспечивает более высокие показатели обнаружения и распознавания высокочастотных речевых звуков по сравнению с исходной версией НЛЧК. Кроме того, нет признаков снижения разборчивости речи при использовании адаптивного алгоритма НЛЧК.

Не все полученные результаты были статистически значимыми, однако отмечена тенденция к несколько лучшим показателям при применении промежуточной версии НЛЧК-2, а именно НЛЧК-2В. Адаптивное функционирование НЛЧК-2 в сочетании со второй граничной частотой позволяет значительно снизить первую граничную частоту по сравнению с используемой в НЛЧК-1. Настоящее исследование не лишено недостатков. Во-первых, не изучались показатели в шуме. Не исключено, что НЛЧК-2 улучшает разборчивость речи в тишине, но никак не сказывается на разборчивости речи в шуме. Во-вторых, настройки НЛЧК-2 основывались на настройках НЛЧК-1, использовавшихся детьми до начала исследования. Вполне допустимо, что преимущества НЛЧК-2 были бы еще очевиднее при оптимизации индивидуальных настроек с применением объективных (измерения в реальном ухе) и субъективных показателей. Кроме того, весьма вероятно, что преимущества НЛЧК-2 над НЛЧК-1 недооценены в настоящем исследовании из-за слишком короткого (4-6 недель) периода адаптации. В-третьих, показатели, полученные с использованием НЛЧК-1 и НЛЧК-2, не сравнивались с показателями, полученными без НЛЧК. В предыдущих работах было показано, что у детей с такими же нарушениями слуха, как у наших испытуемых, использование НЛЧК-1 не только не ухудшает, но и в ряде случаев улучшает показатели разборчивости речи по сравнению с отсутствием НЛЧК. Однако в рамках данной работы такие исследования не проводились, поэтому вывод о преимуществах НЛЧК-2 над традиционным звукоусилением был бы неправомочен.

Заключение

Эффективность влияния адаптивной нелинейной частотной компрессии на показатели слышимости и разборчивости речи у детей изучалась путем сравнения НЛЧК-2, базового алгоритма SoundRecover2 с исходным алгоритмом частотного понижения SoundRecover. Результаты свидетельствуют о следующих преимуществах нового алгоритма НЛЧК:

бóльшая доступность высокочастотных речевых звуков;
лучшее распознавание односложных СГС-слов.

Не отмечено ухудшения разборчивости речи. Кроме того, опытные пользователи традиционной НЛЧК (т.е. исходного варианта SoundRecover) смогли перейти на новую адаптивную НЛЧК без длительного периода адаптации.

Материал предоставлен брендом Phonak