SoundRecover2 в детской практике: слышать то, что необходимо
Потенциальные преимущества новой адаптивной версии нелинейной частотной компрессии (НЛЧК), позволяющей применять более низкие коэффициенты компрессии и граничные частоты, были изучены на детском контингенте. В данной работе сравнивались показатели слышимости и разборчивости речи, полученные с использованием исходного и нового алгоритмов НЛЧК. Согласно результатам, новая адаптивная версия НЛЧК обеспечивает лучшую доступность высокочастотных речевых звуков и повышает разборчивость односложных СГС-слов (согласная-гласная-согласная) без снижения разборчивости речи. Эта новая адаптивная НЛЧК-обработка, получившая название НЛЧК-2, лежит в основе алгоритма Phonak SoundRecover2.
В 2008 г. компания Phonak впервые представила основанный на нелинейной частотной компрессии (НЛЧК) алгоритм SoundRecover. С ним можно восстановить слышимость недоступных при обычном усилении высокочастотных звуков. Используемая в SoundRecover технология NLFC сжимает высокочастотные акустические входные сигналы, перемещая их в более низкочастотную область. Так детям обеспечивается доступность важных для развития речи высокочастотных звуков, в частности, фрикативов /ф/, /с/ и /ш/.
 
Обзор исследований достоинств такой обработки сигнала у детей показывает, что SoundRecover может улучшить разборчивость речи при условии выполнения надлежащей верификации. Несмотря на хорошо известные преимущества SoundRecover, завышение параметров НЛЧК (например, слишком высокий коэффициент компрессии и слишком низкая граничная частота) может привести к значительному искажению исходного речевого сигнала, вплоть до дискомфорта и неразборчивости.
 
Для преодоления этих ограничений было создано второе поколение НЛЧК – НЛЧК-2. Главное различие между исходной версией НЛЧК и адаптивной НЛЧК-2 состоит в том, что алгоритм НЛЧК-2 не статичен, а адаптивно реагирует на распределение энергии входного сигнала. Кроме того, НЛЧК-2 характеризуется второй граничной частотой, «защищающей» низкочастотные звуки, такие как гласные и звонкие согласные. Согласно схеме обработки сигнала НЛЧК-2, звуки, частота которых меньше нижней граничной частоты, всегда остаются неизменными (т.е. к ним применяется линейная частотная обработка). Звуки, частота которых превышает верхнюю граничную частоту, всегда подвергаются частотной компрессии. Обработка звука, частота которого лежит между нижней и верхней граничными частотами, зависит от мгновенного распределения энергии входного сигнала. В этой области система адаптивно и мгновенно решает, применять или не применять частотную компрессию.
 
При надлежащем значении верхней граничной частоты нижнюю граничную частоту можно установить гораздо ниже 1500 Гц, что было пределом в исходном варианте алгоритма. Соотношение формант гласных звуков не будет нарушено, т.к. адаптивный алгоритм включает частотную компрессию средне- и высокочастотных входных сигналов только при их доминировании над одновременно присутствующими низкочастотными компонентами. Кроме того, использование более низкой граничной частоты позволит применять меньшие коэффициенты компрессии, а это положительно скажется на сохранности спектральной формы средне- и высокочастотных фонем и окружающих звуков.
 
В данной работе исходной версии НЛЧК (применявшейся в первом поколении SoundRecover) соответствует аббревиатура НЛЧК-1, а адаптивная НЛЧК (используемая в SoundRecover2) именуется НЛЧК-2. Цель работы заключалась в оценке эффективности адаптивного алгоритма нелинейной частотной компрессии у детей.

Методика

Участники исследования

В исследовании приняли участие 14 детей, у которых ранее была обнаружена тугоухость: от малой/умеренной на низких частотах до тяжелой/глубокой на высоких частотах. Средний возраст детей составлял 11 лет и 6 месяцев (от 6 до 17 лет). Все испытуемые ранее пользовались НЛЧК-1. Родным языком для всех был английский. Показатели рецептивной и экспрессивной устной речи находились в пределах двух стандартных отклонений от возрастных норм. Из исследования были исключены дети с расстройствами спектра слуховой нейропатии, ретрокохлеарной патологией слуха, когнитивно-неврологическими нарушениями и/или неграмотностью (последняя не позволяла использовать анкетирование и задания, связанные с разборчивостью речи в закрытом выборе).

Подбор и настройка слуховых аппаратов

Всем участникам исследования был бинаурально подобран прототип заушного слухового аппарата Phonak Naida Q-90 с несколькими алгоритмами НЛЧК. В реальном ухе проводили измерение разности между реальным ухом и куплером для того, чтобы выходной сигнал слуховых аппаратов при выключенной НЛЧК максимально (в пределах ±2 дБ) соответствовал целевым значениям DSL v5.0 для входного речевого сигнала уровнем 55, 65 и 75 дБ УЗД. Во всех слуховых аппаратах было задействовано активное подавление обратной связи. Перед измерениями в реальном ухе осуществляли калибровку и замеры обратной акустической связи.

План исследования

Исследование разбили на три этапа. Длительность каждого составляла 4-6 недель. На каждом этапе участники исследования пользовались одним из трех вариантов НЛЧК: НЛЧК-1, НЛЧК-2А и НЛЧК-2В. Предполагалось, что все участники были абсолютно привычны к НЛЧК- 1, т.к. они применяли этот алгоритм ранее. Что же касается обоих вариантов НЛЧК-2, оценка их эффективности проводилась в начале и по окончании соответствующего этапа (через 4-6 недель).

1. НЛЧК-1

Параметры НЛЧК-1 у каждого участника были идентичны использовавшимся в их собственных слуховых аппаратах, настроенных согласно протоколу верификации и точной настройки. При активированной НЛЧК проводили измерения в реальном ухе, чтобы убедиться, что фонема /с/, произнесенная женским голосом на уровне 65 дБ УЗД, достаточно хорошо слышна в исходных настройках НЛЧК-1 (т.е. уровень подвергшегося компрессии сигнала достигает или превышает расчетное значение DSL v5.0 на целевой частоте). Если фонема /с/ была не слышна, выполнялась точная настройка НЛЧК-1.

НЛЧК-1 сравнивали с двумя вариантами настройки НЛЧК-2.

2. НЛЧК-2А

НЛЧК-2А настраивалась на основании аудиограммы испытуемого по следующим критериям. Максимальная выходная частота НЛЧК-2А устанавливалась в соответствии с точкой пересечения пороговой кривой с кривой максимального уровня выходного сигнала слухового аппарата при отключенной НЛЧК. Верхняя граничная частота задавалась согласно точке пересечения кривой выходного речевого сигнала уровнем 80 дБ УЗД с пороговой кривой. В результате удавалось защитить максимально широкий гармонический диапазон посредством НЛЧК-2.

3. НЛЧК-2В

Настройки НЛЧК-2В были промежуточными между НЛЧК-2А и НЛЧК-1. У каждого испытуемого максимальная выходная частота НЛЧК-2В была такой же, как для НЛЧК-1. Верхняя граничная частота была выше, чем для НЛЧК-2А. Коэффициент частотной компрессии также был более высоким. Верхняя же граничная частота была ниже, чем для НЛЧК-2А. За счет этого слышимый диапазон был почти таким же, как для НЛЧК-1 после точной настройки. Такая настройка была выбрана для проверки субъек тив ных предпочтений НЛЧК-1 и НЛЧК-2 в условиях сходного качества звука, подвергшегося частотной компрессии.

Методы оценки результатов

Разборчивость речи в открытом выборе оценивали с помощью трех показателей: тест множественного числа Университета Западного Онтарио (UWO), тест распознавания односложных слов «согласная-гласная-согласная» (СГС) и тест восприятия фонем Phonak (PPT).

Результаты

Тест множественного числа UWO

Средние показатели теста множественного числа UWO представлены на Рис. 1. Очевидно, что показатели НЛЧК-2В (спустя 4-6 недель после начала использования) были статистически значимо выше показателей НЛЧК-1 (т.е. исходного варианта SoundRecover).

Рисунок 1

Рис. 1. Средние показатели теста множественного числа UWO в различных условиях его проведения. *Статистически значимые различия: р = 0,02.

Тест распознавания СГС-слов

Средние показатели распознавания слов при пяти вариантах проведения теста представлены на Рис. 2 (уровень предъявления сигнала 50 дБА) и Рис. 3 (уровень предъявления сигнала 60 дБА).

Согласно представленным на Рис. 2 и 3 результатам, при обоих уровнях предъявления сигнала (50 и 60 дБА) средние показатели НЛЧК-2А (через 4-6 недель) и НЛЧК-2В (через 4-6 недель) были статистически значимо выше показателей НЛЧК-1 (т.е. исходного варианта SoundRecover).

Рисунок 2

Рис. 2. Средние показатели теста распознавания СГС-слов (50 дБА) в различных условиях его проведения. * и ** Статистически значимые различия: *р = 0,005, **р = 0,004.

Рисунок 3

Рис. 3. Средние показатели теста распознавания СГС-слов (60 дБА) в различных условиях его проведения. * и ** Статистически значимые различия: *р = 0,005, **р = 0,004.

Тест PPT: пороги обнаружения

Статистически значимых различий между результатами, полученными при разных вариантах НЛЧК, не было, однако для некоторых стимулов отмечено снижение порогов обнаружения до 4 дБ УЗД при использовании алгоритма НЛЧК-2В по сравнению с алгоритмами НЛЧК-1 и НЛЧК-2А.

Тест PPT: пороги распознавания

Средние пороги распознавания для различных сочетаний НЛЧК и стимулов представлены на Рис. 4. Статистически значимых различий между отдельными вариантами НЛЧК не обнаружено, однако у большинства испытуемых пороги распознавания всех изучавшихся фонем снижались (т.е. улучшались) при использовании НЛЧК-2В спустя 4-6 недель после начала исследования.

Рисунок 4

Рис. 4. Средние пороги распознавания четырех стимулов в тесте PPT для НЛЧК-1 и НЛЧК-2 (после периода адаптации).

Обсуждение

Согласно результатам настоящего исследования, адаптивный алгоритм НЛЧК обеспечивает более высокие показатели обнаружения и распознавания высокочастотных речевых звуков по сравнению с исходной версией НЛЧК. Кроме того, нет признаков снижения разборчивости речи при использовании адаптивного алгоритма НЛЧК.

Не все полученные результаты были статистически значимыми, однако отмечена тенденция к несколько лучшим показателям при применении промежуточной версии НЛЧК-2, а именно НЛЧК-2В. Адаптивное функционирование НЛЧК-2 в сочетании со второй граничной частотой позволяет значительно снизить первую граничную частоту по сравнению с используемой в НЛЧК-1. Настоящее исследование не лишено недостатков. Во-первых, не изучались показатели в шуме. Не исключено, что НЛЧК-2 улучшает разборчивость речи в тишине, но никак не сказывается на разборчивости речи в шуме. Во-вторых, настройки НЛЧК-2 основывались на настройках НЛЧК-1, использовавшихся детьми до начала исследования. Вполне допустимо, что преимущества НЛЧК-2 были бы еще очевиднее при оптимизации индивидуальных настроек с применением объективных (измерения в реальном ухе) и субъективных показателей. Кроме того, весьма вероятно, что преимущества НЛЧК-2 над НЛЧК-1 недооценены в настоящем исследовании из-за слишком короткого (4-6 недель) периода адаптации. В-третьих, показатели, полученные с использованием НЛЧК-1 и НЛЧК-2, не сравнивались с показателями, полученными без НЛЧК. В предыдущих работах было показано, что у детей с такими же нарушениями слуха, как у наших испытуемых, использование НЛЧК-1 не только не ухудшает, но и в ряде случаев улучшает показатели разборчивости речи по сравнению с отсутствием НЛЧК. Однако в рамках данной работы такие исследования не проводились, поэтому вывод о преимуществах НЛЧК-2 над традиционным звукоусилением был бы неправомочен.

Заключение

Эффективность влияния адаптивной нелинейной частотной компрессии на показатели слышимости и разборчивости речи у детей изучалась путем сравнения НЛЧК-2, базового алгоритма SoundRecover2 с исходным алгоритмом частотного понижения SoundRecover. Результаты свидетельствуют о следующих преимуществах нового алгоритма НЛЧК:
  • бóльшая доступность высокочастотных речевых звуков;
  • лучшее распознавание односложных СГС-слов.
Не отмечено ухудшения разборчивости речи. Кроме того, опытные пользователи традиционной НЛЧК (т.е. исходного варианта SoundRecover) смогли перейти на новую адаптивную НЛЧК без длительного периода адаптации.

Материал предоставлен брендом Phonak

Статьи для специалистов