Стратегия дополнительного усиления тихих речевых составляющих в слуховых аппаратах

Исследования в области коммуникационной аудиологии охватывают, в числе прочего, слуховые усилия или легкость восприятия. Для увеличения легкости восприятия разработчики реализуют в слуховых аппаратах самые разные аудиологические концепции. И разборчивость речи является той целью, которая должна достигаться «с легкостью». Понимание речи в шуме уже улучшено во многих отношениях; но не следует забывать и о нижней границе речевого диапазона, где находятся самые тихие звуки. Новая стратегия от специалистов Oticоn позволяет эффективнее использовать тихие составляющие речи и повышать ее разборчивость почти на 20 %.

Важной целью при протезировании слуховыми аппаратами является достижение оптимальной разборчивости речи. Разработчики, как правило, исходят из того, что нормальная громкость речи составляет примерно 65 дБ УЗД. Многие стандарты измерений, имеющие отношение к слуховым аппаратам, а также большинство алгоритмов настройки опираются на этот уровень громкости речи. Но при более пристальном рассмотрении оказывается, что средний уровень «нормальной» речевой громкости ничего не говорит о том, какой уровень звукового давления фактически присутствует в данный момент времени или в данном частотном диапазоне. Исключительно на основании того факта, что речь всегда обладает определенным динамическим диапазоном, можно прийти к выводу, что речь иногда бывает тихой, а иногда громкой. Нормально слышащим людям для обеспечения хорошей разборчивости речи требуется динамический диапазон не менее 30 дБ. В конце слов или фраз, а также при разделении слогов рот может быть вообще закрыт, т.е. «производить» громкость 0 дБ УЗД – но именно эта информация является особенно важной, так как позволяет распознать, чем заканчивается слово или фраза. Даже эти самые общие рассуждения показывают, что учитывать одну лишь «нормальную» громкость речи величиной 65 дБ УЗД недостаточно для того, чтобы судить о реальных свойствах речи; можно даже сказать, что одного этого значения абсолютно недостаточно для настройки слухового аппарата. Вот почему в новейших версиях алгоритмов настройки рассматриваются разные входные уровни.

Важность тихих уровней

В тихой обстановке дома нас окружает уровень звука величиной 50 дБ и даже меньше. Он складывается из окружающих шумов и голосов. Но даже при нормальной громкости речи в ней всегда имеются тихие речевые составляющие. На Рис. 1 показано распределение громкости во времени для английской фразы «Paint the sockets in the wall dull green» («Покрасьте розетки в стене в матовый зеленый цвет»), которая звучит в течение трех секунд. Такие сильные фонемы, как /ck/ в слове «socket», на 10-20 дБ громче, чем гласные звуки, например, /a/, в слове «wall», и чем согласные звуки, например, /s/, в слове «socket». Сигнал состоит из пиков и впадин, которые образуют модуляцию речи. В то время как средняя громкость этой фразы составляет 65 дБ УЗД, отдельные ее части во впадинах представлены уровнями 45 дБ УЗД и даже ниже. Особенно хорошо это видно по отношению к высокочастотным компонентам.

Рисунок 1

Рис. 1. Осциллограмма мужского голоса. В целом она имеет относительно длинные периоды с уровнями ниже 45 дБ УЗД.

На Рис. 2 показан частотный спектр для речи громкостью 65 дБ УЗД. Видно, что, начиная с 1 кГц, речевые компоненты имеют уровни ниже 45 дБ УЗД.

Рисунок 2

Рис. 2. Частотный спектр для речи средней громкости 65 дБ УЗД. Примерно 80 % речевых компонентов находятся ниже 45 дБ УЗД.

Чтобы оценить, насколько часто владелец слухового аппарата имеет дело с тихими речевыми компонентами в реальной жизни, в США было проведено исследование среди 103 испытуемых с помощью функции мониторинга в аппаратах Alta и Alta Pro. Используемые слуховые аппараты имеют функцию распознавания речи на основе гармонических обертонов, которая отличается от других систем тем, что может работать даже при отрицательном отношении сигнал/шум. В зависимости от ситуации речь может быть даже на 15-20 дБ тише окружающего шума, однако аппарат все равно ее распознает. Дополнительно к этому, СА определяет шум посредством анализа модуляции. Результаты этого анализа сохраняются в памяти слухового аппарата, благодаря чему слухопротезист может изучить их через программу настройки. Все испытуемые были опытными пользователями и носили слуховые аппараты в течение длительного времени. При длительности ношения в среднем 11 часов в день было определено, что примерно 75 % всех речевых сигналов имеют уровень ниже 70 дБ УЗД (Рис. 3).

Рисунок 3

Рис. 3. Длительность использования слуховых аппаратов в различной звуковой обстановке. Усредненный график для 103 испытуемых и для 11-часового ежедневного ношения. Ровно 75 % времени речевые уровни (только для речи или для речи в шуме) находятся ниже 70 дБ УЗД.

Если объединить результаты американского исследования с анализом распределения уровней для речи нормальной громкости, то можно увидеть, что примерно 75 % всех речевых сигналов имеют уровень ниже 45 дБ УЗД. Особенно это справедливо в отношении диапазона выше 1,5 кГц. Становится ясно, что нацеленность настройки на «нормальную» громкость речи величиной 60-65 дБ УЗД основана на ложных (не оптимальных) предположениях. Чтобы добиться лучшей разборчивости речи для ситуаций с тихими речевыми компонентами, была разработана концепция дополнительного усиления именно этих компонентов – так называемый Усилитель тихой речи (Soft Speech Booster, сокр. – SSB).

Feedback Shield 2.0

Необходимость в отдельных случаях использовать добавочное усиление для тихих уровней повышает риск самовозбуждения; особенно при дополнительном усилении высокочастотной области. Именно поэтому одним из условий при разработке Усилителя тихой речи стало улучшение алгоритма подавления обратной связи Feedback Shield. На Рис. 4 показана схема. Функция Feedback Shield работает во всех слуховых аппаратах на платформе Inium/Inium Sense и имеет пять основных компонентов:

Детектор обратной связи: он определяет наличие самовозбуждения.
Тональный детектор: он определяет наличие музыки и речи, при распознавании которых частотный сдвиг не применяется.
Инверсия фазы (динамическая нейтрализация самовозбуждения, dynamic feedback cancellation, сокр. DFC): резонанс обратной связи измеряется и нейтрализуется с помощью противофазного сигнала.
Частотный сдвиг: сигнал, принятый микрофоном, сдвигается на 10-20 Гц, прежде чем выйти из телефона, что делает невозможным возникновение обратной связи.
Регулятор усиления: усиление можно адаптивно регулировать до 40 дБ в секунду в 16-ти узкополосных фильтрах. Эта система очень быстро реагирует на акустические изменения, пока DFC и частотный сдвиг настраиваются на новую ситуацию. Эта функция была впервые использована в слуховых аппаратах ряда Inium/Sense и представляет собой важнейшее усовершенствование алгоритма Feedback Shield.

Сочетание разных компонентов приводит к тому, что во всем частотном диапазоне почти всегда можно обеспечить необходимое усиление.

Рисунок 4

Рис. 4. Три из пяти основных компонента для подавления самовозбуждения. Их дополняют детекторы обратной связи и речи или музыки.

Алгоритм обработки звука VAC+

Современные слуховые аппараты Oticon используют алгоритм обработки звука VAC+, обеспечивающий разборчивость тихой речи. VAC+, в свою очередь, основан на алгоритме VAC (voice aligned compression). VAC учитывает особенности речевого диапазона и восприятия звуков слабослышащими, меньше усиливает громкие уровни входа и больше тихие. VAC+ был оптимизирован при участии нескольких сотен пользователей слуховых аппаратов. Целью было добиться максимального принятия и получения как можно большей пользы в повседневных ситуациях (Рис. 5). VAC+ отличается от VAC наличием Усилителя тихой речи, который позволяет дать больше усиления на высоких частотах (свыше 1,5 кГц) и низких входных уровнях. Более того, усиление тихих уровней можно настроить индивидуально, так как некоторым пользователям требуется большее усиление, а некоторым дополнительное усиление не требуется вовсе.

Рисунок 5

Рис. 5. Принцип действия алгоритма VAC. Разным уровням громкости речи должны соответствовать разные уровни вносимого усиления, потому что в противном случае динамика речи будет слышимо изменяться.

Линейность речевой динамики и функция Speech Guard

Если стратегия VAC изначально нацелена на максимально меньшее влияние компрессии на речь, то функция Speech Guard дополнительно обеспечивает то, что ключевая область всегда передается линейно. Таким образом гарантируется большая естественность передачи речевых звуков, а также музыки. Для взрослых, при прочих равных условиях, она обеспечивает снижение слуховых усилий, а дети в процессе овладения речью быстрее усваивают новые слова.

Индивидуальность: восприятие тихой речи и звуков

Даже несмотря на одинаковую аудиограмму, восприятие громкости у разных людей отличается. В первую очередь это зависит от того, как близкие к порогам слышимости входные сигналы обрабатываются мозгом. На Рис. 6 показан график восприятия различной громкости. Для Боба звуки, близкие к порогам слышимости, кажутся тихими. Поэтому он получает пользу от дополнительного усиления тихих звуков при разговорах в тишине и при восприятии тихих окружающих звуков. В отличие от него Сэму самый низкий слышимый для него уровень звука сразу слышится как уровень средней громкости. Тихого уровня громкости он не знает и считает его скорее помехой.

Рисунок 6

Рис. 6. Кривые громкости для двух человек с одинаковой аудиограммой.

Персонализация тихой речи и звуков

Получается, что восприятие усиленных тихих звуков у разных людей сильно различается. Как предложить каждому пользователю слухового аппарата оптимальный для него баланс между пониманием речи и комфортом? Компания Oticon вместе с Услителем тихой речи добавила в программу настройки Genie два новых рабочих инструмента.

Во-первых, в поддерживаемом программой профиле клиента можно получить первое впечатление с помощью звуковых примеров (Рис. 7). С их помощью будущий владелец СА оценивает звуковые примеры без слуховых аппаратов. Здесь действует правило: тональная аудиограмма снимается без аппаратов. Другие звуковые примеры в профиле клиента используются для того, чтобы оптимизировать индивидуальную настройку автоматических функций (YouMatic) на основе выбранного профиля. С опорой на аудиограмму и оценку звуковых примеров рассчитывается предлагаемая настройка First Fit; ее же можно предложить пользователю для пробного ношения.

Второй инструмент – регулятор для точной настройки усиления тихих звуков.

Рисунок 7

Рис. 7. Звуковые примеры в программе настройки. В процессе настройки они прослушиваются без помощи слуховых аппаратов, чтобы оценить восприятие тихих звуков.

Новый регулятор для точной настройки

Для точной настройки предлагается новый регулятор, который оптимизирует восприятие тихих звуков (Рис. 8). Этот регулятор позволяет индивидуально настроить самый низкий порог компрессии на кривой усиления VAC+. При этом усиление для входных уровней от 25 до 45 дБ УЗД может варьироваться с шагом 5 дБ. Таким способом можно настроить баланс между тихими звуками разной интенсивности. Так как при этом порог компрессии сдвигается, этот регулятор может обозначаться как ТК-регулятор (threshold kneepoint). В отличие от классического ТК-регулятора, который изменяет порог компрессии в т.н. точке перегиба, описываемый регулятор может настраивать только самый нижний из порогов компрессии VAC. Количество точек перегиба может доходить до семи (Рис. 9). По результатам последнего исследования установлено, что 50 % испытуемых предпочитают среднее положение регулятора; это соответствует повышению усиления на 3 дБ в диапазоне выше 1,5 кГц. 35 % хотят иметь еще более высокое усиление, а 15 %, наоборот, меньшее. Дополнительно к этому удалось выявить зависимость от возраста: более молодые участники исследования предпочитали большее усиление (55 % испытуемых моложе 60 лет, в отличие от среднего показателя, равного 35 %), а пожилые люди, наоборот, более приглушенный звук (25 % среди людей старше 80 лет).

Рисунок 7

Рис. 8. Регулятор настройки основного усиления для тихих входных уровней между 25 и 45 дБ УЗД.

Рис. 9. Путем сдвига самого нижнего порога компрессии можно настроить усиление для тихих входных уровней между 25 и 45 дБ УЗД. Тем самым испытуемые с Рис. 6, Боб и Сэм, получат свое собственное индивидуально предпочитаемое восприятие тихих звуков.

Результаты испытания

Для проверки пользы Усилителя тихой речи были проведены три клинических исследования. В ходе двух из них были обнаружены улучшения разборчивости речи за счет Усилителя тихой речи по сравнению со слуховыми аппаратами с аналогичными техническими параметрами, но без Усилителя тихих звуков (Alta и Alta2). В Дании в исследовании приняли участие 34 испытуемых, в Германии – 30. В Германии при дополнительном усилении 3 дБ в диапазоне выше 1,5 кГц было достигнуто улучшение величиной 4 %; в Дании – величиной 9 %; среднее взвешенное значение в зависимости от числа испытуемых составило 7 %. Разница между немецкими и датскими результатами объясняется в том числе и тем, что немецкие испытуемые не имели опыта ношения слуховых аппаратов Alta. В отличие от них все датские участники были опытными пользователями слуховых аппаратов Alta, поэтому они смогли сосредоточиться на преимуществах Усилителя тихой речи в Alta2.

Благодаря персонализированной настройке Усилителя тихой речи удалось добиться дальнейшего улучшения на 6 %. Тем самым с помощью Усилителя тихой речи значительно улучшился средний показатель разборчивости речи (13 %), при этом наилучший показатель равнялся 20 % (Рис. 10). Во время третьего исследования, в котором участвовали 30 датских слабослышащих, было доказано улучшение порога разборчивости речи (SRT) на 0,7 дБ при фоновом шуме 65 дБ. В пересчете на распознавание слов это соответствует дополнительной пользе величиной 8 %.

Рисунок 10

Рис. 10. Преимущество, достигнутое за счет Усилителя тихой речи и персонализации.

Заключение

Тихие речевые компоненты с уровнем ниже 45 дБ УЗД составляют существенную долю в речи с нормальной громкостью. Усилитель тихой речи предлагает для этих уровней в диапазоне выше 1,5 кГц дополнительное усиление величиной 3 дБ, которое можно настраивать индивидуально на указанном диапазоне. Таким образом, пользователь может получить преимущество в разборчивости речи до 13 %. Параллельно с этим растет процент принятия слуховых аппаратов, а также более индивидуально учитываются слуховые предпочтения слабослышащего человека.

Материал предоставлен компанией Oticon, журнал «Hörakustik» № 11 за 2015 год