Компрессия широкого динамического диапазона WDRC. Применение компрессии при глубоких потерях слуха
С возрастанием потери слуха более жесткими становятся и требования к слуховым аппаратам. С одной стороны, он должен усиливать входной звук в имеющемся остаточном динамическом диапазоне, с другой стороны – эффективно ограничивать выходной УЗД. Это осуществляется с помощью компрессии широкого динамического диапазона WDRC – системы ограничения остаточной динамики. Д-р Памела Соуза и ее коллеги изучили показатели распознавания речи и оценку качества речи при участии людей с глубокой потерей слуха для четырех разных видов усиления. В данной статье исследуются аспекты клинического применения результатов независимого исследования.
Большинство современных слуховых аппаратов имеют несколько каналов обработки сигнала и компрессию широкого динамического диапазона WDRC, которая выполняет следующие задачи: поддержание (сильно) ограниченного остаточного динамического диапазона и автоматическую настройку громкости.

Для пациентов со слабой и средней потерей слуха WDRC улучшает разборчивость речи и качество звука в тишине (Соуза, 2002 год). Наблюдаются и некоторые преимущества WDRC по сравнению с линейным усилением в шуме (Мур, 1999 год). Но то, что большинство исследований WDRC проводятся при участии людей со слабой и средней потерей слуха, не дает достаточной информации об успешности применения этой системы у пациентов с сильной и глубокой потерей слуха. Поэтому многие слухопротезисты считают, что пациенты с глубокой потерей слуха предпочитают линейное усиление и получают от него максимальную пользу.

Глубокой потере слуха сопутствует сниженная частотная избирательность (Фолкнер, 1990 год; Розен, 1990 год) и ухудшенное временное разрешение (Ламур, 1990 год; Нельсон и Фрейман, 1987 год). Помимо ограниченной слуховой способности из-за потери слуха, эти ухудшения дополнительно ограничивают возможности человека определять и различать речевые компоненты. Так как спектральные составляющие воспринимаются в ограниченном объеме или вовсе не воспринимаются, пациенты с глубокой потерей слуха опираются на другие стимулы, например, на вариации огибающей речевой амплитуды во времени (Розен, 1990 год). По причине этого многие системы компрессии ограничиваются тем, что минимально ослабляют речевой сигнал.

Рисунок 1

Особая проблема в случае WDRC заключается в том, что естественные вариации речевой амплитуды могут меняться (тихие речевые составляющие становятся громче, а громкие – наоборот, тише, то есть наблюдается некоторое «выравнивание» по громкости), что ухудшает восприятие и распознавание речи. В результате наблюдается снижение по качеству восприятия согласных (Соуза и Тернер, 1998 год) или общего распознавания фразы (Соуза и Кич, 2001 год; Стоун и Мур, 2003 год; Ван Таселл и Трайн, 1996 год). Снижение амплитуды громких речевых составляющих, заложенных в обработке речи с помощью WDRC, в сочетании с ограниченной частотной избирательностью может приводить к ухудшению слуховой способности у пациентов с глубокой потерей слуха, когда они пользуются слуховыми аппаратами с WDRC. И действительно, в 1999 г.  Соуза и Бишоп обнаружили, что усиление с WDRC дает лишь небольшое улучшение распознавания фраз по сравнению с линейным усилением. В 1986 г. де Дженнаро также не нашел никаких преимуществ WDRC для пациентов с глубокой потерей слуха, несмотря на тот факт, что эта система предлагала лучшую слуховую способность, чем линейное усиление.

Преимущества WDRC при глубокой потере слуха

В отличие от этого, другие исследования сумели обнаружить преимущества WDRC для пациентов с глубокой потерей слуха. В 2001 г. Баркер обнаружил, что пациенты с этой степенью ограниченности слуха предпочитали одноканальную WDRC по сравнению с компрессионным ограничением на выходе или пик-клиппированием (ограничением УЗД при достижении слуховым аппаратом уровня насыщения). Хотя предпочтение пользователя является основным критерием для успешного протезирования слуховыми аппаратами, гораздо важнее добиться адекватного понимания речи. В то время как многие формулы настройки пытаются достичь баланса между пониманием речи и качеством звука, до сих пор не существует консенсуса относительно наилучшей характеристики усиления, которая обеспечивала бы хорошее распознавание речи наряду с приемлемым качеством звука для владельцев слуховых аппаратов с глубокой потерей слуха.

Какие результаты показали четыре вида усиления?

Целью исследования Соузы стало изучение показателей распознавания речи и оценки качества речи для четырех разных видов усиления с участием пациентов с глубокой потерей слуха:
1) линейное с пик-клиппированием;
2) линейное с компрессионным ограничением на выходе;
3) двухканальная WDRC;
4) трехканальная WDRC.

В исследовании участвовали 13 испытуемых с глубокой сенсоневральной потерей слуха. Большинство из них уже имели опыт ношения слуховых аппаратов. В качестве контрольной группы были приглашены семь человек с нормальным слухом. Распознавание речи оценивалось с помощью теста бессмысленных слогов (NST, Резник, 1976 год). Оценка качества речи проводилась с помощью задачи на парное сравнение с фразовыми стимулами из теста связной речи (CST, Кокс, 1987 год). В случае каждой пары стимулов испытуемые слышали одно и то же предложение, обработанное двумя разными видами усиления. Им предлагалось выбрать предпочтительный для них вид усиления. Испытуемых специально не просили использовать громкость в качестве основного критерия предпочтения. Речевые материалы предъявлялись с имитацией всех описанных выше видов усиления через компьютерную систему Master Hearing Aid. Сигнал предъявлялся с громкостью 70 дБ УЗД через внутриушные телефоны ER-2. АЧХ определялись на основе средних аудиометрических порогов группы испытуемых. Сами целевые значения представляли собой среднее значение расчета NAL-RP для разговорной речи (Диллон, 1999 год).

Как и следовало ожидать, показатели распознавания речи для нормально слышащих участников были одинаково высокими для всех тестовых условий. Слабослышащие участники показали ухудшенные показатели для пик-клиппирования и многоканальной WDRC по сравнению с компрессионным ограничением. Единственная статистически достоверная разница была обнаружена между компрессионным ограничением и трехканальной WDRC.

Далее следует подробный анализ характеристик, чтобы определить, какие речевые свойства плохо передает система трехканальной WDRC, включая место артикуляции, фонацию и вид артикуляции. Информацию о месте артикуляции не может эффективно передать ни одна система обработки сигнала, возможно, потому, что слабослышащие участники имеют плохое частотное разрешение, а информация о месте в основном передается за счет частотных символов (Розен, 1992 год). Оба вида усиления WDRC сохранили информацию о фонации немного лучше, чем компрессионное ограничение и пик-клиппирование. Главный интерес представлял вид артикуляции, так как он преимущественно передается через огибающую амплитуды (Розен, 1992 год). Можно предположить, что огибающая амплитуды будет сильнее искажаться быстродействующей WDRC, чем пик-клиппированием или компрессионным ограничением на выходе.

Подробный анализ передачи артикуляции обнаружил, что вид усиления по-разному влияет на категории фонем. Фрикативные (щелевые) звуки достаточно хорошо сохраняются при компрессионном ограничении и WDRC, но хуже при пик-клиппировании. Двухканальная WDRC передает носовые звуки лучше, чем пик-клиппирование или компрессионное ограничение. В отличие от этого, трехканальная WDRC передает носовые звуки хуже. Так как носовые звуки главным образом передаются низкочастотными компонентами (Кент и Рид, 1992 год), то переходные частоты в трехканальной системе могут искажать эти речевые символы. Аффрикаты, то есть сочетания смычного согласного с фрикативным, лучше всего сохраняются при линейном усилении – пик-клиппировании или компрессионном ограничении. Зато WDRC повлияла на них отрицательно. Авторы предполагают, что плохая идентификация аффрикат может быть связана с временными константами алгоритмов WDRC. Они вызывают уменьшение амплитуды после паузы, отчего взрывные согласные воспринимаются как разрывы, и это ведет к их неправильному распознаванию.

Оценка качества звука слабослышащими испытуемыми показала выраженное предпочтение компрессионного ограничения. Была обнаружена значимая разница между всеми сравнениями, за исключением пик-клиппирования и двухканальной WDRC. Ни один нормально слышащий испытуемый не предпочел пик-клиппирование. Выбор нормально слышащих испытуемых равномерно распределился между остальными вариантами.

Ухудшение распознавания речи и качества звука из-за WDRC

В общей сложности результаты этого исследования подтвердили ухудшенное распознавание речи и качество звука для WDRC по сравнению с компрессионным ограничением. Предыдущие работы показали, что польза компрессии снижается, когда пороги слышимости по воздушному звукопроведению превышают 70 дБ нПС (Гедегебуре, 2001 год; Соуза и Бишоп, 1999 год). В 1988 г. Бутройд пришел к выводу, что причиной плохого результата при быстродействующей двухканальной компрессии являются амплитудные искажения. Эти предположения удалось подтвердить в данной работе, в которой было найдено смешение аффрикат в сочетании с неправильной интерпретацией амплитудных стимулов.

Хотя компрессионное ограничение привело в данном исследовании к улучшению распознавания речи и качества звука, авторы предостерегают, что это не должно исключать использование систем WDRC для людей с глубокой потерей слуха. К примеру, они допускают, что короткое время восстановления, которое они использовали, могло повлиять на огибающую амплитуды. Однако из-за большого разброса параметров актуальных схем WDRC может наблюдаться и разница их влияния на огибающую речи. Сохранение огибающей амплитуды, скорее всего, помогает людям с глубокой потерей слуха понимать речь, делая ее более четкой. Этого можно добиться с помощью увеличенного времени срабатывания и восстановления (Кук и Людвигсен, 2000 год). В качестве альтернативы укороченное время срабатывания и восстановления в сочетании с уменьшенным коэффициентом компрессии может снизить вредное влияние WDRC на амплитудную информацию.

Качество звука компрессионного ограничения

Соуза и ее коллеги также предупреждают, что АЧХ, которые они использовали в своем исследовании, могут отличаться от индивидуально рассчитанных целевых значений и тем самым влиять на обработку звука. Они применили свою формулу настройки к средней потере слуха группы испытуемых, что не дает такого точного согласования с целевыми значениями, которого можно добиться при обычной настройке слухового аппарата. В целом их АЧХ давали слегка завышенное усиление на низких частотах и слегка заниженное – на высоких. Для всех испытуемых они использовали жестко настроенный коэффициент компрессии 3:1 во всех каналах. Этот коэффициент был выше коэффициента, рассчитанного по формуле настройки для клинического применения. Кроме того, один и тот же коэффициент компрессии для всех каналов – довольно необычное явление. Все эти отклонения от клинически определенных значений могли повлиять на результаты распознавания речи и предпочтение качества звука в данных исследованиях.

Слабослышащие люди в данном исследовании высказали явное предпочтение качеству звука компрессионного ограничения по сравнению с пик-клиппированием или разными вариантами WDRC. Улучшенная слышимость высокочастотной информации при использовании WDRC может отрицательно повлиять на качество звука для некоторых владельцев слуховых аппаратов, особенно для тех, которые не привыкли к выделению высоких частот. Слухопротезисты хорошо знают, что когда люди начинают носить новые слуховые аппараты с улучшенным высокочастотным усилением, то в самом начале они характеризуют тембр звука как жестяной или металлический. Могут пройти дни и даже недели, прежде чем они привыкнут к новой полосе пропускания и начнут положительно воспринимать повышенную слышимость высоких частот.
 
Точно так же многие опытные владельцы слуховых аппаратов негативно реагируют на WDRC, так как она звучит мягче, чем линейное усиление, к которому они привыкли. Участников данного исследования специально просили не использовать громкость для оценки качества звука, однако относительное снижение громкости при работе WDRC могло повлиять на их предпочтения. Опытные пользователи мощных аппаратов поначалу могут воспринимать уменьшение громкости как ухудшение передачи, пусть даже оно и сопровождается улучшением способности к распознаванию речи.

Хотя эти результаты дают богатый материал для выводов, они основаны на нетипичных параметрах компрессии. Поэтому нужно с осторожностью применять их в процессе клинического протезирования. Например, можно по-другому проводить оценку качества звука в повседневной жизни, и лучше всего делать это после ношения слуховых аппаратов в течение определенного времени. Известно, что владельцу требуется некоторая акклиматизация к новым слуховым аппаратам, причем ее длительность зависит от степени потери слуха и от вида предыдущих аппаратов (Кидсер, 2009 год). Поэтому мы имеем право предположить, что схема с WDRC, которая предлагает повышенную слышимость высоких частот, через какое-то время последовательного ношения будет звучать более естественно и четко, хотя поначалу она воспринимается, как слишком тихая, или «с металлическим звуком».

Требуются дальнейшие исследования

Соуза и ее коллеги предоставили слухопротезистам важные знания о том, как нужно настраивать слуховые аппараты для людей с глубокой потерей слуха, граничащей с глухотой. Они настаивают на необходимости дальнейших исследований с целью изучения особых параметров WDRC и их влияния на распознавание речи и предпочтения людей с глубокой потерей слуха. Особый интерес представляет то, как действуют параметры WDRC с течением времени в слуховых ситуациях повседневной жизни, за пределами лаборатории. Подобные работы показывают, как объективные и субъективные измерения раскрывают прямые аспекты слуховых ощущений пациента и дают информацию, которая помогает слухопротезистам находить наилучшую отправную точку для протезирования этих людей.

Д-р Памела Соуза – доцент факультета коммуникации Северо-
Западного университета (Эванстон, штат Иллинойс, США).
Д-р Лорен Дженстад – доцент кафедры аудиологии и речи
 медицинского факультета Университета Британской Колумбии (Ванкувер, Канада).
Ричард Фолино – аудиолог медицинского центра Департамента
 по делам ветеранов (Сиэтл, штат Вашингтон, США).


Журнал «Hоrakustik», № 1, 2013 год

Статьи для специалистов