Сложные коммуникационные ситуации. Речевое восприятие и когнитивные функции
В предлагаемой статье приводится ряд примеров из литературы, которые доказывают наличие разнообразных форм взаимодействия между восприятием и когнитивными функциями. Оказывается, что важную роль в понимании речи в сложных ситуациях может играть не только рабочая память, но и другие когнитивные механизмы, такие как внимательность или исполнительные функции. Результаты исследований свидетельствуют о том, что это может иметь серьезные последствия как для слуховой диагностики, так и для реабилитационных мероприятий, например, протезирования слуховыми аппаратами и кохлеарными имплантами.
Понимание речи – сложный процесс, в который вовлечены механизмы периферийного слуха, центральный слух, а также когнитивные факторы. У людей, в первую очередь пожилых, часто возникают особые проблемы в ситуациях, требующих одновременной концентрации на словах нескольких собеседников. Львиная доля сложностей при коммуникации объясняется за счет потери слуха, которую можно уменьшить путем адекватного протезирования специальными техническими средствами. Но даже при наилучшей коррекции потери слуха показатели разборчивости речи в сложных акустических условиях не всегда поддаются рациональному объяснению. В связи с этим в последнее время ученые усиленно пытаются изучать влияние когнитивной деятельности на понимание речи, при этом основное внимание они уделяют вербальной рабочей памяти. Однако до сих пор так и не удалось создать общеупотребительную модель распознавания речевых символов и их усвоение с когнитивной составляющей.

Нарушения слуха представляют собой частую проблему, особенно у пожилых людей (Теш-Ромер, 2006 год; Лин, 2011 год; Рот, 2011 год). Они могут приводить к возрастающему ограничению коммуникационной способности (Пихора-Фуллер и Соуза, 2003 год; Йоркстон, 2010 год) и иметь далеко идущие последствия, такие, как прогрессирующий отказ от типичных ситуаций общения, социальная изоляция и т.д., вплоть до депрессивных расстройств (Рихтберг, 2006 год; Гопинат, 2009 год).

Патологические проявления потери слуха могут наблюдаться на всех участках слухового пути, от периферического слухового органа до слуховой коры (Фризина, 2009 год). В простейшем случае их можно обнаружить путем  тональной аудиометрии по приподнятому порогу слышимости. Этот индивидуальный «компонент ослабления слуха» действительно объясняет большую часть расхождения показателей разборчивости речи, однако понимание устной речи в сложных ситуациях слушания обычно показывает более сильные ограничения, чем можно было бы предсказать на основе тональной аудиометрии (например, Хьюмс, 2006 год). Ученые предполагают, что здесь играют роль дополнительные ограничения частотной избирательности на периферийном уровне или временной обработки на центральном уровне, включая бинауральные нарушения обработки звука (например, Гордон-Салант, 2005 год). Так как понимание речи является в высшей степени сложным процессом, в котором задействованы не только чисто слуховые, но и кортикальные механизмы, вполне вероятно, что важную роль в нем играют и когнитивные процессы. Известно, что способность принимать, усваивать и сохранять в памяти новую информацию с возрастом обычно ослабевает (например, Букнер, 2004 год), поэтому ее влияние на слуховую и коммуникационную деятельность представляет особый интерес, в том числе и с точки зрения стратегий вмешательства (например, Кислинг, 2003 год).

В качестве факторов в первую очередь имеет смысл назвать общую внимательность, память, а также другие когнитивные функции, ассоциирующиеся с речью, при этом в понимании речи участвуют как восходящие, так и нисходящие процессы (Рис. 1).

Рисунок 1

Пока мы не имеем достоверной картины того, в какой степени общее возрастное когнитивное ухудшение и слуховые ограничения влияют на ресурсы, необходимые для понимания устной речи. В 2011 г. Зеквельд изложил четыре основные гипотезы о тот, как и в каких ситуациях могут быть связаны способность оперативно усваивать новую информацию и приложенные слуховые усилия при понимании речи. Так, в гипотезе «когнитивной действенности» это взаимодействие проявляется во всех коммуникационных ситуациях и связано с уменьшенными слуховыми усилиями, а в гипотезе «усилий» – наоборот, с повышенными. Гипотезы «легкого понимания речи» и «ресурсов» приводят к аналогичным модельным представлениям, однако, в отличие от вышеперечисленных предположений, лишь в трудных ситуациях слушания. Отчасти диаметрально противоположные гипотезы о том, что, с одной стороны, повышенные когнитивные возможности способствуют более легкому процессу слушания, а, с другой стороны, именно использование этих ресурсов приводит к повышенным слуховым усилиям, показывают, что в настоящее время детальное понимание этого механизма отсутствует.

Схематическая модель речевого восприятия
Очень упрощенную и схематическую модель показывает структура, изображенная на Рис. 2. Речь идет о входных сигналах, в которых, например, могут присутствовать голоса разных людей (эффект вечеринки). В идеальном случае этот сигнал не искажен, однако в реальности в нем могут существовать нарушения, вызванные посторонними шумами или потерей слуха.

Рисунок 2

Опираясь на механизмы акустического анализа сцены (Брегман, 1990 год), слуховая система образует объекты, объединенные в слуховые потоки. Важнейшими акустическими характеристиками при этом являются основная частота голоса, тембр, интенсивность и модуляция. Согласно результатам новейших исследований (например, Шин-Канингхэм, 2008 год), формирование слуховых объектов преимущественно протекает автоматически, и тем самым подвергается меньшему действию нисходящих процессов до тех пор, пока входной сигнал не искажен. Образовавшиеся слуховые потоки в свою очередь подвергаются действию нисходящих процессов, а именно избирательной (или раздельной) внимательности, что в модели схематично представлено как процесс развертки. Результат этого процесса записывается в рабочую память, которая, согласно современным представлениям (например, Ренберг, 2003 год), играет центральную роль в понимании речи как своеобразный аккумулятор. После этого содержание рабочей памяти непрерывно сравнивается с умственным словарем, сохраняющимся в долговременной памяти. При совпадении распознается элемент на уровне слова. Благодаря семантическим/лексическим закономерностям и знанию жизни на основе этого можно раскодировать смысл устной речи.

Поражает, с какой скоростью протекают эти процессы, а также то, что понимание речи может протекать без малейших усилий. Но это происходит лишь до тех пор, пока входной сигнал не искажен или не нарушен большим числом конкурирующих голосов, посторонних шумов, потерей слуха или артефактами в процессе обработки сигнала в слуховом аппарате. Для того чтобы можно было осуществить важное сравнение между внешним фонетическим представлением и элементами долговременной памяти, необходима повышенная внимательность, позволяющая провести «развертку» в слуховые объекты и потоки. Возможные ошибочные элементы рабочей памяти должны быть исправлены или дополнены, что с учетом когнитивной нагрузки приводит к повышенным слуховым усилиям. К этому следует добавить, что коммуникационные ресурсы можно использовать не безгранично, и что с возрастом они снижаются. Это является свидетельством влияния когнитивной деятельности на понимание речи.

Когнитивные величины и результаты речевой аудиометрии

Ряд исследователей пытался обнаружить взаимосвязь между результатами тестов на понимание речи и когнитивными параметрами. Для оценки разборчивости речи в основном применялись стационарные или модулированные шумовые сигналы, речевые маскеры использовались реже. Для оценки когнитивной деятельности в наше время используются разные аспекты общего интеллекта из области рабочей памяти и скорости обработки информации, вплоть до фонологических/лексических способностей, при этом основное предпочтение отдается рабочей памяти (обзор Экройда, 2008 год).

Наши собственные исследования (Майстер, 2001 год, А) посвящены взаимосвязи между различными тестами проверки когнитивных способностей и результатами разборчивости речи в сложных слуховых ситуациях. Здесь в качестве маскеров использовались как немодулированные (например, olnoise) и модулированные шумовые сигналы (например, ICRA 5_250, Дрешлер, 2001 год), так и непонятные (ISTS, Холубе, 2009 год) и понятные (Ольденбургский и Геттингенский фразовый тест) речевые маскеры. Это позволяло учитывать эффекты как энергетической, так и информационной маскировки. Одновременно с этим учитывалась избирательная внимательность (слушать одного собеседника из двух) и раздельная внимательность (понимать двух собеседников одновременно). В качестве теста на объем вербальной рабочей памяти использовался Вербальный тест проверки внимания и способностей к обучению (VLMT, Хельмштедтер, 1990 год). Испытуемому предлагалось запомнить слова из предъявленного списка, насчитывающего 15 единиц. В процессе пятикратного повторения тестового перечня и последующего опроса строится кривая обучения и рассчитывается суммарный показатель для описания рабочей памяти.

Так как потеря слуха обычно оказывает ключевое влияние на результаты речевой аудиометрии и тем самым маскирует возможные воздействия когнитивных функций, в исследованиях приняли участие люди с нормальным периферическим слухом, при этом их способности к получению и усвоению больших объемов информации имели отличия. На основании этого была выбрана группа испытуемых с возрастным разбросом от 58 до 79 лет.

Рисунок 3

Была обнаружена взаимосвязь между некоторыми результатами речевой аудиометрии и суммарной оценкой теста VLMT. На Рис. 3 полученные результаты представлены в виде диаграммы рассеяния и даны усредненные результаты речевой аудиометрии для измерений с разными шумовыми маскерами. Судя по записанной прямой регрессии, люди с суммарной оценкой 40 (ниже среднего) запоминали слова при пороге разборчивости речи (SRT) примерно в 11 дБ, в то время как люди со средней оценкой 60 слов имели порог разборчивости речи приблизительно в 13 дБ. Таким образом, опираясь на показатели рабочей памяти, была обнаружена клинически значимая разница величиной 2 дБ. При исследовании раздельной внимательности с речевой маскировкой взаимосвязь с результатами теста VLMT, напротив, оказалась значительно меньше. А для ситуаций, в которых нужно одновременно усваивать информацию от двух собеседников, нейропсихологические параметры в области внимательности и исполнительных функций (рассеивание внимательности, координация информации) показали выраженную взаимосвязь с результатами речевой аудиометрии (Майстер, 2011 год, Б). Это значит, что, в зависимости от сложности ситуации общения, здесь могут проявляться разные когнитивные механизмы.

Наличие взаимосвязи между рабочей памятью и показателями понимания речи в шуме удалось доказать и для людей, протезированных слуховыми аппаратами. В 2003 году Ланнер изучал усвоение устной речи в шуме через слуховые аппараты. Для этого он провел два когнитивных теста, которые проверяли рабочую память (тест пробела при чтении) и скорость обработки устной речи (рифмованный тест оценки). Результаты теста проверки рабочей памяти в первую очередь показали зависимость (r = 0,6) от итогов теста на понимание речи. И в этом исследовании людям с плохой рабочей памятью (менее 30% правильных ответов) потребовалось для аналогичного понимания речи в среднем на 2 дБ лучшее отношение сигнал/шум (50%-ная дискриминация), чем людям с хорошей рабочей памятью (более 60% правильных ответов).

В 2008 году Раднер, член той же рабочей группы, сообщил об экспериментах, в которых тесты на разборчивость речи в условиях стационарного и модулированного шума проводились при разных параметрах настройки слухового аппарата (быстрая и медленная компрессия). При этом испытуемым было предложены два теста, один из которых проверял рабочую память (тест пробела при чтении), а второй – рабочую память и лексические способности (мониторинг письма). Гипотеза, лежащая в основе эксперимента, предполагала, что в зависимости от индивидуального опыта использования параметров компрессии (быстрая или медленная), к хорошему сравнению входных сенсорных сигналов и вербальной долговременной памяти приводит либо быстрая, либо медленная компрессия. А при затрудненном сравнении результаты сильнее связаны с когнитивными способностями. И действительно, такой результат можно получить при использовании чистого теста на рабочую память (тест пробела при чтении). На основании этого автор пришел к выводу, что непривычная обработка сигнала приводит к ошибочному сравнению внешнего и внутреннего фонетического представления, и что в данном случае показатели разборчивости речи зависят от когнитивных функций, особенно рабочей памяти.

В целом, специализированная литература доказывает, что когнитивные функции имеют основополагающее значение для понимания речи, а рабочая память играет в этом случае особую роль. Если в сложных акустических ситуациях когнитивную систему нагружает понимание речи, то, исходя из противного, мероприятия по улучшению входных сигналов приведут к высвобождению   способностей человека перерабатывать новую информацию для решения других задач. Этот подход находит свое отражение в так называемых двухзадачных методах. При этом задача на понимание объединена, к примеру, с задачей на память, а эффект манипуляций с сигналом определяется в обеих областях. Классический эксперимент, который в 1995 году провел Пихора-Фуллер, был в 2009 году воспроизведен Сарампалисом для оценки действия алгоритма подавления шума. При этом для исследований в шуме применялся фразовый тест SPIN (идентификация речи в шуме), широко распространенный в англо-американском пространстве, в котором испытуемые должны были правильно распознавать последнее слово произносимых фраз. Сарампалис использовал его следующим образом: после нескольких предъявлений он просил участников эксперимента вспомнить предыдущие слова. Для обеих задач, понимания и запоминания, была найдена зависимость от отношения сигнал/шум. Использование подавления шума в слуховых аппаратах никак не повлияло на количество правильно понятых слов. Это совпадает с результатами других исследований, которые не обнаружили наличия какого-либо воздействия алгоритма подавления шума, выявляемого по показателям речевой аудиометрии. При этом функция шумоподавления в слуховых аппаратах оказала значительное положительное влияние на количество запомненных слов, что указывает на снижение нагрузки на когнитивную систему за счет снижения слуховых усилий. Таким образом, двухзадачные методы могут стать интересной дополнительной диагностической возможностью. К сожалению, Сарампалис не смог доказать наличие стойкого эффекта для большого диапазона отношений сигнал/шум. В 2012 году Шрайтмюллер описал аналогичную парадигму, основанную на Ольденбургском фразовом тесте, и показал, что результаты двухзадачных методов могут зависеть от ряда факторов (например, смена стратегии), которые нужно учитывать при подобных измерениях.

Будущие перспективы
Рассмотренные работы показывают, что вовлечение когнитивных функций в аудиологическую диагностику и реабилитацию является целесообразным, и не последнюю очередь в этом играют происходящие в обществе демографические перемены. Пока еще невозможно подробно объяснить, в какой степени когнитивные способности влияют, например, на результаты речевой аудиометрии. В литературе описывается как минимум вторичный эффект, когда речь идет о слышимости речевых компонентов. Однако неясно, насколько сильно когнитивные способности влияют на разные методы речевой аудиометрии, и наоборот, можно ли по результатам диагностики качества распознавания речи сделать выводы о когнитивной деятельности. В данный момент эти аспекты изучаются в ходе исследовательского проекта SAKOLA (речевая аудиометрия и когнитивная деятельность в пожилом возрасте), который проводится в Кельнском университете (ФРГ).

Помимо этого, когнитивные способности могут быть связаны с разными аспектами протезирования слуховыми аппаратами и кохлеарными имплантами. В данном случае имеет смысл ориентировать настройку слуховых аппаратов и обработку сигнала на когнитивные факторы. Здесь свою лепту попытается внести исследовательский проект «Моделирование слуховых аппаратов» (Хюбер и Кольмайер, 2012 год). И, наконец, когнитивные функции необходимо учитывать в процессе слуховой реабилитации, чтобы улучшать взаимосвязь восходящих и нисходящих процессов.
Хартмут Майстер
Журнал «Horakustik» № 7 за 2012 год

Хартмут Майстер изучал технику средств связи в университете Зигена и медицинскую технику в университете Вупперталя. С 1992 по 2002 годы он работал научным сотрудником в отоларингологической клинике Кельнского университета. Когда в 2002 году при университете был основан Институт клинических исследований имени Жана Урмахера, он возглавил в нем группу аудиологических исследований. В 2004 году он получил докторскую степень в области медицинской акустики и аудиологии, а в 2011 году стал профессором Кельнского университета.


Статьи для специалистов