Искусственный интеллект в акустике слуха
Искусственный интеллект давно и широко применяется в повседневной жизни. В качестве наиболее известных примеров можно привести поисковые задачи в сети Интернет, автоматически сгенерированные рекомендации о покупке того или иного продукта или голосового помощника в мобильном телефоне. Недавнее появление ChatGPT еще раз убедительно показало, насколько обширные возможности скрывает в себе искусственный интеллект.

Тексты, «написанные» компьютером, создание реалистичных фотографий и видео, а также автоматическая обработка баз данных приводят к поразительным результатам. Не нужно быть человеком, обладающим какой-то особенно развитой фантазией, чтобы оценить возможности искусственного интеллекта и того, как он начинает менять нашу повседневную жизнь. В предлагаемой вашему вниманию статье представлена попытка дать обзор доступных на сегодняшний день применений искусственного интеллекта в сурдоакустике, а также заглянуть в будущее. 

Большинство современных разработок в области искусственного интеллекта опираются на искусственные нейронные сети, которые особым образом имитируют биологические нейроны мозга и связи между ними. Чем больше нейронов и связей имеется в мозгу, тем более сложные задачи он может решать. Недавно ученые в мозгу личинки фруктовой мушки дрозофилы обнаружили 3016 нервных клеток и 548 000 связей между ними. Мозг человека состоит из миллиардов нервных клеток, а связи между ними не поддаются подсчету.

Если говорить об искусственных нейронных сетях, их потенциальная мощность также напрямую зависит от их сложности, при этом крупные нейронные сети требуют для обучения больших массивов данных. Например, на создание суперкомпьютера для обучения нейронной сети OpenAI ChatGPT корпорация Microsoft потратила несколько сотен миллионов долларов. При этом для обработки запроса к этой программе обычный компьютер абсолютно непригоден, ей нужен высокомощный сервер. Если говорить про слуховые аппараты, то в их процессоре используются лишь крохотные доли расчетной мощности и накопителя.

Уже известные применения искусственного интеллекта

Методы машинного обучения в слуховых аппаратах применяются уже давно, например, для автоматической классификации окружающей обстановки. При помощи спектральных или временных характеристик акустического сигнала еще на этапе разработки слухового аппарата инженеры могут оценить способность слухового аппарата оценивать звуковое окружение и необходимым образом менять параметры его настройки. Методы классификации непрерывно совершенствуются, что позволяет распознавать все большее число разных ситуаций и лучше опознавать их смешанные формы.

Особую важность в этом процессе имеет работа над улучшением понимания речи, особенно в шуме. Направленные микрофоны могут помочь в этой ситуации только тогда, когда полезный и шумовой сигнал поступают с разных направлений. Если этого не происходит, используется одноканальное подавление шума. В этом случае применяются методы искусственного интеллекта, которые опираются на искусственные нейронные сети, имеющиеся в слуховом аппарате. Не так давно немецким ученым удалось добиться хотя и небольшого (менее 1 дБ), но статистически значимого улучшения отношения сигнал/шум для понимания речи в шуме при проведении Ольденбургского фразового теста. Это весьма примечательно, потому что одноканальное подавление шума в слуховых аппаратах до сих пор хотя и повышало слуховой комфорт, но не улучшало понимание речи в шуме. Если же расчетной мощности слухового аппарата не хватает для подавления шума на основе искусственного интеллекта, то в качестве дополнительного «вычислителя» можно использовать смартфон, подключенный по беспроводной связи.

Еще один вариант применения искусственного интеллекта в слуховых аппаратах — поддержка точной настройки, ориентированной на пользователя. Приведем пример ситуации. Настройка параметров слухового аппарата рассматривается как невозможная. При помощи приложения для смартфона сравниваются разные программы настройки (какая в данном случае звучит лучше, А или В?). Это позволяет с применением статистического метода обучения подобрать параметры потенциально возможной настройки слуховых аппаратов, чтобы позже выполнить оптимальную настройку.

Применение искусственного интеллекта в слуховых аппаратах возможно и для целей, непосредственно не связанных со слухом. Например, сегодня в слуховые аппараты встраиваются сенсоры ускорения, при помощи которых можно определять скорость движения. С одной стороны, они дают владельцу слуховых аппаратов отчет о физической активности, которую он совершает в течение дня (что сравнимо с фитнес-трекером, который носится на запястье и подсчитывает число шагов), с другой стороны, они определяют случаи падения владельца устройства и автоматически сообщают о происшествии родственникам.

Что нам готовит будущее?

Считается, что пока действует закон Мура, согласно которому сложность компьютерных чипов удваивается каждые два года, будут возрастать расчетная мощность и память процессоров слуховых аппаратов. Это позволит применять более сложные виды искусственного интеллекта. Особый потенциал при этом заключается в появлении более мощных системах подавления шума, которые обеспечивают основополагающую потребность большинства владельцев слуховых аппаратов в лучшем понимании речи в сложных акустических ситуациях.

При помощи расчетной мощности стандартного ноутбука уже сегодня можно так обрабатывать зашумленную речь в реальном времени, что фоновые шумы будут существенно снижены. При проведении Ольденбургского фразового теста на фоне разных шумов (шум с речевым спектром, шум ресторана, шум уличного движения) слабослышащим испытуемым в среднем удалось добиться улучшения отношения сигнал/шум примерно на 4 дБ. Это очень большой показатель: согласно функции дискриминации Ольденбургского фразового теста для нормально слышащих людей это соответствует улучшению понимания речи с 50% до 94%. При этом слабослышащие испытуемые имели двустороннюю сенсоневральную потерю слуха величиной не менее 30 дБ. Таким образом, понимание речи у группы испытуемых с нарушенным слухом, которым предъявлялись обработанные тестовые списки, существенно не отличалось от понимания речи у контрольной нормально слышащей группы, которой предъявлялись необработанные тестовые списки. Это дает возможность утверждать: при помощи искусственного интеллекта слабослышащие испытуемые понимали речь в шуме так же хорошо, как и нормально слышащие люди. Хотя ученым, проводившим исследование, нужно решить еще несколько технических трудностей, прежде чем эти методы можно будет применять в слуховых аппаратах, в долгосрочной перспективе это уже не кажется чистой утопией.

Точная настройка слуховых аппаратов — еще одна область для применения искусственного интеллекта. При первой настройке данные индивидуальной аудиометрии и другая информация используются для настройки параметров усиления и компрессии. Взаимосвязи между ними настолько сложны, что при помощи немашинных методов добиться удовлетворительной предварительной настройки невозможно.

Еще при разработке формулы настройки NAL-NL2 Национальная Акустическая Лаборатория Австралии использовала возможности нейронных сетей, чтобы, с одной стороны, показать взаимосвязь между данными аудиометрии и входным уровнем сигнала, а с другой — связь с оптимальной настройкой усиления. Это было в 2011 году, и с тех пор сделано много нового. В частности, при помощи функции регистрации данных удалось определять текущие данные об акустических ситуациях, индивидуальных изменениях настройки в них, а также длительность ношения, что позволяло получать достоверные данные об удовлетворенности клиентов настройкой слуховых аппаратов. Сегодня крупные производители слуховых аппаратов активно участвуют в работе специализированных центров протезирования, где настраивают их сурдотехнику. При этом они собирают множество данных о настройке и особенностях ношения аппаратов, которые искусственный интеллект затем может использовать при определении оптимальных параметров точной настройки.

Не все то золото, что блестит

Несмотря на все преимущества использования искусственного интеллекта, которые мы видим, следует помнить: нейронная сеть по-прежнему представляет собой «черный ящик», мы пока еще не в состоянии понять, какими критериями она руководствуется при принятии решений. Именно поэтому слепо доверять искусственному интеллекту не стоит. Например, ChatGPT ответил на вопрос о том, как лучше всего тренировать стременную мышцу, следующим образом: «Существуют разные методы для тренировки стременной мышцы. Этому может помочь слух на высоких частотах, который активирует стременную мышцу. Его можно добиться благодаря слушанию музыки или высокочастотных звуков». Вы согласны с рекомендацией? Я — нет. В данном случае все работает совсем по-другому.


Автор статьи: Юрген Тхож, физик, профессор акустики слуха в Техническом университете прикладных наук Любека и директор Института акустики при этом университете.

Фото с сайта freepik

Это интересно:

Статьи для специалистов