В классическом тесте Тьюринга происходит беседа между искусственным интеллектом и человеком. Если человек приходит к выводу, что в ответах собеседника что-то не так — возможно, он разговаривает с бездушной машиной, — считается, что искусственный интеллект завалил экзамен. Пока компьютер способен пройти тест Тьюринга только в самом примитивном виде. Однако машины, оказывается, умеют кое-что другое: они и сами могут проанализировать речь человека и понять, что с этим человеком не все так просто. Например, что он страдает психическим расстройством.
На конференции Interspeech 2018, проходящей в эти дни в Индии, представлена работа ИТ-специалистов из Массачусетса. Их программа анализирует человеческую речь — например, аудиоинтервью или письменные ответы на вопросы — и с высокой точностью предсказывает, страдает ли собеседник депрессией.
По данным специалистов, симптомы большого депрессивного расстройства (БДР) хотя бы раз в жизни испытывал каждый шестой житель планеты. Большинство таких состояний остается недиагностированным, однако в развитых странах это одна из самых частых причин обращения пациентов за профессиональной психиатрической помощью. Кроме БДР, специалисты нередко говорят о депрессии как симптоме других психических состояний. Суммарный экономический ущерб от депрессии приближается к ста миллиардам долларов в год.
Для первичной диагностики депрессии и БДР психиатр задает пациенту целый ряд вопросов о его образе жизни, настроении, привычках. На основании ответов делаются выводы о наличии симптомов расстройства. Компьютер уже давно пришел на помощь врачам-психиатрам: разработаны компьютерные тесты, где пациент должен ответить на определенный набор вопросов, а алгоритм оценивает вероятность наличия заболевания. Однако эти тесты используют фиксированный набор вопросов, что сужает область их применимости.
Алгоритм, предложенный специалистами из Кембриджа, устроен по-другому. Он способен анализировать любой вид человеческой речи и не привязан к определенным вопросам и даже темам разговора. Такая программа может, к примеру, стать основой приложения для смартфона, которое будет анализировать характеристики речи владельца и своевременно предупреждать его о необходимости визита к специалисту. Свой подход авторы назвали «бесконтекстным моделированием».
Самообучающийся алгоритм, построенный по принципам нейронной сети, получил в свое распоряжение большую выборку образцов речи разных людей, среди которых были пациенты с БДР. Компьютер выделил в них характерные признаки заболевания. Например, человек, страдающий депрессией, чаще использует определенные слова-маркеры («грустно» или «хуже»), речь его более монотонна и характеризуется понижающейся интонацией, паузы между словами длиннее, а темп речи замедлен. Все эти признаки и раньше ассоциировались с депрессией, но в данном случае алгоритм сам принимал решение, насколько тот или иной признак показателен и надежен.
Эффективность программы оценивалась по двум параметрам: какая доля страдающих депрессией была выявлена алгоритмом и у какой доли пациентов, которых программа сочла страдающими депрессией, действительно был такой диагноз, поставленный врачом-психиатром. Средние результаты: 71% и 83% соответственно. Подобная точность была совершенно недоступна всем предыдущим алгоритмам. Интересно, что компьютеру оказалось проще анализировать письменную речь: для постановки диагноза было достаточно в среднем семи ответов на произвольные вопросы, тогда как при анализе устной речи требовалось около тридцати произнесенных фраз.
Как это нередко бывает с алгоритмами искусственного интеллекта, исследователям пока неясно, какие именно речевые паттерны преимущественно использует машина для принятия решения. Это им предстоит установить. Другое направление работы — использовать алгоритм для диагностики других психических состояний, например, деменции.