Как новый ИИ-стартап помогает врачам оставаться в курсе последних научных достижений
В настоящее время обучение больших языковых моделей застопорилось, что является серьезным ограничением. Если задать вопрос популярному чат-боту ChatGPT от OpenAI, эффективны ли доступные вакцины против наиболее распространенного штамма COVID-19, он ответит следующее: «Будучи нейросетевой языковой моделью, я не имею доступа к данным или информации в режиме реального времени после моего последнего обновления в сентябре 2021 года».
С 2021 года многое изменилось: появились другие штаммы коронавируса, новые вакцины и препараты, были проведены десятки тысяч новых научных исследований. Чат-ботам необходим доступ ко всей актуальной информации, чтобы их можно было использовать в медицинской сфере. Дэниел Надлер, вооружившись капиталом в $32 млн, почти дюжиной сотрудников с докторской степенью (а также кандидатами на ее получение) и суперкомпьютером, расположенном в пустыне Невада, начал работу над решением проблемы ограниченных знаний ИИ с помощью своего нового стартапа OpenEvidence.
Для постоянной переподготовки моделей машинного обучения требуется огромное количество вычислительной мощности, стоимость которой достаточно высока. Однако существует и другой вариант. Как объясняет 40-летний основатель OpenEvidence Надлер, альтернативный способ представляет собой техническую и инженерную задачу «подключения этих языковых моделей к потоку клинических документов, поступающих в режиме реального времени». Фактически ИИ получает доступ к новому массиву данных непосредственно перед тем, как ответить на вопрос — этот процесс специалисты называют «генерацией с расширенным поиском». Если задать чат-боту OpenEvidence вопрос о вакцинах и новом штамме COVID-19, он ответит, что «конкретные исследования по этому запросу ограничены», и отобразит информацию из научных работ, опубликованных в феврале и мае 2023 года, вместе со ссылками на источники. По словам Надлера, главное отличие заключается в том, что его языковая модель «может отвечать, как бы подглядывая в учебник, а не игнорируя его».
Это уже не первый стартап Надлера, связанный с искусственным интеллектом. В 2018 году он продал свою предыдущую фирму Kensho Technologies компании S&P Global за $550 млн, дополнительно получив $150 млн в виде акций. Kensho — это инструмент на основе ИИ для трейдеров с Уолл-стрит, который анализирует миллионы точек рыночных данных, помогая выявлять арбитражные возможности.
Во время пандемии, когда количество научных исследований о коронавирусе за несколько месяцев выросло с нуля до десятков тысяч, Надлер заметил, что медицинские работники столкнулись с той же проблемой, что и трейдеры — трудностью поиска достоверных данных в информационном шуме. Вскоре он понял, что эта проблема касается не только COVID-19, но и всей медицинской сферы в целом, поскольку в мире каждую минуту публикуется около двух научных работ. «Фундаментальная структура проблемы была идентичной, — объясняет Надлер. — Информационная перегрузка, необходимость сортировать доступную информацию и использование компьютеров для этой цели».
По данным PitchBook, за последнее десятилетие венчурные инвесторы вложили более $46 млрд в американские стартапы в области ИИ и машинного обучения, ориентированные на здравоохранение. Пик инвестиций пришелся на 2021 год — $13,4 млрд, однако в 2022 году цифра упала до $10,3 млрд. В этом году стартапы привлекли $3 млрд в рамках 205 сделок.
OpenEvidence была основана в ноябре 2021 года. Вложив собственные $5 млн, Надлер сообщил, что в июле 2022 года закрыл раунд финансирования серии B на сумму $27 млн от внешних инвесторов, оценив стартап в $425 млн. Он открыл раунд для бывших инвесторов Kensho, включая миллиардера Джима Брейера, соучредителя Vista Equity Partners Брайана Шета, инвестиционного банкира Кена Моэлиса и др. В марте OpenEvidence была отобрана для участия в бизнес-акселераторе Mayo Clinic Platform. По словам Надлера, с тех пор более 10 000 клиницистов получили ранний доступ к чат-боту, что и побудило его подробнее рассказать о своем проекте.
Как объясняет Надлер, OpenEvidence пытается соперничать с крупной базой данных UpToDate от нидерландской компании Wolters Kluwer, которой пользуются 2 млн медицинских работников по всему миру. Доход от клинических решений подразделения Wolters Kluwer по здравоохранению, в которое входит UpToDate, в прошлом году составил более $900 млн. По словам представителя Wolters Kluwer Health Сюзанн Моран, UpToDate имеет более чем 7000 специалистов, которые пишут и редактируют статьи на медицинские темы. «Темы в UpToDate пересматриваются по мере публикации новой важной информации», — говорится в заявлении Моран. Редакторы просматривают более 420 рецензируемых научных журналов.
По мнению Надлера, преимущество ИИ перед отредактированными человеком записями в том, что чат-бот OpenEvidence является интерактивным инструментом, а не статичной страницей с информацией — пользователи могут адаптировать свои вопросы к конкретным случаям пациентов и задавать уточняющие вопросы, а не читать огромные куски текста. Кроме того, он может сканировать десятки тысяч журналов по сравнению с теми сотнями, которые просматривают редакторы. Пул документов, из которого OpenEvidence извлекает информацию, включает более 35 млн журнальных статей. По словам Надлера, он несколько раз в день просматривает сайт Национальной библиотеки медицины США, включающий более 31 000 рецензируемых научных журналов. Время обработки новых журнальных статей и их попадания в поисковый пул составляет около 24 часов.
Однако все эти данные создают одно потенциальное препятствие для достижения целей Надлера — не все журналы имеют одинаковое качество публикуемых в них статей. В научном сообществе существует система ранжирования, известная как импакт-фактор, согласно которой журналы с большим количеством цитирований имеют более высокую относительную значимость по сравнению с журналами с меньшим количеством цитирований. Модели OpenEvidence учитывают это при извлечении информации из пула новых журнальных статей. «Вы получите ответ, избранный на основе фактических данных», — объясняет Надлер, подразумевая, что «качество источника» всегда учитывается.
Все большие языковые модели имеют разное поведение, но их общая идея заключается в том, что они составляют ответы, предсказывая следующее наиболее вероятное слово в предложении. По мнению научного сотрудника Института языковых технологий Университета Карнеги-Меллона Ури Алона, когда модели выдают ошибочный ответ, это означает, что «многие различные заключения равновероятны».
Если взять модель, обученную на информации в интернете, и задать вопрос об известном человеке, то она, скорее всего, выдаст правильную биографическую справку. Однако если спросить у такой модели об обычном человеке, о котором у нее нет обучающих данных, она выдаст вымышленную информацию, известную как «галлюцинация». У модели будет гораздо выше шанс выдать правильный ответ, если предоставить ей доступ к пулу информации, включающему биографические данные этого человека. «Некоторые подходы позволяют не только сгенерировать ответ, согласующийся с полученными документами, — рассказывает Алон, — но и определить точное предложение или абзац, в котором об этом говорится».
Именно такого подхода придерживается OpenEvidence, предоставляя ссылки на журнальные статьи, из которых их искусственный интеллект черпает информацию. Однако Алон предупреждает, что такой способ не является 100%-ной гарантией от «галлюцинаций», хотя системы с расширенным поиском и могут помочь уменьшить их количество. Данные модели всегда будут ошибаться, так же, как и обычные люди. «Если предоставить человеку кучу документов или отрывков текста, позволить ему прочитать их, а затем попросить не только ответить на вопросы, но и объяснить, на основании каких данных он сформулировал ответ, то в такой ситуации даже человек может совершить ошибку», — подытожил он.
В настоящее время OpenEvidence могут бесплатно пользоваться лицензированные медицинские работники. Отчасти фокус на этой группе пользователей объясняется тем фактом, что выполнение поисковых запросов обходится дороже и требует больших вычислительных мощностей. Профессор пластической хирургии клиники Мейо (Mayo Clinic) Антонио Форте, входящий в состав медицинского консультативного совета OpenEvidence, признался, что регулярно использует UpToDate. По словам Форте, самым большим отличием использования OpenEvidence за последние несколько недель стала экономия времени. Вместо того чтобы читать объемный текст в поисках ответа, он может получить нужную информацию «не за 10 минут, а за 30 секунд».
В компании надеются, что и у других медицинских работников будет положительная реакция на их продукт. По словам Надлера, он еще не определился с моделью получения дохода. Выбор стоит между реализацией системы подписки и рекламой, однако сам он склоняется к гибридному типу, сочетающему оба варианта. Но одно можно сказать точно — OpenEvidence не станет чат-ботом для среднестатистического пациента. «Проблема заключается не в техническом аспекте. Это нормативная и этическая проблема», — говорит Надлер. Именно поэтому он хочет создать инструмент, который поможет врачам и медсестрам, но при этом позволит им по-прежнему полагаться на свое человеческое суждение: «Вероятность нанесения вреда пациенту в результате применения этой технологии строго ограничена, поскольку в процессе ее использования всегда участвует специалист».
Перевод Ксении Лычагиной