Миллионы новых материалов: как роботы опередили ученых на сотни лет
Компания Google DeepMind представила искусственный интеллект, массово изобретающий новые материалы. Едва начав работу, он почти вдевятеро увеличил количество устойчивых неорганических кристаллов, известных человечеству. Большинство из них еще предстоит создать в лаборатории. В этом поможет робот-химик, самостоятельно проводящий эксперименты и анализирующий их результаты.
Игра в конструктор
В эпоху электроники вопрос «как это сделать» все больше сводится к вопросу «из чего это сделать». Быстродействие компьютеров и емкость аккумуляторов, экономичность светодиодных ламп и КПД солнечных батарей — все это определяется свойствами материалов, взаимодействующих с током, светом или магнитным полем. Благодаря современной индустрии в каждом доме можно найти чуть ли не половину таблицы Менделеева. К примеру, в заурядном компьютерном процессоре используются десятки химических элементов, от кремния и меди до золота, бария и стронция.
В природе встречаются менее 100 элементов. Из этого, казалось бы, скромного набора можно создать огромное количество веществ, даже если ограничиться неорганическими кристаллами. Тому есть две причины.
Во-первых, свойства материала зависят не только от состава, но и от структуры. Обыденный графит, драгоценный алмаз и экзотический графен состоят из одних и тех же атомов углерода, по-разному расположенных в пространстве.
Во-вторых, даже небольшой набор элементов образует множество комбинаций. Возьмем, например, 70 самых распространенных химических элементов. Сколько различных пятиатомных молекул можно из них собрать? Эта задача похожа на следующую. В магазине продаются 70 продуктов. Нужно сделать скидку на какие-нибудь пять из них. Сколько различных «скидочных корзин» из пяти продуктов могут предложить маркетологи? Ответ ошеломляет: более 12 млн.
К сожалению, атомы не так послушны химикам, как ассортимент магазина — маркетологам. Если записать химическую формулу из пяти наугад взятых элементов, вовсе не факт, что подобное вещество будет существовать, тем более — сколько-нибудь стабильно. Большинство случайных сочетаний элементов противоречит законам химии, как большинство случайных сочетаний букв — правилам русского языка.
Поэтому поиск новых материалов всегда был делом интуиции, проб и ошибок. Часто ученые отталкивались от известных веществ и пытались их модифицировать, например, заменить один химический элемент на другой.
К концу XX века компьютеры достигли мощности, позволяющей открывать новые материалы на кончике пера. Опираясь на законы физики и химии, ученые могут рассчитать, будет ли устойчивым то или иное сочетание атомов. Однако остается вопрос: какие сочетания проверять в первую очередь? Перебирать миллионы провальных вариантов, порой случайно натыкаясь на что-то полезное — не самая эффективная стратегия.
XXI век подарил исследователям новый принцип: если не знаете, как решить задачу, поручите ее нейросети. Искусственный интеллект может показаться всесильным, но лишь потому, что его успехи выставляются на всеобщее обозрение, а неудачи остаются за кадром. Ученые не раз пытались обучить нейросеть проектировать новые материалы. Однако результаты оставляли желать много лучшего, пока за дело не взялись разработчики из DeepMind.
Сокровища гнома
Исследователи назвали свое детище GNoME. Это слово, означающее «гном» — аббревиатура от словосочетания graph networks for materials exploration («графовая сеть для исследования материалов»).
Графовые нейронные сети принимают входные данные в виде графа, а не текста или набора чисел. Граф — это набор точек, соединенных линиями. Простейший пример графа — карта с точками-городами и линиями-дорогами. Атомы в кристалле, соединенные химическими связями, тоже удобно изображать в виде графа. Это важно, ведь успех нейросети зависит в том числе и от адекватного представления данных.
Для первого раунда обучения GNoME исследователи использовали открытую базу данных Materials Project. Усвоив эти знания, нейросеть генерировала формулы новых веществ. Разработчики обсчитывали их традиционными методами, выясняя, будут ли эти кристаллы химически устойчивыми. Удачные находки добавлялись в обучающие данные на следующем раунде обучения.
Таким путем нейросеть предложила 2,2 млн новых кристаллов, из которых 381 000 были признаны стабильными. Для сравнения: объединив крупнейшие базы данных и заполнив очевидные пробелы в них традиционными методами, авторы обнаружили всего около 48 000 стабильных кристаллов. То есть благодаря GNoME их число разом увеличилось почти в девять раз.
В блоге компании Google DeepMind этот результат назван «эквивалентным знаниям за 800 лет». Разработчики не уточняют, как они пересчитали кристаллы в столетия. Похоже, самым примитивным образом: GNoME открыл в восемь раз больше стабильных формул, чем было накоплено за предыдущие 100 лет.
В числе придуманных нейросетью материалов 52 000 двумерных, таких как графен — ранее их было известно всего около тысячи, и 528 потенциальных электролитов для литий-ионных батарей — в 25 раз больше, чем нашли авторы предыдущих исследований. Структура всех стабильных кристаллов, найденных GNoME, выложена в открытый доступ, так что каждый ученый может самостоятельно поискать в них что-нибудь интересное.
Заведующий лабораторией
Подчеркнем: почти все открытые искусственным интеллектом кристаллы пока существуют только на бумаге или, точнее, в памяти компьютера. Действительно ли они устойчивы, покажет лишь синтез в лаборатории. Часть этой работы уже проделана. Исследователи проинспектировали научные статьи и обнаружили, что 736 предсказанных нейросетью кристаллов уже синтезированы в разных лабораториях по всему миру. В их числе потенциальный сверхпроводник Mo5GeB2 и материал Li4MgGe2S7, по оптическим свойствам подобный алмазу.
Львиная доля экспериментов еще впереди. Эту огромную работу может облегчить и ускорить робот A-Lab, созданный Национальной лабораторией имени Лоуренса в Беркли (США) в сотрудничестве с той же Google DeepMind.
A-Lab означает «автономная лаборатория». Разработчики подчеркивают, что она не просто автоматизированная, но именно автономная. Электронный химик не следует раз и навсегда введенной программе. Он самостоятельно планирует и проводит эксперименты, интерпретирует результаты и исправляет совершенные ошибки.
Искусственный интеллект робота обучен химическому синтезу на огромном массиве научных статей. Получив задание синтезировать новое вещество, он скачивает данные о нем из общедоступных баз, включая недавние результаты GNoME. Основываясь на этих данных и полученных при обучении навыках, электронный экспериментатор придумывает рецепт синтеза. Робот реализует этот рецепт в лаборатории, благо у него есть не только интеллект, но и манипуляторы. Получившееся вещество просвечивается рентгеновскими лучами, и нейросеть решает, похожа ли структура кристалла на требуемую. Если доля целевого продукта составляет менее 50%, предлагается новый рецепт синтеза.
Разработчики дали A-Lab задание создать 58 соединений. Ни одно из них не было описано в научных статьях, по которым нейросеть обучалась химии. Поэтому искусственный интеллект не мог просто вспомнить инструкцию по синтезу, он должен был ее изобрести.
За 17 дней работы электронный химик синтезировал 41 соединение. Другими словами, доля успеха составила 71%. Это маловато для коммерческого продукта, но очень хорошо для исследовательского проекта. Кроме того, некоторые из 17 неудач случились из-за явных и легко исправимых ошибок. Разработчики уже устранили их, слегка скорректировав алгоритмы принятия решений.
Системы, подобные GNoME и A-Lab, открывают новую эпоху в химии и материаловедении. Быстродействие и неутомимость роботов сочетается в них с химической интуицией, уже вполне сопоставимой с человеческой. Возможно, именно благодаря электронным исследователям будут созданы помехоустойчивые кубиты для квантовых компьютеров, сверхпроводящие магниты для летающих поездов, емкие аккумуляторы для электрических самолетов и сверхпрочные тросы для космических лифтов.