История Миры Мурати, которая работает в OpenAI и участвовала в создании ChatGPT
В ноябре 2022 года компания OpenAI представила свою последнюю разработку — чатбот ChatGPT, который умеет с поразительной правдоподобностью «разговаривать» на естественном языке. За несколько месяцев он смог сдать экзамен на получение степени MBA в Уортонской школе бизнеса при Пенсильванском университете, экзамен на получение медицинской лицензии в США, несколько экзаменов на юридическом факультете Университета Миннесоты (а в России — написать дипломную работу, которую затем удалось защитить в РГГУ). «У вас блестящий ребенок», — иронизирует корреспондент Time. «Мы не ожидали такого сильного волнения от прихода нашего ребенка в этот мир. Скорее испытывали по этому поводу трепет. Мне любопытно посмотреть, в каких областях он начнет приносить людям пользу, а не только поражать новизной», — отвечает технический директор OpenAI Мира Мурати.
От железа к искусственному интеллекту
Мира Мурати родилась в Албании, но в 16 лет уехала в США. Она окончила Инженерную школу Тайера при Дартмутском колледже со степенью бакалавра в области машиностроения. Ее первым местом работы стала французская аэрокосмическая компания Zodiac Aerospace (сейчас входит в Safran Aerosystems), которая производит оборудование для самолетов. А затем в 2013 году Мурати пришла в Tesla — работать над кроссовером Model X.
Этот автомобиль был представлен годом ранее и в 2013-м как раз должен был поступить в продажу. Но поставки начались только в 2015-м. Объясняя двухлетнюю задержку, основатель Tesla Илон Маск отмечал: «Model X — особенно сложный автомобиль. Возможно, это самый сложный автомобиль в мире. Я не уверен, что будет сложнее». Авторы многочисленных обзоров с восторгом описывали двери в форме крыла сокола, способность разгоняться до 100 км/ч за 3,1 секунды, систему очистки воздуха, умную пневмоподвеску и систему Autopilot — набор функций помощи водителю вроде центрирования полосы движения, самостоятельной парковки и полуавтономного вождения.
«Полная автономия на самом деле ограничена программным обеспечением, — говорил Илон Маск позже. — Оборудование для ее обеспечения существует. Так что речь на самом деле идет о разработке продвинутого узкого искусственного интеллекта для работы автомобиля. Я хочу подчеркнуть: узкого — мир он не захватит, но сможет хорошо водить машиной». Чтобы обучать этот ИИ, компания еще в 2014 году начала устанавливать первые версии Autopilot на все свои серийные автомобили. Датчики, входящие в аппаратную часть, собирали данные, благодаря которым совершенствовалось программное обеспечение.
Тогда-то инженер Мурати и «заболела» искусственным интеллектом. В 2016 году она покинула должность старшего менеджера по продукту в Model X и перешла в компанию Leap Motion.
Leap Motion разрабатывала жестовое управление в AR/VR на основе технологии захвата движения и в 2016 году как раз выпустила обновление Orion: используя контроллер, похожий на Kinect для XBox, оно позволяла отобразить в виртуальной реальности руки пользователя, которыми можно было «брать» виртуальные объекты.
«Наши руки — универсальная форма ввода, — объясняла Мурати в интервью Design News. — Мы [ими] строим, играем в шахматы, бросаем мячи, но когда дело доходит до технологий, оказываемся ограничены сенсорным экраном». Сенсорные экраны и вообще любые компьютерные интерфейсы она считала ограниченными — ведь они предусматривали только определенные функции, которые, к тому же, пользователь должен был изучить. Ей же хотелось, чтобы люди взаимодействовали с цифровыми объектами так же, как с физическими, — интуитивно. Виртуальную реальность Мурати называла наиболее человеко-ориентированной платформой.
Через год после ее прихода на должность вице-президента по продукту и разработкам Leap Motion привлекла $50 млн в раунде C. Компания заявила, что собирается расширять присутствие в коммерческих и корпоративных приложениях — в образовании, здравоохранении, промышленном симуляционном обучении, — и объявила об открытии офиса в Шанхае. Технологии захвата движения рук нашлось применение в распознавании жестового языка. Но несмотря на столь амбициозные планы и открывающиеся возможности, Мурати пришла к выводу, что продукт Leap Motion находится на слишком ранней стадии.
До сих пор она занималась узким ИИ — то есть таким, который решает конкретные задачи. Ей же хотелось решать задачи планетарного масштаба. В 2018 году Мурати перешла в компанию OpenAI, которая занимается разработками в области общего ИИ.
Разговоры с ботами
Общий ИИ (или ОИИ) знаком нам по научно-фантастическим книгам и фильмам. Это бортовой компьютер HAL 9000 из «Космической одиссеи 2001 года» (любимый фильм Мурати), дроид R2-D2 из «Звездных войн» или Саманта из фильма «Она». В некоторых из этих произведений показано, каким ОИИ может быть опасным. Неслучайно на сайте OpenAI говорится: «Если ОИИ будет успешно создан, эта технология поможет нам вывести человечество на более высокий уровень за счет приумножения достатка, ускорения мировой экономики и помощи в открытии новых научных знаний, которые изменят пределы возможностей <...> С другой стороны, ОИИ также сопряжен с серьезным риском неправильного использования, серьезных аварий и социальных потрясений». «Сейчас уникальный момент времени, когда у нас есть возможность влиять на то, как [ОИИ] формирует общество. И это работает в обоих направлениях: технология формирует нас, а мы формируем ее, — говорит Мурати в интервью Time. — Есть много сложных проблем, которые нужно решить. Как заставить модель делать то, что вы от нее хотите, и как убедиться, что она соответствует человеческим намерениям и в конечном счете служит человечеству?»
OpenAI была основана в 2015 году как раз для создания безопасного ОИИ президентом венчурного фонда Y Combinator Сэмом Альтманом и Илоном Маском, — впрочем, последний в 2018-м покинул совет директоров из-за возможного конфликта интересов, поскольку собственные разработки в области ИИ были и у Tesla.
Тогда же компания представила первую версию GPT — генеративной языковой модели, способной генерировать связный текст. В 2019-м появилась более продвинутая GPT-2. Опасаясь ее недобросовестного использования (например, для генерирования фальшивых отзывов в интернет-магазинах), OpenAI отказалась выкладывать исходный код. Доступ к GPT-3, представленной в 2020 году, осуществлялся через API.
Мурати объясняет, что таковы принципы безопасности компании: ограниченный доступ к исходному коду снижает риски, при этом непрерывное развертывание разработок позволяет эти риски выявлять. Например, в случае с GPT-3 разработчики больше всего боялись, что злоумышленники будут использовать модель для создания фейков, но оказалось, что ее особенно полюбили спамеры.
Кроме того, непрерывное развертывание необходимо для совершенствования моделей за счет обратной связи от аудитории. «Модель не признáется, что у нее нет экспертизы в какой-то теме или что она не знает ответа», — говорит Мурати. Обратная связь помогает уличать модель, когда она «выдумывает» несуществующие факты (и в целом ведет себе «неестественно»), и делать ее более надежной за счет обучения с подкреплением.
Именно за обучение с подкреплением Мурати отвечала, когда только пришла в OpenAI. В нем у модели нет заранее размеченных данных, которые позволяют понять, какие действия считаются правильными, — зато есть среда, которая в зависимости от действий меняется. Модель подобна младенцу, исследующему мир, пробующему на зуб игрушки и пытающемуся дотянуться до всего, что недостаточно хорошо спрятано, объясняла Мурати в лекции на фестивале Girl Geek X. В случае с GPT подкреплением становится реакция пользователя.
Естественная форма такого обмена действиями и реакциями — диалог. Неслучайно последняя версия GPT — чатбот, который способен не просто генерировать текст, но и связно отвечать на вопросы пользователя. Он мгновенно привлек всеобщее внимание поразительной естественностью своих реплик; к 1 февраля 2023-го число пользователей чатбота достигло 100 млн. Отвечая на вопрос о том, какую пользу может приносить ChatGPT уже сейчас, Мурати предполагает, что бот справится с персонализацией обучения.
Она также руководила развертыванием DALL-E — нейросети, которая генерирует изображение из текстового описания. Это мультимодальная версия GPT-3, то есть работающая с разнородными типами данных (текстом, изображениями и др.). «Одна из целей, которые мы преследовали с DALL-E, заключалась в том, чтобы добиться более четкого представления о мире — чтобы модели понимали мир так же, как и мы», — говорит Мурати.
Но, помимо мультимодальности, нейросети заимствуют у человеческого интеллекта когнитивные искажения. Модель может «прочитать» миллионы текстов и научиться составлять последовательности из слов или «прослушать» миллионы треков и научиться генерировать музыку, но может ли она отличить талантливое произведение от посредственного, а нейтральное изложение фактов — от агрессии и транслирования стереотипов? OpenAI разрабатывает способы тонкой настройки моделей (для чего приходится, например, собирать и размечать образцы токсичных комментариев из интернета). Отдельное направление машинного обучения — создание интерпретируемых моделей, про которые точно понятно, что именно происходит у них «внутри».
Однако в конечном счете необходим доступ к технологиям ИИ для как можно большего числа людей, считает Мурати. Она — сторонница регулирования ИИ, в том числе со стороны государства («для всех очень важно начать в этом участвовать, учитывая то влияние, которое эти технологии будут иметь»).
Правда, сама OpenAI весной 2019 года заключила партнерство с Microsoft, которая стала привилегированным партнером при коммерческом внедрении новых разработок (при этом Microsoft вложила в OpenAI $1 млрд). В 2021-м две компании объявили о создании фонда OpenAI Startup Fund, который планирует инвестировать в общей сложности $100 млн в стартапы, работающие в тех областях, где ИИ может иметь «преобразующий эффект». Наконец, в 2023 году Microsoft анонсировала новые многомиллиардные инвестиции в OpenAI, а The Information и Bloomberg со ссылкой на источники сообщили, что она планирует добавить возможности ChatGPT в свою поисковую систему Bing и в офисные приложения.
Мурати сравнивает разработки в области ИИ с изобретением парового двигателя: он заменил мускульную силу человека, но поначалу приносил выгоду только тем, у кого был капитал и кто мог строить фабрики и заводы. «Я рассматриваю ИИ как платформу, которую можно использовать для создания продуктов, творчества, решения повседневных и рабочих задач. Но для этого она должна быть доступна, она должна быть — пусть это звучит как клише — демократичной», — говорит Мурати.
Этому принципу — масштабировать любую технологию, чтобы превратить ее в платформу и сделать взаимодействие с технологией интуитивно понятным — Мурати следует на любом месте работы, идет ли речь об автомобилях, виртуальной реальности или нейросетях.