Переломный момент: сможет ли ChatGPT обойти Google в гонке за внедрением ИИ
В непримечательном конференц-зале офиса OpenAI президент компании Грег Брокман оценивает «уровень энергии» команды, курирующей новую модель искусственного интеллекта — ChatGPT. «Как у нас обстоят дела по шкале от «работа горит, и все сотрудники перегорели» до «все только что вернулись после праздников, и все прекрасно»? Каков спектр эмоций?» — спрашивает он.
«Я бы сказал, что праздники наступили как раз вовремя», — отвечает один из сотрудников компании. Однако это еще мягко сказано. В течение пяти дней после запуска ChatGPT в ноябре 1 млн пользователей завалил серверы компании пустяковыми вопросами, командами написать стихи и запросами рецептов. По оценкам Forbes, сейчас число запросов превышает 5 млн. OpenAI спокойно перераспределил часть нагрузки на свой суперкомпьютер — тысячи взаимосвязанных графических процессоров, созданных по заказу вместе с Microsoft и Nvidia, в то время как долгосрочная работа над следующими моделями, такими как долгожданный GPT-4, отошла на второй план.
Пока сотрудники находятся на совещании, серверы ChatGPT, работающие на пределе возможностей, по-прежнему отказывают пользователям. Накануне чат-бот не работал в течение двух часов. И все же, несмотря на усталость, эти сотрудники, которым по 20-30 лет, явно наслаждаются участием в этом историческом процессе. «Искусственный интеллект будет самой обсуждаемой темой 2023 года. И знаете что? Так и должно быть, — говорит Билл Гейтс. — Это важный момент, сравнимый с развитием ПК и интернета».
Компания OpenAI (а именно 34-летний Брокман и его начальник, генеральный директор 37-летний Сэм Олтмен) оценивается в $29 млрд после получения инвестиций от Microsoft в размере $10 млрд. Но она не является единственной в своем роде. Amazon поддерживает компанию в области генерации изображений Stability AI (недавняя оценка — $1 млрд), чей дерзкий генеральный директор, 39-летний Эмад Мостак, стремится стать лидером в категории веб-сервисов Amazon. Компания Hugging Face ($2 млрд) поставляет таким гигантам, как Intel и Meta (признана в России экстремистской и запрещена), инструменты для создания и запуска конкурентоспособных моделей. Ниже поставщиков генеративного искусственного интеллекта (ИИ) в этом начинающемся технологическом стеке находятся Scale AI ($7,3 млрд) и другие компании, обеспечивающие инфраструктуру, а над ними развивается экосистема приложений, внедряющих ИИ в специализированное программное обеспечение, которое может кардинально изменить работу юристов, продавцов, врачей и других специалистов.
Шумиха вокруг ИИ все не утихает. Заявленная оценка OpenAI, агрессивно прогнозирующая доход в $200 млн в 2023 году (ожидаемый доход в прошлом году составлял около $30 млн, согласно презентации для инвесторов, которую видел Forbes), подразумевает 145-кратное отношение цены к объему продаж по сравнению с более типичными 10-кратным или 20-кратным. Неважно, что противники ИИ не пытаются полностью подорвать их деятельность — Amazon, Google, Microsoft, Nvidia и другие компании уже получают прибыль, предоставляя облачную инфраструктуру, лежащую в основе многих приложений. В частности, Google с ее огромными ресурсами и десятилетними исследованиями в области машинного обучения является «компанией, которую глупо игнорировать», говорит инвестор Майк Вольпи из Index Ventures.
Социальные проблемы также не обошли тему искусственного интеллекта. В ИИ-моделях возможны предвзятость и дискриминация, не говоря уже об их злоупотреблении со стороны недобросовестных лиц. Возникают юридические споры по поводу права собственности на работу, созданную ИИ, и фактических данных, используемых для их обучения. А еще есть конечная цель, которую некоторые, например руководители OpenAI, представляют себе таким образом: сознательный, самосовершенствующийся «искусственный интеллект общего назначения», способный переосмыслить капитализм (надежда Олтмена) или угрожать человечеству (страх некоторых людей, в том числе Илона Маска).
Но в разговоре более чем с 60 исследователями, инвесторами и предпринимателями в области ИИ стало ясно, что у этой «золотой лихорадки» есть и то, чего не хватало другим недавним повальным увлечениям — практическое, даже скучное, деловое содержание. Гонка за внедрение инструментов в рабочие процессы компаний, больших и малых, уже началась. По данным компании Rapid, в 2022 году число обращений к фрагментам кода, основанным на ИИ или API, выросло в 10 раз, причем в декабре этот рост только ускорился. Недавнее исследование Cowen, проведенное среди 100 с лишним покупателей корпоративного программного обеспечения, показало, что ИИ стал главным приоритетом расходов среди развивающихся технологий. Модели ChatGPT и OpenAI приходят в линейку таких продуктов Microsoft, Outlook и Word, и большинство производителей ПО для бизнеса готовы начинать развивать что-то подобное.
Спустя четверть века после того, как программа Deep Blue компании IBM победила шахматного гроссмейстера Гарри Каспарова, переход к искусственному интеллекту наконец-то произошел. «Это захватывающее время, — сказал Forbes стесняющийся прессы Олтмен, — но я надеюсь, что до полного перехода еще далеко».
Переломный момент в развитии ИИ также связан с компанией Stability AI. В августе, после запуска бета-версии модели изображений OpenAI DALL-E, Эмад Мостак выпустил Stable Diffusion, которая позволяет любому человеку мгновенно превратить строчку текста в произведение искусства или скучное селфи — в эффектный автопортрет. В отличие от модели OpenAI в программе Мостака нет открытого исходного кода. Тем не менее программа стала главным источником прибыли проекта на сегодняшний день. Каждый день 10 млн человек используют Stable Diffusion — больше, чем любую другую модель на основе ИИ.
Мгновенной популярности Stability AI было достаточно, чтобы инвесторы предложили компании оценку в $1 млрд и финансирование в размере более $100 млн в августе, в течение двух недель после ее запуска.
Сейчас генеративный ИИ переживает невероятную популярность. Электронная музыкальная группа Chainsmokers использовала Stable Diffusion для создания музыкального клипа, и Мостак предсказывает, что скоро этот инструмент будет использоваться для создания целых фильмов. Музей Сальвадора Дали в Сент-Питерсберге, штат Флорида, использует DALL-E, чтобы помочь посетителям визуализировать свои мечты, а аналогичный инструмент генерации изображений от стартапа Midjourney вызвал возмущение в интернете, когда был использован для создания художественного произведения, получившего главный приз на ярмарке штата Колорадо.
«Я считаю, что наступил поворотный момент в истории», — поделился генеральный директор Stripe Патрик Коллисон, бывший начальник Брокмана. Он также признался, что с нетерпением ждет появления инструментов ИИ, которые смогут переводить видео на YouTube во время прямой трансляции и группировать их по темам, определяемым ИИ.
По мере распространения Stability AI OpenAI уже решила отложить разработку ChatGPT, чтобы сконцентрироваться на альтернативах, ориентированных на домены, и приберечь интерфейс для более крупного последующего релиза. Но к ноябрю она изменила курс. В январе, когда система государственных школ Нью-Йорка запретила ChatGPT на своих компьютерах, а профессор из Уортонской школы бизнеса, тестировавший программу, поставил ей четверку на выпускном экзамене, компания предложила некоторым пользователям тестовую платную версию инструмента. «Stable Diffusion бросило бомбу в этот водоворот событий, сделав ИИ более доступным, — говорит инвестор Sequoia Патрик Грейди, сторонник OpenAI. — Это действительно расшевелило бизнес OpenAI и заставило их стать более коммерчески ориентированными».
Это событие, в свою очередь, ускорило коммерческие устремления всей отрасли. Эмад Мостак, генеральный директор Stability AI, предоставил всем своим сотрудникам отпуск на время праздников, так как ожидал, что 2023 год станет изнурительным, поскольку он попытается вступить в борьбу не только с OpenAI, но и с такими компаниями, как Google и Meta. Он сказал своей команде: «Вы все умрете в 2023 году».
Крупнейшие технологические компании мира приняли вызов. Как сообщается, основатели Google Сергей Брин и Ларри Пейдж вернулись в штаб-квартиру компании в рамках «красного кода», введенного генеральным директором Сундаром Пичаи для решения проблемы ChatGPT и ему подобных; давно вышедший на пенсию сооснователь Microsoft Гейтс рассказал Forbes, что теперь он тратит около 10% своего времени на встречи с различными командами по поводу пути развития их продуктов.
Преимущество должно быть у Google. В 2017 году исследователи Google опубликовали работу об алгоритмах, которые, анализируя контекст, делают большие языковые модели более практичными. Один из ее авторов, Эйдан Гомес, вспоминает, как внедрил эту технологию сначала в Google Translate, а затем в поисковую систему Google, Gmail и «Google Документы». Однако технология используется в основном в рекламных продуктах, составляющих основную часть продаж компании, оставляя потребителей равнодушными. «Я ждал, что мир заинтересуется этой технологией и начнет создавать что-то новое с ее помощью, но ничего не происходило, — говорит Гомес, который в 2019 году запустил свой собственный OpenAI — компанию Cohere. — Ничего не менялось». Из восьми авторов статьи шесть покинули Google и основали свои собственные компании, еще один перешел в OpenAI.
Microsoft, похоже, готова стать лидером отрасли. В 2019 году Брокман и его команда поняли, что не смогут оплатить крупномасштабные вычисления, необходимые для дальнейшей разработки GPT, за счет средств, которые им удалось привлечь в том числе от таких людей, как Питер Тиль и Илон Маск. OpenAI создала коммерческую компанию, чтобы предоставить сотрудникам долю в капитале и привлечь новых спонсоров, а Олтмен перешел на полную ставку. Генеральный директор Microsoft Сатья Наделла выделил OpenAI $1 млрд и гарантировал большую и растущую клиентскую базу благодаря облачному сервису Microsoft Azure.
Теперь инвестиции Microsoft в размере $10 млрд пойдут на внедрение ChatGPT в программный пакет Microsoft Office. Аналитик RBC Capital Markets Риши Джалурия, занимающийся Microsoft, представляет себе мир ближайшего будущего, в котором работники одним нажатием кнопки превращают документы Word в презентации PowerPoint.
Соучредительница FPV Ventures Пега Эбрахими, бывший IT-директор инвестиционно-банковского подразделения Morgan Stanley, считает, что в течение многих лет вопрос больших данных для крупных предприятий заключался в том, как превратить огромные массивы данных в сведения, приносящие доход. Теперь сотрудники спрашивают, как они могут внедрить инструменты ИИ для анализа видеокаталогов или встроить чат-ботов в свои собственные продукты. «Многие из них занимались анализом в последние пару месяцев и пришли к выводу, что это действительно интересно и есть области, где мы могли бы использовать эти технологии», — добавила Эбрахими.
Большие дебаты вокруг новой эры ИИ связаны с еще одной аббревиатурой — ИИОН (AGI), или искусственный интеллект общего назначения: сознательная, самообучающаяся система, которая теоретически может развиваться без человеческого контроля. Помощь в безопасном развитии такой технологии остается основной задачей OpenAI, говорят ее руководители. «Самым важным вопросом будет не то, как добиться технического прогресса, а то, какие ценности в нем будут заложены», — говорит Брокман. Эмад Мостак считает эту цель ошибочной: «Меня не волнует AGI… Если вы хотите заниматься AGI, идите работать в OpenAI. Если вы хотите создать продукт, который достанется людям, то приходите к нам».
Сторонники OpenAI, такие как миллиардер Рид Хоффман, который сделал пожертвование в ее некоммерческую организацию через свой благотворительный фонд, утверждают, что достижение AGI будет бонусом, а не основным источником для получения выгоды. Олтмен признается, что он «много размышлял» о том, признаем ли мы AGI, если он появится. В настоящее время он считает, что «это не произойдет в один момент, это будет гораздо более постепенный переход». Но исследователи предупреждают, что потенциальное влияние моделей ИИ необходимо обсуждать уже сейчас, учитывая, что после релиза ничего нельзя будет вернуть назад.
В ближайшей перспективе эти модели и стоящие за ними компании столкнутся с насущными вопросами об этичности своих творений. OpenAI и другие компании используют сторонних поставщиков для маркировки некоторых своих данных и обучения своих моделей тому, как определять, что выходит за рамки дозволенного, теряя при этом некоторый контроль над своими создателями. Недавно Киран Снайдер, генеральный директор компании Textio, занимающейся разработкой программного обеспечения, проанализировала сотни описаний вакансий, составленных с помощью ChatGPT, и обнаружила, что чем более личным был запрос, тем более убедительным был результат работы ИИ — и тем более предвзятым. Защита OpenAI не позволяет использовать явно сексистские или расистские термины. Но дискриминация по возрасту, инвалидности или религии все еще проскальзывает. «Трудно написать редакционные правила, которые отфильтровывают многочисленные проявления фанатизма у людей», — добавляет Снайдер.
Законы об авторском праве — еще одно поле битвы. Microsoft и OpenAI являются объектами коллективного иска, связанного с пиратством программного кода. (Обе компании недавно подали ходатайства об отклонении исков и отказались от дальнейших комментариев.) На компанию Stability AI недавно подала в суд компания Getty Images, которая утверждает, что Stable Diffusion была незаконно обучена на миллионах ее собственных фотографий. Представитель компании заявил, что компания все еще изучает документы.
Еще более опасны злоумышленники, намеренно использующие генеративный ИИ для распространения дезинформации — например, реалистичных видеозаписей жестоких беспорядков, которых на самом деле никогда не было. «Доверие к информации — это часть фундамента демократии, — говорит Фей-Фей Ли, содиректор Стэнфордского института искусственного интеллекта, ориентированного на человека (HAI). — На это будет оказано глубокое влияние».
Кому придется отвечать на такие вопросы, отчасти зависит от того, как будет формироваться быстрорастущий рынок ИИ. «В 90-е годы у нас были AltaVista, Infoseek и еще около десяти подобных компаний, и в тот момент можно было почувствовать, что кто-то из них достигнет небывалых высот, — говорит партнер Benchmark Эрик Вишрия. — Теперь все они исчезли».
Инвестиции Microsoft в OpenAI, которые сопровождаются соглашением о распределении контрольного пакета прибыли до тех пор, пока компания не окупит свои инвестиции, плюс предельная доля дополнительной прибыли являются беспрецедентными, включая обещание OpenAI в конечном итоге вернуться под контроль некоммерческих организаций. (Олтмен и Брокман называют это «предохранительным механизмом» и «автоматическим выключателем», чтобы удержать OpenAI от концентрации власти, если она станет слишком большой). Некоторые отраслевые наблюдатели более язвительно рассматривают эту сделку как почти приобретение или, по крайней мере, аренду, которая больше всего выгодна Наделле. «Каждый раз, когда мы обращались к ним со словами: «Эй, нам нужно сделать эту странную вещь, которая вам, вероятно, не понравится», они отвечали: «Это потрясающе», — говорит Олтмен о соглашении. (Microsoft отказалась обсуждать условия сделки.)
Есть еще один аспект этой сделки: OpenAI может получить доступ к огромным новым хранилищам данных из офисного пакета Microsoft Office, что крайне важно, поскольку модели ИИ неустанно изучают доступные в интернете документы. Google, конечно, уже обладает таким сокровищем. Ее подразделения ИИ работали с данными годами, в основном для защиты собственного бизнеса.
Мостак очень старается объяснить, что его бизнес ориентирован на творческую индустрию, скорее на Disney и Netflix, — прежде всего, чтобы не мешать Google. «У них больше графических процессоров, чем у вас, у них больше кадрового потенциала, чем у вас, у них больше данных, чем у вас», — говорит он. Но Мостак, возможно, сам подписал договор с дьяволом, заключив сделку с Amazon. В рамках партнерства со Stability AI лидер облачных вычислений предоставил компании более 4000 чипов Nvidia AI для сборки одного из крупнейших в мире суперкомпьютеров. Мостак говорит, что год назад у Stability AI было всего 32 таких графических процессора.
«Они предложили нам невероятно привлекательную сделку», — говорит он. И не зря: совместная деятельность обеспечивает очевидный доход от облачных вычислений на базе Amazon Web Services и может генерировать контент для развлекательного подразделения компании Studios. Но, помимо этого, вопрос о плане Amazon остается открытым.
Нельзя игнорировать и компании Apple и Meta, которые также имеют крупные подразделения по ИИ. Apple недавно выпустила обновление, интегрирующее Stable Diffusion непосредственно в свои последние операционные системы. Ян Лекун, главный научный сотрудник Meta по ИИ, рассказал журналистам о шумихе вокруг ChatGPT. Кроме того, существует множество стартапов, стремящихся построить все вокруг OpenAI, Stability AI и им подобных. Клем Деланг, 34-летний генеральный директор компании Hugging Face, которая занимается разработкой модели Stable Diffusion с открытым исходным кодом, представляет своего рода альянс повстанцев, разнообразную экосистему ИИ, менее зависимую от какого-либо крупного технологического игрока. В противном случае затраты на такие модели не будут прозрачными и будут зависеть от субсидий крупных технологических компаний, чтобы оставаться жизнеспособными. «Это отмывание облачных денег», — заключает Деланг.
Существующие стартапы, такие как Jasper, копирайтер на основе ИИ, который создал инструменты на базе GPT и в прошлом году получил доход в размере $75 млн, пытаются удержаться на плаву. Компания уже переориентировалась на индивидуальных пользователей, некоторые из них платили примерно по $100 в месяц за функции, используемые теперь в ChatGPT. «Подобные проекты пробиваются так быстро, что кажется, будто ни у кого нет никакого преимущества», — говорит генеральный директор Дэйв Рогенмозер.
Это относится и к OpenAI — самому большому трофею и самой большой мишени в этой группе. В январе компания Anthropic, основанная бывшими исследователями OpenAI (в последнее время ее поддерживал Сэм Бэнкман-Фрид из обанкротившейся фирмы FTX), выпустила собственный чат-бот под названием Claude. По словам генерального директора Scale AI Александра Вана, поставщика инфраструктурного программного обеспечения для обеих компаний, этот бот по многим параметрам не уступает ChatGPT, несмотря на то, что его разработка обошлась в разы дешевле.
В OpenAI Брокман указывает на пункт в уставе компании, который обещает, если другая компания приблизится к достижению искусственного интеллекта общего назначения, свернуть работу OpenAI и объединить ее с конкурирующим проектом. «Я не видел, чтобы кто-то еще принял такое решение», — говорит он. Олтмена также не беспокоит конкуренция. Может ли ChatGPT победить поисковую систему Google? «Люди упускают возможности, если концентрируются на прошлом, — размышляет он. — Мне гораздо интереснее думать о том, что будет дальше».
Перевод Ксении Лычагиной