02 января 2023

Луч света в царстве рецессии: как технологии создания изображений стали трендом года

Андрей Себрант Автор

Изображение, сгенерированное нейросетью DALL·E 2

Stub — Изображение, сгенерированное нейросетью DALL·E 2

Конец 2022 года для техногигантов массового рынка выглядит довольно тускло и вызывает опасение, что развитие компаний, особенно основанных на рекламной модели, зашло в тупик. Но в этом темном царстве пессимизма есть пусть и небольшое, но светлое пятно. Директор по стратегическому маркетингу «Яндекса» Андрей Себрант рассказывает в колонке для Forbes, почему ушедший год надо благодарить за развитие продуктов на основе искусственного интеллекта — генеративных графических систем нового поколения

В этом году общая картина для технологического сектора всеми мировыми экспертами оценивается как печальная.

Проблема не в том, что технологические гиганты перестали быть прибыльными — с прибылями у них все по-прежнему очень и очень неплохо. Но любили (и ценили на бирже) эти компании прежде всего за казавшийся неостановимым рост, и времена пандемии придали этой любви новый оттенок. Когда все традиционное и устойчивое тормозило и разваливалось, техногиганты как ни в чем не бывало продолжали безудержно расти, а некоторые даже ускорялись всем локдаунам назло. Возникла иллюзия их полной неуязвимости, невиданной устойчивости к экономическим кризисам. И вот эта иллюзия рассыпалась: рост техногигантов в 2022 замедлялся, а иногда даже становился слегка отрицательным (и речь не только про капитализацию, но и про основные бизнес-метрики).

На этом грустном фоне очень интересно и контрастно выглядело развитие тренда, который отчетливо сформировался раньше в 2022 году: распространение систем text-to-art, генераторов высококачественной графики по словесным описаниям и, при желании, по простеньким корявым эскизам. Вот, например, Microsoft впервые за долгое время вместо наращивания своего штата проводит пусть не очень большие, но сокращения. И одновременно тот же самый Microsoft обсуждает с OpenAI дальнейшие инвестиции поверх того миллиарда долларов, который он в 2019 году туда вложил. Оценка стоимости этой молодой компании растет и приближается к $20 млрд, а генеративные возможности ее ставшей знаменитой системы DALL-E 2, как объявлено, станут использоваться в новейшем приложении для создания иллюстраций Microsoft Designer и в браузере Edge.

Материал по теме

Другой пример еще показательнее: на фоне снижения инвестиционной активности в технологичные компании молоденькая британская фирма с всего лишь сотней сотрудников Stabilty.ai получает более $100 млн инвестиций по оценке, сразу делающей ее «единорогом» (а в 2022 году это нечастый зверь). Эта компания разработала open-source систему генерации высококачественных и гибко управляемых изображений Stable Diffusion, за несколько месяцев снискавшую огромную популярность (и вызвавшую ожесточенные споры) в сообществах художников и иллюстраторов.

События, а также деловая и пользовательская активность вокруг новых генеративных систем выглядят особенно привлекательно на фоне сложностей другой горячей темы и модного слова уходящего года — метавселенной. Хотя и лично Цукерберг, и многочисленные журналисты и пиарщики, и столпы игровой индустрии, и криптоэнтузиасты всячески качали эту тему, никакой пользовательской популярности виртуальные миры, представляющие будущее метавселенной, пока не сыскали. Несмотря на миллиардные вложения, любимое метавселенское детище Цукерберга Horizon Worlds не в состоянии удержать ни пользователей, ни даже сотрудников компании, несмотря на всю их лояльность. Впрочем, долгосрочные надежды на метавселенную вполне живы, и в 2023 году будет интересно наблюдать за прогрессом в этой области. Но историей успеха-2022 метавселенная точно не стала.

Материал по теме

Массовые продукты, основанные на машинном обучении и обеспечивающие генерацию нового визуального, а не вербального контента — это лишь одна сторона новаций 2022 года. Вторая — это не столь заметный, но от этого не менее серьезный прогресс в машинном зрении и массовости использования графических образов в качестве входного сигнала, а не результата работы систем искусственного интеллекта. Конечно, в мобильных приложениях крупнейших поисковых систем ввод изображения с камеры смартфона или из галереи изображений — давно привычная часть интерфейса. Но не случайно именно осенью 2022 года случилось очень редкое событие — изменение в предельно лаконичной стартовой странице Google, где в поисковую строку добавилась иконка поиска по изображениям.

Можно сказать, что именно уходящий год продемонстрировал в массовых сервисах, насколько хорошо люди научили машины не только читать и понимать тексты, но и видеть окружающий мир — и отвечать на запросы визуальным, а не только словесным, контентом. Для дальнейшего сотрудничества людей и машин это важная веха: наши очень далекие предки полагались на зрение во времена, когда еще не существовало никаких языков, и до сих пор богатство мира вокруг мы в значительной степени воспринимаем зрительно. А иметь помощником и соавтором слепого не всегда удобно и эффективно. Теперь работать вместе с машинно-обученными цифровыми коллегами (или инструментами, если кому-то так спокойней воспринимать происходящее) станет комфортнее и плодотворнее. Если же взглянуть с потребительской точки зрения зрителя, а не автора или бизнесмена, то можно уверенно ожидать в следующем году изобилие и красоту не только плоских сгенеренных алгоритмами картинок, но и появление внятных генеративных видео и 3D-сюжетов в виртуальных мирах — будет на что полюбоваться.

Мнение редакции может не совпадать с точкой зрения автора