Луч света в царстве рецессии: как технологии создания изображений стали трендом года
В этом году общая картина для технологического сектора всеми мировыми экспертами оценивается как печальная.
Проблема не в том, что технологические гиганты перестали быть прибыльными — с прибылями у них все по-прежнему очень и очень неплохо. Но любили (и ценили на бирже) эти компании прежде всего за казавшийся неостановимым рост, и времена пандемии придали этой любви новый оттенок. Когда все традиционное и устойчивое тормозило и разваливалось, техногиганты как ни в чем не бывало продолжали безудержно расти, а некоторые даже ускорялись всем локдаунам назло. Возникла иллюзия их полной неуязвимости, невиданной устойчивости к экономическим кризисам. И вот эта иллюзия рассыпалась: рост техногигантов в 2022 замедлялся, а иногда даже становился слегка отрицательным (и речь не только про капитализацию, но и про основные бизнес-метрики).
На этом грустном фоне очень интересно и контрастно выглядело развитие тренда, который отчетливо сформировался раньше в 2022 году: распространение систем text-to-art, генераторов высококачественной графики по словесным описаниям и, при желании, по простеньким корявым эскизам. Вот, например, Microsoft впервые за долгое время вместо наращивания своего штата проводит пусть не очень большие, но сокращения. И одновременно тот же самый Microsoft обсуждает с OpenAI дальнейшие инвестиции поверх того миллиарда долларов, который он в 2019 году туда вложил. Оценка стоимости этой молодой компании растет и приближается к $20 млрд, а генеративные возможности ее ставшей знаменитой системы DALL-E 2, как объявлено, станут использоваться в новейшем приложении для создания иллюстраций Microsoft Designer и в браузере Edge.
Другой пример еще показательнее: на фоне снижения инвестиционной активности в технологичные компании молоденькая британская фирма с всего лишь сотней сотрудников Stabilty.ai получает более $100 млн инвестиций по оценке, сразу делающей ее «единорогом» (а в 2022 году это нечастый зверь). Эта компания разработала open-source систему генерации высококачественных и гибко управляемых изображений Stable Diffusion, за несколько месяцев снискавшую огромную популярность (и вызвавшую ожесточенные споры) в сообществах художников и иллюстраторов.
События, а также деловая и пользовательская активность вокруг новых генеративных систем выглядят особенно привлекательно на фоне сложностей другой горячей темы и модного слова уходящего года — метавселенной. Хотя и лично Цукерберг, и многочисленные журналисты и пиарщики, и столпы игровой индустрии, и криптоэнтузиасты всячески качали эту тему, никакой пользовательской популярности виртуальные миры, представляющие будущее метавселенной, пока не сыскали. Несмотря на миллиардные вложения, любимое метавселенское детище Цукерберга Horizon Worlds не в состоянии удержать ни пользователей, ни даже сотрудников компании, несмотря на всю их лояльность. Впрочем, долгосрочные надежды на метавселенную вполне живы, и в 2023 году будет интересно наблюдать за прогрессом в этой области. Но историей успеха-2022 метавселенная точно не стала.
Массовые продукты, основанные на машинном обучении и обеспечивающие генерацию нового визуального, а не вербального контента — это лишь одна сторона новаций 2022 года. Вторая — это не столь заметный, но от этого не менее серьезный прогресс в машинном зрении и массовости использования графических образов в качестве входного сигнала, а не результата работы систем искусственного интеллекта. Конечно, в мобильных приложениях крупнейших поисковых систем ввод изображения с камеры смартфона или из галереи изображений — давно привычная часть интерфейса. Но не случайно именно осенью 2022 года случилось очень редкое событие — изменение в предельно лаконичной стартовой странице Google, где в поисковую строку добавилась иконка поиска по изображениям.
Можно сказать, что именно уходящий год продемонстрировал в массовых сервисах, насколько хорошо люди научили машины не только читать и понимать тексты, но и видеть окружающий мир — и отвечать на запросы визуальным, а не только словесным, контентом. Для дальнейшего сотрудничества людей и машин это важная веха: наши очень далекие предки полагались на зрение во времена, когда еще не существовало никаких языков, и до сих пор богатство мира вокруг мы в значительной степени воспринимаем зрительно. А иметь помощником и соавтором слепого не всегда удобно и эффективно. Теперь работать вместе с машинно-обученными цифровыми коллегами (или инструментами, если кому-то так спокойней воспринимать происходящее) станет комфортнее и плодотворнее. Если же взглянуть с потребительской точки зрения зрителя, а не автора или бизнесмена, то можно уверенно ожидать в следующем году изобилие и красоту не только плоских сгенеренных алгоритмами картинок, но и появление внятных генеративных видео и 3D-сюжетов в виртуальных мирах — будет на что полюбоваться.
Мнение редакции может не совпадать с точкой зрения автора