Как экс-сотрудница «Яндекса» создала «этичную» нейросеть для дизайнеров
«Этичный ИИ для креаторов» — гласит надпись на главной странице сервиса exactly.ai (ранее durer.ai). Он позволяет цифровым художникам и дизайнерам обучать искусственный интеллект на собственных произведениях, чтобы затем он генерировал изображения в похожем стиле. Художники используют их в качестве идей для творчества, а также для ускорения и упрощения своей работы. В будущем Самсонова хочет настроить для креаторов возможность продажи или сдачи в аренду своих моделей ИИ заказчикам, чтобы те могли использовать их в коммерческих целях.
Еxactly.ai возник в ответ на запуск нейросети Midjourney для генерации изображений по текстовому описанию. Самсонова говорит, что быстро поняла: нейросеть обучали на большом массиве данных, а значит, она может иметь проблемы с авторским правом. Позднее проблемы действительно появились: художники, чьи работы попали в базу для тренировки ИИ, подали иски в связи с нарушением своих авторских прав к Midjourney и другим нейросетям для генерации изображений. «Вместо того чтобы воровать данные у художников, можно каждому из них дать возможность создать персональную ИИ-модель», — объяснила Самсонова.
Ей удалось заразить идеей инвесторов. С конца 2022 года ее стартап привлек около $5 млн от международного венчурного фонда Speedinvest, британских GuruDev Capital, InReach Ventures, Cornerstone VC и бизнес-ангелов. Как вырос exactly.ai и сможет ли Самсонова заработать на своей идее?
Эстетика и этика
Москвичка Тоня Самсонова получила образование по социологии в Высшей школе экономики и долго строила журналистскую карьеру. Во время учебы работала ведущей на радиостанции «Эхо Москвы», а после устроилась редактором отдела общества и политики в издание Slon.ru (сейчас Republic, признано иноагентом) и ведущей на телеканал «Дождь» (признан иноагентом и нежелательной организацией). Весной 2013 года Самсонова перебралась в Великобританию как лондонский корреспондент этих СМИ. А через год, разочаровавшись в журналистике, придумала свой собственный медиапроект — сервис вопросов и ответов TheQuestion. Идея пришла интуитивно: журналисткой Самсонова обращалась к экспертам, которые профессионально разбираются в историях, требующих ясного объяснения, а теперь решила масштабировать этот опыт.
За четыре года проект собрал аудиторию в 10 млн уникальных пользователей в месяц, и в 2019 году его купил «Яндекс». Как стало известно позже из отчета корпорации, сумма сделки составила 384 млн рублей. Корпорация объединила TheQuestion и собственный похожий сервис «Яндекс Знатоки», и Самсонова возглавила объединенный юнит — «Яндекс Кью». В беседе с Forbes она вспоминает, что продолжила жить в Лондоне, но летала в Москву почти каждую неделю.
В марте 2022 года Самсонова уволилась из «Яндекса» и начала думать о новом собственном бизнесе. Она говорит, что, как человек «из мира текстов и букв», всегда интересовалась визуальными проектами и в целом тем, как люди могут передавать идеи невербальным способом. Самсонову привлекал и искусственный интеллект. За время работы в «Яндексе» она убедилась, насколько эффективно он может выполнять некоторые задачи за человека. Например, «Яндекс Кью» поручил алгоритму подбор экспертов для ответов на вопросы, и в 90% случаев технология предлагала решения, которые Самсонова приняла бы и сама.
Идея совместить визуальный язык и искусственный интеллект приобрела более четкие очертания после запуска на широкую аудиторию нейросети Midjourney в июле 2022 года. Самсонову поразило качество изображений, создаваемых ИИ по текстовым описаниям. «Но очень быстро я поняла: происходит то же, что и всегда. Большие технологические компании берут все данные из интернета, засовывают их в один алгоритм и выдают средний результат по больнице», — рассуждает предпринимательница. Она посчитала это несправедливым по отношению к авторам, на чьих работах обучают нейросеть, и решила сделать сервис, с помощью которого любой художник смог бы создать свою ИИ-модель и зарабатывать на ней.
Задумка попала в болевую точку рынка. По мере развития Midjourney и его конкурентов недовольство авторов и владельцев произведений росло, а в 2023 году оно вылилось в судебные споры. В начале года три художника подали коллективный иск к Midjourney, а также к другим заметным генеративным нейросетям — Stable Diffusion и DreamUp. По словам истцов, компании использовали для обучения своего ИИ некоммерческую общедоступную базу данных, которая содержит более 5 млрд изображений из интернета, включая работы многих художников. При этом авторы не давали согласия на включение своих произведений в базу для обучения, им не заплатили за участие, хотя компании, включая Midjourney, взимали плату за использование своих инструментов. Вскоре после первых исков заявление к Stable Diffusion подал и один из крупнейших в мире фотобанков Getty Images. Компания утверждала, что разработчик нейросети скопировал более 12 млн изображений из ее базы, не спросив разрешения и не заплатив за них. В Великобритании иск приняли и передали в суд.
Нейросети не воруют изображения и стили сами по себе. «Появление тех или иных черт в генерациях объясняется данными, на которых обучали модель, ну и немножко волей случая, ведь процесс генерации ученые пока не могут контролировать полностью», — рассуждает директор лаборатории FusionBrain Института искусственного интеллекта AIRI Андрей Кузнецов. Гендиректор школы no-code разработки «Зерокодер» Кирилл Пшинник сравнивает метод работы генеративных нейросетей с тем, как художники вдохновляются предшественниками и заимствуют их стиль. «Ограничивать использование такого инструмента неправильно, так как это не копия, а работа, вдохновленная другими работами», — уверен он. При этом Пшинник понимает претензии художников к нейросетям: «Что с этим делать, сложный этический вопрос».
Проблему с авторскими правами решает качественная проверка данных для обучения нейросетей, считает Кузнецов. И в мире даже есть стартапы, которые делают такую проверку, говорит инвестиционный аналитик MTS AI Богдан Дубинчук. Он приводит в пример модель ImageAI от компаний Databricks и Shutterstock, обучающуюся только на лицензированных изображениях. По похожему принципу работают Adobe Firefly и Mitsua Diffusion. Такой подход, по словам Дубинчука, может быть эффективным в предотвращении воровства, но лимитирует объем данных, необходимых для обучения, и негативно влияет на производительность моделей. Но есть решения, которые обходят и это ограничение, позволяя собирать лицензированные изображения сразу из нескольких баз, например израильский сервис Bria (весной 2024 года привлек $24 млн).
При этом мало кто на этом рынке пробовал решать проблему через взаимодействие с авторами контента, утверждает Кузнецов. Эту нишу и решила занять Самсонова. В октябре 2022 года она наняла первого инженера по машинному обучению, который ранее тоже работал в «Яндексе», а затем в Snap (разработчик Snapchat). Затем зарегистрировала в Лондоне компанию и сразу же начала искать инвестиции. Стартап использовал модель advanced subscription agreement, когда частные инвесторы могут вкладывать в бизнес в течение года при условии, что они получат акции после заключения первого институционального раунда инвестиций. Таким образом стартап привлек около £500 000 ($630 000), которые пошли на зарплаты инженерам, говорит Самсонова. Она не раскрывает число и имена инвесторов.
Пообщаться с зеркалом
В основу сервиса легла архитектура нейросети Stable Diffusion, но впоследствии команда далеко от нее отошла, рассказывала Самсонова. Компания параллельно работала в двух направлениях: улучшала качество генерации изображений и создавала собственное решение, позволяющее точно понимать стиль художника по небольшому количеству его работ. Вскоре после начала разработки стартап открыл доступ к пилотной версии по запросу. Пользователь мог загрузить свои работы и получить персональную ИИ-модель. Затем он давал нейросети текстовый промт (задание), и она создавала новые изображения в стиле исходных картинок.
Пилотную версию exactly.ai в марте 2023 года тестировала, например, Мария Гильманова, соосновательница российского бренда керамики ручной работы Agami Ceramics. «Нам было интересно, что сделает ИИ в области керамики и сможем ли мы использовать полученные дизайны в качестве эскизов будущих изделий», — рассказывает она в беседе с Forbes. По словам предпринимательницы, тогда сервис был в очень сыром виде и генерировал расцветки и формы, которые невозможно повторить с керамическими материалами. Она пришла к выводу, что платформа заточена на графических дизайнеров и иллюстраторов, а не на создателей физических объектов, и в итоге не стала дальше работать с exactly.ai.
Поначалу сервис многого не умел, но постоянно модифицировался, утверждает Самсонова. По мере роста числа загруженных картинок улучшилось и базовое качество ИИ-модели. К тому же появились новые функции, например, возможность поправить только часть сгенерированной картинки, если все остальное в ней нравится, или создавать генерации с помощью ИИ поверх готового наброска. Сверхзадачей команды было разработать интерфейс, который был бы интуитивно понятен всем, а не только программистам, рассказывает основательница.
Exactly.ai стал доступен для всех желающих в июле 2023 года. Поначалу он был бесплатным, а с сентября начал монетизироваться с помощью подписок. За $20 в месяц можно обучить на своих работах пять ИИ-моделей и создать с их помощью 250 изображений. Тариф без ограничений по количеству моделей и генераций обойдется в $50 в месяц. Бесплатно пользователи могут получить две персональные ИИ-модели, сгенерировать 10 изображений, а также в некоммерческих целях пользоваться моделями других дизайнеров, которые дали согласие на их публикацию на платформе.
Самсонова не хотела тратить деньги на рекламу, поэтому сервис рос органически. Пользователи публиковали в соцсетях сгенерированные изображения, на которых был логотип компании, и так о ней узнавало все больше иллюстраторов, которые решили попробовать продукт. За год exactly.ai удалось собрать 45 000 регистраций, утверждает Самсонова. Подстегнул рост и интерес бизнеса. По словам предпринимательницы, сегодня 40% зарегистрированных пользователей — компании, которым нужно регулярно создавать много иллюстраций в своем корпоративном стиле.
Иллюстраторы в свою очередь используют платформу в качестве этюдника, в котором делают эскизы и пытаются разработать личный стиль, объясняет Самсонова. Основательницы студии графического дизайна Holystick, к примеру, с помощью exactly.ai проверяют гипотезы, чтобы определиться с композицией и стилем. В беседе с Forbes они признают, что сервис все больше становится похож на графический редактор, умеет создавать изображения на основе эскиза, и это помогает находить неожиданные решения. Предпринимательницы пользуются бесплатной версией, но время от времени, когда возможностей становится недостаточно, оплачивают подписку.
Мультидисциплинарный художник Глеб Солнцев считает, что exactly.ai предоставляет авторам «инструмент познания», который позволяет осмыслить свой стиль и отследить его характерные черты. «Персональные ИИ-модели — это будущее. Нейросети ускоряют работу художника и подсказывают ему дополнительные решения, так как зациклены на его творчестве. Получается общение с собственным зеркалом», — рассуждает Солнцев. Впрочем, диджитал-художник и номинант рейтинга Forbes «30 до 30» в 2022 году Ниджат Гусейнов видит в этой зацикленности ограничения для пользователей: «Если модель учится только на ваших работах, то однозначно будет ограниченность в плане выдаваемого результата, что не будет приводить к эврике». Гусейнов считает, что exactly.ai полезен в первую очередь тем, кому важен единый визуальный стиль, а не концепция произведения.
Дружелюбный маркетплейс
Самсонова не раскрывает выручку exactly.ai, отмечая лишь, что 80% доходов приходится на США и Великобританию, где компании больше всего тратят на рекламу. «Если предположить, что половина зарегистрированных художников ежемесячно приобретают стандартную подписку за $20, то годовая выручка компании составит $4,8 млн, — рассуждает Дубинчук из MTS AI. — Но, вероятнее всего, на деле цифра окажется ниже».
Как объясняет Самсонова, компания еще на начальной стадии и сфокусирована на увеличении числа пользователей, а не на росте финансовых показателей. В ее планах — дать художникам возможность сдавать в аренду или продавать свои ИИ-модели бизнесу. «Мы знаем, что иллюстраторы сейчас передают своим клиентам логины и пароли от аккаунтов, чтобы те могли работать в exactly.ai. И это как раз наша следующая механика — мы строим маркетплейс, который сводит исполнителей с заказчиками», — заявляет Самсонова.
На эту идею в мае 2024 года exactly.ai привлек $4,3 млн от фондов Speedinvest, InReach Ventures, Cornerstone VC, GuruDev Capital и частных инвесторов. По словам Самсоновой, переговоры заняли почти год: венчурный рынок «был на самом дне», и инвесторам было сложно решиться на вложения. «Самый главный вопрос, который нам задавали: «Как вы будете защищаться? На рынке огромное количество игроков. Почему маленький стартап может претендовать на то, что он займет их место?» По словам Самсоновой, решающим фактором в переговорах стало то, что права на ИИ-модели, созданные иллюстраторами на платформе, принадлежат им, а не exactly.ai. «В итоге инвесторы сказали, что хотят, чтобы этот подход стал рыночным стандартом», — утверждает предпринимательница.
Что ждет exactly.ai? С одной стороны, рынок генеративного ИИ на подъеме. Управляющий директор по исследованию данных в «Сбере», один из создателей нейросети Kandinsky и победитель нового рейтинга Forbes «30 до 30» Денис Димитров говорит, что в 2023 году его объем составил несколько миллиардов долларов и он будет экспоненциально расти. «Бизнес только-только понимает, на что способны эти модели, почему они полезны и как их можно применять», — добавляет он. С другой стороны, это очень конкурентный рынок. Наиболее заметные игроки среди нейросетей, генерирующих изображения, по мнению Кузнецова из AIRI, это те же Midjourney и Stable Diffusion, а также DALL-E от OpenAI, российские Kandinsky и YandexART.
Кузнецов считает основным риском для стартапа то, что натренировать на собственных изображениях можно почти любую существующую большую open-source модель. Это доступно самому художнику, если у него есть нужные навыки. Но exactly.ai позволяет создавать ИИ-модели людям без специализированных навыков, далеким от технологий и разработки, и это отличает его от конкурентов, замечает Димитров. «Вы можете дообучить модель генерации изображений под свой стиль, нажав одну кнопку. Я не видел подобных проектов, это действительно круто, но стоит недешево», — добавляет он. Кузнецов с этим согласен: «Создавать собственную модель с нуля для креатора долго и менее выгодно, чем оплатить работу с уже готовой юзер-дружелюбной платформой».
Но компании с гораздо более мощной технологией и большими ресурсами могут быстро внедрить в свой продукт функционал стартапа, предполагает Пшинник из «Зерокодера». Он считает это глобальной угрозой для exactly.ai, преимуществом которого остается интерфейс, но его «легко повторить». Димитров тоже предвидит появление у стартапа конкурентов по мере масштабирования рынка и развития технологий ИИ.
Самсонова в разговоре с Techcrunch назвала основными конкурентами своего стартапа международные фриланс-биржи Upwork и Fiverr. Что касается крупных генеративных нейросетей, то она хоть и признает конкуренцию, но считает, что у ее площадки с ними пока мало общего, к тому же у exactly.ai совсем другое позиционирование. Она верит, что стартап будет расти за счет интереса к иллюстрациям со стороны бизнеса. «Основной спрос на изображения предъявляют бренды, которые тратят миллиарды долларов в год на контентный маркетинг и рекламу. Бренды покупают не картинки, а лицензии на эти картинки, и если вы не можете подтвердить авторское право на генерацию, вы не можете ее продавать, а exactly.ai как раз решает эту проблему, и в этом наше главное конкурентное преимущество», — утверждает основательница.