К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего браузера.

Принять образ Барби и создать цифрового двойника: как женщины развивают нейросети

Иллюстрация Bairbie.me
Иллюстрация Bairbie.me
Одновременно с выходом фильма «Барби» завирусилось веб-приложение Bairbie.me: его пользователи выкладывали в сеть свои фото в образе знаменитой куклы. Создательница приложения — выпускница Массачусетского технологического института Ширли Мао. Рассказываем о ней и о других создательницах проектов, где искусственный интеллект рисует популярные картинки
Ширли Мао: «Какая ты Барби?»
DR

Ширли Мао: «Какая ты Барби?»

Еще в школьные годы Ширли Мао открыла локальное отделение организации «Women In Tech» — глобального движения, которое поддерживает девушек в STEM. Затем поступила в Массачусетский технологический институт (MIT), где изучала биомеханику и биомедицинские устройства, робототехнику и приборостроение, а также компьютерные науки и искусственный интеллект. Будучи студенткой, Мао вошла в коллектив авторов нескольких статей, посвященных адресной доставке молекул прямиком в клетку (это повышает эффективность и снижает побочные эффекты от применения некоторых лекарств, в том числе использующихся в терапии ВИЧ), и прошла стажировку в Google и Facebook (теперь — Meta, признана в России экстремистской и запрещена).

По словам самой Мао, она всегда любила рисовать и считала, что изображения — лучший способ объяснять сложные вещи. Интерес к дизайну и биотехнологический бэкграунд Мао объединила, запустив после окончания учебы собственный бизнес — брендинговое агентство для компаний, которые работают в сферах биотеха и искусственного интеллекта.

Известность она получила в 2023 году, когда удачно воспользовалась хайпом вокруг фильма «Барби». Мао запустила сайт Bairbie.me с простым аттракционом на основе ИИ: пользователь загружает свое фото, выбирает цвет кожи и волос и получает свой портрет в образе куклы Барби или Кена. Бесплатное фото содержит водяной знак; чтобы получить изображение без него, нужно заплатить $1,99.

Сколько Мао и ее компании удалось заработать таким образом, неизвестно, но за несколько дней после запуска многочисленные «кукольные» фото заполонили интернет. Популярности сервиса способствовала и маркетинговая кампания фильма (создатели которого никак не связаны с проектом Мао), и внимание знаменитостей: свои фото в виде Барби выложили в соцсетях Тейлор Свифт, Селена Гомес, Кайли Дженнер и другие.

Мария Чмир: цифровые двойники

Мария Чмир: цифровые двойники

В 2020 году Сбер выпустил рекламный ролик, главным героем которого стал персонаж фильма «Иван Васильевич меняет профессию» Жорж Милославский. Образ был создан на основе технологии deepfake компанией с похожим названием DeepCake. Ее соосновательница — выпускница Южно-Уральского университета, долгое время работавшая в рекламе Мария Чмир.

В 2021 году DeepCake приложила руку к рекламному ролику компании «МегаФон», одним из персонажей которого стал молодой Брюс Уиллис. Тогда же в СМИ появились сообщения о том, что актер (до этого он был вынужден завершить карьеру из-за прогрессирующего заболевания) продал компании права на свое лицо, но позже представители как Уиллиса, так и DeepCake опровергли это.

Работу DeepCake критиковали — и за недостаточно качественный постпродакшнн, и за этическую неоднозначность самой технологии, которая, только появившись, сразу стала инструментом «черного пиара». На сайте Brask — компании, сооснователем которого Чмир стала в 2020 году, — говорится о приверженности этическим стандартам и «ответственному ИИ». Компания специализируется на создании цифровых масок, полноценных цифровых дублей (как в случае с Брюсом Уиллисом и Жоржем Милославским) и других продуктов, связанных с модификацией видео и аудио (например, потоковый переводчик Rask распознает речь, переводит сказанное с одного языка на другой и озвучивает тем же голосом, каким текст был произнесен изначально).

«Когда мы объединим все эти технологии, мы сможем говорить о цифровом бессмертии, — говорит Чмир в интервью изданию Wired. — Потому что мы можем воссоздать любого человека как цифрового двойника, с мышлением, поведением, голосом и внешностью этого человека».

Мелани Перкинс: «волшебный» графический редактор

Мелани Перкинс: «волшебный» графический редактор

Мелани Перкинс — основательница и CEO компании Canva, которая поддерживает и развивает одноименный графический редактор. В 2021 году компания привлекла $200 млн при оценке $40 млрд.

С развитием генеративного искусственного интеллекта эту технологию стали брать на вооружение многие создатели дизайнерского ПО, и в 2023-м свою версию представила Canva. Во-первых, благодаря ИИ становится проще обработка изображений (результаты фотомонтажа становятся более реалистичными). Во-вторых, появился встроенный генератор изображений по текстовому описанию.

Canva — не первый графический редактор, в котором используется ИИ. Но у него ниже порог входа, он ориентирован не на профессиональных дизайнеров, а на всех, кому приходится так или иначе работать с изображениями — создавать презентации, подбирать картинки для публикаций в соцсетях, верстать несложные сайты. По состоянию на 2023 год у Canva более 6 млн командных подписчиков и около 125 млн пользователей совокупно.

Сама Перкинс избегает терминов «технологии», «искусственный интеллект», предпочитая слово «волшебный». «Мы верим, что наши клиенты действительно хотят волшебства, а не технологической экосистемы, о которой много говорят…» — говорит она в интервью Fortune.

Элис Чан: виртуальная «примерка»
PERFECT CORP.

Элис Чан: виртуальная «примерка»

Еще в 2014 году Элис Чан придумала YouCam Perfect — бесплатное приложением для редактирования селфи. Оно «отбеливало» зубы, убирало дефекты кожи и темные круги под глазами. Только за первый год без какой-либо рекламы его скачали 17 млн раз.

«Я считаю, что стремление к красоте — это неотъемлемая потребность каждого человека», — говорила Чан. В 2015 году она основала Perfect Corp, которая разрабатывает приложения для «примерки» макияжа. Ее основные клиенты — бьюти-гиганты вроде Estée Lauder, Shiseido, Chanel и Revlon. Сомневающимся потребителям проще решиться на покупку, особенно в интернет-магазине, если они могут посмотреть, как тот или иной косметический продукт будет смотреться на лице.

Сейчас компания зарабатывает $47 млн в год и рассматривает для дальнейшего развития рынок пластической хирургии и эстетической стоматологии.

Кэтрин Кроусон: бум нейросетей
DR

Кэтрин Кроусон: бум нейросетей

В 2021 году в развитии и распространении генеративного ИИ произошел скачок. Компания OpenAI представила нейросеть DALL-E, которая создавала изображения по текстовым запросам, и выложила в открытый доступ математическую модель CLIP — она в работе DALL-E занимается проверкой того, насколько получившееся изображение соответствует текстовому запросу. Сам генератор DALL-E опубликован не был, зато широкой аудитории оказался доступен другой, под названием VQGAN. Совместно с CLIP он стал общедоступным инструментом для генерации картинок. Его опубликовала его соавтор, программистка Кэтрин Кроусон.

Чтобы начать использовать VQGAN+CLIP, нужно уметь хотя бы немного программировать, но все же этот инструмент гораздо доступнее широкой аудитории, чем математические модели той же OpenAI. После публикации VQGAN+CLIP соцсети и форумы наводнили сгенерированные с его помощью изображения. А затем начали появляться программные оболочки для тех, кто программировать не умеет. Например, веб-приложение NightCafe, созданное изначально для переноса стиля (это когда вы даете нейросети запрос вроде «нарисуй героев сериала «Симпсоны» в стиле Ван Гога»), подключило VQGAN+CLIP, чтобы начать генерировать изображения по более сложным запросам.

«Результаты настолько шокируют, что многие, кажется, просто не могут в это поверить, — сказала Кроусон в интервью Vice. — CLIP обучается на 400 млн пар изображение/текст. На таком масштабе мы начинаем видеть способности, которые раньше видели только у людей-художников, например, способность к абстракции или к проведению аналогий».

При участии Ульяны Лесновой

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+