«Яндекс» представил прототип нейросети для генерации изображений

Тимур Батыров Редакция Forbes

«Яндекс» представил прототип нейросети для генерации изображений — своего конкурента DALL-E и MidJourney. Приложение «Шедеврум» доступно на iOS и Android. «К моменту финального релиза оно сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», — обещают в компании

«Яндекс» выпустил бета-версию приложения «Шедеврум», которое позволяет генерировать изображения с помощью нейросети. Программа доступна в Google Play и App Store.

«Технология для генерации картинок нейросетями работает в бета-режиме. Чтобы поучаствовать в бета-тестировании, нужно скачать приложение, подать заявку и дождаться своей очереди», — указано в описании «Шедеврума».

Картинка генерируется на основе описания, в котором при желании можно указать нужный стиль. Вводить запрос можно на английском и русском языках. «Искусственный интеллект представит четыре картинки на выбор, а вы сможете опубликовать лучшее изображение. Количество попыток не ограничено», — говорится в описании.

Нейросеть генерирует картинку по методу каскадной диффузии: сперва создает изображение в соответствии с запросом, затем увеличивает его разрешение и добавляет детали, говорится в сообщении «Яндекса». Первую версию приложения обучили на 240 млн картинок с текстовыми описаниями, сейчас обучение продолжается на наборе из 500 млн примеров, добавили в компании.

Материал по теме

«К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», — пообещал руководитель управления машинного интеллекта и исследований «Яндекса» Алексей Гусаков, слова которого приводятся в релизе.

По данным на 15:59 мск, акции «Яндекса» на Мосбирже снижались на 0,16% и стоили 1902 рубля.

«Яндекс» не первым представил своего конкурента нейросети DALLE от OpenAI и программы Mindjourney. В июне 2022 года «Сбер» показал нейросеть Kandinsky, доступную в мобильном приложении «Салют». Накануне «Сбер» представил улучшенную версию нейросети — Kandinsky 2.1. В компании заявили, что она может не только создавать изображения, но и «смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна».