«Яндекс» представил прототип нейросети для генерации изображений
«Яндекс» представил прототип нейросети для генерации изображений — своего конкурента DALL-E и MidJourney. Приложение «Шедеврум» доступно на iOS и Android. «К моменту финального релиза оно сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», — обещают в компании
«Яндекс» выпустил бета-версию приложения «Шедеврум», которое позволяет генерировать изображения с помощью нейросети. Программа доступна в Google Play и App Store.
«Технология для генерации картинок нейросетями работает в бета-режиме. Чтобы поучаствовать в бета-тестировании, нужно скачать приложение, подать заявку и дождаться своей очереди», — указано в описании «Шедеврума».
Картинка генерируется на основе описания, в котором при желании можно указать нужный стиль. Вводить запрос можно на английском и русском языках. «Искусственный интеллект представит четыре картинки на выбор, а вы сможете опубликовать лучшее изображение. Количество попыток не ограничено», — говорится в описании.
Нейросеть генерирует картинку по методу каскадной диффузии: сперва создает изображение в соответствии с запросом, затем увеличивает его разрешение и добавляет детали, говорится в сообщении «Яндекса». Первую версию приложения обучили на 240 млн картинок с текстовыми описаниями, сейчас обучение продолжается на наборе из 500 млн примеров, добавили в компании.
«К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только», — пообещал руководитель управления машинного интеллекта и исследований «Яндекса» Алексей Гусаков, слова которого приводятся в релизе.
По данным на 15:59 мск, акции «Яндекса» на Мосбирже снижались на 0,16% и стоили 1902 рубля.
«Яндекс» не первым представил своего конкурента нейросети DALLE от OpenAI и программы Mindjourney. В июне 2022 года «Сбер» показал нейросеть Kandinsky, доступную в мобильном приложении «Салют». Накануне «Сбер» представил улучшенную версию нейросети — Kandinsky 2.1. В компании заявили, что она может не только создавать изображения, но и «смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна».