Гонка искусственных умов: кто и зачем создает аналоги ChatGPT в России
Зачем миру столько клонов ChatGPT
В интернете можно найти десятки альтернатив ChatGPT на любой вкус и кошелек. Есть как бесплатные сервисы, интегрированные в интерфейс, к примеру, Telegram-чатов, так и различные платные опции на тех или иных платформах. Но в основе у всех — большая языковая модель, Large Language Model (LLM). И каждая компания по-своему видит, как можно использовать LLM.
Кто-то досконально повторяет функциональность других чат-ботов. Кто-то — приносит туда что-то свое, новое. В целом никто не гонится за созданием крупных, больших моделей, таких, как GPT. Здесь скорее идет «гонка вооружений» в автоматизации всех процессов: как правильно предподготовить данные, чтобы подать их в LLM, как хорошо составить промпт и т.д. Поэтому компании так часто выпускают свои собственные альтернативы ChatGPT — каждая видит в них свою уникальность и использует их по-своему.
Нельзя не учитывать и такую мотивацию, как пиар. Для разработчика релиз своего бота — это возможность показать всему рынку, как он умеет использовать автоматизацию в работе с LLM. И в этой ярмарке тщеславия участвуют даже самые крупные компании: «Сбер», например, запустил GigaChat, «Яндекс» — YandexGPT. В «Яндексе» чат-бот пока работает в режиме тестирования, но компания уже предлагает интегрировать его в бизнес-приложения и веб-сервисы. «Сбер» в сентябре открыл доступ к GigaChat для всех в виде чат-бота в Telegram. Ранее сервис был доступен для пользователей Сбер ID и был своеобразным дополнительным стимулом стать клиентом экосистемы.
Создать свой ChatGPT: с чего начать
У каждой компании или разработчика причины для создания альтернативы ChatGPT, безусловно, свои. Но есть у всех российских игроков одна проблема: если говорить про исконный ChatGPT от OpenAI, то для подключения к нему нужен VPN, иностранный номер и иностранная карта для оплаты — это неудобно, если в компании многие сотрудники используют чат для решения повседневных задач. Свой чат-бот минимизирует неудобства при небольших вложениях, необходимых для его создания.
Работа с некоторыми чат-ботами на рынке не гарантирует конфиденциальности информации, поскольку зачастую не ясно, как обрабатываются запросы, отправляемые пользователем. Если эти запросы содержат конфиденциальные данные, использование таких ботов может нарушать политику информационной безопасности компаний. Именно поэтому чат-боты зачастую ориентированы на развлекательные функции. В этом контексте необходимо разрабатывать решения с возможностью размещения на собственных серверах (on-premise). Только так можно гарантировать безопасность данных.
Наконец, есть вопрос банальной экономии. ChatGPT или его качественные аналоги — это платные решения. Если в бизнесе ими пользуются многие сотрудники, в месяц на доступ к боту будет уходить приличная сумма. Со своим чат-ботом можно сократить эти издержки.
Так, мы в red_mad_robot используем Daisy — чат-бот, который мы представили в июле 2023 года — как корпоративное решение. Все сотрудники могут подключаться к боту через корпоративную почту и пользоваться им — с определенными лимитами, но это бесплатно. И мы уже видим прирост в производительности в некоторых вопросах, которые сотрудники решают через бота: от написания кода до генерации текстов и изображений. Хотя изначально бот задумывался как ИИ-ассистент для широкого пользователя, он показал такую эффективность, что стал неотъемлемой частью внутреннего рабочего процесса.
Корпоративный ИИ-бот может помочь автоматизировать специфические запросы определенной отрасли бизнеса. Digital-агентство Advertalyze создало Chad — агрегатора нейросетей, где в режиме одного окна можно заказывать текст и иллюстрации по запросу. При производстве контента или рекламных баннеров компания использовала нейросети, но в какой-то момент поняла, что пользоваться зарубежными SIM- и банковскими картами больше неудобно. Решили делать свой сервис: подготовили MVP, протестировали на команде, а потом выпустили на рынок. Оказалось, у многих схожие боли, поэтому Chad быстро взлетел даже без продвижения. Сейчас к платформе подключены нейросети DALL-E и ChatGPT — они через API отвечают на запросы пользователей. Скоро туда добавят Midjourney, планируют подключать и другие нейросети и сервисы.
Стартап TextMark разработал свой SaaS-сервис: ИИ-бота, выполняющего функции помощника SMM-специалиста. Он умеет создавать контент, план публикаций, писать готовые статьи, переписывать существующие. Также этот инструмент может массово генерить SEO-статьи. Его уникальность в том, что он в реальном времени собирает из интернета статьи конкурентов, учитывает контекст и текущую поисковую выдачу, а значит, создает уже оптимизированные тексты. К тому же, он генерирует все это в html-формате — можно сразу разместить и не тратить время на верстку.
Как выбрать ИИ-бот
С точки зрения пользователя есть три основных параметра, по которым можно выбирать генеративного чат-бота: UX/UI, цена и функциональность.
Вероятно, юзабилити будет первым фактором. Все зависит от того, как человек привык пользоваться технологиями: будет ли ему удобно, например, добавить чат-бота в Telegram или он предпочтет скачать отдельное приложение. Некоторые компании делают и отдельный веб-интерфейс — кому-то больше всего понравится такой способ использовать бота.
Второй момент — это, конечно, стоимость. Полностью бесплатных генеративных чат-ботов не существует. Точнее, есть «условно-бесплатные» с опцией апгрейда до премиум-версии. Те разработчики, которые утверждают, что их продукт полностью бесплатный, либо используют модели старого образца, либо вообще не GPT — а, например, некоммерческие лицензии LLaMA или Alpaca: это относительно новые фреймворки, и у них пока нет всей функциональности GPT. Бесплатными также могут быть модели из open-source, и они тоже хорошо справляются с некоторыми задачами, но не в таком объеме, как это умеет делать GPT от OpenAI. Так что для доступа к качественному чат-боту придется потратиться — и тут уже дело пользователя, какую сумму он готов потратить и какому разработчику больше доверяет, готов ли переплачивать за имя и т.д.
Теперь к вопросу о функциональности. Цена тут не гарантирует наличие большого количества опций — и, напротив, можно за приемлемую цену купить максимально приятный, нужный себе функционал. Например, вам нужна расшифровка голосовых сообщений, генерация картинок, подключение к GPT и адекватное количество запросов в месяц — такие варианты есть на рынке.
Будущее генеративных чат-ботов
Сейчас ИИ-боты используют одномодальный Large Language Model — это значит, что есть только один тип данных, которые они принимают. Люди отправляют текст, нейросеть может ответить текстом, кодом, картинкой. В дальнейшем разработчики будут пытаться создать мультимодальную систему.
В Multimodal Language Model (MLM) боты будут использовать разный тип контента: они смогут принять видео, фотографию, документ. И под капотом все будет устроено так, чтобы бот мог работать с разными типами файлов.
Нынешняя гонка чат-ботов может привести к тому, что разработчики сделают хорошие драйверы к разному типу модальностей, то есть к разному типу данных. Ведь к кастомным чат-ботам люди добавляют самую разную функциональность. Например, «пришлите документ Word, и мы сможем вам рассказать, о чем он, сделать краткую выжимку и сохранить ее отдельным файлом». Или «дайте нам аудиозапись, мы ее расшифруем и разобьем на спикеров», или «загрузите видеозапись, мы ее транскрибируем, разделим данные на категории, классифицируем и добавим в базу данных». Все это приведет к тому, что в будущем у нас появятся умные ассистенты-помощники «в кармане», которые смогут одновременно обрабатывать данные и выступать базой знаний.
Сейчас очевидно, что классические нейросети типа ChatGPT или Midjorney в сыром виде приносят мало пользы бизнесу и специалистам на рынке. По статистике разработчика Chad, большая часть пользователей сервиса — школьники и студенты. Поэтому будущее нейросетей — в нишевании, «приземлении» технологий ИИ на нужды конкретного бизнеса и конкретные продукты. Например, можно написать промпты под ChatGPT так, чтобы нейросеть стала корпоративной базой знаний для бизнеса. Или сделать отдельный продукт вроде нейросетевой «обучалки языкам» от DuoLingo. Все это — точки роста для бизнеса.
В итоге в каждой сфере применения генеративных чат-ботов останется несколько лидеров. Бизнес трансформируется, но ИИ-помощники не будут заменять людей полностью. Они будут ускорять и улучшать процессы, с их помощью бизнес станет более эффективным — но это не означает, что люди будут не нужны.
Мнение редакции может не совпадать с точкой зрения автора