Сложности интеграции: что поможет ускорить GPT-трансформацию бизнеса
По версии консалтинговой компании Gartner, генеративные нейросети достигли вершины технологического хайпа. Пользователи ждут от технологий едва ли не чуда, а интерес к GPT со стороны людей и бизнеса зашкаливает: количество поисковых запросов со словом «нейросеть» в Яндексе выросло по итогам 2023 года в девять раз.
Любая LLM (Large language model, большая языковая модель) — это сложная нейронная сеть, которая сначала обучается на огромном количестве источников, а затем генерирует текст в ответ на сообщения пользователя. LLM хранит свои знания в параметрах нейронной сети. В представленном в 2021 году докладе ученые из Microsoft Research и Стэнфордского университета показали, что нейросеть с большим числом параметров работает гибче, а также лучше поддается обучению.
До середины 2022 года мы наблюдали на рынке больших языковых моделей экспоненциальный рост количества параметров LLM, и именно за счет этого они становились умнее. Одна из крупнейших таких моделей — это нейросеть PaLM от Google, первая версия которой насчитывала около 540 млрд параметров. Более поздние LLM, такие как GPT-4, по разным оценкам, имеют примерно 1,76 трлн параметров — разработчики официальных цифр не разглашают.
Потом оказалось, что количество параметров — не главное. Настоящего прорыва удалось достичь за счет обучения на основе отзывов пользователей, а также за счет AI alignment — когда ИИ учат действовать так, чтобы помогать людям достигать желаемых результатов, причем с учетом социальных норм, которым нужно следовать. Примеры ответов на промпты, то есть запросы нейросетям, помогают ИИ лучше понимать, что от него ждут. Сыграла свою роль и методика, при которой создавались немного разные версии модели. AI-тренеры сравнивали их ответы между собой и выбирали модель-победителя. Кроме того, разные версии модели стали конкурировать между собой: в несколько этапов побеждала такая версия модели, ответы которой казались более подходящими AI-тренерам. Эти подходы сделали современные нейросети, такие как GPT-модели, более человечными. Не случайно LLM отлично проходит знаменитый тест Тьюринга.
Несмотря на это, уровень адаптации больших языковых моделей для бизнеса все еще невысок. Согласно опросу McKinsey Global, лишь немногие зарубежные компании оказались готовы к массовому использованию AI. Только 21% респондентов, сообщивших о внедрении искусственного интеллекта, заявили, что разработали конкретные правила использования сотрудниками ИИ. А среди российских компаний только 12% понимают, зачем LLM их бизнесу, — эти данные приводят «Яков и партнеры».
Суммируя зарубежный и российский опыт, можно выделить несколько причин, по которым бизнес не спешит внедрять LLM:
- Непонимание, как ставить задачу модели. Работа с LLM во многом построена на верной постановке задач — написании промтов. Умение формулировать промты для нейросети, чтобы она отвечала так, как тебе нужно, с использованием различных данных, — это новый востребованный скил.
- Нехватка специалистов по GPT. Хотя базовый запрос к LLM может написать каждый, но сделать его высокоточным и стабильным — это уже специальная профессия, промт-инженер. В бизнесе задача усложняется тем, что модель должна работать хорошо даже в условиях ограничений и правил. Для этого задачу разбивают на подзадачи, собирают их в цепочки, совмещают со строгой логикой. Кроме того, для правильной работы моделей нужны AI-тренеры для сбора данных и оценки качества. Все это — новые дефицитные профессии в мире ИИ.
- Неумение дообучить модель или отсутствие ресурсов. Когда дело касается специфических задач, LLM необходимо дополнительное обучение, а для этого нужно собрать качественные данные, показать модели много примеров запросов и правильных ответов. Отсутствие практических навыков, инструментов и ресурсов у бизнеса также часто становится барьером на пути эффективного внедрения LLM.
- Языковой барьер. Большинство генеративных нейросетей обучены на англоязычных данных и не всегда адаптированы под реалии русскоговорящей среды. Архитектура языковых моделей на русском языке делает модели более эффективными, они работают в несколько раз быстрее, а ответы на русском языке становятся более качественными.
- Неготовность работать в облаке. Вопросы, которые беспокоят бизнес при внедрении LLM–решений, — безопасность персональных данных и корпоративной тайны. Компании все еще опасаются передавать чувствительную информацию в облачные сервисы, несмотря на то что облачные провайдеры стремятся обеспечивать безопасность на высоком уровне. Например, в случае с LLM это могут быть сообщения пользователя в поддержку, которые могут содержать персональные данные. Чтобы снизить риски, провайдеры проходят проверку на соответствие требованиям российского закона о персональных данных, а также принимают ряд других мер по защите инфраструктуры и платформы.
- Непонимание границ применимости LLM. У бизнеса сформировались высокие ожидания от LLM. На практике они дают существенный эффект в некоторых областях, таких как программирование, клиентская поддержка, маркетинг и продажи. Чтобы получить этот эффект, недостаточно одной только LLM, нужно создать ряд решений вокруг языковой модели. Например, систему поиска данных и верификации ответа для клиентской поддержки. Для многих задач LLM — слишком дорогое и нецелесообразное решение, и есть варианты попроще.
Правильные задачи для LLM
Простейшая языковая модель умеет примерно то же, что обычный человек с бумагой и ручкой. Это довольно эрудированный человек, отлично знающий русский и английский языки, возможно, прогуливавший математику в школе, но дайте ему немного времени, он научится. Если такой персонаж может сносно решить ту задачу, которую вы для него задумали, то, скорее всего, и языковая модель сможет это сделать.
Следуя этой логике, можно понять, какие задачи LLM делает хорошо:
1. Общается с клиентами
Больше всего запросов на интеграцию LLM мы получаем для автоматизации клиентской поддержки. Например, торговая сеть Ralf Ringer использовала подобное решение, чтобы автоматически отвечать на вопросы клиентов на маркетплейсах и комментировать отзывы о товарах. Как любой новый сотрудник клиентской поддержки, ИИ пока отвечает только на простые комментарии: благодарит за позитивный отзыв, уточняет, какие размеры обуви в наличии и сколько стоит товар. В дальнейшем, если нейросеть обучать на правильном наборе данных, задачу можно и усложнить — уточнять, скользит ли подошва, для какой погоды обувь лучше подходит и как правильно за ней ухаживать.
Автомобильные концерны, например Volkswagen, встраивают GPT в голосовые помощники. Водитель сможет спросить о пробках и погоде или просчитать время движения до соседнего города с учетом средней скорости.
Интересный пример применения LLM предложил Сеченовский университет. Организация хочет создать что-то вроде «тренажера пациента». Робот с генеративной нейросетью будет описывать симптомы, а студент по описанию — учиться правильно ставить диагноз и тренировать софт-скилы для общения с пациентами.
2. Редактирует тексты, делает компиляции
Например, Битрикс24 анализирует содержание разговоров с клиентами и заполняет карточки в своей CRM для клиента с помощью LLM, также выделяя ключевые сущности и факты из расшифровки телефонного разговора. К этой же категории задач относятся истории, когда GPT написал курсовую, диплом или посты в Telegram-канал.
3. Выделяет в тексте сущности: даты, адреса, телефоны
Пример такого кейса — «Яндекс Маркет». Языковая нейросеть в сервисе помогает продавцам на маркетплейсе заполнять карточки товаров из неструктурированного текста, выделяя сущности. Например, для велосипеда: тип — «шоссейный», модельный год — 2022, диаметр колес — 22, и т. д.
Часто подобные запросы связаны с анализом юридических, финансовых и даже медицинских документов. В сфере здравоохранения эта технология помогает выделять важную информацию из лабораторных отчетов и электронных медицинских карт. Это помогает снизить рабочую нагрузку, быстрее и точнее анализировать данные, чтобы в итоге улучшать качество медицинской помощи.
Какие еще необычные задачи бизнес может решить с помощью LLM
Многие клиенты пробуют автоматизировать поддержку, как внешних пользователей, так и своих сотрудников. IT-компании активно внедряют LLM в свои продукты, создавая дополнительную ценность для пользователей. Но и в числе наших заказчиков и в целом на рынке есть компании, которые решают менее стандартные задачи. Например:
- Риск-менеджмент и мониторинг. Нейросети могут проанализировать информационное поле по заданным параметрам. Например, «ДОМ.РФ» следит за новостями по инвестиционно-строительной тематике с помощью LLM. Система собирает новости по заданным источникам и анализирует их тональность. В случае, если информационное поле компании негативное, срабатывают автоматические триггеры. Они выделяют ключевую информацию из публикаций, которая далее передается соответствующим специалистам.
- Интеллектуальный корпоративный поиск. Это что-то вроде привычного поисковика, но по внутренним базам данных компании. С помощью LLM пользователи смогут делать такие запросы на естественном языке, искать документы и файлы по смыслу, а не по ключевым словам, что должно существенно ускорить работу с информацией. Попытки делать такие решения делались и ранее с технологиями Natural Language Processing. Но LLM, обученная на большом массиве данных, будет работать намного более эффективно. Она позволяет не просто искать информацию (такое было и раньше), а получать ответы на свои вопросы и помощь в решении конкретных бизнес-задач на основе этой информации.
- Геймдев. Нейросеть помогает автоматизировать создание диалогов героя с неигровыми персонажами (NPC). Благодаря правильным настройкам разработчика LLM (определение характера, роли, возможностей, влияния на сюжет) оживляет NPC и делает опыт каждого игрока более уникальным и более глубоким.
Что может LLM в связке с другими алгоритмами
- Ранжировать результаты поиска, давать рекомендации товаров и услуг. Для этой задачи много лет существуют рекомендательные системы, которые хорошо адаптированы под поиск информации по большому количеству объектов. При этом, когда вы уже подобрали для пользователя несколько вариантов, например отобрали к рекомендации три товара, то можно обосновать этот выбор, подобрать правильные продающие слова для клиента с помощью языковой модели, опираясь на его предпочтения, историю поиска и покупок или отзывы на другие товары.
- Решать задачи, основанные на строгой логике. Простейшие запросы клиента, например запись на прием к врачу или ее отмена, заявка на смену тарифа или открытие нового счета легко, выполняются с помощью программных роботов с применением строгих классификаторов и регулярных выражений. При этом LLM хорошо работают в сочетании с такими роботами, как «агенты нестрогой логики», для случаев, когда пользователю все же требуется решить вопрос по нестандартному алгоритму. Также LLM помогает гибко формулировать умный ответ в зависимости от контекста вопроса и предоставленной информации и может уточнять данные.
- Помогать в работе, когда цена ошибки слишком высока. Например, мы не можем полностью доверить LLM подготовку финансового отчета для инвесторов, потому что любая ошибка может сказаться на стоимости акций компании. Это не значит, что в таких задачах LLM совсем не используются, но вместо полной автоматизации технология должна выступать в роли ассистента, дополнять и расширять возможности человека, увеличивать его производительность.
Перспективы
Все технологии в своем развитии проходят через хайп на пути к разочарованию и последующему выходу на плато продуктивности. Чем быстрее конкретный бизнес разберется, как ему работать с GPT, тем выше будет его конкурентное преимущество: он окажется среди тех немногих 12%, которые уже понимают, как использовать LLM.
Чтобы применять большие языковые модели эффективно, нужно понимать их логику, разбираться в написании промтов и в том, как в целом работает искусственный интеллект. Важно понимать, для каких именно задач подходят LLM, а в каких вопросах это будет тот самый микроскоп, забивающий гвоздь.
Генеративные нейросети — не волшебная палочка, но во многом они способны помочь компаниям. Благодаря LLM бизнес-процессы будут ускоряться, а в жизни офисных работников станет меньше рутины. За счет ИИ эффективность сотрудников будет постепенно расти. ИИ не конкурент человеку и не объект риска, а мощный инструмент, который при должном контроле и умении принесет большую ценность человеку как виду.
Мнение редакции может не совпадать с точкой зрения автора