Не восхищать, а зарабатывать: как в 2025 году изменится отношение к генеративному ИИ
Объяснимое и вероятное
Для начала очевидное: рынок сервисов на основе генеративного искусственного интеллекта будет расти. По прогнозам Polars Market Research, к 2032 году глобальный объем рынка больших языковых моделей вырастет до $61,74 млрд, среднегодовой темп роста составит 32,1%.
В России почти та же история: согласно данным MTS AI, рынок сервисов с LLM (Large Language Models, большие языковые модели) с 2025 по 2028 год будет расти со среднегодовым темпом в 25%, а по итогам 2024-го его объем составит 35 млрд рублей. Но подход любого бизнеса к внедрению ИИ-сервисов изменится. Венчурные инвесторы перестанут заваливать мешками денег стартапы только из-за того, что в их питчах упоминается AI и его производные, а топ-менеджеры будут куда более осмотрительно внедрять ИИ во все бизнес-процессы, от контроля брака на производстве до уборки помещений, внимательно оценивая потенциальную эффективность инноваций. А крупнейшие инвесторы текущих глобальных лидеров индустрии, той же OpenAI, будут все настойчивее требовать коммитментов по прибыли.
Оттого в 2025 году миссией генеративного ИИ будет не восхищать, пугать или давать надежду, а зарабатывать. Или, по крайней мере, не тратить так много.
«Прожорливость» ИИ станет большой проблемой
Все большее распространение сервисов с генеративным ИИ уже приводит к росту нагрузки на вычислительную инфраструктуру, а значит, и энергетику. Согласно данным McKinsey, спрос на мощности дата-центров каждый год будет расти на 19-22% до 2030 года. В конкретных цифрах — спрос на энергию, формируемый дата-центрами, задействованными в обеспечении работы ИИ, вырастет с текущих 60 ГВт до почти 300 ГВт к 2030 году. По прогнозам Gartner, к 2027 году недостаток электроэнергии будет ограничивать работу около 40% действующих центров обработки данных, задействованных в обучении ИИ-моделей. Энергии на всех не хватит.
Поэтому крупнейшие игроки пытаются найти выходы из сложившейся ситуации. Глобально здесь есть два направления работы. Первый — развитие собственной энергетической инфраструктуры. По такому пути уже пошли в Google — компания в этом году заключила сделку с Kairos Power, которая построит несколько модульных ядерных реакторов специально для нужд Google. Второй путь — это оптимизация энергопотребления и вычислений. Покупка Nvidia израильского стартапа Run.ai (сумма сделки могла составить около $1 млрд), разрабатывающего решения для оптимизации вычисления на GPU, — хороший пример этого тренда.
При этом проблему дефицита вычислительных мощностей и нехватки энергии можно решить не только технологически, но и через работу с новыми бизнес-моделями. Например, через вывод на рынок платформы распределенных вычислений — она позволит владельцам мощных компьютеров или вычислительных кластеров напрямую сдавать свои мощности в аренду AI/ML-разработчикам, испытывающим нехватку вычислительных мощностей для реализации своих проектов. Такое решение позволит решить проблему нехватки вычислительных мощностей и даст дополнительные возможности заработка владельцам мощных компьютеров и вычислительных кластеров.
Частная практика
Главная цель 2025 года — это превратить уже существующие сервисы с генеративным ИИ из красивого бантика, который нравится акционерам, в работающие решения. Один из путей решения этой цели — делать ИИ более «частным». Мы увидим расцвет рынка узконаправленных ИИ-сервисов, которые будут решать не общие, а конкретные задачи. Проще говоря, это помощники врачей определенных специальностей, учителей, инженеров или ученых, натренированные именно на массиве данных из той сферы, за которую они отвечают. Такие сервисы, возможно, не смогут достоверно ответить на вопрос об истории Столетней войны, но быстро дадут точную информацию по профильной теме с минимальной погрешностью.
Понятный пример — внедрение таких узконаправленных ИИ-сервисов в медицине для помощи врачам. ИИ-помощник терапевта не сможет написать курсовую работу, но будет в состоянии дать пояснения по жалобам пациентов в приемном отделении. Это поможет организовать базовую фильтрацию пациентов, а значит, разгрузить врачей.
Другая сторона тренда — появление спроса на персональных ИИ-агентов у частных лиц. Это значит, что на рынке будет появляться все больше ИИ-сервисов, обученных на массиве информации, касающейся конкретного человека или семьи. Благодаря этому персональные ИИ-агенты будут мгновенно удовлетворять запросы своего владельца с учетом всех его особенностей. Представим, что владелец такого ИИ-агента болен диабетом. Он просит сервис собрать корзину еды для заказа в сервисе доставки. ИИ-агент помнит о болезни владельца и поэтому не включает в корзину определенные продукты.
При этом набор ИИ-агентов, решающих узкие задачи как в отдельных отраслях, так и для отдельных людей, будет управляться специальным агентом, задача которого — оркестрировать ИИ-сервисы. На рынок выйдут модели, задача которых будет в том, чтобы управлять моделями поменьше, распределяя задачи и контролируя результат.
В переносном смысле
Текущая модель работы сервисов с генеративным ИИ под капотом предполагает постоянную связь девайсов с облачными серверами. Так, прежде чем ответить на вопрос о погоде на улице, ваша умная колонка должна обратиться на сервер, узнать ответ и вернуться с ним. Все это предполагает задержку ответа. В каких-то случаях это полсекунды, в каких-то — несколько секунд. Но главная проблема в том, что с учетом роста количества IoT-устройств с умными элементами растет вместе с объемом передаваемого трафика и нагрузка на сети, а вся инфраструктура все сильнее зависит от стабильности конкретных ЦОД. Одно дело, если от неполадок в ЦОД замолчала умная колонка — тут задержки или проблемы со связью можно потерпеть. Но когда речь идет об устройствах, от которых требуется работать без перебоев, например о сети видеокамер, распознающих злоумышленников, или о медицинских устройствах, — цена вопроса кардинально иная.
В последнем случае стабильность и безопасность работы систем может обеспечить распределенный edge-computing — развертывание малых и средних ИИ-моделей непосредственно на устройствах. Что-то вроде того, что показано в фильме «Терминатор» — когда устройство благодаря собственной ИИ-модели на борту будет самостоятельно принимать решения, не обращаясь в облако. Развитие именно этого направления мы увидим в 2025 году в том числе из-за развития рынка человекоподобных роботов. По моим данным, роботы Tesla Optimus уже способны выполнять часть функций без подключения к сети. Бояться этой революции бессмысленно, ибо она уже идет — с нами или без нас. Мы можем лишь возглавить ее.
Мнение редакции может не совпадать с точкой зрения автора