Поднебесные технологии: чем запомнилась конференция по искусственному интеллекту WAIC
AI для всеобщего блага
В Китае сегодня насчитывается более 240 AI-моделей с числом параметров выше 1 млрд — в России и других странах количество таких моделей можно пересчитать чуть ли не по пальцам. В КНР разработчиков продуктовых софтверных решений на базе GenAI кратно больше, чем в нашей стране, а потому узнать, как Китай развивается в условиях внешних ограничений, было крайне интересно.
Лейтмотивом WAIC 2024 стала тема искусственного интеллекта для всеобщего блага. Помимо собственно конференции, на WAIC состоялся и правительственный форум — High Level Meeting on AI Governance — с участием министров и делегаций из России, стран СНГ, Латинской Америки, Ближнего Востока, Азии и Африки, а также более 500 компаний. В Шанхай приехали такие IT-гиганты, как Tesla, Amazon Web Services, Microsoft, Google, Schneider Electric, Dell, Siemens и технологические корпорации. Не обошлось и без локальных бигтехов — Alibaba, Huawei, Tencent и других.
WAIC — масштабный и весьма представительный форум: 1500 стендов, 300 000 посетителей, 2 млрд просмотров трансляции, тематические и панельные сессии, посвященные регуляторике и этике, безопасности и использованию AI в фундаментальных науках, промышленности, образовании, бизнесе, технологиям генеративного ИИ и другим трендам.
На WAIC выступили мировые AI-хедлайнеры, именитые ученые и разработчики — Юрген Шмидхубер, Йошуа Бенжио, Михаэль Бронштейн, Дон Сонг. Они рассуждали о глобальных рисках развития ИИ и его надежности, представили результаты исследований методов обучения больших языковых моделей и особо остановились на развитии AI-агентов. Много говорили о стартапах, инвестиционной инфраструктуре для них и инструментах господдержки. Baidu, Alibaba, ByteDance и другие техногиганты представили интересные кейсы применения AI в промышленности и сфере развлечений. Характерно, что китайские компании, особенно стартапы, готовы показывать даже «сырые» продукты, действуя по принципу «главное — ввязаться в бой, а там посмотрим».
Мнение визионера
Интересным прогнозом о развитии рынка ИИ на WAIC поделился основатель и CEO Baidu Робин Ли Яньхун. Он считает, что проприетарные модели — такие, как ChatGPT и Wenxin Yiyan (Ernie Bot) — эффективнее, чем open-source модели. Baidu использует стратегию «Проприетарные модели + публичное облако» для конечных пользователей: высокая эффективность AI при низкой стоимости. Для бизнеса же компания предлагает только проприетарные решения.
Глава Baidu не ждет, когда появятся AI-суперприложения, полагая, что лучше сейчас создавать приложения на основе фундаментальных моделей. Для каждой такой модели в Китае разрабатывается приложение с чат-ботом или веб-сайт. По мнению Ли, создание Al-агентов в будущем станет проще, что позволит новичкам разрабатывать собственных интеллектуальных агентов с базовыми навыками и совершенствовать. Процесс поиска решений для удовлетворения новых потребностей людей станет инновационным процессом, который будет лежать в основе их эволюции.
Исследование Baidu показало, что крупные LLM-модели не всегда успешно работают в различных сценариях. Лучше использовать модель меньшего размера, но предварительно точно настроенную под конкретный сценарий. Ли Яньхун считает, что большинство малых моделей работают быстрее и имеют меньшие затраты на инференс (процесс работы уже обученной нейросети на конечном устройстве).
Ценовая война в сегменте LLM практически неизбежна, так как стоимость сервисов на базе LLM уже снизилась до довольно низкого уровня, убежден глава Baidu. Это может привести к тому, что у разработчиков появится мотивация создавать различные приложения на базе LLM, и ИИ быстрее проникнет во все сферы жизни. Технологический предел для развития LLM все еще очень высок. Растет потребность в талантливых специалистах, вычислительных мощностях и датасетах для обучения следующего поколения больших моделей. Конкуренция в этой области усилится.
Embodied AI как драйвер робототехники
Помимо речей, WAIC-2024 отличилась множеством представленных умных роботов, в том числе антропоморфных. Как считают эксперты, в ближайшее время может состояться значительный прорыв в Embodied AI — ИИ, который умеет физически взаимодействовать с реальным миром. Здесь на сцену выходят человекоподобные роботы, чей софт строится на языковых моделях, но не ограничивается ими. Внедрение AI не только позволяет таким роботам лучше взаимодействовать с окружающим миром и человеком, но и помогает в развитии сенсорики.
На WAIC мы насчитали более 50 роботов. В результате сложилось впечатление, что компании на выставке поддерживают тренд на замену людей цифровыми технологиями или физическими роботами в некоторых локальных сценариях. При этом примерно половина показанных роботов ранее не демонстрировались на World Robotics Conference — профильной ежегодной выставке в Пекине. Это говорит о высоких темпах развития не только виртуального направления Al, но и Embodied AI.
Любопытно, что большинство экспонентов, включая знаковые компании, напрямую с ИИ не связаны. Это, скорее, маркетинговый ход для привлечения внимания к собственным разработкам и поиска будущих инвесторов или покупателей. Например, на выставке можно было заметить пассажирский мультикоптер EHANG или Cybertrack от Tesla.
Made AI in China
Как и любая крупная международная конференция, WAIC не обошлась без анонсов решений. Преимущественно от местных бигтехов. Исследовательское подразделение Alibaba Group — Alibaba DAMO Academy — показало публике универсальную платформу Xunguang для создания видео под ключ. Компания внедрила AI-инструменты в процесс разработки сценария, дизайна раскадровки и редактирования видеоматериалов. Теперь пользователи могут настраивать виртуальных персонажей, которые будут задействованы в ролике. В платформе можно редактировать как AI-контент, так и обычные материалы. Сейчас Xunguang находится на стадии внутреннего тестирования.
Tencent продемонстрировала собственную модель Hunyuan Foundation вместе с приложениями Tencent Yuanbao и Tencent Yuangi. Цель — повысить эффективность выполнения рабочих задач и дать новые возможности в сфере досуга и развлечений. Пользователям доступен AI-поиск, суммаризация документов, создание текстов по заданным промптам, креативное рисование и генерация аватаров. То есть классическая функциональность генеративной модели в едином окне.
Kingsoft показал обновленный функционал WPS AI — аналога ИИ-помощника от Microsoft Copilot. В продукте больше 20 наработок, включая генерацию презентаций одним щелчком и оптимизацию написания текста с автоматически генерируемым контентом. WPS AI почти в 10 раз дешевле Microsoft Copilot и обслуживает уже более 600 млн активных устройств по всему миру. К тому же он может интегрироваться с локальными AI-моделями, например, от стартапа Zhipu AI, что позволяет ему лучше справляться с офисными задачами на китайском языке. К слову, Zhipu AI — пекинский стартап, который называют одним из четырех новых «тигров ИИ» Поднебесной и прямым конкурентом Google и OpenAI. В прошлом году Zhipu одним из первых получил одобрение правительства на публичное внедрение AI. С тех пор компания выпустила модель с открытым исходным кодом ChatGLM, а также чат-бота под названием Qingyan. Alibaba и Tencent в 2023 году вложили в компанию более $340 млн, а сегодня продуктами Zhipu пользуются более 400 000 корпоративных пользователей.
Еще одна китайская компания — SenseTime — анонсировала обновления SenseNova 5.5. Они включают SenseNova 5o — первую в Китае мультимодальную модель, которая работает в режиме реального времени на уровне новой версии самой популярной нейросети в мире GPT-4o от OpenAI, а в чем-то и лучше. Благодаря сбору и обработке аудио, текстов, изображений и видео SenseNova 5o обеспечивает совершенно новый интерактивный AI-опыт. Сегодня SenseNova внедрена у 3000 государственных и корпоративных заказчиков.
Наконец, Tesla представила WAIC Optimus Gen 2 — нового антропоморфного робота с улучшенной мобильностью и функциональностью. Обновленный Optimus оснащен собственными приводами и датчиками, включая шею с приводом 2-DoF (Degrees of freedom, степень подвижности), и может ходить на 30% быстрее, чем его предшественник. Tesla уже начала интегрировать роботов-гуманоидов в свои производственные процессы. Впрочем, робот был представлен в статике, поэтому оценить его функциональность не получилось.
В целом выставка произвела большое впечатление. И не только благодаря значительным масштабам — любое приоритетное направление в стране с почти 1,5-миллиардным населением и второй по размерам экономикой мира просто обречено на грандиозность. Дело еще и в том, что многие из представленных разработок бесспорно относятся к «высшей лиге» современных технологий AI, хотя за пределами Китая об этих разработках, порой, знают лишь немногие специалисты. У российских и китайских исследователей в области AI есть большой потенциал сотрудничества, которое в будущем может принести пользу не только нашим странам, но и развитию технологий во всем мире.
Мнение редакции может не совпадать с точкой зрения автора