К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего браузера.

Воплощенный ИИ: как на робототехнику повлияет развитие искусственного интеллекта

Фото Getty Images
Фото Getty Images
Придуманное, как известно, Карелом Чапеком слово «робот» изначально означало искусственное человекоподобное создание, поведение и способности которого напоминали человеческие. В реальной жизни именно такие роботы долго были на периферии, выступая скорее выставочными диковинами и героями антиутопий, чем реальными акторами в экономике. Однако с бурным развитием ИИ робототехника может перейти на новый уровень, полагает директор по стратегическому маркетингу «Яндекса» Андрей Себрант

До сих пор бурно развивались и во многом определяли технологический прогресс механические специализированные роботы, не отличающиеся антропоморфностью (всем знакомы картинки безлюдных сборочных конвейеров или логистических комплексов). С развитием IT возникли роботы и вовсе бестелесные: например, те, что позволяют поисковым системам сканировать интернет, или боты в мессенджерах.

Теперь параллельная эволюция механических и программных систем дошла до уровня, когда фантазии писателей можно не только воплотить, но и превзойти. И финальный толчок, запустивший этот процесс, был дан развитием ИИ.

Весь прошлый год (и I квартал текущего) основные новости мира высоких технологий крутились вокруг гонки больших языковых моделей и совершенствования продуктов на их основе, в первую очередь — текстовых интерфейсов к ИИ. Мы потихоньку привыкали, что на вход ИИ можно подать и картинку, а сам генеративный ИИ умеет не только полезные тексты создавать, но и все больше совершенствуется в создании изображений, видео и звуков (от человеческих голосов до музыки).

 

В той сложной суперпозиции материального и цифрового миров, в которой мы нынче живем, ИИ явно продолжал оставаться преимущественно на цифровой стороне, мало взаимодействуя напрямую с материальным миром и проявляя себя в нем. Эта оторванность от физического окружения справедливо считалась одним из критических недостатков языковых моделей: они функционировали на основе словесных описаний мира, а не непосредственного практического знания о нем. Но именно поэтому большие языковые модели и называются языковыми, это ограничение встроено в них по определению.

Наступивший год явно обещает нам большой прогресс в области ИИ, имеющего прямой телесный опыт взаимодействия с материальной стороной окружающего мира (embodied AI). Соответствующими продуктами прежде всего окажутся человекоподобные роботы, ПО которых основано на языковых моделях, но не ограничивается ими.

 

Самое яркое обещание скорых серьезных новостей в этой области прозвучало от человека, который располагает большими, чем кто-либо еще в мире, ресурсами для воплощения своих слов — Дженсена Хуанга, руководителя Nvidia. Выступая в марте на конференции Nvidia GTC 2024, важнейшем событии в технологическом мире, он сказал: «Создание фундаментальных моделей для человекоподобных роботов общего пользования является одной из самых важных задач, которые сегодня решает ИИ. Все необходимые для этого технологии сходятся в одной точке, чтобы позволить специалистам по робототехнике всего мира совершить прорыв в область artificial general robotics». Специально оставляю без перевода последние три слова, которые четко отсылают к термину artificial general intelligence — великой цели для разработчиков ИИ и страшилке для алармистов.

Хуанг не ограничился общими словами. Он представил Project GROOT (Generalist Robot 00 Technology), в рамках которого робот не только способен понимать естественный язык, но умеет учиться совершать осмысленные движения, просто наблюдая за действиями человека. В итоге робот демонстрирует хорошую координацию и ловкость, уверенно перемещается и взаимодействует с окружающим миром на основе собственного обучения, без необходимости закладывать в него заранее созданные алгоритмы.

Nvidia далеко не единственная компания, демонстрирующая впечатляющий прогресс ИИ-робототехники, хотя ее чипы и платформы действительно играют огромную роль. За последние месяцы многие компании, от техногигантов до небольших стартапов, продемонстрировали очень впечатляющих роботов. Впечатляющих в первую очередь визуально наблюдаемыми отличиями от моделей прошлых лет: скоростью движений, их плавностью и ловкостью. Яркий пример — разработки канадской компании Sanctuary AI, отказавшейся от массово применяемых электромоторов в пользу гидроприводов, обеспечивших недоступную раньше плавность движений робота Phoenix без потери скорости. Скорость важна с точки зрения не только производительности, но и восприятия роботов людьми), беглая речь и уверенные быстрые движения робота Figure заставляют даже скептично настроенных людей воспринимать его как партнера, помощника, коллегу. Вообще последние несколько месяцев демонстраций человекоподобных роботов показывают, что опасения эффекта «зловещей долины» сильно преувеличены — люди в основном вполне доброжелательно относятся к все чаще попадающимся им умным механическим помощникам.

 

Накопление роботами опыта взаимодействия с физическим миром отражается в улучшении используемых в них моделей и расширении возможных применений, но одновременно это принципиально важно для всего развития ИИ, который чем дальше, тем больше нуждается в своей адекватной модели мира, построенной не только на текстовых описаниях. Ведь и специалисты OpenAI, представляя нашумевшую модель генерации видео по текстовым описаниям SORA, отмечали, что ее смысл не в том, чтобы изменить работу Голливуда, а в создании универсальных симуляторов физического мира для развития ИИ.

Можно уверенно ожидать, что взаимозависимый прогресс моделей и технологий робототехники уже в ближайший год даст вполне материальные и наблюдаемые в физическом мире результаты — и не только на заводах Mercedes.

Мнение редакции может не совпадать с точкой зрения автора

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+