В конце августа в Ванкувере прошел чемпионат мира по игре Dota 2. Счастливые финалисты заработали $11,2 млн. Но для мира важнее события, которые произошли за пределами турнирной таблицы. На этом чемпионате проводятся официальные поединки между командами людей и компьютерной системой на базе искусственного интеллекта (ИИ). Может ли устоять человек перед силой «глубокого обучения», «нейросетями» и прочей магией современных технологий?
Компьютер победил сильнейшего шахматиста мира больше 20 лет назад, следующего достижения ИИ пришлось ждать целых 19 лет: в 2016 году программа AlphaGo выиграла 4 из 5 матчей у обладателя высшего звания в этой дисциплине. Несмотря на долгое ожидание, это случилось гораздо раньше, чем прогнозировалось, — считалось, что компьютер сможет победить человека в го не раньше 2020–2025 годов.
Новый уровень Илона Маска
Следующий уровень сложности — компьютерные игры. В игре-стратегии Dota 2 соревнуются две команды из пяти человек. Цель — разрушить базу противника. О сложности игры может говорить например то, что пока ни одной команде в мире не удалось стать чемпионами более двух раз. Именно сложность игры и многообразие используемых стратегий делает задачу создания алгоритма, который мог бы победить команду людей, такой сложной.
Одним из главных катализаторов прогресса в мире ИИ является организация OpenAI, которая поставила перед собой амбициозную задачу — построить алгоритм, который сможет победить в схватке с командой людей. OpenAI была основана в 2015 году создателем Tesla и SpaceX Илоном Маском и президентом самого известного в мире стартап-акселератора Y Combinator Сэмом Альтманом. Среди целей компании — предотвратить концентрацию знаний об ИИ в руках одной группы людей. Заявлено, что компания будет осуществлять мониторинг появления прорывных технологий, скрытых создателями от широкой общественности. Сама OpenAI получила известность благодаря ИИ, создаваемому для победы в Dota 2.
Первые результаты были достигнуты в 2017 году, всего через два года после создания компании, когда разработанный ею алгоритм победил топового игрока мирового рейтинга Dota 2 в поединке «один на один». Стоит оговориться, что игра проходила по упрощенным правилам, например, нельзя было использовать заклинания для скрытия героев. Теперь OpenAI ставит более амбициозную задачу — победить в полноценном командном соревновании, когда в игре участвуют сразу пять человек.
Внутренняя конкуренция
Хотя алгоритм в 2018 году проиграл профессиональным командам, очень значительный прогресс очевиден: в августе 2018 года боты OpenAI выиграли в двух играх у команды игроков-ветеранов, отошедших от регулярного участия в соревнованиях. Правда, проиграли в двух показательных боях командам, одна из которых заняла последнее место в призовом зачете, а другая даже не вошла в список призеров. От дальнейшего участия организация отказалась.
Полагаю, это только начало, и скорость, с которой развиваются алгоритмы, а также снижение стоимости аппаратного обеспечения изменят наш мир до неузнаваемости. Пример с AlphaGo отлично иллюстрирует утверждение Билла Гейтса, что мы всегда переоцениваем события последующих 20 лет, но недооцениваем то, что случится в ближайшие пять.
Один из важных компонентов прогресса — наличие конкуренции. Кроме OpenAI исследования в области игр ведут и другие компании. Например, подразделение Google DeepMind, которое создало победивший чемпиона мира по игре в го алгоритм, создает ботов для компьютерных стрелялок от первого лица. Они уже способны обыгрывать обычных игроков.
Трудности обучения
Главная техническая особенность современных алгоритмов, которые играют в игры, — универсальность и в плане решаемых задач, и по аппаратному обеспечению. После успешного применения в играх их можно будет применить и в прикладных задачах.
Можно сравнить подход Deep Blue, компьютера, который победил Каспарова в 1997 году, и современную реализацию. Deep Blue был спроектирован и построен как шахматный компьютер, были даже разработаны специальные микропроцессоры, которые брали на себя часть вычислений. Применяемые алгоритмы нельзя было использовать больше ни в каких задачах, кроме шахмат.
В отличие от Deep Blue современный подход использует стандартное железо и программное обеспечение, доступное для всех. В частности, AlphaGo работал в облачном сервисе Google Cloud. Но самое невероятное — это алгоритмы. Они устроены так, что в начале ИИ ничего не знает о задаче, которую должен решить. Нет информации ни о правилах игры, ни о взаимодействии с окружающей средой и партнерами по команде и т. п. Программа должна не только всему этому научиться, но и «найти» стратегию поведения для победы.
Очень упрощенно описать принцип обучения ИИ можно так: алгоритм, называемый «сверхточная нейронная сеть», отвечает за зрение. Он обеспечивает связь других частей программы с игровой средой. Другой алгоритм, называемый «обучение с подкреплением», делает множество случайных действий, исчисляемые миллионами, и получает баллы за каждое: сделал движение вперед — получил +1 балл, нанес повреждение герою противника — получил +1 балл. Получил повреждение — балл отнимается, и т. д. Алгоритм набирает опыт, играя множество партий сам с собой. По этому же принципу был устроен и AlphaGo, победивший человека в го.
Ограничение возможностей ИИ
В целом вся высокотехнологичная отрасль движется по пути стандартизации. Так, если раньше обучение ИИ проводилось на центральных процессорах разных производителей или специально создаваемых нейропроцессорах, то в последние несколько лет стандартом стало обучение на видеокартах компании Nvidia. Изначально они применялись для графики, но оказались эффективными помощниками центральных процессоров в различных расчетах.
Также и алгоритмы OpenAI и DeepMind можно будет применить на практике. Многие ИИ-алгоритмы доступны всем желающим буквально несколькими щелчками мыши. В частности, сверхточные нейронные сети широко применяются в программах распознавания образов, они используются внутри Google Photo, фотоальбомах Apple, самоуправляемых автомобилях и т. д.
Но существующие алгоритмы пока не универсальны, они имеют свою специализацию. В той же Dota 2 применяются решения, которые заточены специально под определенные характеристики игрового мира. Это значит, что для решения других задач, например, игр иного класса, потребуется не только тюнинг существующих алгоритмов, но и создание принципиально новых, которые требуют дополнительных исследований.
Также и применение на практике — любые алгоритмы пока имеют узкоспециализированное применение, хотя ученые мечтают о создании универсального ИИ, который, как человек, сможет решать любые задачи. Но скорость, с которой происходит развитие самообучающихся алгоритмов, вызывает беспокойство о том, как они будут применяться.
Моральная дилемма
Моральные вопросы волнуют исследователей ИИ не меньше, чем создателей атомной бомбы. Они готовы разрабатывать технологию, но задумались о последствиях ее применения раньше коллег из Манхэттенского проекта. В 2014 году при покупке корпорацией Google компании DeepMind (сумма сделки около $400 млн, по данным Reuters) условием сделки было создание в интернет-гиганте коллегии по этике. Планы корпорации в этом году вернуться в Китай привели чуть ли не к восстанию сотрудников, считавших недопустимыми фильтровать контент. Сотрудники Microsoft и Google массово протестовали против контрактов с военными, что показывает стремление индустрии к открытости.
Возможно, OpenAI и Google DeepMind ведущие игроки на рынке ИИ, но точно не единственные, они просто публичны. Трудно оценить, что происходит в Китае и Корее, наряду с США являющихся крупнейшими центрами притяжения для талантливых специалистов по ИИ со всего мира. Так, в 2017 году Китай объявил о намерении стать лидером в области ИИ к 2030 году, потратив на это $22 млрд только государственных средств.
Теперь мир стоит перед проблемой, как поступить с знаниями по ИИ: открыто распространять как OpenAI или прятать в секретных разработках по азиатскому примеру? Дело в том, что последствия применения ИИ превосходят влияние на мир создание ядерной бомбы. Ведь для того, чтобы создать атомную электростанцию или термоядерный заряд, требуются ресурсы целых стран. А полезное или вредоносное приложение на базе ИИ может быть создано одним программистом с помощью имеющихся в открытом доступе готовых программных средств.
OpenAI считает, что ИИ должен быть доступен всем без ограничений. Хорошим примером из истории может быть получение СССР западных секретов атомной бомбы — ядерный паритет на долгие годы заложил основы мировой стабильности.
Альтернативное мнение — такой подход больше похож на раздачу «ядерных чемоданчиков» большому количеству людей. Не очень сложно представить, что могут сделать несколько способных парней, разочаровавшихся в современном мироустройстве, на существующих вычислительных мощностях. И даже думать не хочется, что может натворить группа сильных ученых при государственной поддержке в какой-нибудь закрытой экосистеме.
Участие OpenAI в чемпионате Dota 2 показало, что пока даже у тех, кто находится на переднем крае исследований в области ИИ, нет алгоритмов, позволяющих построить универсальную машину, которая будет управлять значительными ресурсами и побеждать человека в 100% случаев. Это хорошая новость. У нас еще есть время, чтобы решить не только технологические, но и моральные вопросы: что можно позволить ИИ, чтобы он не разрушил жизнь своих создателей.