Беги или умри: как открытый код и таланты становятся главной силой в революции искусственного интеллекта
До недавнего времени разработка интеллектуальных систем оставалась академической дисциплиной на обочине IT-индустрии. Сегодня же и дня не проходит без новости из мира машинного обучения. Технологии искусственного интеллекта обещают замену наших машин на беспилотные автомобили, сулят создание диалоговых систем, способных полноценно общаться с человеком, и грозят исчезновением целого ряда профессий. В развитии глубоких нейронных сетей мы наблюдаем настоящий бум, а причиной этому далеко не только развитие технологий.
На принципах конкуренции
Основными заказчиками результатов разработок в области искусственного интеллекта являются крупные корпорации — Google, Facebook, Microsoft, IBM, Baidu. А кому как не лидерам рынка знать, что главный двигатель прогресса — конкуренция. Состязательность, стремление быть первым — основа любой области исследований, история знает немало споров о первенстве того или иного научного открытия. В области исследования искусственного интеллекта конкуренция возведена в культ. Крупные компании устраивают открытые соревнования по созданию технологий машинного обучения. Так, компания Amazon в этом году проводит соревнование Alexa prize, направленное на создание разговорного интеллекта, способного общаться с пользователем, удерживая его внимание. Команда-победитель получит $2,5 млн, а компания Amazon — право на использование этой технологии. Принцип поддержки состязательности исповедует и Google — недавно им была куплена платформа для проведения соревнований по решению задач по анализу больших данных Kaggle. Таким образом, к участию приглашаются все желающие, а исследования строятся на принципе соревновательности. В выигрыше оказываются все: компании получают доступ к лучшим интеллектуальным ресурсам, а талантливые программисты — реальное приложение своих технологий.
Новая философия
Именно открытость стала тем триггером, который вывел искусственный интеллект в одну из самых перспективных областей последнего времени — большинство базовых алгоритмов современного машинного обучения публикуется под открытыми лицензиями. Закрытость информации и коммерческая тайна, традиционные для создания передовых технологий, — не тот путь, по которому идет развитие современного искусственного интеллекта. Самый яркий пример здесь — проект OpenAI. Некоммерческая исследовательская компания из Сан-Франциско, одним из основателей который является предприниматель Илон Маск, занимается созданием «открытого» искусственного интеллекта. Результаты фундаментальных исследований в этой области, на которые инвесторы обещают выделить до $1 млрд, публикуются в открытом доступе — это значит, что любой желающий сможет взять эти результаты за основу собственных разработок. Открытые библиотеки, такие как платформа TensorFlow, принадлежащая компании Google, определяют технологические стандарты в области машинного обучения. Входящие в них базовые алгоритмы распространяются под открытой лицензией. Всего же у Google несколько тысяч проектов с открытой лицензией.
Facebook выделила гранты крупнейшим исследовательским центрам по разработке технологий машинного обучения с одним лишь условием — результаты работ должны быть опубликованы для общего доступа. Все участники рынка технологий искусственного интеллекта исповедуют новую философию открытости и кооперации. Открывая свои результаты для публичного доступа, они убирают необходимость разработчикам по всему миру биться над решением одних и тех же задач, расширяя поле для исследовательской деятельности, увеличивая инструментарий и тем самым ускоряя прогресс.
Открытая модель распространения технологий создает ситуацию, хорошо описанную Льюисом Кэрроллом в «Алисе в стране чудес»: нужно бежать со всех ног, чтобы только оставаться на месте, но чтобы куда-то попасть, надо бежать как минимум вдвое быстрее. Сегодня, чтобы удержать лидерство, мало владеть результатами интеллектуальной деятельности, необходимо их постоянно развивать, создавая все новые и новые решения. Поэтому на первое место выходят интеллектуальные ресурсы: люди, способные генерировать новые решения, способные выдержать конкуренцию на глобальном уровне. Открытые проекты позволяют компаниям привлекать к разработке технологий самые лучшие таланты со всего мира.
Новые кадры
Найти эти таланты не так-то просто. Взрывное развитие технологий искусственного интеллекта в последние годы привело к тому, что за счет инерционности системы образования образовался дефицит. Университеты не успевают готовить достаточное количество компетентных специалистов в области машинного обучения. Поэтому к образовательному процессу подключаются IT-компании. Компании активно развивают курсы переподготовки сотрудников, делают спецкурсы в ВУЗах и открытые курсы в интернете. Google, например, разработал онлайн-курс по глубокому обучению, Яндекс запустил целый ряд образовательных программ по анализу данных и машинному обучению в МФТИ, на мехмате МГУ и в Высшей школе экономики, а компания Mail.ru разработала образовательные курсы сразу для нескольких технических вузов.
Достаточно эффективной формой взаимодействия науки и бизнеса является индустриальное партнерство. Финансируя исследовательские проекты, компании получают решение какой-то из своих задач, а научный центр в рамках этого проекта обучает новых специалистов. Примером такого взаимодействия является проект iPavlov (запущен на Физтехе — Forbes). Исследования будут носить фундаментальный характер — они проводятся в рамках Национальной технологической инициативы, реализуемой АО «РВК», и их результатом станет технология, в рамках которой машина сможет вести диалог с человеком — причем обучить ее этому можно на любом из естественных языков. В качестве индустриального партнера выступил «Сбербанк», который на основе этой технологии получит реальный сервис — службу поддержки, которая станет общаться с клиентами банка без участия человека. Институту же это позволит вырастить новое поколение специалистов, которые и по завершении проекта останутся заниматься исследованиями в этой области. Именно этот путь дает нашей стране шансы не только преодолеть нарастающую нехватку кадров в данном секторе исследований, но и заложить основу для создания российской школы нейросетевого машинного интеллекта. Но главное — в рамках проекта будет создана открытая платформа с базовыми инструментами «разговорного» машинного интеллекта, которая станет основой для стартапов и разработок для всевозможных отраслей индустрии.
Объединить усилия
Важно понимать: чтобы наши компании могли конкурировать на международном рынке, мы должны создать открытые платформы на базе университетов, которые будут задавать стандарты в отрасли машинного интеллекта. Этого нельзя достичь без действительно серьезной школы по разработке технологий искусственного интеллекта. Генерация и развитие технологий невозможны без интеллектуальных ресурсов, поэтому бизнес должен кооперироваться с их источником — университетами. При этом необходимо создавать условия для воспроизводства кадров, а не бездумно «высасывать» их из университетов, руководствуясь текущей конъюнктурой. Только объединив усилия, современные IT-компании и ведущие научные центры смогут создать среду, в которой будут создаваться условия для развития новых технологий, способных конкурировать на глобальных рынках.