Александр Никулин
Научно-исследовательская
лаборатория Tinkoff Research
Меня ведет мое любопытство. В школе я с интересом учился в биоклассе, потом — на социологическом факультете ВШЭ. Но больше всего меня увлекло машинное обучение, потому что оно меняет мир на глазах.
Благодаря машинному обучению система может, как человек, научиться выделять признаки и по ним, например, отличать кошку от собаки. Нейросети обычно обучаются с помощью методов глубокого обучения, и к ним относится обучение с подкреплением, которым я занимаюсь.
ML-специалист может даже не быть крутым математиком. Главное — любопытство и страсть, желание постоянно учиться новому и много работать.
Я получил премию Yandex ML Prize за статью об оценке неопределенности в обучении с подкреплением. Что это значит? Если, например, мы хотим научить автомобиль самостоятельно ездить по улице, то учить будем не в городе: это опасно. Мы будем учить на больших данных, которые все равно не включают все возможные ситуации. Оценка неопределенности помогает машине выбирать наиболее оптимальные действия: например, не поворачивать направо там, где обычно поворачивают налево.
Нашу группу, как и многих в индустрии, сейчас интересует создание огромных базисных моделей ИИ — такая задача под силу скорее бигтех-компаниях с большими ресурсами. Академические ученые все чаще делают объединенные международные проекты, у которых может быть 50–100 авторов.
- документальный фильм AlphaGo (2017, США)
- книга «(Не)совершенная случайность. Как случай управляет нашей жизнью» Леонарда Млодинова
- видео об обучении ИИ играм: Training AI to Play Pokemon with Reinforcement Learning, A.I. Learns to Drive From Scratch in Trackmania, Learning to play Minecraft with Video PreTraining, The Full Implications of A.I. in Minecraft
- видео об искусственных формах жизни: Lenia: Expanded Universe, Karl Sims — Evolved Virtual Creatures, Evolution Simulation, 1994
Владислав Куренков
Научно-исследовательская
лаборатория Tinkoff Research
Школьником я заинтересовался искусственным интеллектом благодаря компьютерным играм и книгам Яна Миллингтона. На студенческой стажировке я понял, как много можно сделать с помощью машинного обучения с подкреплением.
Машинное обучение с подкреплением позволяет машинам учиться путем проб и ошибок, взаимодействуя со средой. А если это дорого или опасно, как, например, обучать беспилотные автомобили ездить прямо на городских улицах, то используется офлайн-обучение с подкреплением. Сегодня этот метод востребован в самых разных сферах, включая финтех.
Основное отличие академических и индустриальных исследований — в ресурсах. Вузы по-прежнему проводят интересные исследования, а в лучших индустриальных лабораториях всегда работают выпускники престижных вузов. Это синергия.
IT-компаниям выгодно работать со студентами. Во-первых, некоторых специалистов проще вырастить, чем найти на рынке. Во-вторых, у студентов высокая мотивация — это очень важно для исследователя, чтобы не выгореть.
Машинное обучение развивается так динамично, что без собственного исследовательского департамента бигтех быстро проигрывает конкурентам в технологиях. Публикации привлекают к компании экспертов и формируют вокруг нее комьюнити разработчиков.
Советы начинающим исследователям. Первый: не бойтесь отказываться от идей. Если не работает, просто забудьте. Второй: найдите свою исследовательскую группу. В одиночку исследование мирового уровня не сделать.
Мы популяризируем машинное обучение с подкреплением, показывая, как хорошо этот метод работает в реальных продуктах. Мы улучшаем его и выкладываем свои исследования в открытом доступе, ускоряя научный процесс. Я мечтаю, что когда-нибудь наша группа будет создавать самые крутые RL-алгоритмы и делать мир лучше.
- ChatGPT (генерирует тексты)
- Sora (генерирует видео)
- AlphaGo и AlphaZero (играют в го лучше людей).
Продукты на основе искусственного интеллекта:
Айдар Булатов
МФТИ
На занятиях мехмата МГУ для школьников я понял, насколько математика интереснее и глубже, чем нас учили. А на третьем курсе я посмотрел видео, в котором нейросеть, как человек, учится играть в Super Mario. Это настолько меня впечатлило, что я начал самостоятельно проходить разные курсы по машинному обучению.
Моя первая научная публикация в аспирантуре МФТИ связана с трансформером — очень популярной моделью нейронных сетей. С ее помощью многие приложения в вашем смартфоне обрабатывают тексты и изображения. Главный ее минус — она не может работать с очень большими объемами информации. В своем исследовании я предположил, что решить проблему можно, добавив модели память.
В области машинного обучения есть традиция — давать броские названия научным статьям. Наша статья 2024 года, например, обыгрывает поговорку о поиске иголки в стоге сена. Еще одна важная традиция — выкладывать научные статьи в открытом доступе, чтобы любой ученый мог использовать твои результаты для новых открытий. Благодаря этому мы вместе достигаем прогресса.
Я загрузил статью в открытый архив и наутро проснулся знаменитым. Наша статья завирусилась в соцсетях, о ней писали многие профильные ресурсы. Мы получили большой отклик от ученых со всего мира, и из этого выросла научная группа из представителей разных стран. Наука — сила, которая связывает людей, горящих общими идеями.
Довести фундаментальное исследование до какого-нибудь продукта — это большая работа разных специалистов, включая инженеров и прикладных исследователей.
Для динамичного развития сферы машинного обучения государство и IT-компании должны готовить новые качественные образовательные курсы. Это увеличит приток кадров из разных областей. А научное комьюнити должно прикладывать усилия, чтобы все исследования продолжали появляться в открытом доступе для широкой аудитории. Моя научная мечта — научить нейросети постоянно учиться и развиваться, как это умеет делать человек.
- Фантастический фильм «Она» (2013)
- Подкасты, например Eye on AI, со специалистами и учеными: Йошуа Бенджио, Джеффри Хинтоном, Яном Лекуном, Ильей Суцкевером.
виртуальные аватары
Анастасия Янина
МФТИ
Стать специалистом в области ML можно не только в профильном вузе. Крупные IT-компании открывают комплексные образовательные программы, например у Яндекса есть двухлетняя Школа анализа данных (ШАД). Студенты таких программ часто находят работу еще до выпуска.
Все знают, как легко сегодня найти базовую информацию почти обо всем. Но есть еще продвинутые системы так называемого разведочного поиска, которые подбирают тематически близкие документы без точного запроса. С их помощью врач или ученый может найти редкие статьи в малознакомой области, а юрист или журналист — обнаружить документ без названия и даты в огромной базе. С развитием нейросетей разведочный поиск становится доступнее для всех.
Один и тот же специалист может заниматься исследованиями в совершенно разных областях: трудиться над системой разведочного поиска и одновременно создавать цифровые аватары. Эти своеобразные виртуальные двойники можно использовать, например, для виртуальной примерки одежды или в телеконференциях. Продукты и сферы не похожи, а методы могут быть одинаковые.
Исследования российских и зарубежных компаний по сути ничем не отличаются: специалисты читают одни и те же статьи, пишут коды, ездят на отраслевые конференции. Но постановка задач может различаться. Так, российские компании в основном ориентируются на потребности внутреннего рынка, а международным приходится учитывать интересы пользователей с разных континентов.
Часто исследовательская работа связана с преподаванием. Преподавание помогает специалисту глубже разобраться в теме. Я, например, даже написала учебник по машинному обучению. Среди студентов я нахожу помощников в своих исследованиях. Но дорогими исследованиями сегодня проще заниматься в высокотехнологичных компаниях. Да и их результаты, возможно, быстрее найдут применение в жизни.
- Книга Стивена Вольфрама What is ChatGPT Doing ... and Why Does It Work
- Для продвинутых в математике — «Глубокое обучение» Яна Гудфеллоу, Иошуа Бенджио и Аарона Курвилля
- Онлайн-курсы
- Профильные конференции и митапы
и федеративное обучение
Александр Безносиков
МФТИ, Yandex Research ML Residency
Мне всегда хотелось заниматься чем-то прикладным: применяешь математику — и видишь эффект.
Распределенное обучение — это про то, как обучать большие языковые модели, которые сейчас становятся просто невероятными. Данные, на которых они обучаются, — это триллионы картинок и текстов. Сложно это все делать в пределах одного вычислительного устройства. Поэтому используют условно целый домик из видеокарт, которые между собой соединяют, вычисления делаются параллельно.
Федеративное обучение — новая парадигма. На наших персональных устройствах — телефонах, планшетах, компьютерах — хранится много полезной с точки зрения машинного обучения информации, которую можно использовать в обучении языковых моделей. Потенциал использования огромный. Например, в медицине: несколько дата-центров, которые хранят информацию о пациентах, могут объединить усилия для обучения одной модели. При этом в каждом из элементов цепочки — приватные данные, они зашифрованы, засекречены, никуда не передаются и остаются на устройствах.
Главная проблема исследователей — как собрать большой вычислительный ресурс. В России такими ресурсами владеют максимум десятки компаний. Поэтому даже мы в пределах Физтеха, обучая какие-то даже не самые большие модели, используем распределенные подходы.
Мы начинаем активно исследовать вопросы приватности, атак на данные, модели, лейблы и защиты от этих атак. Актуальны и вопросы эффективности коммуникаций: как передавать меньше, быстрее, стабильнее, а также персонализации обучения. Это все социально важные вопросы. И мы хотим в этом разбираться на уровне передовых мировых исследователей.
Победа в Yandex ML Prize дает, во-первых, статус, который можно использовать в продвижении своих проектов и идей, при подаче на гранты, работе с бизнесом. Ты победитель ML Prize — твои результаты признаны, тебе можно доверять. Во-вторых, Yandex Cloud дает вычислительные мощности. В-третьих, материальная составляющая.
- Нелли Литвак, Андрей Райгородский. «Кому нужна математика? Понятная книга о том, как устроен цифровой мир»
- Айзек Азимов. Любые произведения