Нейросети, ИИ и NFT: как женщины развивают IT-технологии в России
Александра Ватьян, развивает ИИ в медицине
Кандидат технических наук, доцент факультета инфокоммуникационных технологий, старший научный сотрудник исследовательского центра в сфере искусственного интеллекта «Сильный искусственный интеллект в промышленности» Университета ИТМО
В детстве Александра мечтала стать космонавтом, ученым или врачом, но в старших классах заинтересовалась программированием. После школы она поступила в петербургский политех на факультет технической кибернетики. Однако своей альма-матер Ватьян считает университет ИТМО, где начался ее научный путь в сфере искусственного интеллекта в медицине.
С помощью ИИ Ватьян с коллегами удалось показать, что возраст больного коронавирусом вовсе не приговор и не главный фактор риска, как утверждалось во многих академических исследованиях. Оказалось, что гораздо важнее отслеживать у пациентов с COVID-19 сопутствующие (в первую очередь сердечно-сосудистые) заболевания и вовремя бороться с их обострениями.
Другая область, в которой работает Александра, — онкологические заболевания, где каждый потерянный месяц или даже день может стоить больному жизни. В рамках сотрудничества с Петербургским онкоцентром вуз решает проблему выбора персональной тактики лечения пациентов и обеспечения его необходимыми препаратами.
Ватьян уверена, что никакое решение, принятое на основе ИИ, не заменит врача и не будет достаточно убедительным для пациента. Но ИИ может стать удобным инструментом в работе медиков: он способен не просто предлагать врачу решение задачи, но и показывать, почему система пришла к такому выводу.
Еще один крупный проект Ватьян — разработка виртуального полигона для проверки и верификации медицинских изделий на основе ИИ. Процесс внедрения таких изделий в клиническую практику зачастую занимает больше времени, чем их разработка, ведь они должны соответствовать многочисленным стандартам. Александра с командой работает над созданием доступного решения на основе сильного ИИ для предварительной проверки медпродукции, чтобы сократить сроки ее внедрения в клинические учреждения.
Анастасия Капралова, обучает ИИ эмоциям
Технический директор Gorky AI, лауреатка научной премии «Яндекса» имени Ильи Сегаловича 2019 года
Анастасия признается, что попала в Data Science случайно: на втором курсе ее пригласили работать в команду, которая занималась классическим машинным обучением, и это направление ее затянуло.
Сегодня Капралова занимает позицию технического директора (СТО) нижегородской компании Gorky AI. Она изучает развитие искусственного интеллекта как с точки зрения исследований и разработки продуктов, так и для популяризации этого направления. В основном проекты компании связаны с компьютерным зрением и обработкой текстов (Natural Language Processing, NLP, — обработка естественного языка). Например, Капралова работает над применением компьютерного зрения в медицине, над мониторингом качества дорожного покрытия и обработкой постов и комментариев в социальных сетях.
Анастасия много работает над распознаванием эмоций в голосе человека и считает, что это важнейший шаг к созданию полноценного искусственного интеллекта. Она уверена, что наделить компьютер чувствами — это тот уровень технологий, к которому и стоит стремиться.
В начале работы ее гипотеза заключалась в том, что за эмоцию в голосе отвечает интонация. Однако все оказалось не так просто: мало того, что у разных людей эмоции проявляются по-разному, так еще и их внешние проявления очень субъективны. Даже люди порой с трудом могут определить, какую эмоцию испытывает говорящий.
Другая проблема заключалась в том, что все известные голосовые треки для обучения ИИ записывались актерами, то есть реакция в них не настоящая, а сыгранная. Команде Анастасии пришлось составлять свой набор данных, который специалисты постарались максимально разнообразить записями голосов с непостановочных видео из интернета и собственных архивов. Дальше исследователи искали закономерности в звуках и в итоге смогли создать достаточно точный алгоритм.
Капралова считает, что подобные разработки стоит внедрять в системы, которые контактируют с человеком. Технологию можно применять в call-центрах для оценки удовлетворенности клиента, не вызывая раздражения в конце разговора, или в системах «умного дома».
Антонина Пучковская, оцифровывает историю
Кандидат культурологии, руководитель м-платформы «Искусства и науки», директор Международного центра цифровых гуманитарных исследований Университета ИТМО
В старших классах Антонина увлекалась постмодернистскими текстами Умберто Эко и решила поступать на философский факультет СПбГУ, где изучала историю и теорию культуры. В аспирантуре она занимались исследованием и переводом работ Иммануила Валлерстайна, автора концепции мир-системного подхода к изучению социокультурных систем обществ.
Пучковская искала область на стыке «гуманитарного и компьютерного» и наткнулась на понятие Digital Humanities (DH). Она поехала изучать эту сферу в Нью-Йорк, где познакомилась с исследователями DH и их проектами. За Нью-Йорком последовал летний DH-институт в Канаде при Университете Виктории. Вернувшись в Россию, Антонина отправилась в ИТМО и предложила руководству запустить подобное направление и у них. Вуз согласился.
Одним из первых DH-проектов Пучковской стало исследование культурной географии Санкт-Петербурга, а дальше в университете появились международная магистерская программа по анализу и визуализации культурных данных, научно-исследовательский центр и платформа по запуску проектов в области Arts&Sciences. Флагманским проектом стала интерактивная онлайн-платформа St. Retrospect, собравшая метаданные о ключевых культурно-исторических локациях Санкт-Петербурга. Проект рассказывает о местах и связанных с ними исторических личностях, а веб-интерфейс позволяет осуществлять поиск по персонам, применять тематические и хронологические фильтры, а также просматривать информацию в виде интерактивных историй. Вслед за платформой появилось мобильное приложение для изучения истории Санкт-Петербурга с элементами геймификации Que.St. Отвечая на вопросы и выполняя задания, пользователи могут попробовать себя в роли сыщика, прожить один день вместе с любимым литературным персонажем или помочь Федору Михайловичу Достоевскому опубликовать свой первый роман.
Еще один значимый проект Пучковской — PagesofEarlySoviet Performance, коллаборация с Принстонским университетом. Исследовательница вместе с коллегами работала с оцифрованными коллекциями советских периодических журналов 1920-30-х годов, посвященных перформативным искусствам. В результате были созданы две базы данных. Одна — для семантического поиска, другая, оформленная при помощи библиотеки, разработанной коллегами из лаборатории цифровых гуманитарных исследований в Йельском университете, — из иллюстративного материала.
Сейчас Антонина вместе с сотрудниками Петергофа работает над созданием информационно-образовательной системы и базы данных, посвященной Петру I. Запуск проекта приурочен к празднованию 350-летия со дня рождения Петра. Помимо самого дворцового комплекса, в работе участвуют более 120 музеев петровской тематики — их всех предстоит объединить на одной платформе.
В будущем Пучковская планирует написать докторскую диссертацию и совершенствоваться в области продуктового дизайна и UX-исследований, так как считает эту область крайне перспективной, особенно для индустрии впечатлений и цифровых проектов на стыке гуманитарных и компьютерных наук.
Лариса Маркеева, уменьшает нейронные сети
Инженер-исследователь искусственного интеллекта, лауреатка научной премии «Яндекса» имени Ильи Сегаловича 2020 года
Во время учебы в аспирантуре в МФТИ Маркеева начала работу над диссертацией по теме тензорных разложений и применения их для сжатия. Говоря простыми словами, исследовательница стала работать с избыточной информацией, которая на самом деле не несет смысловой нагрузки и не нуждается в хранении или обработке. К примеру, с помощью тензорных разложений можно сжать видео на YouTube или удалить высокочастотный шум с картинки.
В область интересов Маркеевой входит также дистилляция нейронных сетей — еще один вариант сжатия. Например, есть две нейронные сети: одна — большая и неповоротливая, другая — маленькая, так называемый ученик. Лариса «доучивает» ее до максимально близкого качества, чтобы она сохранила точность, как у своей «старшей сестры», но при этом занимала меньше памяти и работала быстрее. Тема весьма актуальная для эпохи цифровизации, когда нейронные сети есть везде — от камеры телефона до часов на руке.
Сейчас Лариса работает инженером-исследователем в британской компании, которая специализируется на искусственном интеллекте. С одной стороны, она выполняет инженерные задачи, с другой — оптимизирует процесс исследований и решает, как их можно провести быстрее и эффективнее. Маркеева отмечает, что в Англии многое устроено по-другому: отличается работа над проектами, система взаимодействия между людьми в компании. Например, больше внимания уделяется тому, как сделать рабочую среду для разработчиков и исследователей максимально комфортной и минимизировать стресс — это согласуется с современными исследованиями креативности мозга. Полученный опыт управления командой Лариса надеется перенести в свой стартап или открыть собственную лабораторию.
Мария Горденко, изучает новые способы преподавания
Инженер-программист, старший преподаватель департамента программной инженерии факультета компьютерных наук ВШЭ
Мария выросла на космодроме Байконур, где работали ее родители. Она часто ездила на запуски ракет, участвовала во встречах с космонавтами и увлекалась ракетомодельным спортом. Училась она там же — в Международной космической школе им. В. Н. Челомея.
За высшим образованием Горденко отправилась в Москву — в Высшую школу экономики, поступив в 2013 году на направление «Программная инженерия». Мария изучала теорию графов, занималась транспортными задачами и получила девять свидетельств об интеллектуальной собственности на разработанные совместно с научным руководителем алгоритмы. С 2017 года она начала вести семинарские занятия по дискретной математике и программированию. За последующие два года среди ее курсов появились также программы, связанные с теорией графов, комбинаторикой, алгоритмами и структурами данных.
В 2019 году она поступила в аспирантуру и поменяла направление исследований, уйдя в EdTech. Это область интересовала ее инновационными подходами и методами: геймификацией, онлайн- и персонализированным обучением, высокоиммерсивными средами VR/AR/MR/XR (виртуальная реальность, дополненная реальность, смешанная реальность, расширенная реальность). Горденко начала совмещать преподавательство с научной деятельностью и работой инженера-программиста.
Сегодня она занимается автоматической генерацией заданий в программных комплексах персонализированного обучения — система может проанализировать ошибки ученика и подобрать набор задач, похожих на те, что бы им плохо усвоены. Также Мария работает над повышением качества современных адаптивных интеллектуальных систем.
В планах у Горденко — заняться современными адаптивными системами скаффолдинга (техники эффективного обучения с постепенным уменьшением влияния учителя на процесс).
Надежда Чиркова, обучает нейронные сети
Научная сотрудница Центра глубинного обучения и байесовских методов ВШЭ, преподаватель департамента больших данных и информационного поиска факультета компьютерных наук ВШЭ
Первой работой Чирковой в области машинного обучения стал проект по автоматическому определению тем в текстах. Ей удалось разработать алгоритм, который был взят на вооружение ее научным руководителем на мехмате МГУ. На пятом курсе Надежда попала в исследовательскую группу байесовских методов (если объяснять коротко, то они связаны с использованием теории вероятностей), а спустя два года стала научным сотрудником Центра глубинного обучения и байесовских методов в «Вышке».
Последние два с половиной года она занимается применением нейронных сетей для обработки программ. Вместе с коллегами Чиркова исследует методы, которые становятся основой инструментов для разработчиков программного обеспечения, — совершенствует модули автодополнения кода, которые подсказывают, какой фрагмент программы будет написан дальше, или модули автоматического обнаружения и исправления ошибок в программе.
Надежда рассказывает, что программный код удобно обрабатывать с помощью тех же методов, что и текст, и в этой области за последние годы был сделан сильный прорыв: нейронные сети научились не только хорошо «понимать» текст, например определять его тематику или переводить на другой язык, но и генерировать новый. Однако у программного кода есть свои особенности, и если их учитывать в методах, то они могут работать еще лучше. Этим-то Надежда и занимается — разрабатывает модификации методов, учитывающих особенности кода, а также исследует, какие методы из обработки текстов хорошо подходят для него, а какие нет.
До 2021 года Чиркова параллельно с работой по применению нейросетей для обработки программ участвовала в проекте по анализу свойств современных нейросетей. Команда проекта успешно опубликовала две работы на конференции NeurIPS (главное научное событие года в области машинного обучения), причем одну из них — как короткий устный доклад, что считается очень престижным. Вышка эту работу выделила как труд, вносящий особый вклад в научную репутацию университета.
Как отмечает Надежда, оба проекта были не про практику, а про общее понимание механизмов работы нейросетей. По ее словам, несмотря на то что нейросети достигли потрясающих результатов во многих задачах анализа данных, ученые до сих пор не совсем понимают, почему нейросети так хорошо работают. То есть на практике все функционирует, а почему — никто до конца не знает. Надежда уверена, что поиск ответов на эти «почему» гипотетически может открыть новые способы улучшения нейросетевых моделей.
Анастасия Бируля, запускает NFT-коллекции
Исследовательница феномена АСМР, директор криптонаправления в медиаагентстве Soyka, ex-куратор Third Place NFT Marketplace
Бируля неоднократно работала помощником кураторов на российских и международных выставках современного искусства. Однако первый серьезный заработок пришел к ней из сферы digital-маркетинга. Анастасия поняла, что в практическом смысле маркетинг и искусство в чем-то схожи: и то, и другое ищет ответ на вопрос, что и почему «цепляет» людей.
Параллельно Бируля открыла для себя явление АСМР (автономную сенсорную меридиональную реакцию) — это необычная «щекотка» в мозгу, когда наше внимание что-то цепляет и доставляет удовольствие. Феномен АСМР Анастасию увлек, она просмотрела тысячи АСМР-видео в попытках понять, почему людям хочется смотреть, как кто-то мнет глину, нашептывает тексты или постукивает ногтями по столу. В ИТМО она пришла с идеей создания музея, посвященного АСМР. Исследовательница планирует собрать базу данных со всеми известными универсальными триггерами с их классификацией и категоризацией.
За плечами у Бирули уже есть один амбициозный проект, которым она занималась вместе с командой культурного пространства «Третье место» в Санкт-Петербурге. Осенью 2021 года основательница площадки запускала курируемый маркетплейс Third Place NFT на базе блокчейна Everscale и искала человека, который мог бы токенизировать цифровые и физические арт-объекты и умел бы разбираться в искусстве и блокчейне. Вместе с Анастасией они создали программу Creators Program, куда любой творческий проект, художник или галерея может отправить свое портфолио. В случае прохождения кураторского отбора, работы минтятся (то есть через смарт-контракт регистрируются в блокчейне сети, таким образом, превращаясь в готовый к продаже NFT) на платформе за счет организаторов. В рамках этой работы у Бирули получалось продолжать свое исследование АСМР-триггеров, разбирая художественные портфолио.
После работы в NFT-маркетплейсе она присоединилась к команде медиаагентства Soyka в качестве директора по криптонаправлению. Сейчас Бируля ведет несколько масштабных проектов, связанных со стратегическим запуском NFT-коллекций, обучением блокчейн-технологиям и развитием децентрализованных криптобирж.
В ближайшем будущем Анастасия планирует объединить свой опыт и продолжить исследования в области феномена АСМР в контексте глобальной диджитализации и бума NFT. По мнению исследовательницы, в коллекционировании NFT функционируют совсем иные экономические закономерности и привычные схемы «доблокчейновой» эпохи устаревают, требуется новое и актуальное осмысление цифрового искусства.