Начнем по команде: кого брать в штат ИИ-стартапа и на какие навыки смотреть
Стартапы в области ИИ работают с массивами данных, соответственно, им нужны сами данные, вычислительные ресурсы и люди, которые умеют искать, готовить, хранить и анализировать информацию.
При этом нужны не только технические специалисты, но и профильные эксперты, разбирающиеся в отрасли, для которой стартап строит решения. По мере роста еще понадобятся посредники, которые свяжут разработчиков и таких экспертов. Скажем, если компания занимается ИИ-расшифровкой рентгеновских снимков, ей нужно искать не только инженеров, исследователей и разработчиков, но и врачей, а в перспективе и менеджеров, которые будут хорошо понимать как задачи бизнеса, так и специфику рентген-исследований, и потребности ИИ-модели.
Релевантных специалистов крайне мало и стоят они очень дорого. Сначала лучше сосредоточиться на научной и технической экспертизе — профессионалах в искусственном интеллекте и в вашей прикладной области.
Штатный минимум
В штат нужно заполучить тех, кто будет разрабатывать сам ИИ-продукт и координировать разработку. В зависимости от продукта набор может немного меняться, но обычно базовый состав ИИ-команды выглядит так:
- Дата-инженер
Инженер данных нужен, чтобы организовать работу с датасетами. Ведь прежде чем анализировать информацию, ее нужно собрать, очистить и упорядочить. Продумать, где и как хранить, как обезопасить, как гарантировать доступ.
Так что дата-инженер разрабатывает и адаптирует ПО для разметки и подготовки к использованию нужных данных, а также контролирует их хранение и обновление. Для этого ему нужно знать алгоритмы и техники хранения, уметь программировать и хотя бы поверхностно понимать, как устроено машинное обучение.
Часто стартапы экономят и делят задачи дата-инжиниринга между другими ML-специалистами в команде. Или нагружают инженера данных анализом и разработкой. Так делать не нужно, даже если сотрудники сами предлагают: только тщательно обработанные данные принесут пользу, и инженеру лучше не отвлекаться.
- Дата-аналитик / дата-сайентист
Нашли того, кто обеспечит качественный набор данных — отлично. Теперь нужен тот, кто может их интерпретировать, то есть, аналитик или специалист по Data Science.
Дата-сайентист не разрабатывает новые ИИ-модели, он настраивает уже существующие алгоритмы под конкретные данные, чтобы нащупать нужный и понятный для бизнеса вывод. Например, предсказать, какими свойствами будет обладать комбинация молекул и поможет ли она создать эффективное лекарство. Дата-аналитик делает то же самое, только с ретроспективными данными, — он не работает с прогнозами, а дает рекомендации «здесь и сейчас».
Такие специалисты должны хорошо разбираться в основах машинного обучения и показывать быстрые результаты. Определить качество дата-сайентиста или аналитика можно по его победам в открытых кейс-чемпионатах и хакатонах.
- ИИ-исследователь
Исследователи могут создавать новые и совершенствовать существующие ИИ-модели. Они решают задачи, которые еще никто не решал, — для этого поглощают огромное количество научных статей, посещают конференции, общаются с множеством разноплановых экспертов.
ИИ-ресечеры не просто генерируют идеи, они создают прототипы моделей и тестируют их. Лучшие передают ML-инженерам, и те уже реализуют промышленное решение.
Учитывая, что ИИ-разработка — новая, стремительно развивающаяся сфера, найти опытного исследователя сложно, их очень мало на рынке. Переучить дата-инженера и дата-сайентиста тоже тяжело: обычно они привыкают работать в конкретных фреймворках и не готовы экспериментировать. Поэтому неплохой вариант — взять недавнего студента, у которого уже есть глубокие технические знания, но еще не закостенел практический подход.
Небольшой лайфхак для отбора кандидатов на должность ИИ-ресечера: спросите, какие три статьи про ИИ ему особенно понравились за последний год и почему. Так вы проверите навык регулярного осмысленного чтения, без которого исследователь не справится.
- Специалист по машинному обучению
ML-инженеры доводят прототипы до продукта и следят за его эксплуатацией. Они должны быть отличными специалистами как минимум в двух сферах: нужной вам области машинного обучения и программирования на нужном вам языке. А еще разбираться в математике, базах данных, параллельных вычислениях, облачных системах, веб-приложениях.
Чтобы проверить эти знания, недостаточно собеседования и хорошего резюме: обязательно давайте практические задания по алгоритмам и программированию.
Обычно ML-инженеры выступают тимлидами технической команды, а когда стартап подрастает, вторым лидом становится лучший ИИ-исследователь.
- Продакт-менеджер
В тесной связке с техническими экспертами должен работать сотрудник, понимающий, как продвигается и продается продукт — продакт-менеджер. Он должен подружить желания целевой аудитории с реальными возможностями команды.
Выбирая такого сотрудника, обращайте внимание в первую очередь на его энтузиазм и обучаемость — он должен живо интересоваться искусственным интеллектом и быть готовым разбираться в сложных процессах. Хорошо, если у кандидата есть опыт работы в нескольких IТ-областях.
Что можно отдать на аутсорс
Сразу укомплектовать команду всеми сотрудниками вряд ли выйдет из-за уникальности большинства ИИ-проектов и обычной для стартапов нехватки финансов (даже в начинающих ИИ-проектах зарплаты должны быть конкурентоспособными, поскольку кадров не хватает). Поэтому в штат набирайте интеллектуальный костяк, а остальных привлекайте на аутсорс.
В первую очередь доверяйте подрядчикам стандартные IТ-задачи:
- Классическую разработку: фронтенд и бэкенд-системы, UI/UX-дизайн и т. д. От стандартной технической работы вроде создания приложения или сайта никуда не деться — но тут так много опытных профильных фрилансеров и агентств, что подобные задачи можно спокойно отдать внешним специалистам. И никакие специфические познания в ИИ тут не нужны. Позже, когда бизнес наберет первых клиентов и поток задач стабилизируется, классических айтишников можно набирать и в штат.
- Разметку данных для обучения ИИ-модели. Сырые данные нужно сделать понятными для машины: разложить их по категориям, найти и отметить важные особенности, определить зависимости. Например, если нейросеть учат распознавать растения по фото, на тренировочных картинках нужно промаркировать все виды листьев и лепестков, заложить, что форма растения важнее размера, и т. д. Это довольно монотонная работа, многое из которой уже можно автоматизировать — конечно, если ваши данные не слишком специфичны.
- Оценку работы алгоритмов. По сути, это независимое тестирование прототипа или готовой ИИ-модели.
На аутсорс отдают не только рядовые IT-процессы. На рынке остро не хватает высококвалифицированных многопрофильных ИИ-экспертов, и даже если их найти, они наверняка уже будут устроены так хорошо, что переманить их не удастся. А вот на проектную подработку или, как минимум, консультацию они могут согласиться — и зачастую не ради денег, а из-за интереса. Так что не бойтесь предлагать им поучаствовать в тех же исследованиях или оценке результатов.
Порой на аутсорсе также привлекаются MLOps- и DLOps-инженеры — специалисты по автоматизации и оптимизации процессов разработки, развертывания и управления моделями машинного обучения. Такие сотрудники должны разбираться в работе с кластерами, графическими процессорами и ускорителями, а также быть компетентными в использовании всех соответствующих программных пакетов. Все это идеально в теории, но на практике MLOps- и DLOps-инженеров непросто найти и еще сложнее привлечь на проект, поэтому функционал часто передается системным администраторам. Они стараются минимизировать потребности, используя облачные ресурсы и закупая вычислительные мощности у платформ со своими специалистами.
Пусть сейчас для стартапов в целом время тяжелое, это не касается области ИИ, венчурные вложения в которую активно продолжаются. В том числе и в России есть много инструментов поддержки профильных стартапов и проектов. Библиотеки решений с открытым кодом доступны для множества задач. Если у команды основателей есть силы и желание, время для поиска команды и внешних консультантов — подходящее.
Мнение редакции может не совпадать с точкой зрения автора