Как разработчик из России привлек $40 млн на развитие базы данных
«Векторный поиск — новая технология, не все с ней знакомы. Большая часть нашей маркетинговой активности — это материалы о том, какие возможности она открывает программистам», — делится в разговоре с Forbes 30-летний Андрей Васнецов, сооснователь немецкой компании Qdrant. Она разрабатывает систему управления векторными базами данных для малого и среднего бизнеса. Эта технология позволяет создавать чат-ботов, рекомендательные системы и другие продукты на основе искусственного интеллекта. Стартап, выросший из личного проекта Васнецова, с 2022 года привлек почти $40 млн от фондов Spark Capital (инвестировал в Twitter (сейчас Х; соцсеть заблокирована в России), Trello и др.), Unusual Ventures, 42CAP и нарастил оценку до около $150 млн.
В этом году команда выпустит продукт для крупных компаний, который может стать основным источником выручки бизнеса. Однако глобальные планы проекта куда амбициознее — изменить поиск в интернете.
Новый вектор
Васнецов родился в Москве. Он увлекся IT в 15 лет, когда ради интереса купил самоучитель по языку программирования Microsoft Visual Basic. К выпускным классам он загорелся идеей строить роботов и после школы поступил в Московский государственный технический университет им. Н. Э. Баумана на факультет «Специальное машиностроение». Однако уровень образования его быстро разочаровал. Поэтому после первого курса он перевелся на соседний факультет «Информационные системы и технологии», где обучали программистов.
Летом 2014 года Васнецов устроился стажером в отдел разработки IT-компании Mail.ru (сейчас VK). Со временем совмещать учебу и работу стало сложно, и в 2016-м он уволился. Продолжить карьеру решил уже после выпуска: в 2017-м занял позицию старшего аналитика-разработчика в отделе Big Data (большие данные) и машинного обучения в банке «Тинькофф». Два года спустя, после участия в протестах из-за выборов в Мосгордуму, Васнецов решил покинуть Россию. К январю 2020-го он получил предложение о работе от немецкого рекрутингового сервиса MoBerries и переехал в Берлин.
В компании он возглавил отдел Data Science (наука о данных), который отвечал за разработку нейросети в основе MoBerries. Она автоматически подбирала резюме на вакансии работодателей. Для этого она анализировала информацию, предварительно загруженную в векторную базу данных. В ней описания вакансий и резюме хранились в виде последовательных наборов чисел — векторов. Нейросеть сравнивала между собой эти векторы и выбирала наиболее похожие друг на друга. Таким образом она могла сопоставить на первый взгляд разные тексты (без одинаковых ключевых слов, при этом обладающие одинаковым смыслом), например предложение о работе интерфейсному инженеру с резюме веб-разработчика, рассказывает Васнецов.
В MoBerries использовали векторную базу данных Milvus от китайского разработчика Zilliz. Однако в ней нельзя было задавать параметры поиска информации — например, указать, что работодателю требуются только немецкоговорящие специалисты. Васнецов решил это исправить и создать собственную систему управления векторными данными с настраиваемой системой фильтров.
Возможность заняться сторонним проектом у Васнецова появилась весной 2020-го, когда из-за вспышки коронавируса MoBerries отправила сотрудников в отпуска. Разработка не требовала вложений. Впоследствии Васнецов опубликовал продукт на GitHub, а также поделился им с коллегами. Сервис произвел впечатление на технического директора MoBerries Андре Заярни. В мае 2021-го он опубликовал ссылку на сервис на форуме Reddit. В тот же день проект получил сотни звезд на GitHub. Таких результатов достигают далеко не все проекты на площадке, уверяет Васнецов. Директор отдела Big Data в компании МТС, победитель в категории «Наука и технологии» в рейтинге Forbes «30 до 30» в 2020 году Виктор Кантор называет это «очень хорошим результатом».
Повышенный интерес к Qdrant подтолкнул программиста к запуску собственной компании. Однако это требовало инвестиций. Опыта фандрайзинга у Васнецова не было, поэтому он позвал в проект Заярни. В 2021 году партнеры открыли юридическое лицо. Около 10% в стартапе получила MoBerries, которая помогала предпринимателям на старте, в том числе контактами потенциальных инвесторов. Оставшиеся доли сооснователи распределили между собой, раскрывать пропорцию Васнецов отказался. Он стал в проекте техническим директором, а должность главы компании предложил партнеру, посчитав, что ее лучше занять немецкоговорящему специалисту. Заярни на запросы Forbes не ответил.
В январе они привлекли первые инвестиции — $2,2 млн от фондов 42CAP, IBB Ventures и бизнес-ангелов. Это позволило нанять трех разработчиков. Найти средства оказалось относительно просто, признается Васнецов: часть инвесторов сами приходили к компании, обращая внимание на большое количество звезд у проекта на GitHub. «У инвесторов есть программы, которые автоматически замечают проекты, которые начинают резко набирать звезды [на GitHub]. Это то, на что они ориентируются при выборе портфельных проектов», — добавляет предприниматель. Связаться с фондами Forbes не удалось.
Компания сразу решила распространять разработку бесплатно и совершенствовать ее за счет обратной связи от клиентов. Пользователь мог скачать систему управления данными на официальном сайте Qdrant и наполнить ее нужной информацией, предварительно переведенной в векторы. Соответствующие инструменты предлагают многие компании, включая американскую OpenAI, которая разработала чат-бот ChatGPT, уточняет Васнецов. Программист затрудняется назвать количество пользователей в 2022 году. Но уверяет, что к концу года число звезд на GitHub выросло до 3180. По итогам года у стартапа не было выручки, а его убыток составил $1,1 млн.
Проект Х
К началу 2023 года компания ввела платную поддержку пользователей. На такую идею команду натолкнул разработчик сервиса распознавания лиц с помощью компьютерного зрения Japan Computer Vision (принадлежит SoftBank Mobile), который обратился к стартапу за консультацией по работе с векторной базой данных. Услуга обошлась заказчику в несколько тысяч долларов в месяц и предполагала помощь в запуске и настройке сервиса, уточняет Васнецов. Нововведение пошло проекту на пользу, уверяет предприниматель: «Когда люди платят, они замечают мелкие недостатки и придираются. Это то, что нам нужно, потому что мы еще в процессе разработки».
Кроме того, в 2023-м компания выпустила первый коммерческий продукт — Qdrant Cloud, или «Клауд», как называет его Васнецов. Это веб-сайт, где клиент может арендовать виртуальный компьютер с преднастроенной базой данных Qdrant. От бесплатной версии сервиса его отличает то, что пользователю не нужно самостоятельно настраивать программу, создавать логи (текстовые файлы, куда автоматически записывается важная информация о работе системы или программы), бэкапы (резервная копия важных данных, сохраненная в специальный файл) и пр. «Мы предоставляем пользователю готовую базу, с которой можно работать», — заключает Васнецов.
Стоимость продукта для клиента варьируется от $30 до $5000 в зависимости от размера серверов, где размещается «Клауд». Компания арендует их у облачных провайдеров Google Cloud или Amazon Web Services, так как не имеет собственной облачной инфраструктуры. В цене, кроме стоимости аренды, заложена маржа Qdrant, она составляет 20-30%. Предприниматель затрудняется назвать точную сумму, которую потратил на запуск продукта, но отмечает, что над ним работало 10 программистов.
В апреле 2023 года Qdrant привлек еще $7,5 млн от венчурных фондов Unusual Ventures, 42CAP, IBB Ventures и бизнес-ангелов на дальнейшее развитие. За год команда выросла до 30 разработчиков, половина из которых работала в отделе Qdrant Cloud. Количество звезд у компании на GitHub за год выросло в пять раз, до 15 000. По подсчетам Васнецова, на сегодня бесплатные решения стартапа используют свыше 1000 компаний из различных сфер, от страхования до сельского хозяйства. В первую очередь это представители малого и среднего бизнеса и отдельные разработчики, которые хотят облегчить работу с данными. «Представим стартапера, который придумал проект, где векторный поиск (поиск по векторным данным. — Forbes) — часть решения. Ему больше не нужно создавать его (поиск) с нуля. Ему достаточно скачать Qdrant», — поясняет Васнецов.
Но среди пользователей бесплатного решения есть и крупный бизнес. Это фармацевтическая компания Bayer, консалтинговая компания Deloitte, производитель лекарственных препаратов, гигиенических товаров и медицинского оборудования Johnson & Johnson и др. Васнецов точно не знает, для чего они используют продукт. «Они могут разрабатывать функции поиска по картинкам, или чат-ботов, которые отвечают на вопросы пользователя с учетом его истории покупок и каталога товаров на сайте компании, или же рекомендательный сервис», — перечисляет варианты предприниматель. С середины 2023 года стартап также оказывает платную поддержку соцсети X (ранее Twitter). Представители компании использовали бесплатное решение Qdrant, чтобы создать функцию See Similar (с англ. «увидеть похожее») в социальной сети. Она стала доступна в ноябре прошлого года и позволяет находить на площадке твиты на одну тему. Васнецов отказался раскрывать сумму контракта, но назвал его долгосрочным.
Компания не продвигает свои продукты на конкретных рынках, но большинство клиентов приходят из США, уверяет Васнецов. «Разработка Qdrant помогает создавать новые продукты, а делать это в Штатах легче, чем в Европе, так как там меньше бюрократии», — поясняет он. Долю региона в общей структуре выручки стартапа он раскрывать отказался.
По итогам 2023 года суммарная выручка компании составила $1 млн. 90% суммы принесли продажи Qdrant Cloud, оставшиеся 10% — платные консультации. Убыток при этом достиг $6 млн. До самоокупаемости стартапу далеко, признается Васнецов: «Мы хотим построить фундаментальное решение для стека (набор технологий, на основе которых разрабатывается сайт или приложение). Инвесторы понимают, что такие проекты не выходят на самоокупаемость быстро».
Сильный проект
Международный директор по искусственному интеллекту в сервисе доставки еды Deliveroo Дмитрий Зборовский, победитель в категории «Управление» в рейтинге Forbes «30 до 30» в 2023 году, называет проект сильным, но считает, что компания может не выдержать растущую конкуренцию.
«Есть огромное количество компаний, которые захватывают сегмент B2B на рынке векторного поиска. Это, например, Pinecone (с момента основания в 2021 году компания привлекла $138 млн, последний раунд, на $100 млн, состоялся в 2023-м и поднял оценку компании до $700 млн. — Forbes) с 4000 платящих пользователей. Рынок насыщен технологиями, и выиграет тот, кто внедрит свою технологию в наибольшее количество компаний», — отмечает он.
Конкурентность рынка подтверждает и сам Васнецов. Он отмечает, что количество игроков в нише выросло в 2022-2023 годах: «Все вдруг сообразили, что векторный поиск — это интересная ниша», — уверяет предприниматель, не называя конкретные компании. Этому способствовало появление чат-бота ChatGPT3.5 от американского разработчика OpenAI и последовавший за этим бум нейросетей. Это подтверждает принципал венчурного фонда R136 Ventures Денис Ефремов: «Векторные базы данных предназначены для работы с неструктурированными или плохо структурированными данными, то есть как раз теми, которые используются в LLM моделях (Large Language Models, с англ. — «большие языковые модели», к которым относится ChatGPT. — Forbes). Это достаточно классическая тема — за ростом популярности тех или иных моделей вычислений растет рынок провайдеров».
К основным конкурентам своего стартапа Васнецов относит Milvus, Pinecone и голландскую Weaviate (в 2023 году подняла раунд на $50 млн по оценке $200 млн). Руководитель отдела машинного обучения в разработчике программного обеспечения и IT-продуктов под ключ Napoleon IT Игорь Терехин также называет базы данных ElasticSearch и Apache Cassandra. Qdrant конкурирует и с Chroma, считает он. Ее запустили в 2022 году Джефф Хубер и Антон Тройников в США. Руководитель отдела backend-разработки IT-компании SimbirSoft Сергей Галеев заметными игроками на рынке считает открытую библиотеку для машинного обучения TensorFlow от Google и библиотеку векторного поиска Facebook AI Research Similarity Search (принадлежит Meta, которая признана в России экстремистской и запрещена). Преимуществами стартапа Васнецова по сравнению с ними он называет среди прочего удобный API (интерфейс программирования приложения), открытый исходный код и высокую скорость обработки запросов. Независимый IT-эксперт Артем Брель отмечает, что Qdrant легче интегрировать в бизнес-процессы по сравнению с конкурирующими продуктами. По наблюдениям Кантора из МТС, сегмент векторных баз данных пока фрагментирован и выделить основных игроков нельзя.
В январе 2024 года Qdrant привлек еще $28 млн от Spark Capital, Unusual Ventures и 42CAP. По итогам раунда компанию оценили примерно в $150 млн. Ефремов называет раунд крупным для ниши и отмечает сильных инвесторов, в частности Spark Capital. Управляющий партнер Sk Capital Павел Морозов называет раунд крупным даже по меркам США: «Сделка свидетельствует о высоких ставках инвесторов на лавинообразный рост приложений на базе искусственного интеллекта в ближайшем будущем», — считает он.
По словам Васнецова, новые инвестиции пойдут на наем сотрудников и доработку второго коммерческого продукта — «Гибридного клауда». В отличие от «Клауда», он запускается на сервере клиента, а значит, у Qdrant не будет доступа к данным пользователя. Предприниматель надеется, что это привлечет к сервису крупный бизнес, который не покупал доступ к Qdrant Cloud из соображений безопасности. Предприниматель рассчитывает, что продукт станет основным источником выручки стартапа. Сервис уже прошел бета-тестирование и привлек первых клиентов, но названия компаний Васнецов держит в секрете. Стоимость сервиса он также не раскрывает.
Впрочем, своей глобальной задачей Qdrant видит создание нового интерфейса для поиска в интернете. «Строку поиска придумали 50 лет назад. Наша глобальная идея — предложить новое видение того, как будет устроен поиск. На мой взгляд, он не будет завязан на строку с ключевыми словами, а будет напоминать исследование», — рассуждает Васнецов.