Самым большим вкладом Корженевского в науку о данных стала лаборатория SberIndex. Этот проект, использующий Big Data для оценки состояния экономики, стал по-настоящему инновационным. Вместе с ним в России появилась макростатистика в реальном времени. Она быстро стала фундаментом для исследований ведущих мировых банков и заинтересовала даже Банк России. Теперь же приложение Get Me ASAP так же в реальном времени будет рассказывать ресторанам об изменениях на их рынке, а пользователям позволит получать персональные рекомендации. Задача Николая — полагаясь на данные, решить, что и где будет есть каждый из нас.
— Вы занимали высокую должность в крупнейшем российском банке и возглавляли известный во всей стране проект. А сейчас работаете в стартапе. Почему решили сделать такой переход?
— На протяжении двух лет я был управляющим директором лаборатории SberIndex, которую сам и создал. У проекта была единственная цель: перейти от экспертных догадок на тему экономики к количественному анализу, то есть твердым фактам. Мой первый масштабный проект работы с большими данными. Задача была исключительно экономической — делать оценку макроэкономических рядов, но 80% времени уходило именно на работу с данными.
Нынешний проект, приложение Get Me ASAP, — шаг в сторону еще большего погружения в «сырые» цифры. Приложение на основе данных о предыдущих покупках и посещениях рекомендует пользователям кафе и рестораны. В будущем добавим спортивные студии и залы, парикмахерские. Сейчас Get Me ASAP работает в Нью-Йорке, Варшаве и Барселоне. При огромной конкуренции в общепите, особенно в Штатах, сотрудничество с заведениями продвигается интенсивно. Мы даем им платформу, которая позволяет развивать свою систему лояльности. А клиент получает намного более качественный сервис.
— В чем различие работы в большом банке и развивающейся молодой компании?
— В первом случае мы располагали данными, покрывающими практически все сферы экономики. На основании обезличенных трансакций SberIndex делал и оценки общего потребительского спроса. Например, по начислениям ФОТ оценивал среднюю, медианную зарплаты, общие трудовые доходы в стране. Так или иначе, это были макроэкономические показатели, потому что именно это интересовало бизнес.
В Get Me ASAP фокус — на конкретных рынках. На основе трансакционных данных о покупках в кафе и ресторанах нужно, во-первых, оценить состояние этих рынков. Во-вторых, требуется составить персональные рекомендации того, что и где клиент может захотеть. Эта задача посложнее, так как рекомендации должны быть индивидуальными, но разработать их необходимо опять же на анонимизированных данных.
— Вы постоянно подчеркиваете анонимность данных. Вас раздражает это обстоятельство? Как балансировать между потребностью в данных для развития бизнеса и необходимостью обеспечивать конфиденциальность и безопасность этой информации?
— Нет, слово «раздражает» точно не подходит. Хотя, конечно же, мне хочется, чтобы клиент отдал вообще все данные. Если точно знать, что какой-то человек всегда ежедневно занимается спортом и ложится спать в 22:00, то, наверное, не стоит предлагать ему заведения, специализирующиеся на алкоголе, верно? Чем больше мне о вас известно, тем вероятнее, что рекомендация будет вам в самом деле полезна и понравится. Вопрос здесь этический: а что разработчик имеет право о вас знать? Это вечная дилемма.
По второй части вопроса важно только одно. Некорректное использование данных или тем более их утечка — ошибка, которой компании могут не простить. Это и есть такой естественный ограничитель любопытства бизнеса. Просчетов в обращении с клиентской информацией быть не должно, поэтому персональные данные, как правило, в аналитических целях недоступны.
— Каков, на ваш взгляд, ключевой вызов, с которым сталкивается индустрия больших данных?
— Главная проблема — это конфликт точности и скорости. Если вы хотите быструю оценку, то, скорее всего, она будет достаточно грубой. Мы часто с этим сталкиваемся, к примеру, как клиенты банков. Совершаем какой-нибудь перевод, и его почему-то блокируют, хотя трансакция выглядит совершенно невинно. Почему так происходит? Потому что банку за пару секунд необходимо решить, мошенническая это операция или нет. Соответственно, решение принимает какой-то примитивный алгоритм, и из-за этого ошибки происходят чаще, что нас нервирует, но технологии пока не позволяют большего.
Собственно, моя работа — минимизация потерь в точности оценок при какой-то требуемой скорости. Так было при расчете макроэкономических рядов, и то же происходит при оценке состояния отдельных рынков и клиентских потребностей. Пользователь доволен работой приложения, если реакция на любой его запрос составляет не более двух секунд. В случае сложных задач человек готов ждать не более десяти секунд. Это примерно то же время, какое есть у банка для определения качества трансакции в примере выше. И этот же срок есть у Get Me ASAP до того, как человек закроет приложение и уйдет в другую поисковую систему.
На более общем уровне у использования больших данных есть проблема недостатка мощностей. Считается, что полезное использование составляет всего 6–10% от их объема. Мне это представляется очень трезвой оценкой. Но это технологическое ограничение постепенно отступает вслед за совершенствованием технологий.
— Что вы успели сделать в области анализа данных в Get Me ASAP?
— Хотя я и пришел в команду только в середине года, но наблюдаю за развитием проекта почти десять лет. Необходимость радикально улучшить именно аналитическую часть Get Me ASAP появилась в прошлом году, с выходом на новые рынки. Сейчас мы находимся на этапе накопления данных. Поэтому о результате для пользователей говорить, пожалуй, преждевременно. Но есть чрезвычайно важный внутренний результат: архитектура анализа данных выгодно отличает нас от других проектов в данной области. Она нравится инвесторам. Это критически значимо, так как стартап сейчас проводит очередной раунд привлечения инвестиций. И понятное конкурентное преимущество сразу существенно повышает капитализацию компании. К сожалению, в силу конфиденциальности конкретных цифр я не могу раскрыть. Но услуги, основанные на Big Data, увеличили нашу стоимость как минимум вдвое.
— До полного ухода в Big Data вы смогли построить публичную экспертную карьеру, были известным экономическим обозревателем, модерировали дискуссии на самом высоком уровне, преподавали во ВШЭ. Как этот опыт помогает вам в текущей работе?
— Без этого опыта не было бы никаких последующих проектов. Именно он помог нащупать проблемы в области экономической статистики. При подготовке к дискуссиям с представителями финансовых властей я постоянно сталкивался с нехваткой или неполнотой официальной макроэкономической информации. Так и появилась идея SberIndex — восполнить пробелы на основе больших данных.
В свою очередь, годы в лаборатории окончательно убедили меня в том, что любые экспертные суждения требуют обоснования в виде цифр. Я продолжаю настаивать на том, что правда содержится только в данных, а не в фантазиях пусть даже очень образованных людей. Теперь в Get Me ASAP мы будем делать не макроэкономическую статистику, а отраслевую, то есть шума будет больше, а сущностных данных меньше. Для меня лично это вызов дальнейшего совершенствования используемых методов.
Что касается преподавательского опыта, то без него вообще не было бы никакой науки и интуитивного понимания, что такое подлинно ценный проект. Мне повезло преподавать и заниматься исследованиями в Высшей школе экономики в ее лучшие времена.