Рынок данных — очень громкие слова. Тем не менее на этом рынке уже существуют решения для автоматизации анализа внешних и внутренних данных, для обработки и использования в маркетинге, таргетированной рекламе, повторных продажах, скоринге, HR и многом другом. Активно развиваются рекламные и различные сервисы, которые предлагают возможности, основанные на аналитике данных.
Собственные данные — это наиболее важные и наиболее ценные данные. В них очень много полезной информации для построения бизнес-моделей, систем персонализации и проектирования. Внешние данные — это то, что вам дают другие компании. Это релевантные вашей задаче данные, но релевантны они только для вас и в данной конкретной ситуации. Для других компаний ваши данные также могут стать внешними и приносить существенный доход за счет продажи, построения аналитических сервисов, взаимодействия с партнерами, а также повышения эффективности текущих бизнес-процессов. Публичные данные — это данные, условно говоря, «для всех», которые достаточно широко известны на рынке: данные из открытых источников, рекламных платформ, которые нужны для масштабирования вашей деятельности.
В России рынок данных только формируется. В США и Европе компании уже не первый год работают с данными: тысячи компаний открыто заявляют о своем участии в развитии этого рынка. Например, такие гиганты, как Visa, Mastercard, телеком-операторы. В мае в Европе вступило в силу новое положение о работе с персональными данными (GDPR): работающее жестко, регулирующее работу с данными, которое сильно повлияло на российский рынок, потому что многие российские компании так или иначе имеют дело с зарубежными партнерами или клиентами. В то же время происходит дезинтеграция мирового рынка, поэтому крупные иностранные компании не приходят на российский рынок со своими данными.
По российскому рынку собирать статистику преждевременно, хотя такие попытки уже были. Главная проблема — большая неопределенность в вопросах сбора внешних данных с точки зрения законодательства. В России разрабатывается свое законодательство по работе с данными: в рамках программы цифровой экономики заявлено много законодательных инициатив, в том числе по работе с данными.
Основные провайдеры сбора и обработки данных в России — это в первую очередь телекомы. Телекомы — обладатели данных обо всем, что мы смотрим в интернете. Они отслеживают весь трафик. А теперь, по новому российскому законодательству, они не просто могут, а даже должны его собирать и хранить.
На втором месте — соцсети. В них есть множество открытых данных, которыми многие компании тоже активно используются для решения различных задач.
И на третьем месте — мобильные приложения, платежные и маркетинговые сервисы, которые тоже обладают знаниями о людях и готовы этими знаниями делиться. Но у них есть особенность — они достаточно небольшие, и поэтому, чтобы получить необходимый для аналитики объем данных, нужно научиться агрегировать их.
Где искать внешние данные
Для сбора данных существуют различные маркетинговые инструменты. Для малого бизнеса это рекомендательные и рейтинговые сервисы, рекламные площадки, которые сейчас очень активно наращивают свой функционал и возможности по таргетированию и персонализации рекламы.
Средний бизнес может попробовать поработать с так называемой DMP-платформой. Это программное обеспечение, которое позволяет собирать, обрабатывать и хранить любые типы данных. Они работают по принципу агрегатора: унифицируют данные и дают компаниям аналитику уже в готовом виде.
Средний и крупный бизнес работает также с биржами данных. Это очень крупный игрок на рынке. Он отличается от агрегатора наличием более прозрачной схемы, более понятной и легитимной с точки зрения установления отношений между поставщиком и покупателем данных.
Очень крупный бизнес работает через прямые сделки: например, «Газпром-медиа» объявил о создании совместного предприятия с «МаксимаТелеком» для продажи интернет-рекламы. Еще один тренд — private data exchange, когда компании, входящие в состав крупных холдингов, обмениваются данными не публично.
Российский рынок данных находится на начальной стадии развития: данных не хватает для аналитики, и она оказывается неэффективной. Но чем больше будет таких примеров, чем больше будет прецедентов (как успешных, так и не очень), тем эффективнее мы все сможем работать.