Big Data с молотка: как Китай создал биржу данных и нужна ли она России
Что такое биржа данных
Крупные компании аккумулируют огромное количество данных своих пользователей. К примеру, крупнейший американский ретейлер Amazon за 30 лет собрал примерно миллион терабайт историй покупок и предпочтений клиентов.
Анализ таких массивов Big Data будет полезным практически для любого предприятия в любой сфере деятельности. Но даже крупный бизнес способен собирать данные в ограниченных масштабах, а доступ к данным других компаний сильно затруднен — европейский Общий регламент по защите данных (GDPR) и аналогичные законодательные акты других стран максимально ограничили возможность торговли и обмена пользовательской информацией. Даже в случае, если ее предварительно обезличили.
Естественно, подобные условия не позволяют компаниям свободно обмениваться и торговать большими данными — слишком большой риск «попасть на деньги». На выручку приходят биржи данных. Это не просто системы обмена обезличенными данными. Это платформы для решения стратегических проблем и задач бизнеса. Можно выделить две модели, по которым они работают:
- биржа-маркетплейс, которая выступает витриной данных. Она помогает заключить сделку между продавцом и покупателем, соответствующую законодательству, но не несет ответственности за результаты и передаваемые данные;
- биржа-эксперт и доверенный посредник между государством и бизнесом. Она помогает решать бизнес-задачи клиентов на основе данных. Эксперты объясняют, как лучше решить задачу, что для этого потребуется, помогают это получить и предоставляют необходимые технические решения вместе с необходимыми юридическими и консультационными услугами.
С помощью бирж можно стандартизировать процессы обмена информацией для крупных игроков рынка, а также создания общих сервисов и аналитических моделей на сборных дата-сетах. Благодаря анализу данных компании получают дополнительные возможности для решения бизнес-задач. Все в выигрыше.
Восточный опыт: как формировались биржи данных в Китае
В Китае данные воспринимают в первую очередь как топливо для цифровой трансформации государства и разных отраслей бизнеса, ведущей к процветанию нации и экономическому росту.
Первые попытки создать национальную биржу данных проводились еще в 2014 году в Пекине. Впрочем, этот опыт оказался провальным. Учредителям не удалось создать единый функциональный маркетплейс данных, но даже в таких условиях объемы сделок достигали почти 1 млрд юаней в год. В 2020 году китайцы запустили биржу данных в Гуйяне, который называли «долиной больших данных Китая». И за год торгов участники провели сделок на 5 млрд юаней ($689 млн). Формально результат был, но исследователи оценивали размер рынка минимум в 20 млрд юаней, поэтому вторую попытку посчитали частично успешной.
Чтобы обеспечить успех бирже данных и вывести ее на национальный уровень, Китаю нужно было решить целый ряд проблем:
- принять единые стандарты авторских прав на данные и порядок их использования;
- разработать механизмы передачи и аналитики больших данных;
- продумать механизмы оценки качества данных, чтобы биржи не стали механизмом ведения корпоративных войн;
- создать и принять единые законы, регулирующие специфику торговли анонимизированными данными, которые защитят обычных граждан от разглашения их персональных данных.
И уже в 2021 году вступил в силу закон «Закон о защите персональной информации», который комплексно регулирует принципы сбора, анализа и торговли обезличенными данными. Юристы говорят, что по уровню защиты информации граждан он во многом напоминает европейский GDPR, но при этом не ограничивает потенциальные рынки торговли анонимизированными данными для бизнеса.
Вместе с новым законом в крупных городах Китая (Пекин, Шанхай и Шэньчжэнь) стали действовать обновленные государственные биржи данных. Фактически их функционал свели к обычному посредничеству и консалтинговым услугам.
Но главное в том, что для торговли анонимизированными данными компании обязаны использовать только государственные биржи. Это одновременно упростило контроль над процессом продажи и использования продуктов и решений на основе Big Data и привлекло большое количество бизнес-игроков, которые заинтересованы в продаже или покупке данных.
Подход дал отличные результаты. Уже в 2022 году китайский рынок торговли данными оценивали в $12,3 млрд. А если учесть динамику роста, то уже в 2025 году размеры рынка составят $28,8 млрд, а в 2030-м — $72,6 млрд.
Перспективы в России
Согласно аналитике Института статистических исследований и экономики знаний НИУ ВШЭ, 35,5% российских компаний уже используют технологии Big Data или планируют начать это делать в ближайшие три года. При этом больше половины в разы нарастили объемы используемых данных с 2020 года.
Вот только обмен данными между компаниями в России сегодня развит крайне слабо. Этот способ получения информации для бизнес-анализа не входит даже в десятку самых распространенных. Большинство компаний (58,5%) предпочитает собирать данные пользователей самостоятельно.
При этом интерес к данным третьих сторон есть. Почти четверть (23,4%) респондентов хотели бы покупать данные у других игроков рынка или государства для улучшения бизнеса, а 19,3% организаций не против зарабатывать на торговле собственными данными.
Впрочем, сейчас государство пытается монополизировать сбор данных в некоторых отраслях. К примеру, в июле был принят закон об обезличенных персональных данных, который разрешает компаниям хранить данные для развития технологий, но исключает возможность установления личности человека.
Крупные российские компании, которые хотят работать с данными легально, сталкиваются с серьезными барьерами. Из-за отсутствия явных правил игры на заключение одного контракта покупки анонимизированных данных уходит примерно полгода: много времени нужно, чтобы согласовать условия и особенности передачи, а также формулировки договоров. Конечно, в дальнейшем обмен данными будет быстрее, потому что все бюрократические моменты уже улажены. Но с каждой новой компанией процесс нужно повторять заново. Запуск полноценной биржи данных в России поможет сократить первый этап юридической подготовки в разы: с полугода до нескольких недель. И его нужно сделать только раз: последующие обмены данными даже с новыми компаниями будут идти по ускоренной схеме.
С помощью понятного механизма передачи данных в стране компании смогут быстрее и дешевле проверять свои бизнес-гипотезы, создавать более клиентоориентированные продукты и услуги. Эксперты считают, что к концу 2024 года с помощью анализа больших данных бизнес получит дополнительный эффект в размере 1,6 трлн рублей, из которых 10-15% обеспечат именно биржи данных. Так бизнес сможет приносить больше денег государству в качестве налогов. Сами компании за счет оптимизации операционных процессов смогут перераспределить время и ресурсы в пользу развития и повышения эффективности.
При этом не обязательно создавать единую биржу данных. Это вполне могут быть и отраслевые или межотраслевые системы. Впрочем, российский рынок находится в самом начале этого пути. У Китая ушло 10 лет, чтобы превратить перспективную идею в работающий механизм, который сейчас серьезно поддерживает экономическое развитие. Сколько уйдет у России, нам только предстоит узнать.
Мнение редакции может не совпадать с точкой зрения автора