Искусственный интеллект и нейронные сети в картографии: будущее картографических сервисов
В мае 2016 года я с семьей ездил в Петергоф. Там всегда была большая проблема с парковочными местами, но в этот раз я случайно заметил новую большую парковку, которую только что заасфальтировали. Разумеется, ее не было ни на одной из существующих в мире карт. Увидеть ее на спутниковых снимках тоже было невозможно: ведь они не обновляются махом для всего мира и могут быть на устаревшими на год, а то и два.
Этот рядовой эпизод отражает острую проблему сегодняшней картографии: между моментом, когда объект появляется (или исчезает) на местности, и отражением этого факта на карте всегда проходит время. Это может быть и несколько дней, и несколько лет.
При этом точные свежие карты могут понадобиться не только обычному человеку для повседневной навигации дома и в путешествии. Например, они необходимы всем, кто так или иначе вовлечен в логистический бизнес — пассажирские и грузоперевозки. Карты нужны для навигации в пространстве бытовым и промышленным роботам и дронам: частично или полностью самоуправляемым автомобилям, квадрокоптерам, доставляющим небольшие грузы, подвижным бытовым уличным роботам (например, уборщикам, охранникам или курьерам). Всем этим устройствам требуются предварительно загруженные в память карты для базовой навигации; их дополняют системы ориентации на базе LIDAR-сканирования, поскольку карта все равно имеет некоторую погрешность и уж точно ничего не знает о временных объектах. И это лишь малая часть огромного геолокационного рынка, в который сейчас вовлечен широкий спектр компаний от небольших стартапов до огромных корпораций. Давайте детальнее посмотрим на структуру этого рынка.
Оценка рынка геолокационных сервисов
По оценкам аналитического агентства marketsandmarkets.com весь мировой геолокационный рынок в 2016 году оценивался в $30,71 млрд. К 2021 году ожидается рост рынка более чем в 2 раза до $73,91 млрд со среднегодовым приростом в 19,2%. В данное исследование включены такие типы гео-сервисов как анализ поверхности, геовизуализация, дистанционное зондирование, GPS навигация, GIS, геодезия, системы безопасности и прочее. Я более детально расскажу про сегмент картографии: создания, интерпретации и использования карт. Рынок картографии и гео-сервисов сильно фрагментирован, но в целом можно условно разделить на несколько бизнес направлений:
- B2B — создание и продажа спутниковых снимков высокой точности
Для создания спутниковых снимков, очевидно, нужно иметь в распоряжении собственные спутники на орбите, способные делать снимки поверхности высокого разрешения (до 30 см на пиксель) и передавать их на Землю. Такие графические данные могут продаваться как в сыром виде, так и использоваться для создания собственных B2B (реже B2C продуктов). Игроков на этом рынке по понятным причинам не много: не каждая коммерческая компания может позволить себе разработать (это несколько миллионов долларов) запустить на орбиту и обслуживать хотя бы один спутник (стоимость одного запуска Falcon 9 от SpaceX составляет $62 млн). Можно выделить несколько ключевых игроков, которые отличаются количеством и новизной специализированных спутников для фотосъемки поверхности земли: DigitalGlobe (куплена концерном MDA, 5 спутников, новейший — 2016 год), AIRBUS (подразделение DEFENCE AND SPACE, 1 спутник, 2016 год), ASTER (принадлежит NASA, 1 спутник, 1999 год). Разумеется всего в космосе очень много спутников, с помощью которых можно получать снимки высокого разрешения, но большинство из них принадлежат военным структурам различных государств и для гражданских нужд по понятным причинам не используются. Например, у той же AIRBUS в распоряжении около 50 спутников различного назначения и лишь один используется исключительно для получения снимков поверхности высокого разрешения. Крупнейшим коммерческим игроком и по сути монополистом на этом рынке снимков поверхности является компания DigitalGlobe, основанная в 1992 году и имеющая в своем распоряжении пять специализированных спутников высокого разрешения. DigitalGlobe имеет капитализацию около $2 млрд и годовую выручку в $730 млн.
DigitalGlobe занимается продажей как сырых данных, так и создает различные B2B продукты. Продажа снимков в сыром виде не пользуется популярность, ввиду высокой стоимости: свежие снимки от DigitalGlobe начинаются от $23 за квадратный километр с разрешением 50см на пиксель. Если брать только города всего мира (примерно 1% от всей площади суши), то потребуется купить примерно 1,49 млн км2 данных, что обойдется в $34 млн, плюс надо учесть что придется регулярно покупать обновления. По этой причине наиболее востребован доступ к данным по API. Так Google, Microsoft, Uber, Mapbox, Facebook, государства различных стран и прочие крупные международные и локальные игроки (коммерческие и государственные организации), которым нужны сырые данные, покупают доступ к API. Стоимость доступа начинается всего от $5 в месяц и не имеет ограничений по покрытию, качеству и актуальности снимков (предоставляются только самые свежие снимки): тарифицируется только запросы к системе (количество просмотров снимков). Однако доступ к API подразумевает что вы обладаете всеми необходимыми компетенциями и инструментами для работы с этими данными, плюс по API нельзя получить, скажем, снимок 10 летней давности, чтобы понять как менялся ландшафт, застраивались города или засевались поля. Для этого у DigitalGlobe есть отдельный продукт GBDX — аналитическая геопространственная биг-дата платформа. К примеру в 2014 году министерство природных ресурсов и экологии Российской Федерации закупало у DigitalGlobe исследование для выявления случаев незаконной вырубки леса в России. В целом гео-сервисы в структуре выручки DG занимают 56% и категория продажи доступа по API самая быстрорастущая.
Стоит принять во внимание, что на получение снимкова всей планеты в качестве 50см на пиксель у одного спутника уходит примерно 750 дней (2 года). Это объясняет необходимость иметь более 1 спутника, иначе где-то данные будут актуальными, а где-то — 2 летней давности. Таким образом у DigitalGlobe на обновление снимков всей планеты уходит порядка 150 дней (5 месяцев). Именно по этой причине активно развивается аэрофотосъемка, так востребованная в сельском хозяйстве. Разумеется речь идет только о спутниках, способных делать снимки требуемого качества. Ниже приведен пример снимков. Видно, что разрешение ниже 30 см на пиксель уже значительно ухудшает распознавание объектов.
Пример снимков поверхности различного качества (30, 70, 100, 300 см на пиксель):
- B2B – создание (то есть рисование) и продажа векторных карт
Отрисованные векторные карты создаются на базе спутниковых снимков и замеров на местности для последующей продажи обработанных векторных геоданных компаниям, занимающимся печатью бумажных карт и созданием картографических сервисов (как B2C так и B2B — в виде SDK с оплатой по запросам к API). Этот сегмент рынка последние несколько лет претерпевает существенные изменения, в силу перехода от бумажных карт к электронным и появления B2B сервисов вроде Google Maps API и Mapbox API, позволяющих быстро создавать новые B2B/B2C сервисы на базе готового SDK, работающие с геолокацией пользователя. Тем не менее сырые векторные данные стабильно покупают государственные организации (дорожные, коммунальные и прочие службы), требующие определенной точности отрисованных данных и соответствия индустриальным и государственным стандартам. Глобальных игроков в этом сегменте B2B/B2C сервисов также немного: из крупных можно выделить Google Maps, TomTom, Here Maps и OpenStreetMap.org (открытые данные). Есть еще ряд локальных игроков вроде 2ГИС в России, которые начинали свой бизнес с B2B, создавая и продавая данные, но сумели со временем сделать пивот в B2C. Рисование карт мероприятие дорогостоящее, а создаваемые последнее время сервисы предпочитают использовать готовые B2B решения на базе Google Maps SDK или Mapbox SDK, вместо покупки сырых данных, отрисовки и разработки собственного SDK. Стартовые пакеты у подобных сервисов как правило бесплатные, но ограниченные по ряду функций, что привлекательно для стартапов, которые впоследствии конвертируются в платных подписчиков сервиса.
С ростом мобильной индустрии и появлением в 2005 году Google Maps сильно упал рынок физической навигационной продукции (бумажные карты, автонавигаторы в виде отдельного устройства или интегрированные), что отлично читается в истории торгов акций TomTom. В результате TomTom решил сделать «пивот» в совершенно другое направление — носимые устройства — трекеры (умные часы) и сейчас имеет капитализацию в $2,2 млрд и годовую выручку около $1 млрд. Рынок интегрированных навигаторов достаточно инертный, но падающий (у многих в авто до сих пор есть CD плеер), поэтому такие компании как TomTom и Here еще получают с этого какой-то доход.
- B2B: продажа готового сервиса на базе SDK с определенным набором функционала и оплатой по количеству запросов к сервису по API.
Такие компании, как правило, покупают готовые векторные данные от локальных ГИС компаний (как основу) и подписку на доступ к спутниковым снимкам от DigitalGlobe (или других игроков) и дорабатывают их, оперируя собственным штатом картографов, до нужного качества, для последующего создания собственного B2B/B2C сервиса. Примеры таких компаний с B2B продуктами: Alphabet (Google Maps), Microsoft (Bing), Mapbox.com, TomTom, Here, 2ГИС, Яндекс. По оценкам Mapbox, рынок гело-локационных B2B сервисов типа mapping API может вырасти до $40 млрд к 2019 году. Среди основной массы игроков можно выделить компанию Mapbox, как один из наиболее динамично развивающихся проектов в этом сегменте. В 2015 году Mapbox подняли раунд инвестиций в размере $52,6 млн и на сегодняшний день API Mapbox обслуживает запросы от более чем 300 млн активных пользователей по всему миру. Недавно даже Snapchat стал использовать SDK от Mapbox для нового функционала Geofenced Story (локальная история). Аналогичный функционал под название location stories запустил и Instagram. Не так давно и Facebook запустил новый функционал City Guides, который реализован на базе нескольких сервисов, в частности данные по местах предоставляются компанией Foursquare, а картографический API — Here Maps. Часть гео сервисов Facebook работает на данных OpenStreetMap.
Компания Snap использует map API от Mapbox
- B2B: сбор и продажа локальных данных
Сбор локальных данных об организациях с привязкой к GPS позиции. По сути это справочники организаций и прочих объектов. Крупнейшие глобальные е коммерческие игроки: Yelp, TripAdvisor, Foursquare. Существует масса локальных игроков, собирающих данные только в рамках своего региона, в частности в России это 2ГИС. Крупнейшие открытые ресурсы: OpenStreetMap и Wikimapia (последняя примерно в 5 раз меньше OSM). Foursquare продает свои данные по API ряду крупных игроков, таких как Facebook и Uber. Этот вид бизнеса последнее время также претерпевает изменения, ввиду обогащения данными о местных компаниях на картах Google Maps и MAPS.ME.
В результате падения рынка продажи гео-данных, возникла новая бизнес модель, на которую стали переключаться такие игроки. Их основной бизнес — создание и продажа высокотехнологичного сервиса по занесению и актуализации данных о локальных заведениях на всех популярных картах мира для клиентов со средней и крупной сетевой структурой. Пример таких компаний: Brandify, NavAds, Mobilosoft. Клиентами таких компаний становятся крупные сетевики вроде Макдоналдс, BP, Wal-Mart, Starbucks и прочие.
- B2C: создание клиентских геолокационных сервисов
Будем рассматривать только решения, основным функционалом которых являются карты и навигация на из базе. Крупнейшие глобальные игроки, имеющие аудиторию по всему миру:
Google Maps: более 1 млрд установок (предустановленные, по собственным данным компании)
Apple Maps: более 500 млн установок (предустановленные, по собственным данным компании)
Waze: более 200 млн установок
MAPS.ME: более 75 млн установок (данные OpenStreetMap)
Sygic: более 60 млн установок (данные OpenStreetMap)
Here Maps: более 50 млн установок (по собственным данным компании)
TomTom: более 10 млн установок (по собственным данным компании)
Есть также ряд локальных игроков, которые могут доминировать в своем регионе, но за пределами своего региона иметь ничтожную долю аудитории. Зачастую такие решения не локализованы на другие языки:
Baidu Maps (Китай, собственные данные)
KakaoMap (Корея, собственные данные)
2ГИС, Яндекс.Карты+Навигатор (Россия, СНГ, собственные данные)
Монетизация клиентских навигационных приложений достаточно сложная история, перечислим все возможные варианты монетизации:
Гиперлокальная реклама для малого и среднего бизнеса – набирающее популярность направление. По оценкам аналитиов Morgan Stanley Google Maps к 2021 году будет зарабатывать около $5 млрд в год. Данный вид рекламы позволяет малому бизнесу привлекать посетителей в определенном радиусе от своего заведения. eCPM у такой рекламы примерно в 10 раз больше, чем у обычной, не таргетированной по гео локации рекламы.
Традиционная баннерная реклама. Обычно выкупается крупными брендами по низкой цене за счет больших объемов.
Нативная реклама — встраиваемая в интерфейс приложения текстовая реклама с небольшой картинкой или без нее.
Продажа обезличенных данных компаниям, занимающимся созданием графа пробок.
Продажа аналитических исследований для компаний, занимающихся локальным бизнесом (рестораны, магазины и прочее). Например: исследование наиболее посещаемых улиц и заведений города с целью поиска оптимального места для запуска нового ресторана.
Подключение сторонних сервисов на подобии Booking.com, Viator.com, RentalCars.com и прочих сервисов по бронирования локальных услуг.
Продажа приложения как навигатор по классической premium модели — по сути умирающая модель, вытесняемая бесплатными аналогами. Зачастую по такой модели существует урезанная бесплатная версия и полная платная.
Продажа дополнительного функционала в условно-бесплатных приложениях. Обычно это одно бесплатное приложение с ограниченным функционалом, который расширяется за счет внутренних покупок. Это также умирающая модель, вытесняемая полностью бесплатными аналогами с таким же функционалом, но бесплатным.
Также карты важны для владельцев локальных бизнесов (отелей, ресторанов, магазинов, музеев, салонов красоты, юристов, автомастерских и так далее) как способ привлечения новых клиентов. Зачастую локальные бизнесы сильно ограничены в рекламных возможностях, и карты для них становятся настоящим спасением. В 2014 году Google провел исследование, по результатам которого выяснилось, что 72% пользователей, который производили локальный поиск на смартфоне в итоге посещали магазин в радиусе 8 км.
Уверен, сейчас этот процент еще выше для мобильных, что является отличным драйвером роста для компаний, которые занимаются location based advertising. В частности компания Yelp за 2016 год заработала в США $713 млн на локальной рекламе. Такую выручку им обеспечили 137 000 рекламных акаунтов малого и среднего бизнеса. В целом же рынок гиперлокальной рекламы в США оценивается в $12,4 млрд в 2016 году, а к 2021 году ожидается рост до $32,4 млрд. Поскольку рынок США составляет примерно треть от международного рынка интернет рекламы, то общий размер рынка гиперлокальной рекламы можно оценить примерно в $100 млрд к 2021 году, что составит 45% от всем мобильной рекламы.
Мы убедились, что рынок картографии огромен и разнообразен, но давайте вернемся к вопросу создания векторных карт, которые всем так нужны и разберемся как и кто их создает, какие инструменты использует и какое будущее ждет этот сегмент бизнеса.
Создание векторных карт
Современная карта – это, по сути, оцифрованная интерпретация изображения местности. Процесс создания карт можно практически целиком свести к двум шагам. Первый – получение графического изображения местности: спутникового снимка или фото на местности с GPS-привязкой. Второй – распознавание объектов на снимке и сохранение в цифровом формате (линии, точки, названия и т.д.) с привязкой по координатам: широте, долготе, высоте над уровнем моря. Кажется, что все это можно делегировать искусственному интеллекту. Однако ряд картографических задач на сегодняшний день требует человеческого вмешательства.
К примеру, базу OpenStreeMap ежемесячно обновляют около 40 000 «маперов» по всему миру. Если представить себе, что OSM коммерческая организация и предположить что средняя зарплата одного мапера по миру составляет скажем $1000 в месяц, то это уже $40млн только на зарплату. При таких затратах — активная подписка на свежие спутниковые снимки всей планеты от DigitalGlobal за $600 в месяц кажется сущим пустяком. Таких расходов на ФОТ и на покупку данных мало кто может себе позволить в международном масштабе, а уменьшение количества маперов автоматически ухудшает качество отрисовки и полноту данных. Именно по этой причине у многих коммерческих карт сильно хромает качество и актуальность данных: крайне трудно за счет наемных картографов поддерживать в актуальном состоянии карты всего мира. За счет ИИ и машинного обучения можно будет существенно сэкономить ресурсы на распознавание объектов.
Можно условно выделить ключевые типы объектов на карте: ландшафт, водоемы, леса, здания, дороги и организации (места). Часть информации (контуры дорог, зданий, водоемов) достаточно легко «мапить», не находясь на местности. Вторую часть (названия улиц, дорог, организаций, номера домов) можно собрать, только будучи непосредственно на месте.
Все существующие способы создания и пополнения карт можно поделить на ручные и перспективные автоматические. В первом случае часть крупных объектов вроде морей и лесов определяется автоматически, а дома и дороги дорисовываются вручную. Во втором используются нейронные сети и машинное обучение.
Ручными методами маппинга мы будем называть те методы в который напрямую вовлечен человеческий труд.
1. Ручное обведение контуров объектов по спутниковым снимкам с GPS-привязкой.
Это самый простой и распространенный метод: он используется, например, для наполнения OpenStreetMap (далее – OSM: популярные карты, которые редактируются по принципу Википедии). Спутниковые снимки высокого качества почти всей нашей планеты для OSM c 2010 года великодушно предоставляет на бесплатной основе компания Microsoft (данные Bing Maps).
Такой метод достаточно удобен для оцифровки дорог, домов, водоемов, лесных массивов и прочих различимых на снимках объектов. Качества современных спутниковых снимков достаточно, чтобы человек смог сосчитать количество полос на шоссе. Также активно используются данные аэрофотосъемки: изображения, полученные этим способом, обладают куда более высокой четкостью и точностью, чем спутниковые. Однако, по понятным причинам, аэрофотосъемка покрывает далеко не все регионы, и лишь часть данных доступна бесплатно.
Кроме того, недостаточно просто нарисовать объект. Необходимо также указать дополнительные данные: название и номер шоссе, скоростное ограничение, номер дома, название улицы, высоту дома и т.д. С помощью спутникового снимка сделать это вручную невозможно. Также стоит отметить, что данные со спутника могут быть устаревшими, ведь они обновляются нечасто: так, на спутниковых снимках Google Maps есть участки, где отображены данные двухлетней давности.
Пример карты, на которой отсутствуют многие здания
Веб-редактор OpenStreetMap, через который можно на спутниковом снимке обводить контуры зданий
2. Ручное нанесение информации об объектах через мобильные приложения.
Этот способ позволяет собирать уточненные данные об объектах (организациях, названиях улиц, номерах и этажности домов и т.д.), находящихся в поле зрения пользователя, через популярные навигационные мобильные приложения с GPS-позиционированием. У нас (автор представляет сервис MAPS.ME) есть встроенный редактор карт, через который уточненные данные поступают напрямую в базу открытых карт OpenStreetMap. Достоверность информации проверяют другие члены OSM-сообщества, которые, как правило, живут неподалеку от объекта. Аналогичной функциональностью обладает и приложение Google Maps. Однако данные, добавляемые в Google Maps, не доступны для бесплатного использования, в то время как открытыми данными OpenStreetMap можно пользоваться в любых целях совершенно бесплатно.
3. Ручная запись GPS-треков (GPX).
Этот способ особенно актуален для нанесения объектов, зачастую незаметных на спутниковых снимках – например, скрытых под лесами (лесные тропы, дороги, дома) или шапками снега. Есть масса приложений, от популярных простых для бега и велоспорта до специализированных с множеством настроек, которые позволяют записывать GPS-треки в формате GPX и делиться ими. Наиболее популярные – Geo Tracker, Strava (Android) и GPX Tracker (iOS). Вернувшись из путешествия, пользователь может экспортировать свои GPX-треки, загрузить их в OSM после путешествий и нанести на карту новые дороги, тропы и ручьи, которые не видны на спутниковых снимках.
Такой метод сбора данных на местности очень популярен в открытых сообществах вроде OSM и редко используется коммерческими организациями по созданию карт, поскольку крайне затруднительно проверить достоверность и точность таких данных. Google, Here и TomTom не имеют функционала загрузки GPX треков для последующего нанесения на карту, но у локальных и узко специализированных игроков такие решения могут быть. Например у Яндекса есть проект «народные карты» (по сути это локальный аналог OSM), только коммерческий и все данные, создаваемые пользователями в «народных картах» становятся собственностью Яндекса (по этой причине социально ответственные мапперы постепенно переходят на открытую платформу OSM). У Яндекса есть веб-инструмент «блокнот картографа», но он существует только в виде адаптивного сайта и только в онлайне, то есть вы не можете его использовать открывая новую тропу где-нибудь в Yosemite парке, потому что там вообще нет сотовой связи, а загружать GPX трек, записанный в офлайн режиме сторонними треками не разрешается. А теперь представьте что вы хотите создать самую подробную карту туристических пешеходных маршрутов всего мира: сделать это за деньги, нанимая картографов — невозможно, ибо мало кто захочет за зарплату ходить труднодоступными маршрутами в горы или передвигаться по лесной тропе на велосипеде.
Тропинка в парке в г. Сиэтл (США), записанная мной через GPS-трекер
4. Ручное распознавание снимков отдельных небольших зон, сделанных беспилотниками/дронами (аэрофотосъемка).
Такой метод получения снимков поверхности почти не применяется в регулярной массовой картографии большими игроками, поскольку это операционно весьма хлопотное и дорогое мероприятие. Однако это самый быстрый способ для регулярного получения актуальных снимков высокого разрешения (до 1см на пиксель, что значительно лучше 30см на пиксель у лучших спутниковых снимков) для территорий, подвергшихся стихийным бедствиям (после землетрясения в Непале в 2015 году активистами HOTOSM.org использовалась аэрофотосъемка для исправления карт) или требующим регулярного детального анализа поверхности (анализ посевов в сельском хозяйстве). К примеру американская компания DroneMapper оказывает услуги по созданию актуальных снимков поверхности на заказ. В основном такие снимки делаются за счет небольших самолетов беспилотников (дронов) и основные заказчики — фермеры. Квадрокоптеры пока используются реже, поскольку низко летают, имеют малый запас хода и не могут летать в дождь, но набирают популярность для применения на небольших фермах в силу легкой доступности и невысокой стоимости. Такие компании как CropCopter предоставляют готовые технические решения для самостоятельной организации аэрофотосъемки, что актуально для областей, не обслуживаемых дронами-беспилотниками.
Пример спутникового снимка посевов
(спектральный анализ)
Пример аэрофотосъемки дронами
(спектральный анализ)
популяризация клиентских мобильных сервисов на базе открытых карт со встроенными инструментами для маппинга;
популяризация концепции открытых карт и вовлечение в процесс маппинга большего количества рядовых пользователей, работа со школьниками и студентами;
активная работа над вовлечением мапперов в регулярный процесс маппинга, поскольку мапперы это такие же обычные пользователи и их также надо возвращать и мотивировать;
переход крупных коммерческих картографических компаний с собственных проприетарных данных на работу с единой открытой платформой с целью снижения издержек на создание и обновление картографических данных.
Однако при создании дорожных автомобильных карт уже существует ряд автоматизированных решений, о которых мы поговорим в следующей колонке.