Беззащитные данные: как Facebook оказалась в центре самого большого скандала в истории
Акции Facebook падают — со вчерашнего дня капитализация компании «провалилась» на $40 млрд. Причина — масштабный и нехорошо пахнущий скандал: бывший сотрудник компании Cambridge Analytica (далее CA) Крис Уайли (Chris Wylie) дал интервью The Guardian, в котором признался, что компания использовала данные пользователей Facebook без их ведома, для профилирования и «промывания мозгов».
А конкретно — для активной доставки контента, влияющего на решения людей, в том числе во время выборов президента США. Крис признался, что покровителем затеи был не кто иной, как Стив Бенон, доверенный советник Трампа, и именно он придумал проекту название «psychological-warfare mindfu@k tool» ( если смягчить перевод — «инструмент для запудривания мозгов»). Об этой истории на данный момент написала практически вся западная пресса: The Guardian, NY Times, Observer, и маятник только начинает раскачиваться, ибо все вопросы, которые витали в воздухе относительно понятия «приватность» внезапно стали как никогда актуальными и наглядными. Оказалось, что как минимум одна коммерческая компания может влиять на то, кто будет президентом любой развитой страны.
Ситуация очень сложная с технической точки зрения, поэтому большинство спикеров не комментируют, что, собственно, произошло и почему это настолько важно, что инвесторы сбрасывают акции Facebook. Мне кажется, важно объяснить суть, а для этого вспомним порядок событий. Изложение сознательно упрощено, чтобы не уходить в технические дебри:
1) Компания Cambridge Analytica во главе с СЕО Александром Никсом (Alexander Nix) понимает, что данные о человеке можно использовать для манипуляции общественным мнением.
2) Компания поднимает инвестиции, нанимает инженеров, чтобы сделать программное обеспечение, способное анализировать поведенческие данные человека: что пользователь пишет в интернете, с кем общается, его лексикон, маршруты движения, предпочтения в литературе, фильмах и музыке и т. д. На основании этих данных делаются конкретные заключения: что надо сказать человеку и в каких выражениях/форме, чтобы он поверил и отреагировал предсказуемо — так, как надо заказчику.
3) Компания проводит тесты своего софта и понимает, что она не ошиблась: условно, если холерикам и сангвиникам, собирателям и революционерам давать разный контент и упаковывать одни идеи в разные сообщения — кому-то видео чиновника со скрытой камеры, кому-то скриншот почтового ящика Хилари Клинтон, кому-то подкаст никому не известного блогера, — люди реагируют с потрясающим уровнем конверсии (соотношение кликов к количеству показанной рекламы).
В CA понимают — это золотая жила, но для того, чтобы развернуться, им нужно еще больше данных о людях.
4) Cambridge Analytica придумывает ход конем, чтобы высасывать из пользователей Facebook максимальное количество информации: о них, их друзьях и знакомых, а главное — дополнительную личную информацию для составления психологического портрета пользователей. Они своими руками и руками внешних подрядчиков начинают делать всевозможные веселые приложения и онлайн-тесты, пройдя которые, можно узнать, условно, «кто ты во «Властелине колец» и «кто ты на самом деле по гороскопу», и поделиться смешным рейтингом с друзьями.
Затея срабатывает — люди не чуют подвоха, соглашаются на любые условия работы приложения и начинают отдавать кучу личной информации о себе и своих друзьях. Эти приложения по сути представляют собой психологическое анкетирование (до 2015 года это было возможно в космических масштабах и почти без ограничений, в 2015-м Facebook изменил свой API и запретил приложениям собирать большую часть информации о «друзьях друзей», но это драматично не повлияло на бизнес CA, ибо их главный конек был и остается в социальном инжиниринге).
5) Помимо FB компания Cambridge Analitica покупает данные у дата-брокеров (на рынке более 2000 компаний, в том или ином виде специализирующихся на перепродаже наших данных — истории покупок, истории поиска и веб-серфинга и т. д.). Сопоставляя данные профилей FB, покупную информацию и данные из «веселых» приложений и «даркнета», где публикуют, например, украденные хакерами базы данных, они получают возможность делать предсказания о конкретных людях с колоссальной точностью.
По исследованиям компании Biolink.Tech, всего можно выделить 14 типов данных. Например, чтобы вы понимали возможности: с высокой достоверностью даже по анонимным данным можно определить пол человека, расу, профессию, социальный статус и примерный уровень доходов. А также личные качества: гей или натурал, изменят жене/мужу или нет, за кого будет голосовать из списка кандидатов, шовинист или нет, расист или нет, правые или левые взгляды — список классификаций почти бесконечный.
Как писал Джордж Оруэлл, «кто контролирует прошлое, контролирует будущее». И тут это как нельзя точно описывает суть — если ты знаешь, что делал человек последние 10 лет, ты почти гарантированно сможешь сказать, что он будет делать завтра.
6) CA убедилась, что машинка по поиску целей работает. С каналами доставки мозговых бомб тоже все было понятно — социальные сети. Осталось решить простую проблему — контент. Они начали в прямом смысле планировать кампании по изменению общественного мнения через компромат, настоящий и выдуманный контент, компрометирующий или, наоборот, выставляющий в хорошем свете конкретного человека или фракцию. Гендиректор компании открыто признался в одном из своих интервью — «не важно, правдива новость или нет, если в нее поверят». Это в сути своей отражает бизнес-модель CA: собрать базу из 50 млн человек, разбить их по типам, понять цель заказчика и начать одним людям скармливать одно, другим — другое, третьим — третье, чтобы все начали ругаться друг с другом, но в сухом остатке была достигнута цель — победа кандидата Х на выборах или принятие решения на референдуме по выходу Англии из Евросоюза. Автор не утверждает, что в CA это сделали, лишь указывает, что у них могла быть такая возможность, компания открыто продавала свои услуги на рынке.
The Guardian упоминает о том, что они делали питч даже компании «Лукойл», которая не совсем поняла, как их возможности связаны с нефтяным бизнесом, и якобы на этом разговор и закончился. Зная косность и консервативность нефтянки и то, как «быстро» они принимают стратегические решения вне своей прямой экспертизы, полагаю, что «Лукойл» — ложный след. Это лишь пример разнообразия клиентской базы CA.
6) Facebook напряглись, что у них в пуле есть партнер, который высасывает из их абонентской базы столько данных. По заявлению вице-президента Facebook Пола Греваля (Paul Grewal), FB отрезал CA доступ к данным после изменения правил в 2015-м. Он четко обозначил позицию: мол, они нарушили наше лицензионное соглашение, и мы потребовали письменных доказательств, что данные, полученные о наших пользователях, уничтожены. Были ли они уничтожены на самом деле — неизвестно, но в этом сейчас будет разбираться экспертная группа, автор уверен, что власти UK и EU выдадут соответствующий ордер.
7) Отписавшись в Facebook, мол, все окей, не переживайте, Cambridge Analytica не просто не прекратила своей деятельности, она, наоборот, ее стала наращивать и применять новые инструменты сбора данных, часто противоречащие политике самой Facebook. Крис Уайли признался:
Бесплатные соцсети. Дорого
В сухом остатке совершенно неважно, докажет расследование, что CA нарушили правила работы Facebook, или окажется, что Facebook, например, не просто не мешала, но и помогала их деятельности. Существует одна компания, которая сосредоточила в своих руках знания о поведении 2 млрд человек.
Мы видим, что социальные сети совсем не бесплатные. Наши данные стоят денег, и немалых: Facebook зарабатывала на рекламе около $40 млрд в год, а сколько заработала CA на выборных кампаниях — страшно подумать (только на предвыборную компанию в интернете штаб Трампа затратил $58,6 млн).
Монополия Facebook на наши «цифровые ДНК» (следы, которые пользователь оставляет в интернете) стоит поперек горла всем. Бизнесы подсаживаются на рекламные ковровые бомбардировки, как на героин, люди устают смотреть рекламу вещей, которые им не нужны, государства в силу своей природы ищут баланса сил на уровне ООН, а FB очевидным образом придает больше силы США. И не все в США этому рады: в Америке живет и работает огромное количество блестящих специалистов и потрясающих, добрых, открытых людей, реально ставящих нужды планеты выше своих собственных. Не надо судить о США по поведению политиков, так же, как многие американцы не судят о России по передачам российского телевидения.
На данный момент Марк Цукерберг не дал ни одного комментария о ситуации, что выглядит крайне странно, особенно на фоне пикирующего курса акций. Как сообщил Marketwatch, оказывается, Марк в последние дни активно распродавал собственные акции, полагаю, он это делает осознанно, понимая будущую силу только начинающегося скандала.
Осенью 2016 года автор этого текста выступал на TEDx с темой важности «цифрового ДНК» и опасности управления с его помощью общественным мнением. По итогам в числе прочего пришлось выслушать массу критики в духе «не надо выдумывать проблему там, где ее нет. Не существует такой проблемы, как приватность, потому что данные — это собственность бизнесов».
Надеюсь, теперь многие увидят, как жестоко ошибались. Рад, что эта ситуация стала публичной и вопрос прав человека на владение своими данными неизбежно будет обсуждаться на уровне глав государств.
И о важном. Заявление, что данные применялись «без ведома пользователей», технически не соответствует действительности.
Например, не удивляйтесь, если Facebook соберет из ваших данных бота с вашим лицом и начнет вашим друзьям продавать что-то. Это не будет нелегальным. Уверен, сложившаяся ситуация наконец всех отрезвит и подходы к данным в мире начнут меняться.