Каждые две недели человечество накапливает больше информации, чем за всю свою историю до 2000 года. Эти космические объемы данных сулят свободу, эффективность и влияние каждому, кто сможет их обрабатывать. Именно этим и занимается всю жизнь профессор Норман Най.
В 1968 году Най, только получивший степень по политическим наукам, стал одним из изобретателей самой знаменитой статистической программы — Statistical Package for Social Sciences. SPSS, наряду с разработками других пионеров вроде института SAS, породила аналитическую и предсказательную статистику — и научила корпорации производить, оценивать и продавать свою продукцию. Теперь, в 67 лет, Най хочет снабдить статистическим инструментарием каждого обывателя. Если текстовые редакторы превратили нас всех в издателей, а Youtube —в кинопродюсеров, то статистика может из каждого сделать аналитика.
«Мы находимся в начале пути, который изменит облик национальных государств, — рассуждает Най. — Люди смогут принципиально иначе оценить последствия того или иного действия или политического решения. Это может привести либо к усилению отдельной личности, либо к развитию технологий манипуляции и контроля. В любом случае мир станет другим».
Статистика — довольно молодая наука. Она была создана в XVII веке для оценки рисков в азартных играх и расцвела в начале XX в результате стремительного прогресса измерительных приборов. Человеческий мозг, выводящий закономерности из многочисленных наблюдений, — тоже своего рода статистический инструмент. Он принимает решение, ужинать ли ему в определенном ресторане, основываясь на множестве факторов: популярность заведения, наличие метрдотеля, пристрастие к определенной кухне. То же, к чему мозг приходит с помощью догадок, компьютер выводит, изучая единицы информации, порой — триллионы единиц.
Программа SPSS начиналась как академический проект, но со временем стала серьезным бизнесом — прошлым летом, через два года после ухода Ная, IBM купила ее за $1,2 млрд. Она представляет собой набор алгоритмов, позволяющих эксперту быстро выявлять закономерности и делать на их основании предсказания. Например, как цена влияет на продажи цветов в День матери или как меняется потребность в тюрьмах в зависимости от демографической ситуации.
Сложите громкий коммерческий успех SPSS с открытым программным кодом, и вы получите новую компанию, Revolution Analytics. В фирме, основанной Наем в 2007 году, сейчас работает 30 человек.
Revolution основывает свои разработки на бесплатном статистическом языке программирования R, изобретенном новозеландскими учеными и доработанном энтузиастами по всему миру. Открытые библиотеки языка R насчитывают 2500 алгоритмов, написанных пользователями.
Используя R, правозащитная организация Benetech установила закономерности геноцида в Гватемале, а бейсбольный фанат из Западной Вирджинии смог предсказать, когда начнут уставать питчеры, — и получил работу в клубе Tampa Bay Rays. Пропагандист языка Майкл Дрискол доказал с его помощью, что вы в семь раз вероятнее смените мобильного оператора, если в течение последнего месяца это сделал кто-то из ваших друзей. Теперь он использует R для оценивания и размещения интернет-рекламы, анализируя 100 000 переменных в секунду.
R — мощное средство, но очень трудное в освоении. Компания Ная намерена снабдить его хорошо организованными библиотеками, способностью решать более масштабные задачи и пользовательским интерфейсом, позволяющим перетаскивать данные мышкой и получать легко читаемые графики. Продуктовая линейка состоит из бесплатной урезанной версии для университетов и полной бизнес-версии, которая, по словам Ная, будет на 80% дешевле продукции конкурентов из SPSS и SAS. Клиентами Revolution уже стали Pfizer, онкоцентр Йельского университета, Bank of America и Motorola.
Помимо предпринимательских соображений Ная не оставляет идея изменить мир. Разбогатев на SPSS, он не бросил академической карьеры и продолжает работать в Стэнфорде и Университете Чикаго. Когда-то в книге «Меняющийся американский избиратель» он статистическими методами показал, что голосующее население становится все искушеннее и толерантнее. Позже в «Образовании и гражданственности в Америке» Най продемонстрировал, что образованные слои населения терпимее прочих относятся к различиям, но не стремятся расширять свое участие в политической жизни страны.
По мнению ученого, его изобретение могло сыграть роль в расколе политических партий, существующем в сегодняшней Америке. Сегодня, говорит он, дешевые издательские технологии и лучший статистический анализ привели к более острым политическим противоречиям.
«Благодаря опросам вы могли выяснить, чего на самом деле хотят люди, — объясняет Най, — но благодаря этому общество, кажется, разрывается на части». Теперь политики ищут себе группы поддержки с помощью опросов общественного мнения и статистических методов, а избиратели в свою очередь могут голосовать за кандидатов столь же радикальных, сколь они сами. В результате, говорит Най, возникают большие проблемы.
Тем не менее, считает он, надо и дальше влиять на политику с помощью статистики. Исследователи могут блюсти интересы обычного человека, помогая ему избежать манипуляций со стороны правительств, медиа и корпораций.
«С помощью открытого языка R всякий может узнать цену своему дому, автомобилю, супругу и детям — положительную или отрицательную, — говорит он, возможно полушутя. — Это небывалое уравнивание возможностей, Великая хартия вольностей, гарантирующая децентрализацию аналитических прав».
Будучи реалистом, Най признает, что все может пойти по обратному сценарию, по мере того как все больше и больше наших слов и дел учитывается в статистических исследованиях. «Потребительское давление на бизнес как никогда велико, но наука манипуляций и контроля также достигла беспрецедентных успехов», — признает он.
SAS и IBM предсказуемо обратились к R, чтобы не упустить своей доли в революции предсказательной аналитики. Обе компании обещают, что написанные на языке алгоритмы будут доступны в их аналитических средах. «Чем больше аналитического кругозора, тем лучше, — утверждает Энн Милли, старший директор SAS. — Долгое время наука считалась детерминистской, но мы живем в вероятностном мире».
Норманн Най вырос в Сент-Луисе, бросил школу и уехал в Мексику, чтобы стать писателем — он начал публиковаться еще в подростковом возрасте. Вернувшись домой, он изучал социологию и политологию в Университете Вашингтона в Сент-Луисе. Для диссертации в Стэнфорде ему нужно было обсчитать разнородные данные из семи стран.
«Обработать все это руками было невозможно, — говорит Най. — Необходимо было придумать машинный способ». Вместе с Хадлаем Халлом и Дейлом Бентом, докторантом на кафедре исследования операций, он разработал SPSS — быстрый алгоритм обработки разных типов данных. Программа быстро завоевала популярность, и к изобретателям стали обращаться коллеги с просьбой поделиться. Они решили продавать ленты с кодом по $400 — такую сумму младший профессор университета мог потратить без согласования с администрацией.
Переехав в 1969 году в Университет Чикаго, Най продолжил развитие SPSS совместно с Халлом. В 1973 году, выяснив, что в университете появилась прибыльная компания, администрация рекомендовала Наю взять годовой отпуск и заняться ее развитием. В 1975 году безо всяких инвестиций — но с крепкими связями в академической среде, Най и Халл выкупили долю Бента и основали компанию SPSS.
Но сейчас все его заслуги остались позади. «R — это невероятный прогресс по сравнению с той аналитикой, которую разработал я, — говорит Най. — Это возможность изменить правила игры в самой быстроразвивающейся области программирования».
Сейчас профессор работает над книгой о технологиях, изменивших ход истории, вроде печатного станка, хлопкоочистительной машины, противозачаточных пилюль и интернета. Аналитические программы, по его мнению, тоже изменят мир, и мы даже не знаем как именно.
Через дорогу от офиса Revolution Analytics, в Cтэнфорде студенты проходят курс «Элементы статистического анализа», и их 700-страничный учебник наполнен формулами языка R. После выпуска большая часть студентов идет работать в компании вроде Twitter и Facebook.
«Крупные корпорации, производящие тучу данных, интернациональные сообщества, интернет-перевод — все это стирает национальные границы», — говорит профессор. «К чему это приведет — к расцвету индивидуальности или тотальному контролю? У каждой технологии есть обратная сторона».