Статистика помогает принимать важные решения, но непонимание ее законов создает проблемы в самых разных областях — здесь и судебные ошибки, и многомиллионные потери инвесторов, и неверные оценки страховых рисков. В книге «Голая статистика» (Naked Statistics) профессор Дартмутского колледжа Чарльз Уилан с помощью ярких примеров и парадоксов показывает, как правильно читать статистические данные. Русское издание книги выходит в издательстве «Манн, Фербер и партнеры». Forbes публикует сокращенный текст главы «Проблемы с вероятностью», где среди прочего говорится о самоуверенных знатоках математики, едва не разрушивших мировую финансовую систему.
Сломанный спидометр
Статистика не может быть более совершенной, чем люди, которые ее используют. Но иногда она заставляет умных людей делать глупости. Одним из самых безответственных случаев применения статистики в последнее время стал механизм оценивания рисков на Уолл-стрит перед финансовым кризисом 2008 года. В то время компании, представляющие финансовый сектор, использовали общепринятый барометр риска — модель стоимости риска, или рисковой стоимости (Value-at-Risk, VaR). Теоретически VaR сочетала в себе элегантность индикатора (совмещая обширную информацию в едином числовом показателе) с мощью вероятностей (присоединяя ожидаемую прибыль или убыток к каждому из активов или торговым позициям соответствующей фирмы). Такая модель исходила из того, что для каждой инвестиции компании существует определенный диапазон возможных исходов. Если, например, компания владеет акциями General Electric, то их стоимость может повышаться или понижаться. Когда VaR вычисляется для короткого промежутка времени, например недели, то самым вероятным исходом станет то, что в конце данного периода у этих акций будет примерно такая же стоимость, как и в начале. Вероятность того, что их стоимость повысится или снизится на 10%, относительно невелика. Еще меньше вероятность того, что она повысится или снизится на 25%, и т. д.
На основе прошлых данных о движениях рынка «количественные» эксперты компании (их еще называют «квантами» от слова quantitative, «количественный») могли определить максимальную сумму в денежном выражении, которую фирма может с 99%-ной вероятностью потерять на данной позиции в течение рассматриваемого периода времени. Например, в 99 случаях из 100 компания не потеряет более $13 млн на конкретной торговой позиции; а в 1 случае из 100 потеряет.
Запомните последнее утверждение, поскольку вскоре оно станет важным.
До финансового кризиса 2008 года фирмы охотно использовали модель VaR для оценки своего суммарного риска. Если у какого-либо отдельно взятого трейдера было 923 открытые позиции (инвестиции, стоимость которых могла расти или падать), то каждую из таких инвестиций можно было оценить, как описано выше для акций GE, и на основе этого вычислить совокупный риск портфеля данного трейдера. Формула даже учитывала корреляции между разными позициями. Если, например, ожидаемые доходности двух инвестиций отрицательно коррелированы между собой, то убыток по одной из них, скорее всего, будет компенсирован прибылью по другой; таким образом, две инвестиции в совокупности менее рискованны, чем каждая в отдельности. В целом глава торгового отдела должен знать, что, скажем, у Боба Смита, торгующего облигациями, 24-часовая VaR (стоимость риска в течение ближайших 24 часов) — $19 млн. Как указывалось выше — с 99%-ной вероятностью. Максимум, что может потерять Боб Смит в течение ближайших 24 часов, это $19 млн — в 99 случаях из 100.
Главной причиной критики в адрес VaR является то, что фундаментальные риски, связанные с финансовыми рынками, невозможно предсказать по аналогии с подбрасыванием монетки или слепой сравнительной дегустацией двух сортов пива. Ложное ощущение точности, встроенное в эти модели, породило ложное ощущение безопасности. Показатель VaR был похож на неисправный спидометр; пожалуй, это хуже, чем если бы его не было вообще. Понадеявшись на неисправный спидометр, вы перестанете обращать внимание на другие признаки того, что уже превысили допустимую скорость. В случае же отсутствия спидометра вам придется отслеживать признаки, указывающие на реальную скорость автомобиля.
Примерно в 2005 году, ориентируясь исключительно на показатели VaR, которые ежедневно появлялись на рабочих столах руководителей компаний ровно в 16:15, Уолл-стрит набрала скорость, существенно превышающую допустимую. К сожалению, с профилями риска, заложенными в моделях VaR, было две огромные проблемы. Во-первых, вероятности, на которых строились модели, исходили из прошлых движений рынка; однако на финансовых рынках будущее вовсе не обязательно похоже на прошлое. Таким образом, не было оснований полагать, что движения рынка в период с 1980 по 2005 год были наилучшим предиктором изменений после 2005 года. В какой-то степени этот недостаток воображения напоминает периодические ошибочные предположения генералов о том, что следующая война будет похожа на предыдущую. В 1990-е годы, а также в начале нулевых коммерческие банки широко применяли модели кредитования для жилищных ипотек, согласно которым вероятность значительного снижения цен на жилье близилась к нулю. Цены на жилье никогда ранее не падали так сильно и так быстро, как это происходило с начала 2007 года. Однако случилось то, что случилось.
Кроме того, даже если бы исходные данные могли точно прогнозировать будущий риск, 99%-ная гарантия, обещанная моделью VaR, была опасно бесполезной, поскольку остающийся 1% действительно вводит в заблуждение. Менеджер хеджевого фонда Дэвид Айнхорн поясняет: «Это как подушка безопасности, которая дает сбой именно в момент автокатастрофы». Если стоимость риска (VaR) какой-либо компании составляет $500 млн, то это можно рассматривать как 99%-ную вероятность того, что на протяжении указанного периода фирма потеряет не более этой суммы. Но это также означает, что компания может с 1%-ной вероятностью потерять свыше $500 млн (а при определенных обстоятельствах даже значительно больше). По сути, опираясь на эти модели, невозможно предусмотреть, насколько плохим может оказаться 1%-ный сценарий. Очень мало внимания уделялось так называемому хвостовому, то есть малому, риску (производное от хвоста кривой распределения) катастрофического исхода. Если вы возвращаетесь домой из ресторана за рулем своего автомобиля и уровень алкоголя в вашей крови равен 0,15 промилле, то вероятность того, что вы попадете в ДТП со смертельным исходом, наверное, будет менее 1%, тем не менее это не повод садиться за руль в нетрезвом виде. Многие компании усугубили эту ошибку, сделав нереалистичное предположение о своей готовности к маловероятным событиям. Бывший глава Казначейства США Хэнк Полсон пояснил, что большинство из них надеялись в крайнем случае привлечь денежные средства путем продажи активов. Но во время кризиса деньги нужны всем, поэтому все пытаются продать активы. С точки зрения управления рисками это равносильно тому, как если бы вы сказали: «Мне нет нужды запасаться водой и продуктами питания, поскольку в случае стихийного бедствия я смогу пойти в супермаркет и купить все необходимое». Разумеется, после того как астероид упадет на ваш город, его 50 000 жителей ринутся в супермаркеты, чтобы запастись водой и продуктами, но когда вы доберетесь до ближайшего супермаркета, окна в нем будут разбиты, а полки пусты.
«Кванты» с Уолл-стрит совершили три фундаментальные ошибки. Во-первых, они спутали точность с достоверностью. Модели VaR действовали подобно моему дальномеру, который был настроен на измерение расстояний в метрах, а не в ярдах, в результате чего расстояния измерялись точно, но неправильно. Эта ложная точность заставила обитателей Уолл-стрит поверить, будто они контролируют риск, хотя это было не так. Во-вторых, оценки вероятностей, положенные в основу вычислений согласно модели VaR, оказались ошибочными. Как указывал Алан Гринспен, выступая в одном из комитетов Конгресса США, относительно благополучные десятилетия до 2005 года не следовало брать за основу при построении распределений вероятностей, которые использовались для прогнозирования поведения рынков в предстоящие десятилетия. Это как если бы вы отправились в казино с уверенностью, что выиграете в рулетку в 62 случаях из ста только потому, что именно так получилось вчера, когда удача сопутствовала вам. В-третьих, компании пренебрегли «хвостовым риском». Модели VaR прогнозируют, что должно произойти в 99 случаях из ста. Именно таков механизм действия вероятностей. Между тем маловероятные события иногда случаются. Более того, в долгосрочном периоде они не так уж маловероятны. Иногда в людей попадает молния. Моя мать убедилась в этом на собственном опыте.
Ложные связи
Теория вероятностей дает нам мощный и полезный набор инструментов, правильное использование которых поможет лучше уяснить ситуацию в мире, а неправильное посеет в нем хаос. В русле метафоры «статистика как мощное оружие», которая неоднократно повторяется в этой книге, я хочу перефразировать любимое выражение сторонников свободной продажи огнестрельного оружия в США: ошибается не теория вероятностей, а люди, которые ею пользуются.
Предполагается, что события независимы, тогда как на самом деле они зависят друг от друга. Вероятность выпадания решки при подбрасывании «правильной» монетки равняется 1⁄2. Вероятность выпадания решки двух раз подряд при подбрасывании той же монетки составляет (1⁄2), или 1⁄4, поскольку вероятность одновременного наступления двух независимых событий равняется произведению их индивидуальных вероятностей. Теперь, когда вы вооружены этим важным знанием, допустим, что вас назначили на должность начальника отдела управления рисками в крупной авиакомпании. Ваш заместитель сообщает вам, что вероятность выхода из строя авиадвигателя во время трансатлантического перелета составляет 1 шанс из 100 000. Учитывая количество трансатлантических перелетов, этот риск нельзя считать приемлемым. К счастью, каждый современный самолет, совершающий такие перелеты, оснащен по меньшей мере двумя двигателями. Ваш заместитель подсчитал, что риск их одновременного выхода из строя во время трансатлантического перелета равняется (1/100 000), или 1 шансу из 10 млрд, что считается вполне приемлемым риском с точки зрения обеспечения безопасности полетов. Что же, сейчас самое время предложить вашему заместителю взять отпуск и подготовиться к увольнению. Поломка обоих авиадвигателей не относится к категории независимых событий. Если во время взлета самолет наталкивается на стаю гусей, то, вероятнее всего, оба двигателя выйдут из строя по одной причине. То же самое можно сказать о многих других факторах, влияющих на функционирование авиадвигателя, начиная с погодных условий и заканчивая небрежным выполнением своих обязанностей наземными службами техобслуживания. Если один двигатель выйдет из строя, то вероятность поломки второго будет значительно выше, чем один шанс из 100 000.
Еще одна разновидность ошибок возникает, когда события, действительно независимые друг от друга, рассматриваются как взаимосвязанные.
Если вы когда-либо окажетесь в казино (а с точки зрения статистики там лучше вообще не появляться), то обязательно увидите людей, вперившихся взглядом в игральные кости или карты и заявляющих, что они «ожидают должное». Если в рулетку пять раз подряд выпадет черное, то всякому здравомыслящему человеку понятно, что в следующий раз должно выпасть красное. Нет, нет и еще раз нет!
Вероятность того, что шарик остановится на красном поле, каждый раз будет одной и той же: 16/38. Уверенность в том, что это вовсе не так, иногда называют «заблуждением игрока». В действительности если монетку подбросить 1 000 000 раз и каждый раз будет выпадать решка, то вероятность того, что на 1 000 001-й раз выпадет орел, по-прежнему останется 1⁄2. Само определение статистической независимости двух событий заключается в том, что исход одного события никак не сказывается на исходе другого. Даже если статистика не убеждает вас, обратитесь к физике соответствующего явления: каким образом выпадание решки несколько раз подряд может повлиять на вероятность выпадания орла в результате следующего подбрасывания монетки?
Нам подчас свойственно усматривать закономерность там, где ее и в помине нет.
Ниже описан эксперимент, который я провожу со своими студентами, чтобы подтвердить этот базовый постулат. Чем больше аудитория, тем лучше. Я предлагаю каждому из присутствующих вынуть монетку и встать. Затем все подбрасывают монетку, и те, у кого выпала решка, садятся. Допустим, в аудитории 100 студентов, примерно 50 из них сядут после первого подбрасывания. Потом мы выполняем это упражнение еще раз, в результате останутся стоять примерно 25 студентов. И так далее. Чаще всего после пяти или шести подбрасываний остается один человек, у которого пять или шесть раз подряд выпал орел. Я спрашиваю этого уникума: «Как вам это удалось?», или «Вам, наверное, известна особая методика тренировок, позволяющая достигать такого результата?», или «Вы, возможно, придерживаетесь особой диеты, помогающей добиться такого исхода?» Все присутствующие, конечно, воспринимают это как шутку, поскольку наблюдали процесс подбрасывания монетки своими глазами, к тому же неплохо знают друг друга и понимают, что у человека, которому удалось пять раз подряд поймать монетку орлом вверх, нет особых талантов, а результат, которого он добился, не более чем случайность. Однако каждый раз, когда мы видим какое-либо аномальное событие вне конкретного контекста, у нас невольно возникает подозрение, что помимо случайности здесь замешано что-то еще.
Возврат к среднему
Возможно, вы слышали о так называемом проклятии Sports Illustrated: спортсмены или команды, фотографии которых помещались на обложке этого журнала, впоследствии снижали свои достижения. Одно из объяснений этого феномена заключалось в том, что появление фотографии спортсмена на обложке неблагоприятно сказывается на его последующих показателях. Более правдоподобным с точки зрения статистики будет объяснение, что команды и спортсмены обычно появляются на обложке Sports Illustrated после того, как добьются выдающихся успехов (например, станут олимпийскими чемпионами), поэтому вполне естественно, что, пройдя пик физической формы, они снижают результаты. Это явление называется возвратом к среднему. Теория вероятностей говорит о том, что любой «отщепенец» — наблюдение, существенно отклоняющееся от среднего значения в ту или другую сторону, — часто сопровождается исходами, более близкими к долгосрочному среднему значению.
Тенденция возврата к среднему позволяет объяснить, почему Chicago Cubs всегда платит огромные суммы за так называемых свободных агентов, которые потом разочаровывают болельщиков вроде меня. Игроки могут выторговать у клуба высокие зарплаты после одного-двух необычайно удачных для себя сезонов и, одевшись в форму Chicago Cubs, вовсе не обязательно начинают играть хуже (правда, я не исключаю и такой вариант); скорее клуб платит за них огромные деньги по окончании какого-то особенно удачного для этих суперзвезд периода, после чего их результаты (уже в составе Chicago Cubs) возвращаются к неким средним показателям.
Представьте, что я пытаюсь сформировать команду подбрасывателей монет, основываясь на ошибочном предположении, что способности в этом деле играют большую роль. После того как я увидел студента, у которого шесть раз подряд выпал орел, я предлагаю ему 10-летний контракт на $50 млн. Разумеется, я буду разочарован, если в эти 10 лет орел будет выпадать лишь в 50% случаев.
Кстати, исследователи зафиксировали еще и так называемый феномен Businessweek. Когда главам компаний вручают престижные награды (в том числе еженедельник Businessweek присваивает им звание «лучший менеджер»), как правило, в течение трех следующих лет эти компании ухудшают показатели (такие как учетная прибыль и цена акций). Однако в отличие от эффекта Sports Illustrated феномен Businessweek — нечто большее, чем возврат к среднему. По словам Ульрики Малмендьер и Джеффри Тейта, экономистов Калифорнийского университета в Беркли и UCLA соответственно, когда главы компаний обретают статус суперзвезды, внезапно свалившаяся на них слава отвлекает их от дел. Они пишут мемуары. Их приглашают в советы директоров других компаний. Они ищут для себя так называемых статусных (то есть молодых и эффектных) жен. Малмендьер и Тейт пишут: «Полученные нами результаты свидетельствуют о том, что культура суперзвезд, искусственно формируемая средствами массовой информации, ведет к более глубоким изменениям поведения, чем обычный возврат к среднему». Иными словами, когда фото главы компании появляется на обложке Businessweek, пиши пропало, то есть быстро продавай акции этой компании.
Статистическая дискриминация
В каких случаях следует опираться на то, что подсказывает нам теория вероятностей, а в каких не стоит? В 2003 году Анна Диамантопуло, еврокомиссар по проблемам занятости и социальным вопросам, предложила запретить страховым компаниям применять разные ставки к мужчинам и женщинам, поскольку это нарушает принцип равноправия, исповедуемый Евросоюзом. Однако страховые компании не рассматривают такие надбавки как гендерную дискриминацию — для них это всего лишь статистика. Мужчины обычно больше платят за автостраховку, поскольку чаще попадают в аварии. А женщины больше платят за аннуитеты (финансовый продукт, который выплачивает фиксированную ежемесячную или ежегодную сумму), поскольку живут дольше. Очевидно, что многие женщины попадают в аварии чаще, чем многие мужчины, а многие мужчины живут дольше, чем многие женщины. Но, как говорилось в предыдущей главе, страховщикам нет до этого дела. Их интересуют лишь среднестатистические показатели, именно они позволяют им получать прибыль. Что же касается европейских политиков, запретивших страховые надбавки в зависимости от пола (эта норма вступила в силу в 2012 году), то они и не утверждают, будто страхуемые риски не связаны с полом, а лишь заявляют о неприемлемости увязки с полом ставок страхования.
Поначалу это кажется всего лишь раздражающей данью политкорректности. Но после некоторого размышления я не стал бы торопиться с таким выводом. Помните информацию о предотвращении преступлений? Как реагировать на вероятностные модели, говорящие, что мексиканские наркоторговцы чаще всего оказываются испаноязычными мужчинами в возрасте от 18 до 30 лет и перевозят товар в красных грузовиках-пикапах где-то между девятью и двенадцатью часами ночи, если нам также известно, что подавляющее большинство испаноязычных мужчин, соответствующих этому описанию, не промышляют контрабандой метамфетамина? Теория вероятностей указывает нам, какие события более вероятны, а какие менее. Да, речь идет лишь о базовой статистике. Но это статистика с социальными последствиями. Если мы хотим поймать уголовных преступников, террористов и наркоторговцев, то обязаны использовать все имеющиеся в нашем распоряжении инструменты. Теория вероятностей может быть одним из них. Наивно полагать, будто пол, возраст, расовая принадлежность, национальность, вероисповедание и страна происхождения человека в своей совокупности не играют никакой роли в том, что касается правоприменения.
Однако вопрос, что мы можем или должны делать с информацией такого рода, является философско-правовым (но отнюдь не статистическим). Буквально каждый день мы получаем все больше информации о все более широком круге явлений. Одобрим ли мы дискриминацию, если соответствующие данные говорят, что мы будем правы гораздо чаще, чем неправы? (Именно отсюда происходит термин «статистическая дискриминация», или «рациональная дискриминация».) Точно такой же анализ, какой использовался, чтобы выяснить, что люди, покупающие корм для птиц, менее склонны увиливать от оплаты по кредитным карточкам (представьте, это действительно так!), может применяться ко всем остальным аспектам нашей жизни. Какая часть всего этого может быть приемлема для нас? Если нам удастся разработать модель, позволяющую выявлять наркоторговцев в 80 случаях из 100, что случится с оставшимися 20% невинных людей? Для них эта модель представляет угрозу!
Проблема в том, что наша способность анализировать данные развилась в большей степени, чем понимание того, что делать с результатами этого анализа. Вы можете соглашаться или нет с решением Еврокомиссии, запрещающим применение страховых надбавок, связанных с полом человека, но я уверен, что это не последнее спорное решение такого рода. Нам нравится думать о числах как о «холодных, неумолимых фактах». Если вычисления выполнены правильно, то должен получиться правильный ответ. Однако подчас мы можем правильно все рассчитать — и двинуться в опасном направлении. Мы можем разрушить финансовую систему или упечь за решетку 22-летнего белого парня, которому не повезло оказаться в определенное время в определенном месте, потому что, согласно статистической модели, он явился туда, чтобы купить наркотики. Какой бы соблазнительной ни была элегантность и точность вероятностных моделей, они не заменят здравого размышления о сути и цели выполняемых вычислений.