На сегодня сегмент систем мониторинга и аналитики в спорте оценивается в $764,3 млн, а к 2023 году ему предрекают рост до $15,5 млрд. У больших данных в спорте есть серьезный потенциал, но это игра вдолгую: ценность аналитики данных растет с их накоплением.
Для игровых видов спорта лучше всего подходят системы аналитики объемных массивов статистической информации, позволяющие обнаруживать скрытые паттерны в действиях команды по ходу сезона и корректировать тактические схемы, выявлять незаметные слабые и сильные места игроков, а также разбирать игру соперника на ближайший матч.
Данные дают результаты
Практически в каждом игровом виде спорта сегодня используются свои показатели и коэффициенты эффективности действий игроков и команды в целом, которые ранее аналитики попросту не выявляли и не использовали.
Так, показатель CORSI в хоккее (соотношение бросков: в створ ворот, мимо ворот и заблокированных игроками соперника) помогает менеджменту команды выявлять наиболее эффективных игроков в составе, составляя из них оптимальные сочетания, что приводит к повышению результативности клуба. Также выявляются и самые слабые — при этом вовсе не обязательно очевидные — звенья в игровой схеме команды в перспективе будущих корректировок (перевод игрока на другую позицию, подбор новых партнеров или обмен).
Одним из адептов применения CORSI в практике управления клубом в НХЛ стала команда «Торонто Мэйпл Лифс», совсем недавно начавшая попадать в плей-офф после долгого перерыва. В этом году ее и вовсе называют одним из претендентов на победу в Кубке Стэнли.
По такому же принципу работает футбольный показатель xG — «ожидаемые голы». Это система, позволяющая оценивать каждый удар по воротам с максимальной детализацией, принимая во внимание все составляющие, которые привели к нанесению удара (позиция бьющего относительно ворот, какой частью тела бил игрок, из какой части поля он получил передачу, точность удара, результат — гол, аут, угловой, продолжение игры — и т. д.).
Анализируя xG команды по итогам игры, тренерский штаб получает максимально объективную картину действий своих игроков. Выявляются эффективные и неэффективные игровые паттерны, связки игроков, закономерности, очевидные при более «грубом» анализе, — например, «удары в створ ворот». Аналогичную роль в баскетболе играют показатели Win Shares и VORP, в бейсболе — саберметрика.
Детальный разбор игровых действий каждого игрока, различных линий (обороны, атаки) команды и коллектива в целом в сопоставлении с данными о тренировках и восстановлении открывают новые горизонты развития спорта.
Будущее, которое уже наступило
Собственно, большие данные в спорте уже используются, и большой тайны в этом нет. Все помнят полуфинал Кубка мира по футболу 2014 между Бразилией и Германией (1:7). Немецкая федерация футбола после сенсационного разгрома охотно делилась вкладом продвинутого анализа игры. Дескать, никакого чуда, мы просто их просчитали, отталкиваясь от игры.
Прежде всего, анализ игры с помощью инструментов big data позволил существенно увеличить скорость перепасовки в центре поля — по ходу турнира команда повышала этот показатель, и к полуфиналу с Бразилией со средних 3,4 с на одну передачу научилась тратить всего 1,1 с.
Воспользовавшись перекосом состава бразильцев в пользу атакующей линии в ущерб середине поля, а также рядом неочевидных кадровых решений тренерского штаба латиноамериканцев (защитник Марсело играл под нападающими), немцы буквально растерзали хозяев чемпионата мира.
Бейсбольные «Оклендс Атлетикс» в середине 2000-х показывали невероятную эффективность. С помощью глубокого анализа больших данных они собирали сверхдешевые составы из никому не известных или всеми забытых игроков и выходили в плей-офф 4 раза подряд, а всего — 5 раз за 7 сезонов.
Клуб английской футбольной Премьер-лиги «Лестер» сотворил настоящую футбольную сенсацию в 2016 году, став впервые в своей истории обладателем почетного титула. Это произошло во многом благодаря внедрению в тренировочный и игровой процесс многокомпонентной системы digital-инструментов сбора и обработки информации, описывающей различные параметры игры.
Отметим, что одним из пионеров научного data-ориентированного подхода к тренировочному процессу, развитию игроков и созданию тактического рисунка под конкретного противника был СССР, где комплексную аналитическую работу с помощью ЭВМ проводили еще на стыке 70-80-х годов прошлого века.
Большие данные решают не все
Несмотря на осязаемые результаты применения Big Data в большом спорте, а также вполне реальные перспективы их использования в новых областях, возникают и новые угрозы.
Во-первых, чем больше в профессиональном спорте зависит от данных, тем большую ценность они представляют и тем большие риски возникают при их утечках. В индустрии используются все больше датчиков и носимых устройств, данные с которых чрезвычайно важны.
Производители таких устройств пока мало заботятся о кибербезопасности, допуская риск взлома и кражи ценных сведений. Так, в 2018 году данные 150 млн пользователей фитнес-трекеров MyFitnessPal оказались скомпрометированными в результате утечки — по сути, аналогичные носимые устройства используются профессиональными командами во всех игровых видах спорта.
Ряд спортивных состязаний завязан на данных. Например, гонки «Формулы-1» — здесь ущерб от взлома, утечки или подмены информации станет катастрофическим, вплоть до летальных исходов, если исказить отчет о работе двигателя или ходовой болида.
Во-вторых, важнейший и пока еще плохо осознаваемый тип угроз от Big Data в спорте — переоценка возможностей ИИ, а также недооценка традиционных для большого спорта компонентов: психологии победителя, факторов травмы ведущих игроков по ходу турнира или матча, низкий уровень настроя фаворита в матче с аутсайдером.
Знаменитый Moneyball одного из апологетов спортивной аналитики Билли Бина в итоге не сработал. Несмотря на чудеса оптимизации соотношения «состав/результат», «Окленд» в 2000-х ни разу не выходил в финал чемпионата лиги. Победы продолжают одерживать клубы с суперзвездами за сотни миллионов долларов в составе.
Можно предположить, что в хоккейном финале Олимпиады-2018 Россия победила Германию не благодаря продвинутой системе аналитики игры и тонко продуманной тактической схеме, а в первую очередь за счет выдающейся индивидуальной игры Никиты Гусева.
Наконец, в свете успеха на чемпионате мира 2014 можно не сомневаться, что сборная Германии к первенству 2018 года в России готовилась по тем же лекалам и на основе тех же умных технологий, которые принесли ей триумф в Бразилии. Однако никакой ИИ не научил «манншафт», как не проиграть 0:2 Южной Корее в решающей игре.
Анализ Big Data в большом профессиональном спорте, скорее всего, никогда не станет волшебной палочкой, взмах которой принесет гарантированную победу в Лиге чемпионов, на Кубке мира или Олимпиаде. Спортивным менеджерам еще только предстоит понять, что именно за инструмент оказался в их руках и на что они могут рассчитывать при его применении.
Однако командам, обладающим сравнимыми ресурсами, необходимо учиться работе с большими данными: сегодняшние отличники в этой области подготовки, скорее всего, завтрашние чемпионы.