К сожалению, сайт не работает без включенного JavaScript. Пожалуйста, включите JavaScript в настройках вашего броузера.

Прогноз Евро-2016: система Microsoft предсказывает победу Германии

Фото REUTERS / Ina Fassbender
Фото REUTERS / Ina Fassbender
Мониторинг высказываний в соцсетях добавляет 5% к точности прогноза

Система от Microsoft под названием Cortana Intelligence Suite прогнозирует, что в чемпионате Европы по футболу с вероятностью 66% победит Германия. Как утверждает искусственный интеллект, в матче с Англией 11 июня Россия не забьет ни одного гола, проведет менее четырех атак, а число результативных пасов не превысит 221.

Для прогнозирования результатов Cortana Intelligence Suite использует комплексный анализ двух факторов: статистические данные (соотношение побед и поражений команды, количество забитых голов, место проведения матча, погодные условия) и данные веб-поиска и социальных сетей (феномен «коллективного разума»). Шанс выигрыша каждой команды определяется в процентном соотношении, рассчитывается вероятность ничьей в матчах для каждой игры отборочного тура.

Систему впервые опробовали на предсказании результатов матчей Чемпионата мира по футболу в 2014 году. Тогда правильными оказались 15 из 16 прогнозов исходов игр. После этого Microsoft составляла прогнозы для чемпионата мира по футболу среди женщин, английской Премьер-лиги, Лиги чемпионов УЕФА, чемпионата Бразилии, чемпионата Франции, чемпионата Испании, чемпионата Германии, чемпионата Италии.

 

Алгоритмы анализируют результаты матчей всех этих соревнований и выявляют, что именно приводит команды к успеху. Достижения одной команды разных лет относятся не только к успехам той же самой команды. Например, «игра на своем поле» в 2000 году, которая помогла команде Нидерландов продвинуться в зачете, влияет и на результаты сборной Франции в 2016 году. Предиктивные алгоритмы, анализируя большой массив данных, понимают, что одни команды лучше играют в определенных погодных условиях, а другие побеждают, когда противостоят тому или иному стилю игры противника.

quote_block node/296431Результаты анализа статистики дополняет анализ мнений «коллективного разума». Как оказалось, качество прогноза любителей спорта зависит от доступной им достоверной информации. Но даже имея достаточно много сведений, люди не всегда делают правильный прогноз.

 

Например, в 2016 году по итогам чемпионата Национальной футбольной лиги США по американскому футболу было много критики в адрес команды Новой Англии, за то что она не попросила тайм-аут за одну минуту до конца игры. Это не пришло в голову тренеру. Люди, конечно, тоже не могли предвидеть, что именно тайм-аут решит судьбу матча.

К тому же эксперты Microsoft обнаружили, что анализ поисковых запросов любителей спорта и их публикаций в соцсетях позволяет лучше узнать мнения людей, чем соцопросы. Оказывается, отвечая социологам, люди находятся под влиянием предубеждений, а в их интернет-активности этого нет.

В целом феномен «коллективного знания» недооценен, считают в Microsoft. Результаты мероприятий, на которые, казалось бы общественное мнение повлиять не может (футбольные чемпионаты как раз этот случай), на самом деле можно предсказать, анализируя поведение людей в интернете. Так Cortana Intelligence Suite прогнозирует результаты ТВ-шоу, выборов, церемоний награждения и самых разных конкурсов, основанных на голосовании. Cortana Intelligence Suite выявляет, какие именно публичные действия пользователей коррелируют с распределением голосов. На этих корреляциях и составляются предиктивные алгоритмы.

 
лауреатов «Оскара»

С 2015 года эта же система делала предсказания по победителям для самых популярных еженедельных шоу в США American Idol, The Voice и Dancing with the Stars, и точность была более 85%, говорят в Microsoft.

Мероприятия, механизмы прогнозирования которых несколько различаются, делятся на три категории: конкурсы со зрительским голосованием, конкурсы с жюри и соревнования. Легче всего предсказать результаты для первой категории — достаточно анализа информации из открытых источников и социальных сетей, чтобы определить мнение большинства. Для второй категории нужен более сложный анализ, сочетающий мнение масс и объективные факторы, влияющие на выбор жюри. Третья категория, к которой относятся спортивные игры, является самой сложной для предсказаний, так как на нее влияет огромное количество не связанных друг с другом факторов. Но здесь срабатывает такой феномен, как «мудрость толпы».

«Идея проста: никто не может знать все, но совокупные знания большого количества отдельных людей формируют глобальное мнение, обладающее предикативными свойствами благодаря содержанию самой последней релевантной информации», — говорит Дмитрий Марченко, директор по маркетингу технологий обработки данных и облачной платформы Microsoft в России. Такой подход очень результативен в случае форс-мажоров. Если, например, игрок получает травму или красную карточку. Эти непредсказуемые события создают необходимость корректировать прогноз «в реальном времени». Сделать это можно, только анализируя отклик людей на произошедшее — мониторинг высказываний в онлайн-среде позволяет это.

Алгоритмы машинного обучения уже продемонстрировали способность извлекать скрытые закономерности в данных, недоступные нашему взгляду, отмечает Дмитрий Коробченко, глава проектов в исследовательском центре Samsung. Анализ высказываний пользователей в интернете как раз может помочь найти такие неявные взаимосвязи. «Действительно может оказаться, что алгоритмы машинного обучения нашли скрытые корреляции между не связанными на первый взгляд событиями (общественное мнение и результаты спортивных состязаний), — говорит Коробченко. — С другой стороны, таких признаков (факторов) может быть очень много. Одни из них будут релевантными и потому прибавят точности предсказанию, другие  «шумом» и будут портить результат». Поэтому выбирают подмножество, объясняет Коробченко, причем выбор связан с доступностью данных. Например, легко собирать данные по запросам в поисковиках и социальным сетям,  а вот получить данные о кардиограмме каждого футболиста на поле  — сложно, хотя  это, возможно, могло бы быть более релевантным фактором. Получается, принцип «больше данных — лучше» не всегда оправдан. 

Прогнозы с использованием машинного обучения становятся все интереснее и бизнесу, и обычным людям, отмечает Михаил Левин, руководитель службы анализа больших данных «Яндекса». Технологии машинного обучения помогают корпорации прогнозировать, например, погоду, или спрос на товары с учетом промоакций. Для «Росавтодора» Yandex Data Factory предсказывала самые аварийно опасные участки дорог, а для Wargaming  — отток пользователей из игры World of Tanks. «Предиктивные алгоритмы —  горячая тема в техническом образовании, — отмечает Левин. — Например, совместно с ВШЭ мы запустили курс по машинному обучению на Coursera. В финальном проекте студентам нужно предсказывать результаты игр в Dota. В общем, любой студент может записаться на бесплатный курс и, закончив его, делать свои прогнозы  о результатах матчей».

 

«Каждый, кто начинает более-менее глубоко заниматься машинным обучением, задумывается, не спрогнозировать ли котировки на бирже или исходы тех или иных соревнований или игр, — соглашается Виктор Канторстарший преподаватель кафедры «Алгоритмы и технологии программирования» факультета инноваций и высоких технологий МФТИ и руководитель исследовательской группы в Yandex Data Factory. — Можно оставить алгоритм делать ставки, а тебе останется радоваться постоянному доходу, путешествовать и наслаждаться жизнью. Людей обычно останавливают два фактора пока еще ненулевой порог входа на этот рынок и этические мотивы. Чаще, пожалуй, важнее первое, но признаваться в этом как-то неловко —  ссылаются на второе».

Мы в соцсетях:

Мобильное приложение Forbes Russia на Android

На сайте работает синтез речи

иконка маруси

Рассылка:

Наименование издания: forbes.ru

Cетевое издание «forbes.ru» зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций, регистрационный номер и дата принятия решения о регистрации: серия Эл № ФС77-82431 от 23 декабря 2021 г.

Адрес редакции, издателя: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Адрес редакции: 123022, г. Москва, ул. Звенигородская 2-я, д. 13, стр. 15, эт. 4, пом. X, ком. 1

Главный редактор: Мазурин Николай Дмитриевич

Адрес электронной почты редакции: press-release@forbes.ru

Номер телефона редакции: +7 (495) 565-32-06

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации)

Перепечатка материалов и использование их в любой форме, в том числе и в электронных СМИ, возможны только с письменного разрешения редакции. Товарный знак Forbes является исключительной собственностью Forbes Media Asia Pte. Limited. Все права защищены.
AO «АС Рус Медиа» · 2024
16+