Мысли о голкиперах: модель ожидаемого сейва

Мастерство голкипера, особенно при небольшой статистической выборке, обычно сложно оценивать реально. Это связано с тем, кто реализация каждого голевого момента помимо действий и скилла вратаря связана с множеством случайных факторов.

Для того чтобы все-таки понять и оценить вклад голкипера рассмотрим модель ожидаемого сейва (expected save). Для построения модели использована статистика чемпионатов Англии, Испании, Германии и Италии за последние 4 сезона, без учета пенальти. Модель учитывает следующие факторы:

откуда нанесен удар, под каким углом,
удар головой или ногой,
в какую зону ворот нанесен удар.

Безусловно, удар в угол ворот из района 11-метровой отметки чаще станет голевым, а дальний выстрел по центру прямо во вратаря это чаще всего легкий сейв. Для оценки мы рассмотрим значение ожидаемого гола для каждого удара, нанесенного в створ, и сравним с реальным показателем. В идеальных условиях мы могли бы оценить мастерство голкипера, взяв разницу между реальным и ожидаемым значением, и получить рейтинг вратарей.

Однако мы живем не в идеальном мире, соответственно возникают следующие нюансы.

Красный маркер это индивидуальный рейтинг вратаря. Чем выше маркер на схеме – тем выше рейтинг. Как мы видим, для небольшого общего числа ударов в створ в схеме огромный разброс, который постепенно исчезает с увеличение количества ударов — регресс к среднему значению. Разброс вызван тем фактом, что некоторые вратари вследствие небольшого наигрыша не имели возможности отразить много ударов. То есть, вратарь мог отразить 100 % ударов (допустим, один из одного) или 0 % (если третий вратарь вышел на замену на пять минут в сезоне).

По вертикали - рейтинг скилла (разница между ожидаемым и реальным исходом удара),

по горизонтали - общее количество ударов в створ.

Красный маркер на схеме это индивидуальный рейтинг вратаря. Чем выше маркер – тем выше рейтинг. Как мы видим, для небольшого общего числа ударов в створ в схеме огромный разброс, который постепенно исчезает с увеличение количества ударов — регресс к среднему значению. Разброс вызван тем фактом, что некоторые вратари вследствие небольшого наигрыша не имели возможности отразить много ударов. То есть, вратарь мог отразить 100 % ударов (допустим, один из одного) или 0 % (если третий вратарь вышел на замену на пять минут в сезоне).

Очевидно мы не можем дать реальную оценку голкиперу после нескольких сейвов. Как вариант, можно провести 10000 компьютерных симуляций, основанных на ожидаемом исходе конкретного удара, и снова оценить разницу между показателями, но подобный тест не всегда поможет получить реальный рейтинг.

В реальных условиях эффективно оценивать мы можем лишь тех игроков, по воротам которых наносится достаточное количество ударов. За сезон по воротам наносится в среднем чуть более 100 ударов (для нашей выборки среднее значение — 119 ударов). Поэтому огромное значение играет случайность — неудивительно, что годовые показатели вратаря редко совпадают, если рассмотреть последовательно сезон за сезоном.

С увеличением общего количества ударов на схеме картина начинает вырисовываться. После 200, и тем более после 400 ударов, соотношение «сигнал/шум» растет. Проанализировав расположение маркеров в зоне с общим количеством ударов 200+, мы сможем выделить вратарей с показателями лучше или хуже среднего уровня.

В таблице приведен топ-10 вратарей с более 200 ударами за последние 4 сезона по данным Opta. По именам рейтинг выглядит внушительно, при этом, безусловно, некоторые игроки из списка могут иметь серьезные недочеты в игре за исключением умения отражать удары, но это уже тема отдельного исследования.

(Заголовки колонок: Имя, Минуты (на поле), Удары (в створ), % ожидаемых сейвов, % реальных сейвов, разница между реальным и ожидаемым % сейвов, Рейтинг мастерства (скилл))

Итак, с одной стороны мы имеем модель с множеством значений, которые разнятся от сезона к сезону. Но также мы можем применить определенные методы для нивелирования шума и выделения сигнала на основании значительной статистической выборки. Вдобавок, даже имея достаточно данных, все равно есть шанс ошибиться при составлении подобных рейтингов, ведь все аспекты игры вратаря в пределах одной модели учесть нереально.

К тому же, как мы видим, для понимания реального уровня вратаря необходимо 2 — 3 сезона только на сбор данных, что в нынешних условиях недоступная роскошь. Но, возможно подобный долгосрочный подход к оценке мастерства голкипера поможет некоторым клубам, ведь сейчас ни на одной позиции мы не видим такой частой ротации как на одной из самых важных — вратарской. В некоторых случаях даже 80 %-я уверенность в том, выбранный вратарь будет выручать чаще конкурентов, является хорошим результатом.

В заключение можно сказать, мы можем оценивать вратарей по совершенным сейвам, для этого нужно всего лишь иметь достаточную статистическую выборку и быть готовым к небольшим сюрпризам.

Все новости

Новости футбола

ПСЖ составил список из четырех потенциальных новичков

«Бавария» рассталась с двумя игроками

Еще один лидер «Ньюкасла» на прицеле топ-клуба

«Арсенал» выставит на трансфер 7 игроков

«Реал» выберет между Кроосом и Модричем

МЮ не может избавиться от полузащитника

В «Барселоне» надеются устроить распродажу игроков летом

Хаверц: "Я буду самым большим фанатом Тоттенхэма"

Мысли о голкиперах: модель ожидаемого сейва