БК Pinnacle против игроков-профи: кто круче?

01 Августа , 06:23
Автор Pinnacle
БК Pinnacle против игроков-профи: кто круче?
На примере достаточно известного в мире источника прогнозов на футбольные матчи под названием FiveThirtyEight мы попытаемся оценить их точность и сравнить с коэффициентами БК Pinnacle. Читайте дальше, чтобы узнать, есть ли в них ценность для бетторов.

По сути дела, коэффициенты букмекера представляют собой прямой прогноз, указывающий на вероятность наступления различных исходов для спортивного события. Они чаще всего выражены в десятичном представлении, и тогда вам необходимо просто инвертировать цифры, чтобы получить процентное выражение вероятности наступления соответствующего исхода. При этом имеет смысл немного поработать для устранения маржи букмекера. Коэффициент 2,00, например (в этом случае маржа уже была вычтена), предполагают вероятность исхода, равную 1/2,00 – 0,5 или же 50 %.

Разумеется, букмекер тоже может ошибаться. Благодаря ошибкам букмекеров у их клиентов появляется возможность найти ожидаемую ценность и получить прибыль в долгосрочной перспективе. Читателям этой статьи, впрочем, должно быть уже известно, что ошибки БК Pinnacle, в том числе и для рынка ставок на футбольные матчи, распределены случайным образом, и в общей картине дел коэффициенты этого букмекера достаточно достоверно отображают действительные шансы на исходы событий.

С этой точки зрения лучшим вариантом для выбора остаются коэффициенты линии закрытия, которые, помимо прочего, могут быть использованы для предсказания того, какую прибыльность стоит ожидать беттору.

Однако существуют и другие многочисленные группы прогнозистов, предлагающие собственные предсказания исходов футбольных матчей. В нашей стране они в последние годы и вовсе растут как грибы после дождя, предлагая как платные, так и бесплатные прогнозы на спортивные события. При этом платные предсказания «гарантируют», по их заверениям, 70%-ную и даже 80%-ную проходимость. Цифры, о которых даже гуру беттинга остается только мечтать.

Одной из таких широко известных в мире групп типстеров является платформа Fivethirtyeight.com. Здесь публикуются прогнозы политических, экономических и спортивных событий. Изначально это был блог, созданнный американским статистиком, бывшим игроком в покер и автором книги «Сигнал и шум» Нейтом Сильвером. Он сделал себе имя благодаря успешным предсказанием исходов президентских выборов в США для 49 из 50 штатов в 2008 г., а четыре года спустя ему удалось предсказать результаты для всех 50 штатов. Результат, согласитесь, впечатляет.

Для поклонника спорта или размещающего ставки игрока прогнозы FiveThirtyEight на исходы матчей особенно полезны, так как они указывают конкретные значения вероятностей для победы хозяев, победы гостей и ничейного исхода. Выполнив инверсию этих значений, мы можем моментально выяснить предполагаемые справедливые коэффициенты.

Цель любого беттора, отыскивающего ценные ставки, заключается в нахождении справедливых коэффициентов, которые более точно отражают вероятность исхода, чем коэффициенты букмекера. Если у игрока есть такая возможность, то ему всего лишь нужно размещать ставки с коэффициентами букмекера в тот момент времени, когда они имеют более высокое значение. И если игроку удается получать прибыль в долгосрочной перспективе, то это верный признак его умения рассчитывать более точные коэффициенты, чем их предлагает букмекер. Попытаемся понять, насколько FiveThirtyEight оправдывает чаяния своих подписчиков.

Прогностическая модель для футбольных матчей от FiveThirtyEight

Типстеры FiveThirtyEight впервые опубликовали прогноз на исход футбольного матча в январе 2017 года, хотя их база данных с результатами содержит записи, датированные августом 2016 года. Методология авторов этого блога основывается на использовании изначально разработанной Нейтом Сильвером «существенно измененной версии индекса силы футбольной команды (SPI) от ESPN». В этой модели используется показатель ожидаемых голов (или же xG) и результаты анализа статистического распределения Пуассона, исходя из которых генерируется матрица возможных исходов матча, позволяющая рассчитать вероятности победы хозяев, победы гостей и ничьей.

Прогнозисты FiveThirtyEight считают, что их прогнозы для футбольных матчей весьма хороши, а их рекомендации куда более ценны, чем попытка угадать результат без применения навыков. Могут ли их прогнозы действительно оказаться точнее предполагаемых вероятностей от компании БК Pinnacle? Попытаемся разобраться в этом честно и непредвзято.

Приносят ли прогнозы FiveThirtyEight прибыль?

Проанализировав базу данных с историей коэффициентов линии закрытия БК Pinnacle, а также рассмотрев открытые для исследования предполагаемые вероятности платформы FiveThirtyEight, мы составили выборку из более 16 тысяч сыгранных в период с 12 августа 2016 года до 31 марта 2019 года матчей различных европейских футбольных лиг и сравнили почти 50 тысяч пар коэффициентов для победы хозяев, победы гостей и ничьей.

В 20 093 случаях коэффициенты линии закрытия БК Pinnacle были выше, чем предполагаемые FiveThirtyEight вероятности. Средняя величина, на которую эти коэффициенты (со средним значением 4,12) оказывались в сравнении выше, составляла 16,2 % – это означает, что если бы мы пожелали размещать ставки одинакового размера с предложенными коэффициентами, нам бы удалось получить прибыль в размере 16,2 %, исходя из предположения, что в среднем коэффициенты FiveThirtyEight являются точным или эффективным представлением «справедливых» коэффициентов. На самом же деле, эти коэффициенты продемонстрировали убытки, равные –6,0 %, что даже хуже, чем убытки величиной в –4,3 % для размещенных со всеми 49 905 коэффициентами ставок.

На Графике 1 ниже продемонстрировано, как предполагаемые коэффициенты FiveThirtyEight не справились с задачей предсказания действительных доходов от размещения ставок с коэффициентами линии закрытия БК Pinnacle. Если мы разделим коэффициенты линии закрытия БК Pinnacle на предполагаемые коэффициенты FiveThirtyEight, то получим значение ожидаемой прибыли для выбранной ставки (с учетом предположения, что коэффициенты FiveThirtyEight являются эффективными).

Теперь сгруппируем ставки в соответствии с инкрементальным увеличением ожидаемой прибыли (с шагом в 0,01): можно заметить, что ожидаемая прибыль вовсе не коррелирует с действительной прибылью от ставок. Вне зависимости от соотношения коэффициентов линии закрытия БК Pinnacle и предполагаемых коэффициентов FiveThirtyEight средняя прибыль остается отрицательной и составляет –6 %. Получается, что по сравнению с коэффициентами линии закрытия БК Pinnacle коэффициенты FiveThirtyEight вовсе не содержат прогностической ценности.

Но что изменится, если мы рассмотрим ситуацию с противоположной стороны? На этот раз давайте предположим, что в качестве букмекера выступает FiveThirtyEight, а БК Pinnacle предлагает лишь прогностическую модель. Для измерения ожидаемой прибыли будем использовать отношение коэффициентов FiveThirtyEight к справедливым коэффициентам линии закрытия БК Pinnacle за вычетом маржи.

Размещение ставок с коэффициентами FiveThirtyEight для 25 557 случаев, в которых они превосходят справедливые коэффициенты линии закрытия БК Pinnacle, предлагает действительную прибыль в 15,5 %, что очень близко к усредненному преимуществу, величина которого составляет 15,9 % (усредненные коэффициенты равны 4,49). График 2 показывает сильную корреляцию между ожидаемой и действительной прибылями для этой инвертированной гипотезы. Наклон линии тренда существует практически в единственном экземпляре и проходит через начальную точку (показанное здесь уравнение y = mx + c). Это свидетельствует, что высокоэффективными являются именно коэффициенты линии закрытия БК Pinnacle, а не уважаемой платформы.

Корректны ли сравнения?

При публикации этих исследований в Твиттере читаетли указывали, что мы, по сути, сравниваем яблоки с апельсинами. Прогностические вероятности FiveThirtyEight рассчитываются до начала соревнований, а итоговая оценка вероятности публикуется еще до того, как завершается предпоследний матч команды. До рассматриваемого матча пройдет еще не один день. И степень точности опубликованных прогнозов целиком и полностью зависит от имеющейся на момент их формирования информации.

В то же время коэффициенты линии закрытия БК Pinnacle отражают в себе всю информацию, доступную на рынке до момента начала самого матча. В этих коэффициентах будут учитываться такие факторы, как травмы игроков, изменения состава команд, погодные условия и состояние поля – все то, что платформа FiveThirtyEight не сможет учесть по объективным причинам.

Чтобы сделать абсолютно честное сравнение прогностической модели с коэффициентами линии закрытия БК Pinnacle, требовалось бы убедить типстеров из FiveThirtyEight рассчитывать и публиковать прогнозы в одно и то же время с БК Pinnacle, то есть прямо перед началом матча. Но этого, конечно же, не случится. В качестве альтернативного варианта мы могли бы использовать коэффициенты БК Pinnacle, опубликованные одновременно с прогнозами FiveThirtyEight для соответствующего матча. Увы, но мы не располагаем данными по коэффициентам БК Pinnacle с временными метками, и даже если бы их удалось найти, опубликованные коэффициенты линии открытия БК Pinnacle все равно появляются позже, чем итоговые публикации прогнозов FiveThirtyEight.

Но даже с учетом всего вышесказанного использование коэффициентов линии открытия БК Pinnacle потенциально способно предложить более честное сравнение моделей, чем использование коэффициентов линии закрытия. Давайте рассмотрим полученные результаты. В 18 952 случаях коэффициенты линии открытия БК Pinnacle были выше, чем коэффициенты FiveThirtyEight (среднее значение: 3,97), усредненное преимущество составляло 14,2 %. Этим случаям соответствовали убытки, равные –4,1 %, что несколько лучше, чем равные –4,4 % убытки при размещении ставок со всеми 49 905 коэффициентами. Как и раньше, здесь мы практически не наблюдаем корреляции между ожидаемой и действительной прибылью, что отражено на Графике 3.

Повторив сравнение моделей в инверсии, и используя коэффициенты линии открытия БК Pinnacle в качестве «истинных», мы увидим, что уровень корреляции окажется куда выше – не настолько точным, как для коэффициентов линии закрытия, но все же близким к равенству. Размещение ставок с коэффициентами FiveThirtyEight для 25 775 случаев, в которых они превосходят справедливые коэффициенты БК Pinnacle, предлагает действительную прибыль в 12,8 %, что снова сравнительно близко к усредненному преимуществу, величина которого составляет 14,8 % (усредненные коэффициенты равны 4,54).

Сигнал и шум

Изученные нами данные говорят сами за себя. На наш взгляд, прогностические возможности FiveThirtyEight с точки зрения информативности уступают коэффициентам БК Pinnacle, как из-за разницы во времени публикации, так и по той причине, что правильное формирование коэффициентов является основой бизнес-модели БК Pinnacle, а блог FiveThirtyEight существует скорее для игроков, делающих ставки ради развлечения. Доход типстеров FiveThirtyEight не зависит от их прогнозов или, по крайней мере, не зависит от прогнозов напрямую. Справедливости ради, стоит также упомянуть, что авторы FiveThirtyEight и не задаются целью формировать свои прогнозы так, чтобы они были пригодны к использованию в беттинге.

Попробуем провести еще один интересный мысленный эксперимент. Объединив обе прогностические модели, можно попытаться создать третью модель, эффективность которой будет превышать отдельно взятые коэффициенты БК Pinnacle. Так мы сможем подтвердить или опровергнуть наличие в прогнозах FiveThirtyEight некоторых полезных данных, которые могли бы дополнить полезные данные, содержащиеся в коэффициентах БК Pinnacle.

Пока наш анализ сводился к выбору одного из двух вариантов: какая из двух прогностических моделей является более точным источником информации. Полученные ответы были как исчерпывающими, так и предсказуемыми. Давайте добавим немного интриги и переформулируем вопрос нашего исследования.

Допустим, конечная вероятность любого рассматриваемого исхода = Z * (вероятность наступления этого исхода по версии FiveThirtyEight) + (1 – Z) * (вероятность наступления этого исхода по версии БК Pinnacle) для каждого Z, значение которого соответствует условию 0 ≤ Z ≤ 1. Посмотрим, какое значение Z позволит максимизировать прогностическую ценность конечных вероятностей.

Такая модель будет достаточно гибкой для возможности расчета конечных вероятностей на основе прогнозов, принадлежащих исключительно FiveThirtyEight (если мы примем Z = 1), исключительно БК Pinnacle (если Z = 0), или на основе любого промежуточного варианта (если 0 ≤ Z ≤ 1).

Но как определить оптимальное значение Z? Существует несколько возможных вариантов, но мы будем использовать оценивание методом максимального правдоподобия (MLE). Целью MLE является нахождение значений одного или нескольких неизвестных параметров, наилучшим образом «подходящих» к набору изучаемых данных. Как нам измерить степень того, насколько «подходит» найденное значение? Эта задача решается сравнением зависящей от значения неизвестного параметра степени правдоподобия наблюдаемых нами значений и того, что мы уже наблюдали до этого.

Сформированная нами выше модель обладает единственным параметром: Z. Любое из значений Z позволит нам рассчитать для каждого матча в этом наборе данных комплект «итоговых» вероятностей победы хозяев, ничейного результата или победы гостей, зависящих от именно этого значения Z. Для каждого матча степень правдоподобия наблюдаемых значений в соответствии с тем, что мы уже наблюдали, станет нашей конечной вероятностью победы хозяев, ничьей или победы гостей, если результатом матча стали победа хозяев, ничейный результат или победа гостей соответственно.

Например, рассмотрим ситуацию для вероятностей победы хозяев, ничейного результата и победы гостей, соответственно равных 0,5, 0,3 и 0,2. Иными словами, если результатом матча будет ничья, то степень правдоподобия наблюдаемых данных для того, что мы уже наблюдали, составляет 0,3.

Поскольку отдельные матчи являются независимыми событиями, степень правдоподобия для набора исходов, идентичного наблюдаемым ранее исходам, будет равняться произведению степеней правдоподобия для каждого отдельно взятого матча. Максимизация этого произведения станет той целью, для которой мы будем пытаться скорректировать значение Z.

Понятно, что произведение 16 635 вероятностей бесконечно мало (можете попытаться представить себе ставку из 16 635 ставок). Таким образом, перед нами возникает проблема вычисления точного значения при расчете MLE с использованием таких инструментов, как Excel: программные ограничения не позволяют рассчитать малые значения ниже определенного порога, ведь все, что оказывается меньше этого ограничения, округляется до нуля.

Чтобы обойти эту проблему, мы можем попытаться максимизировать логарифм степени правдоподобия. Так как абсолютное значение степени правдоподобия нерелевантно для процедуры расчета MLE (единственное, что для нас важно, это характер изменения степени правдоподобия в зависимости от корректировки параметров), максимизация логарифма степени правдоподобия будет математически эквивалентна необходимой нам операции.

Кроме того, что мы будем брать логарифмы итоговых вероятностей исходов матча, вместо произведения мы будем рассчитывать сумму логарифмов степеней правдоподобия. Выполнение этой аналитической процедуры на имеющемся наборе данных даст нам такие результаты:

  • При использовании коэффициентов линии закрытия БК Pinnacle логарифм степени правдоподобия достигает максимума при Z = 0. Другими словами, прогнозы FiveThirtyEight не привносят никакого оптимизирующего влияния в модель составления конечных прогнозов, если рассматриваются только прогнозы FiveThirtyEight и БК Pinnacle.
  • При использовании коэффициентов линии открытия Pinnacle логарифм степени правдоподобия достигает максимума при Z = 0,04. Таким образом, эффективность конечной модели примерно на 4 % зависит от данных FiveThirtyEight.

Коллективные модели коэффициентов

Наиболее интересен для нас второй результат. Если необходимо выбрать только один источник данных, то линия открытия БК Pinnacle обладает прогностической ценностью, которая объективно в значительной мере превышает ценность прогнозов FiveThirtyEight. Правда, есть одно обстоятельство, над которым стоит поразмышлять: средневзвешенное значение из комбинации 4 % от прогнозов FiveThirtyEight и 96 % от коэффициентов линии открытия БК Pinnacle обладает более высокой прогностической ценностью, чем прогнозы любой из обеих сторон по отдельности.

Но есть ли ценность в этом результате для размещающих ставки игроков? На практическом уровне – не такая уж и весомая. 4% – это слишком малая для применения величина, и, кроме того, она может обладать незначительным статистическим характером. Но что было бы, если бы мы выбрали большее значение Z? И как изменилось бы положение дел, если бы вместо двух прогнозов у нас было бы куда большее число предсказаний, каждое с собственным значением Z? Мы столкнулись с проявлением вариации теории «коллективного мнения», согласно которой комбинация из отдельных прогнозов может оказаться более ценной, чем один отдельно взятый прогноз, обладающий наивысшей ценностью.

По сути, именно благодаря действию этой теории коэффициенты БК Pinnacle и оказываются такими точными. Значения для линий задаются наиболее информированными и профессиональными трейдерами. Кроме того, они позволяют вступить в игру профессиональным игрокам, а не отказывают им в участии – такие игроки выступают в качестве вспомогательного источника информации для корректировки значений линий, благодаря чему коэффициенты становятся еще более точными. Коэффициенты линии закрытия БК Pinnacle в своей сущности представляют «коллективные прогностические модели» и отражают конечные значения вероятностей. Поэтому качество прогнозов FiveThirtyEight всегда будет объективно ниже.

Аналитические материалы предоставлены БК Pinnacle.

Комментарии

Комментарии модерируются. Пишите корректно и дружелюбно.