İstatistiksel dernek futbol tahminleri - Statistical association football predictions

İstatistiksel Futbol tahmini , spor bahislerinde , istatistiksel araçlar vasıtasıyla futbol maçlarının sonucunu tahmin etmek için kullanılan bir yöntemdir . İstatistiksel maç tahmininin amacı , onları futbol maçlarının sonucuyla ilgili oranlar belirlemek için kullanan bahisçilerin tahminlerinden daha iyi performans göstermektir .

Tahmin için en yaygın kullanılan istatistiksel yaklaşım sıralamadır . Futbol sıralama sistemleri, her takıma geçmiş maç sonuçlarına göre bir sıralama atar, böylece en yüksek sıralama en güçlü takıma atanır. Maçın sonucu, rakiplerin sıralarını karşılaştırarak tahmin edilebilir. Birkaç farklı futbol sıralama sistemi mevcuttur, örneğin bazıları yaygın olarak bilinen FIFA Dünya Sıralaması veya Dünya Futbolu Elo Derecelendirmesidir .

Sıralama sistemlerine dayalı futbol maçı tahminlerinin üç ana dezavantajı vardır:

  1. Takımlara atanan dereceler, onların hücum ve savunma güçleri arasında ayrım yapmaz.
  2. Sıralamalar, futbol takımlarındaki beceri değişikliklerini hesaba katmayan birikmiş ortalamalardır.
  3. Bir sıralama sisteminin temel amacı, futbol maçlarının sonuçlarını tahmin etmek değil, takımları ortalama güçlerine göre sıralamaktır.

Futbol tahminine başka bir yaklaşım, derecelendirme sistemleri olarak bilinir . Sıralama yalnızca takım sıralamasına atıfta bulunurken, derecelendirme sistemleri her takıma sürekli olarak ölçeklenen bir güç göstergesi atar. Ayrıca, derecelendirme sadece bir takıma değil, aynı zamanda hücum ve savunma kuvvetlerine, ev sahibi saha avantajına ve hatta her takım oyuncusunun becerilerine (Stern'e göre) atanabilir.

Tarih

Futbol öngörüleri için istatistiksel modelleri hakkında Yayınlar 90s görünmeye başladı, ancak ilk modeli çok daha erken onun analize göre 1956 yılında futbol maçı sonuçlarının ilk istatistiksel analiz yayınladı Moroney, hem tarafından önerilmiştir Poisson dağılımı ve negatif binom dağılımı sağlanır futbol oyunlarının sonuçlarına uygun bir uyum. Futbol maçları sırasında oyuncular arasında geçen top serisi, 1968'de Reep ve Benjamin tarafından negatif binom dağılımı kullanılarak başarılı bir şekilde analiz edildi. 1971'de bu yöntemi geliştirdiler ve 1974'te Hill, futbol maç sonuçlarının bir dereceye kadar tahmin edilebilir olduğunu ve sadece bir mesele olmadığını belirtti. şans eseri.

Farklı becerilere sahip takımlar arasındaki futbol maçlarının sonuçlarını tahmin eden ilk model, 1982 yılında Michael Maher tarafından önerildi. Modeline göre, rakiplerin oyun sırasında attığı goller Poisson dağılımından çiziliyor . Model parametreleri, hücum ve savunma becerileri arasındaki farkla tanımlanır ve ev sahibi avantajı faktörü ile ayarlanır. Ev sahibi avantajı faktörünü modelleme yöntemleri, 1992'de Caurneya ve Carron tarafından bir makalede özetlenmiştir. Takım güçlerinin zamana bağımlılığı 1999'da Knorr-Held tarafından analiz edilmiştir. Futbol takımlarını derecelendirmek için yinelemeli Bayes tahminini kullanmıştır : bu yöntem daha ortak ortalama istatistiklere dayalı futbol tahminine kıyasla gerçekçi.

Futbol Tahmin Yöntemleri

Tüm tahmin yöntemleri turnuva tipine, zamana bağlılığa ve regresyon algoritmasına göre kategorize edilebilir. Futbol tahmin yöntemleri Round-robin turnuvası ve Knockout yarışması arasında değişiklik gösterir . Knockout yarışmasının yöntemleri Diego Kuonen'in bir makalesinde özetlenmiştir.

Aşağıdaki tablo Round-robin turnuvası ile ilgili yöntemleri özetlemektedir .

# kod Tahmin Yöntemi Regresyon Algoritması Zamana Bağlılık Verim
1. TILS Zamandan Bağımsız En Küçük Kareler Derecelendirmesi Doğrusal En Küçük Kareler Regresyonu Numara Fakir
2. TİPR Zamandan Bağımsız Poisson Regresyonu Maksimum Olasılık Numara Orta
3. TISR Zamandan Bağımsız Skellam Regresyonu Maksimum Olasılık Numara Orta
4. TDPR Zamana Bağlı Poisson Regresyonu Maksimum Olasılık Zaman damping faktörü Yüksek
5. TDMC Zamana Bağlı Markov Zinciri Monte Carlo Markov Zinciri modeli Yüksek

Zamandan Bağımsız En Küçük Kareler Derecelendirmesi

Bu yöntem, turnuvadaki her takıma sürekli olarak ölçeklenen bir reyting değeri atamayı amaçlar, böylece en güçlü takım en yüksek reytinge sahip olur. Yöntem, rakip takımlara verilen reytingin her maçın sonucuyla orantılı olduğu varsayımına dayanmaktadır.

A, B, C ve D takımlarının bir turnuvada oynadığını ve maç sonuçlarının aşağıdaki gibi olduğunu varsayalım:

Kibrit # Ev sahibi takım Puan Deplasman Takımı Y
1 A 3 - 1 B
2 C 2 - 1 NS
3 NS 1 - 4 B
4 A 3 - 1 NS
5 B 2 - 0 C

Değerlendirmesi rağmen , , ve takımların A, B, C ve D sırasıyla bilinmemektedir, maçın 1. sonucunun ekipleri A ve B saflarına arasındaki fark ile orantılıdır farz edilebilir: . Bu sayede skor farkına tekabül eder ve gürültü gözlemidir. Turnuvadaki tüm maçlar için aynı varsayım yapılabilir:

Bir seçim matrisi X tanıtılarak, yukarıdaki denklemler kompakt bir biçimde yeniden yazılabilir:

Seçim matrisinin girişleri, 1 ev sahibi takımlara ve -1 deplasman takımlarına karşılık gelen 1, 0 veya -1 olabilir:

Matris tam ranklı ise sistemin cebirsel çözümü En Küçük kareler yöntemi ile bulunabilir:

Değilse, aşağıdakileri elde etmek için Moore-Penrose sözde tersini kullanabilir:

Son reyting parametreleri: Bu durumda en güçlü takım en yüksek reytinge sahiptir. Standart sıralama sistemlerine kıyasla bu derecelendirme yönteminin avantajı, sayıların sürekli olarak ölçeklenmesi ve ekiplerin güçleri arasındaki kesin farkı tanımlamasıdır.

Zamandan Bağımsız Poisson Regresyonu

Bu modelde (Maher) 'a göre, eğer ve ekibi ı ardından takım j, karşı oynadığı maçta attı hedefler şunlardır:

ve araçlarla bağımsız rasgele değişkenlerdir ve . Böylece, ev sahibi takımın x gol atması ve deplasman takımının y gol atmasının ortak olasılığı, iki bağımsız olasılığın bir ürünüdür:

Kuonen ve Lee'ye göre ve için genelleştirilmiş log-lineer model şu şekilde tanımlanır: ve burada sırasıyla hücum ve savunma güçleri ve ev sahası avantajına atıfta bulunur. ve sezon boyunca ev sahibi ve deplasman takımları tarafından atılan gollerin ortalamasını temsil eden düzeltme faktörleridir.

C'nin bir sezona katılan takım sayısını ve N'nin şimdiye kadar oynanan maç sayısını temsil ettiğini varsayarsak, takım güçleri, ve ile ilgili olarak negatif log-olasılık fonksiyonunu en aza indirerek tahmin edilebilir :

Buna göre ve biliniyorsa, negatif log olasılığını en aza indiren takımın hücum ve savunma güçleri ve ev sahibi avantajı Beklenti Maksimizasyonu ile tahmin edilebilir :

Bu model için iyileştirmeler Mark Dixon (istatistikçi) ve Stuart Coles tarafından önerildi . Bağımsız Poisson modelinin tutmadığı düşük 0-0, 1-0, 0-1 ve 1-1 puanları için bir korelasyon faktörü icat ettiler. Dimitris Karlis ve Ioannis Ntzoufras, Zamandan Bağımsız bir Skellam dağıtım modeli oluşturdu. Puan dağılımına uyan Poisson modelinden farklı olarak Skellam modeli, ev sahibi ve deplasman puanları arasındaki farka uyar.

Zamana Bağlı Markov Zinciri Monte Carlo

Bir yandan, istatistiksel modeller, parametrelerinin doğru bir tahminini yapmak için çok sayıda gözlem gerektirir. Ve bir sezon boyunca yeterli gözlem olmadığında (genellikle durum olduğu gibi), ortalama istatistiklerle çalışmak mantıklıdır. Öte yandan, takım becerilerinin sezon boyunca değiştiği ve model parametrelerini zamana bağlı hale getirdiği iyi bilinmektedir. Mark Dixon (istatistikçi) ve Coles, en son maç sonuçlarına daha fazla ağırlık vererek bu takası çözmeye çalıştılar. Rue ve Salvesen, Markov Zinciri modelini kullanarak zamana bağlı yeni bir derecelendirme yöntemi tanıttı.

Yukarıdaki genelleştirilmiş doğrusal modeli ve için değiştirmeyi önerdiler :

i ve j takımları arasındaki güç farkına karşılık gelen verilen Parametre daha sonra rakip takımların gücünün hafife alınmasından kaynaklanan psikolojik etkileri temsil eder.

Modele göre, A takımının hücum gücü , zaman için Brownian hareketinin standart denklemleri ile tanımlanabilir :

burada ve sırasıyla hafıza kaybı ve önceki saldırı varyansına atıfta bulunur.

Bu model şu varsayıma dayanmaktadır:

Turnuvada A, B ve C takımlarının oynadığını ve maçların aşağıdaki sırayla oynandığını varsayarsak: : AB; : AC; : BC, ortak olasılık yoğunluğu şu şekilde ifade edilebilir:

Bu durumda parametrelerin analitik olarak tahmin edilmesi zor olduğundan, modelin parametrelerini tahmin etmek için Monte Carlo yöntemi uygulanmaktadır.

Diğer sporlar için kullanım

İçin kullanılan modeller ilişki futbol hedefleri (puan), yani aynı sayımı ile diğer spor için de kullanılabilir buz hokeyi , su topu , hokey , Floorball (1982, vb Marek Toupal ve Šedivá Maher araştırma (2014) inşa ), Dixon ve Coles (1997) ve dernek futbolu için modeller kullanan diğerleri . Buz hokeyi için dört model tanıttılar :

  • Double Poisson dağılım modeli (Maher (1982) ile aynı),
  • Rastgele değişkenler arasında negatif korelasyona izin veren iki değişkenli Poisson dağılımının genelleştirilmesini kullanan iki değişkenli Poisson dağılım modeli (bu dağılım Famoye (2010)'da tanıtıldı).
  • 0:0, 1:1, 2:2, 3:3, 4:4 ve 5:5 bağlarının olasılıklarının ek parametrelerle modellendiği önceki iki modelin (Dixon ve Coles (1997) esinlenerek) çapraz şişirilmiş versiyonları .

Dört modelin tümünde tahmin sürecinde daha eski bilgiler (sonuçlar) iskonto edilir. Modeller 1999/2000 ve 2011/2012 sezonları arasında Çek Cumhuriyeti - Çek Extraliga'daki en üst düzey buz hokeyi liginde sergileniyor . Sonuçlar, bahisçilere karşı hayali bahislerde başarıyla kullanılır .

Referanslar