De eindstand van de voetbalcompetitie in 2021: werkt ons model echt?

06/01/2021

2020 was het jaar dat we de voetbalcompetitie niet uitspeelden. De voetbalfans binnen CQM baalden daarvan, maar bleven enthousiast. Ze ontwikkelden een algoritme waarmee de einduitslag voorspeld werd & de KNVB de Europese tickets kon verdelen, creëerden een app om je eigen competitie-uitslag te bepalen en behaalden daarmee ook nog eens zendtijd op Omroep Brabant! Maar, vorig jaar konden we slechts alleen voorspellen en niet checken of ons model echt hout snijdt. Dit jaar kan dat uiteraard wel, want alle wedstrijden voor 2020-2021 gaan gespeeld worden! En een extraatje: alvast de voorspellingen voor de toppers die in januari gepland staan…
 

De belangrijkste conclusies op 28 december 2020

  • Ajax wordt ruimschoots kampioen en PSV waarschijnlijk tweede.
  • Vitesse, Feyenoord, Groningen, Twente, en AZ strijden om de 3e plaats waarvoor Vitesse de beste papieren heeft.
  • Emmen, VVV en Den haag bezetten de drie laagste plaatsen. De volgorde kan nog alle kanten op.
  • Er is geen aantoonbaar thuisvoordeel in deze competitie.


Wat deden we ook alweer?

Het belangrijkste uitgangspunt van het model is dat een wedstrijduitslag verklaard wordt door de volgende drie componenten (op basis van reeds gespeelde wedstrijden):

  • Kwaliteitsverschil tussen de twee clubs
  • Thuisvoordeel van het thuisspelende team
  • De grootte van het toeval

Met die informatie speelden we de competitie vervolgens 25.000x uit en concludeerden we bijvoorbeeld dat Ajax waarschijnlijk kampioen zou worden, maar dat AZ ook 30% kans had om kampioen te worden.


Hoe werkt dat voor de competitie van 2020-2021?

We kunnen hetzelfde doen voor de huidige competitie. Er zijn op dit moment 14 speelrondes afgewerkt. De KNVB heeft er bewust voor gekozen om de topteams pas in januari tegen elkaar te laten spelen. De hoop aan het begin van het seizoen was dat er dan weer publiek bij de wedstrijden zou mogen zijn. Dat blijkt niet het geval. Maar daarom is het wel extra interessant om de prestaties van enerzijds Ajax, PSV, AZ en Feyenoord te vergelijken met de prestaties van Vitesse, Groningen en Twente. Immers, deze laatste clubs hebben een zwaarder programma achter de rug en dus een makkelijker programma voor de rest van de competitie. Dat maakt deze analyse op dit moment in de competitie extra interessant.

Er zijn twee andere aspecten ook belangrijk in vergelijking met vorig jaar:

  • Weinig wedstrijden gespeeld op 28-12-2020
  • Geen publiek bij thuiswedstrijden

Vorig jaar waren er 232 van de 306 wedstrijden gespeeld, ongeveer 75%. Er was dus al veel informatie beschikbaar over de kwaliteit en het thuisvoordeel van de teams. Dit jaar zijn er na 14 speelrondes van de 34 pas 126 van de 306 wedstrijden gespeeld: slechts 41% van de competitie.

Daarnaast is het zeer de vraag of thuisvoordeel aan de orde is, gezien het feit dat er zonder publiek gespeeld wordt. Analyse laat zien* dat er inderdaad geen aantoonbaar thuisvoordeel is in deze competitie. In combinatie met het relatief kleine deel van de competitie dat gespeeld is op dit moment, kiezen we er daarom voor om thuisvoordeel niet in het model op te nemen. We verklaren dus individuele wedstrijduitslagen met een combinatie van kwaliteitsverschil tussen de teams en toeval.


Kwaliteit van de teams in de Eredivisie op 28-12-2020

In Tabel 1 staan de geschatte kwaliteitsparameters voor de Eredivisie van 2020-2021 op basis van de reeds gespeelde wedstrijden op 28 december 2020. De schatting voor σ, het toeval, is 1.85 doelpunten. We gebruiken hiervoor de Root Mean Squared Error uit de regressieresultaten.


Tabel 1
Geschatte kwaliteit van ieder team Eredivisie 2020-2021 op 28-12-2020.

De kwaliteit van een team is het aantal doelpunten verschil waarmee het team gemiddeld zal winnen of verliezen van een gemiddeld team. Hiermee kan ook voor iedere wedstrijd de verwachte uitslag bepaald worden. Voor de wedstrijd Ajax – Twente is die 2 doelpunten verschil in het voordeel van Ajax. Er geldt namelijk dat 2.63 – 0.51 = 2.12 En afgerond is dat dan 2. Maar door het toeval van 1.85 doelpunten per wedstrijd (standaarddeviatie) is een uitslag van 2.12 +/- 2*1.85 ook goed mogelijk. Het verwachte doelpuntenverschil ligt dus waarschijnlijk (95% betrouwbaarheid) tussen [-1.58;5.82], oftewel als Ajax met 6 doelpunten verschil wint of Twente met 2 dan is dat nog niet heel bijzonder.

We zien in Tabel 1 dat Ajax veruit de sterkste is en VVV de zwakste.


De toppers in januari 2021

De voor de competitie als toppers bestempelde wedstrijden worden voor het eerst in januari gespeeld. In Tabel 2 geven we de verwachte uitslagen, de range waarbinnen we de uitslag verwachten en ook de kansen op winnen/verliezen gelijk spelen van de teams.

Datum 

(jan. 2021)

Wedstrijd

Verwachte uitslag in afgerond doelpuntenverschil

Kans winnen THUIS

Kans GELIJK

Kans  winnen UIT

Range uitslag

10

Ajax – PSV

1

69%

16%

15%

[-2;5]

13

PSV – AZ

1

53%

20%

27%

[-3;4]

17

Ajax - Feyenoord

2

76%

14%

10%

[-2;5]

24

Feyenoord - AZ

0

45%

21%

34%

[-3;4]

31

AZ – Ajax

-2

8%

12%

80%

[-6;2]

31

Feyenoord – PSV

0

32%

21%

47%

[-4;3]

Tabel 2 Voorspellingen voor topwedstrijden in januari.

We zien in Tabel 2 dat Ajax duidelijk de favoriet is in alle wedstrijden maar dat het effect van toeval op de uitslag groot is. De verschillen in kwaliteit zijn dus klein in vergelijking met de grootte van het effect van toeval op de einduitslag: in iedere wedstrijd heeft ook het mindere team een substantiële kans om de wedstrijd te winnen. De effecten van toeval moeten we dan ook altijd meenemen in de kansberekening, om zo dicht mogelijk bij de realiteit te komen.


Verwachte eindstand 2021

Wat de eindstand wordt, is natuurlijk koffiedikkijken. Maar als we op basis van de uitslagen van de reeds gespeelde wedstrijden en het nog resterende programma een voorspelling zouden moeten doen, dan is dat de eindstand in Tabel 3.

Tabel 3 Verwachte eindstand competitie 2020-2021 zoals bepaald op 28 december 2020.

Ajax wordt waarschijnlijk kampioen. De kans daarop is 98%. PSV heeft nog een hele kleine kans en Vitesse en Feyenoord een verwaarloosbare. We zien ook dat de eindstand veel lijkt op de huidige tussenstand. We verwachten in de top dat Vitesse Feyenoord nog zal inhalen. Dat is toe te schrijven aan het zwaardere programma dat Vitesse tot nu toe heeft gehad.

Aan de onderkant zien we dat VVV waarschijnlijk nog wat gaat zakken. De verschillen tussen de laatste drie ploegen zijn echter klein. De afstand tot Willem II lijkt wel nog wat groter te worden. Maar ook voor Willem II geldt dat degradatie, rechtstreeks of via de nacompetitie ook zeker niet uitgesloten is.

De wedstrijd VVV – Ajax eindigde in 0-13 voor Ajax. Volgens ons model was de verwachte uitslag 4 doelpunten verschil in het voordeel van Ajax, bijvoorbeeld 0-4. In combinatie met de grootte van het toeval, kunnen we concluderen dat deze uitslag onverwacht groot was. Statistische en praktische keuzes om deze uitslag mee te nemen lopen hier door elkaar. Normaal is zulke data te verwaarlozen en neem je die niet mee in je eindbeslissing. Aangezien het hier om een competitie gaat en elke wedstrijd telt, hebben we dit toch wel gedaan. Feit is wel dat een dergelijke bijzondere uitslag een behoorlijk groot effect heeft op de uitkomsten, zeker gezien het feit dat er pas 14 speelrondes zijn afgewerkt. De kans dat Ajax kampioen wordt is nu 98%. Als VVV-Ajax 0-4 als uitslag zou hebben gehad, dan zou die kans 93% worden.


 

Ben je benieuwd naar de einduitslagen van alle 18 clubs? Klink dan hier. En denk je nu: ingewikkeld maar interessant en wil je er meer van weten? We gaan een derde succesvol webinar hierover organiseren en er zijn nog plaatsen vrij! Datum wordt in overleg bepaald, meld je bij mij aan!


Fotocredit: Pixabay. 


Alle links op een rijtje:

 

* Het gemiddelde thuisvoordeel in de competitie van 2020-2021 tot nu toe is 0.15 doelpunten en het 95% betrouwbaarheidsinterval is [-0.19;0.49]. Daarnaast toont een likelihood ratio test op de modellen met en zonder thuisvoordeel aan dat het model zonder thuisvoordeel niet aantoonbaar slechter is. In de competitie van 2019-2020 was het gemiddelde thuisvoordeel 0.67 doelpunten en het 95% betrouwbaarheidsinterval hiervoor [0.44;0.89] doelpunten. Wel een substantieel en aantoonbaar thuisvoordeel dus.
Drs. Marnix Zoutenbier MTD CIRM

Drs. Marnix Zoutenbier MTD CIRM

Principal Consultant