02/06/2020


Blog 3 van 3

Eindelijk is het zover: de grote finale wat betreft onze blogreeks over het voorspellen van de Eredivisie. Moe? Nooit. Het blijft ons bezighouden en aan de leuke reacties te zien, willen jullie ook weten hoe het laatste deel van het algoritme werkt. Dus na onze spoiler alert, na het influisteren van de KNVB wat betreft de opbrengsten en na blog 1 en 2 over hoe ons algoritme werkt, volgt nu de klapper op de vuurpijl. We weten nu hoe we de kwaliteit schatten van het thuisvoordeel en hoe we het resterend competitieprogramma voorspellen. Dan is het nu tijd voor: hoe bepalen we op basis van die kansverdelingen de verwachte eindstand?


Voorspelling eindstand Eredivisie

In onze vorige blog legden we uit hoe we met behulp van Monte Carlo simulatie per club de kansverdeling van zijn eindpositie kunnen bepalen. Maar hoe bepalen we op basis van die kansverdelingen een verwachte eindstand? Om maar meteen met de deur in huis te vallen: er is niet één perfecte manier om zo’n verwachte eindstand te maken. We hebben daarom een drietal methoden bekeken:

  1. Ranking op basis van het verwachte aantal punten
  2. Ranking op basis van de verwachte ranking
  3. Met behulp van stochastische dominantie

Voor de eerste twee methoden kunnen we simpelweg gebruik maken van alle eindstanden uit de Monte Carlo simulatie, door die te middelen en te sorteren. Aflopend in methode 1, oplopend in methode 2.  In Tabel 1 vind je voor beide methoden de uitkomst. Zoals je ziet leveren beide methoden in deze situatie dezelfde ranking op.
 


Tabel 1: Verwachte ranking & verwachte aantal punten op basis van de Monte Carlo simulatie
 

Kijkende naar deze verwachte ranking is deze toch echt anders dan wat de KNVB nu als eindstand heeft uitgeroepen. Zo zien we dat met name in de middenmoot nog flink wat verschuivingen zouden plaatsvinden. Ook leuk om te zien is dat PSV Feyenoord naar verwachting passeert op de ranglijst (waar we als Eindhovens bedrijf en buurman van PSV trots op zijn!). Dit is te verklaren doordat PSV in de nog te spelen wedstrijden lichtere tegenstanders treft dan Feyenoord. Bovendien speelt PSV twee wedstrijden meer thuis dan de meeste andere teams, en thuiswedstrijden liggen de Eindhovenaren altijd goed. Uit onze simulaties volgt ook dat de kans dat dezelfde clubs in de top 5 blijven staan 53% is. De waarschijnlijkheid dat de verdeling van de Europese tickets aan de huidige nummers één tot en met vijf eerlijk is geweest, is dus iets groter dan 1 op 2.


Stochastische dominantie

Maar wat gebeurt er als we er met een iets meer wiskundige bril naar het probleem kijken? De verwachte puntenaantallen van Heerenveen en Groningen liggen namelijk wel erg dicht bij elkaar. Kunnen we wel zeker zeggen dat de Friezen aan het langste eind trekken?

Om dat goed te beoordelen kunnen we gebruik maken van het principe van stochastische dominantie. Dit principe wordt vooral gebruikt in de beslissingstheorie om de beste uit twee strategieën te kiezen onder onzekere omstandigheden. Werkt strategie 1 onder alle omstandigheden beter dan strategie 2? Dan noemen we dit statewise stochastische dominantie. Hier kunnen we een parallel trekken met de ranking van bijvoorbeeld Ajax en AZ. De praktische vraag is dan: eindigt Ajax zeker boven AZ? Het antwoord op basis van de Monte Carlo simulatie daarop is duidelijk nee. AZ komt in 31% van de gevallen nog op plek 1 terecht, en daarmee boven Ajax.

Wat we wel kunnen stellen is dat de ranking van Ajax stochastisch dominant van de eerste orde is over die van AZ. Wiskundig gezien zeggen we daarmee dat de cumulatieve kansverdeling van de eindpositie van Ajax boven die van AZ ligt. En dat betekent op zijn beurt dat de kans dat Ajax in de top 2 eindigt groter is dan dat AZ in de top 2 eindigt, waarbij je ‘top 2' door elke andere ‘top x’ mag vervangen. En wat wij helemaal leuk vinden: die kansverdelingen hebben we gevisualiseerd in de dynamische Figuur 2: beweeg er overheen en je ziet de kansen per club!”

 

Figuur 2: Klik op de afbeelding voor een dynamisch beeld (daar beweeg je met je muis overheen en zie je de kansen per club!).

Op zo’n manier kun je paarsgewijs afleiden of de ene club boven de andere club zou moeten eindigen, mits elk van die paartjes zo’n stochastische relatie oplevert. Dat blijkt in het geval van de Eredivisie helaas niet helemaal te kunnen. Als we bijvoorbeeld naar de eindposities van PSV en Feyenoord kijken, dan zien we bijvoorbeeld dat de kans dat PSV in de ‘top 1’ eindigt (oftewel: kampioen wordt) 0.3% is en die van Feyenoord 0.4%, zie Tabel 1 in blog 2. Maar als we naar de kans op de ‘top 2’ kijken dan zijn die kansen 7.7% en 3.5%, respectievelijk. Omgekeerd dus! Iets dergelijks zien we ook voor FC Groningen en SC Heerenveen. Die clubs zijn zo aan elkaar gewaagd dat ook de wiskunde niet kan zeggen wie boven wie eindigt!

  

Maar… Hoe loopt het nu af?

Wanneer we alle clubs op deze manier tegen elkaar afwegen, komen we alsnog op dezelfde ranking als in Tabel 1. Behalve dan dat PSV en Feyenoord een gedeelde 3e, en Heerenveen en Groningen een gedeelde 9e plek innemen.

Inmiddels weten we dat de voetbalcompetities van 2020 vanwege de verlengde coronamaatregelen niet meer wordt uitgespeeld en dat de KNVB heeft besloten de tussenstand als eindstand te hanteren. Helaas zullen we dus nooit weten hoe dicht onze voorspelling bij de werkelijkheid zou hebben gezeten. Maar, we dromen graag en vinden het heel fijn om er gewoon vanuit te gaan dat we er heel, maar dan ook echt héél erg, dichtbij zouden zitten… ;-)

 

Alle links op een rijtje:

 

Wil je op de hoogte blijven van het laatste nieuws van CQM, volg ons op LinkedIn of meld je aan voor onze digitale nieuwsbrief.

 

Fotocredit: Pixabay. 

 

Britt Mathijsen
Britt Mathijsen helpt je graag verder Neem contact op