16/04/2020


Blog 1 van 3

Veel modellen gebruiken historische data om voorspellingen te genereren. Maar de wereld is abrupt in een andere modus terecht gekomen en dat betekent nogal wat voor die modellen. In deze blog lichten we toe wat voor effect de huidige Corona-situatie op onze voorspelmodellen heeft en hoe we in de toekomst hiermee om kunnen gaan.

De drie dominante mechanismen

In de eerste plaats kloppen de voorspellingen voor vandaag en morgen niet meer. In de historische data waarop ze gebaseerd zijn, zat geen informatie waarmee deze huidige situatie voorspeld had kunnen worden. Of het nu gaat om de toegenomen vraag naar bloem, houdbare melk en WC-papier bij Albert Heijn of de afgenomen vraag naar vervoer per trein bij NS. Je zou voor gek verklaard worden als je de huidige situatie drie maanden geleden voorspeld zou hebben.

In de tweede plaats zullen de voorspellingen die gebaseerd zijn op de gegevens die nú gegenereerd worden niet kloppen in de toekomst. De situatie in deze maanden is zeer uitzonderlijk en daarom zullen de gegevens die nu gegenereerd worden niet zomaar bruikbaar zijn voor de langere termijn. In de hoop dat de Corona-epidemie tijdelijk is, is het redelijk te veronderstellen dat maart 2021 meer lijkt op maart 2019 dan op maart 2020.

En daarmee zijn we beland bij het derde mechanisme: ook als we de dataproblemen hebben opgelost, kloppen de voorspellingen mogelijk nog steeds niet! We moeten er namelijk ook rekening mee houden dat er een permanente gedragsverandering plaats zal vinden die in de huidige modellen verwerkt moet worden om bruikbaar te blijven. Zo heeft iedereen inmiddels zijn thuiswerkplek ingericht en ach, als de kinderen weer naar school zijn, is het wellicht best lekker om een dagje meer in de week thuis te werken als het buiten koud is. Maar misschien missen we ook het persoonlijk contact met onze vrienden en bekenden dermate sterk dat we straks vaker af willen spreken in café of restaurant. Dit soort permanente gedragsverandering heeft niks met data te maken maar alles met de dynamiek die door het model beschreven wordt en waarmee de voorspellingen gegenereerd worden.
 

Correlatie en causaliteit spelen een rol

En dan is er nog dit: de eerste dag waarop we in Nederland in de intelligente lockdown gingen, was ook de dag waarop we voor het eerst nog maar 100km/uur mochten rijden op de snelwegen. En ineens waren er geen files meer.

Voorspelmethoden die alleen gebruikmaken van observationele data - en domeinkennis van experts buiten beschouwing laten - zouden tot de conclusie kunnen komen dat er een enorm effect is bereikt door de maximumsnelheid terug te schroeven. Dat is uiteraard onzin. Het is de klassieke valkuil waarin causaliteit en correlatie verkeerd gebruikt worden. Het is van groot belang om dit fenomeen in het oog te houden bij het plegen van aanpassingen op bestaande voorspelmodellen: samenhang betekent niet persé een oorzaak-gevolgrelatie.

Om deze valkuil te vermijden, is de combinatie van enerzijds domeinkennis en anderzijds kennis van voorspelmethoden dé sleutel tot succes. En die twee combineren is nu precies waar wij 40 jaar ervaring mee hebben.
 

Hoe nu verder?

En wil je weten hoe je het beste met je voorspelmodel in deze tijd en in de toekomst om kunt gaan? Kort samengevat moet je een proces inrichten waarin de relevante kennis adequaat gebruikt wordt om tot goed onderbouwde beslissingen te komen. In een vervolgblog gaan we hier nader op in. Als je dat te lang duurt, neem dan nu al contact op met Pleuni van Heiningen.


Wil je op de hoogte blijven van het laatste nieuws van CQM, volg ons op LinkedIn of meld je aan voor onze digitale nieuwsbrief.

Fotocredit: Unsplash

Pleuni van Heiningen
Pleuni van Heiningen helpt je graag verder Neem contact op