Goed blijven voorspellen in de nieuwe werkelijkheid: enkele uitgangspunten in methoden

13/05/2020

Blog 2 van 3

Veel modellen gebruiken historische data om voorspellingen te genereren. In deze tijd van Corona moeten we ons realiseren dat we daardoor anders met deze data om moeten gaan, zoals we al eerder in onze blog noemden. We hadden beloofd om in een vervolgblog in te gaan op het proces dat je kunt inrichten om hiermee om te gaan. Naar aanleiding van de leuke reacties hebben we besloten eerst in deze blog in te gaan op enkele uitgangspunten in voorspelmethoden. Dus hou je vast: het wordt een 3-luik ;-)

De basis verandert niet, de uitwerking vaak wel

Voorspellen op basis van historische data blijft in de kern hetzelfde: op welke manier kan informatie uit het verleden vertaald worden naar voorspellingen in de toekomst? Er zijn ook situaties waarin zelfs in tijden van Corona, het verleden nog steeds prima voorspellend is voor de toekomst, zij het wellicht op een andere manier.

Een eerste voorbeeld hiervan is de vraag naar gas door huishoudens. Die wordt op de korte termijn vooral bepaald door de temperatuur buiten en op de wat langere termijn door de maatschappelijke dynamiek rondom gas. Wellicht is er een heel kleine toename van het verbruik vanwege het thuiswerken maar dat effect is in deze periode van het jaar waarschijnlijk veel kleiner dan in de winter.

De vraag naar elektriciteit in het bedrijfsleven zou wel stevig beïnvloed kunnen worden door Corona en dan vooral vanwege de afnemende economische activiteit. Dit effect zou best vergelijkbaar kunnen zijn met de financiële crisis een aantal jaren geleden. Maatschappelijk gezien volstrekt verschillend, maar voor dit specifieke doel is informatie uit die periode mogelijk heel bruikbaar. Kortom niet alles is veranderd en de vraag is hoe je daar gebruik van kunt maken.

Voorspellingen met een cumulatief karakter

Als het gaat om voorspellingen die een cumulatief karakter in de tijd hebben, dan zijn specifieke verhoudingen vaak een goed startpunt. Met cumulatief karakter bedoelen we dat de te voorspellen grootheid in de loop van de tijd opgebouwd wordt. Voorbeelden hiervan zijn de hoeveelheid werk voor het komende kwartaal bij een nutsbedrijf, de hoeveelheid tankcontainers volgende week voor een transportbedrijf en ook de hoeveelheid post die vannacht gesorteerd moet worden omdat hij morgen bij ons in de brievenbus moet liggen. In alle gevallen ontwikkelt de harde informatie en ook de betrouwbaarheid daarvan zich in de tijd. Werk en orders komen in de loop van de tijd binnen, soms letterlijk zelfs.

Een robuuste manier van voorspellen voor deze situaties, ook in de Corona-tijd, is om gebruik te maken van de patronen in de tijd. Bijvoorbeeld: drie maanden voorafgaand aan de start van de te voorspellen week is gemiddeld 20% van de transportvraag bekend, twee maanden daarvoor is dat 40% en één maand vooraf is dat 80%. Deze percentages zouden niet per se hoeven te veranderen in tijden van Corona ook niet als het niveau van de vraag wel sterk verandert.

Op zoek naar de juiste verhoudingen

Maar lang niet alle voorspellingen hebben een cumulatief karakter. Zo lang in het openbaar vervoer geen gereserveerde plaatsen zijn, is dat een voorbeeld daarvan. En de eerder besproken vraag naar energie natuurlijk ook. Maar ook hier zouden verhoudingen mogelijk minder aan verandering onderhevig kunnen zijn dan het niveau van de voorspellingen. Zo zou de verhouding tussen het aantal reizigers in de spits en in het dal vergelijkbaar kunnen blijven en zal de vraag naar stroom bij bedrijven op vrijdag waarschijnlijk nog steeds lager zijn dan op donderdag.

Een voorspelmodel zou dan uit twee componenten bestaan: in de eerste plaats een voorspelling van het algemene niveau en in de tweede plaats verhoudingen. En die verhoudingen kunnen – zoals uit voorgaande voorbeelden blijkt – dus vaak op basis van een langere historie bepaald worden.

En als laatste het nieuwe niveau

Voor het bepalen van het nieuwe hoogte van voorspellingen is recente informatie die is verzameld sinds het begin van de Corona-uitbraak het best bruikbaar. Het is nog steeds van belang om een relevante periode sinds de Corona-uitbraak te kiezen. Het liefst niet een te korte periode vanwege het nadelige effect van toeval en het liefst niet een te lange periode omdat deze wel representatief moet zijn voor de komende periode waarvoor voorspeld gaat worden. Domeinexperts en Data Scientists komen hier prima samen uit en het voortschrijden van de tijd helpt hier automatisch om de betrouwbaarheid te vergroten.

En let wel, deze informatie gebruiken we primair om een algemeen niveau te berekenen en niet om de verhoudingen tussen dagen in de week, klantgroepen, productgroepen, geografische clusters, etc. te bepalen. Dat hadden we al gedaan met informatie over een langere periode(*1). En omdat we de data sinds het uitbreken van de Corona-crisis voor één heel specifiek doel gebruiken, is een lange periode van gegevens verzamelen ook niet nodig. Bovendien zal iedereen zich er bewust van zijn dat de betrouwbaarheid in het begin beperkt is.

Inspiratie?
Kortom, ga op zoek naar patronen die constant zijn gebleven en combineer data van voor en tijdens de Corona-uitbraak optimaal. Dan kunnen in jouw organisatie de voorspellingen een constante blijven in een zeer variabele en hectische tijd. Dat voorspelproces komt in de volgende blog aan bod. Tenzij jullie reacties weer zo inspirerend zijn als de vorige keer, dan neem ik die als startpunt. Dus neem gerust contact op met Pleuni Naus.

Verwijzingen in deze blog:

[1] Uiteraard verandert dit als verhoudingen uit het verleden niet* bruikbaar zijn voor de toekomst.

Fotocredit: Pixabay. Wil je op de hoogte blijven van het laatste nieuws van CQM, volg ons op LinkedIn of meld je aan voor onze digitale nieuwsbrief.

Pleuni van Heiningen helpt je graag verder Neem contact op

Methode-uitgangspunten in voorspellen in coronatijd