NS en CQM maken reizigersvoorspellingen consistent en inzichtelijk

NS werkt al jaren met rekenkundige modellen om het aantal reizigers per trein te kunnen voorspellen. Over het algemeen werkten de modellen goed, maar afwijkingen waren soms moeilijk te verklaren en de totstandkoming van de voorspellingen was niet altijd even inzichtelijk. NS wilde het systeem inzichtelijker en consistenter in de tijd maken en schakelde hiervoor één partij in: CQM zette NS op het juiste spoor.

 

Voorspellen van het aantal reizigers van groot belang

Het voorspellen van het aantal reizigers per trein is voor NS van groot belang voor een goede klanttevredenheid. Het bepaalt de materieelinzet en daarmee de kosten van vervoer en het comfort voor de reiziger: voldoende reizigers moeten kunnen zitten. Gedetailleerde reizigersvoorspellingen maken een optimale balans tussen materieelinzet en vervoerscomfort mogelijk en daarmee ook de balans tussen betaalbaarheid en klanttevredenheid. Maar wat als een voorspelling voor een individuele trein ineens afwijkt? Bijvoorbeeld als het model voorspelt dat er in één specifieke trein in de doorgaans rustige maand juni juist meer reizigers zitten dan in de drukke maand september? Dan wil NS die vreemde afwijking kunnen verklaren. En dat kon met het eerdere systeem niet. Daarom besloot NS het systeem te vereenvoudigen. De naam van het project: Borealis. De spannende uitdaging: al na enkele weken de eerste voorspellingen volgens een nieuwe transparante methodiek opleveren.

 

Data science met big data aspecten

Dit is typisch een data science project met big data aspecten. Voor elke individuele trein op elk specifiek traject in Nederland en op elk moment in het jaar moet een voorspelling van het aantal reizigers worden gedaan. Eén zogenoemde ‘levering’ bestaat uit maar liefst 125.000 voorspelde combinaties van trein-traject-dag. De input is nog veel groter: bijna 200 miljoen cijfers uit uiteenlopende databronnen. Een steeds belangrijkere bron hierin is de in- en uitcheckgegevens vanuit de OV-chipkaart. Een andere is bijvoorbeeld daadwerkelijke tellingen van het aantal reizigers, die jaarlijks in alle treinen worden gedaan. Ook worden gegevens uit de dienstregeling gebruikt. De eerste levering was nog niet optimaal, maar wel voldoende. Het belangrijkste was dat iedereen vertrouwen had dat Borealis de juiste aanpak zou zijn. Juist omdat we nu wél precies weten welke data en modellen we gebruiken en we de oorzaak van afwijkingen dus kunnen begrijpen.”

 

Nieuwe voorspelmethodiek grote sprong voorwaarts

Borealis-projectleider Raoul Klein Kranenbarg van NS vindt de nieuwe voorspelmethodiek een belangrijke verbetering voor de reiziger en voor NS: “Ten eerste omdat de gegevens vanuit de OV-chipkaart nu, uiteraard anoniem, optimaal door het systeem worden benut. Sinds in- en uitchecken met de OV-chipkaart de standaard is geworden, is dit de belangrijkste databron. Het is dus goed dat we daar afgelopen jaren het model met Borealis op hebben voorbereid om zo de voorspellingen steeds beter te maken. In het model gebruiken we nu ook de meldingen van reizigers gegeven via de NS-app en bij Klantenservice. Dit helpt om te drukke treinen in beeld te krijgen. Met Borealis hebben we daarnaast ook de lege treinen in beeld. Maar het belangrijkste is dat het hele systeem nu veel inzichtelijker is geworden en bovendien consistent in de tijd.” Het is de bedoeling dat NS Borealis nog dit jaar volledig in eigen huis gaat uitvoeren, onder begeleiding van CQM.

 

Wilt u ook capaciteit en kosten kunnen voorspellen?

Of het nu gaat om small, medium of big data, CQM kan u helpen! Neem contact op met Marnix Zoutenbier, hij kan er u alles over vertellen.

 

Meer weten over Data Science?

Klik hier.

 

Wilt u het hele interview met NS en CQM lezen?

Bekijk dan Quant 52.

Drs. Marnix Zoutenbier

Drs. Marnix Zoutenbier

Principal Consultant