Correlatie is geen causaliteit: wat is het dan wel en wat levert het je op

Wiskundigen komen altijd met mensen in aanraking die zeggen: “Wiskunde? Dat heb je niet altijd nodig om tot de juiste conclusie en beste oplossing te komen.” Ons antwoord hierop: klopt. Maar het laat je wel degelijk verder komen. Soms lijken verbanden die je ziet in eerste instantie namelijk enorm logisch, maar blijken ze bij nader inzien gewoon puur toeval te zijn. Wiskunde kan hier het verschil maken en ervoor zorgen dat een verband ook echt onderbouwd is. Oftewel: in deze blog lichten we het verschil tussen correlatie en causaliteit toe én wat dat betekent voor het optimaliseren van je processen.


Onzin verband

Klinken deze termen ingewikkeld? Net zo ingewikkeld als wiskunde ;-) Eigenlijk zeggen we met ‘correlatie is geen causaliteit’: het verband dat we suggereren kan gewoon onzin zijn. Een voorbeeld: je hebt een basisschool met 100 kinderen. We zien een correlatie tussen de schoenmaat van een kind en hoe goed ze kunnen lezen. Zo zie je bijvoorbeeld dat kinderen met een grotere schoenmaat, beter kunnen lezen. Je zou dan dus kunnen stellen: we geven de jongsten – de kleintjes – een grotere schoen en dan gaan ze vanzelf beter lezen. Dit verband – een correlatie – lijkt erg logisch. Niets is minder waar: de reden dat de kinderen met de grotere schoenmaat beter lezen is omdat ze ouder zijn, dus grotere voeten hebben en dus grotere schoenen. En het is vooral erg logisch dat oudere kinderen beter kunnen lezen. Sterker: het is duidelijk dat er een verband is, maar het is niet zo dat het ene een oorzaak is van het andere. Het heeft daarnaast niets met een wetenschappelijk aangetoond verband te maken. Je mag dus niet te ‘naïef’ redeneren, wat vaak bij een correlatie gebeurt.


Randomised experiment

Een voorbeeld waar juist causaliteit sterk terugkomt, is bij het uitvoeren van een experiment. En dan vooral bij een randomised experiment. Dat is een experiment waarbij je controle hebt over alleen die grootheid die je wilt onderzoeken en alle andere mogelijke invloeden willekeurig tot stand laat komen. Bijvoorbeeld: je wilt weten of A (dieettype of een vaccin) beter scoort dan B (ander dieettype of vaccin). Om dat te testen heb je mensen nodig. Een randomised experiment verdeelt deze groep mensen willekeurig over de twee behandelingen A en B. Zou je dat niet doen en bijvoorbeeld de jongere mensen A geven en de oudere mensen B dan zou een eventueel verschil tussen beide groepen niet alleen aan A of B kunnen liggen, maar ook aan de leeftijd. Als je op deze manier de controle behoudt, eigenlijk ook over het toeval dus, ben je bewust met keuzes bezig en heb je daardoor bewust een oorzaak-gevolg gecreëerd. Zie je een verschil dan ligt het aan A versus B, causaliteit dus!

De argeloze lezer zou zomaar kunnen opmerken dat verloten in dit geval niet echt hoeft omdat je ervoor kunt zorgen dat leeftijden netjes verdeeld worden over de twee groepen. Het antwoord daarop is: dat klopt, maar voor factoren die de uitkomst kunnen beïnvloeden maar die je niet kent, kan dat niet! Daarom is verloten belangrijk. Maar wat nu als je door omstandigheden niet of niet volledig kunt verloten? Zoals het weer bijvoorbeeld, daar heb je geen invloed op. Betekent dat dan dat een causaliteitsuitspraak onder druk komt te staan? Dat hoeft niet. In mijn blog van volgende week ga ik hier dieper op in.


Doorgronden wat er echt speelt

Wat is de rol van CQM hierin? Wij begeleiden onze klanten bij het opzetten en uitvoeren van deze experimenten. Met als doel: wat gebeurt er als ik dit of dat doe/doorvoer en hoe verbetert dat mijn (logistieke) proces of product? We halen de logische verbanden vaak uit elkaar en doorgronden wat er écht speelt. En daarmee opereren we altijd op het speelveld van correlatie en causaliteit. Je hebt namelijk twee manieren om de waarheid te vinden:

  1. Via een op het eerste gezicht logisch verband, zoals bij de schoenmaat en de kinderen. Oftewel door het analyseren van data en de beschikbare info (observational data). Van daaruit probeer je te leren en processen te verbeteren.
  2. Door het doen van een experiment.

Bij beide opties is het erg belangrijk om de context erbij te betrekken. Zoals in het voorbeeld van de basisschoolkinderen; er speelt meer mee dan alleen de schoenmaat. Beide manieren zijn dus betrouwbaar, mits je bij optie 1 verder kijkt dan het meest voor de hand liggende. Zodat je de correlaties uit de weg gaat en echt voor de causaliteit gaat. Echte verbanden moet je leren herkennen zodat je gericht acties kunt ondernemen om je processen te verbeteren. CQM helpt je daar graag bij!


Volgende week volgt nog een blog over dit topic, voor de liefhebber… Ik heb namelijk thuis een experiment uitgevoerd. En laat causaliteit en correlatie nou net tijdens een experiment terugkomen. Meer weten? Houd me in de gaten!


Wil je op de hoogte blijven van het laatste nieuws van CQM, volg ons op LinkedIn of meld je aan voor onze digitale nieuwsbrief.

 

Ook interessant:

 

Fotocredit: Unsplash

Drs. Jan Willem Bikker

Drs. Jan Willem Bikker

Principal Consultant