White box vs black box algoritmes in wiskunde: de voor- en nadelen

12/07/2021

In ons vak heb je te maken met algoritmes. Deze zijn er in allerlei soorten en maten. Zo zijn er ook “white box” en “black box” algoritmes. Black box algoritmes refereren naar een uitkomst zonder dat je weet hoe hiertoe gekomen is. Via een white box algoritme is elke stap richting het resultaat logisch te verklaren. Over beide situaties valt iets te zeggen en er zitten voor- en nadelen aan. Toch hebben black boxes niet altijd de voorkeur, omdat wij mensen vaak verklaringen willen voor hetgeen we zien en meemaken. Maar wanneer kies je nou voor een black box algoritme en wanneer heeft juist een white box variant de voorkeur? Je leest het in deze blog!

Het black box algoritme

Een black box algoritme is een algoritme waarbij je input aan een machine of computer geeft, waar vervolgens een resultaat uitrolt. Denk aan Artificial Intelligence technieken zoals Machine Learning en Deep Learning. Prachtig gaaf, maar de grote vraag is: kan je er iets mee? Mensen willen namelijk vaak graag weten hoe iets tot stand komt. Als je bij de dokter zit en je krijgt de uitslag omdat je ergens last van hebt en hij zegt: dit heb je onder de leden, dan wil je altijd weten waar het vandaan komt of waardoor het komt toch? Als het alleen bij die conclusie zou stoppen, zou je niet prettig de praktijk verlaten. Of als je in een zelfrijdende auto stapt en die crasht vervolgens tegen een boom, zou je het heel fijn vinden als je weet hoe het ongeluk is gebeurd.

Dit zijn voorbeelden waarbij black box algoritmes niet echt bruikbaar zijn. En in het geval van de wagen wordt er zelfs echt gebruik gemaakt van zo’n black box algoritme! Dat vervolgens wel weer door mensen wordt geanalyseerd en verklaard… Achteraf, om het ongeluk te begrijpen. Hoe dan ook: liever heb je in deze situaties dat je kunt achterhalen waardoor iets is gebeurd, zodat je het kunt interpreteren en begrijpen.

White box algoritmes

De logica achter een white box algoritme is heel helder en alle aannames zijn transparant. Een white box algoritme neemt je juist mee in elke stap die in het proces gezet wordt, waardoor alles interpreteerbaar is. Je weet exact hoe het resultaat behaald is. Om in het voorbeeld van de dokter te blijven: stel je krijgt via een black box algoritme te horen dat je diabetes hebt. Punt. Omdat de machine getraind is om diabetes te herkennen op bepaalde aspecten die hij continu geleerd heeft, zoals: als je bloeddruk boven een bepaald punt komt, val je in de risicogroep. Terwijl het white box algoritme ook laat zien op basis waarvan deze diagnose is gesteld en waarom hij nu precies bij jou deze diagnose wel geeft en bij anderen niet. Bijvoorbeeld op basis van bloedwaarden, leeftijd, DNA, suikergehalte, erfelijke belastbaarheid, enz. Voor welk resultaat kies je dan liever, ook al is de uitkomst hetzelfde? In het geval van de white box kan een dokter een keuze maken voor een diagnose die is gebaseerd op feiten, die te onderbouwen is. Je kunt letterlijk de vraag gaan analyseren, terwijl je het bij een black box algoritme met de uitkomst moet doen.

Combinatie van white box en black box algoritmes

We horen je denken: is een white box algoritme dan niet altijd beter dan een black box variant? Het antwoord daarop is niet per definitie ja. Vaak hebben black box algoritmes in een of enkele procenten een beter antwoord. Het blijven toch computers ;-) Echter, ze hebben het ook weleens bij het verkeerde eind, omdat ze niet creatief kunnen reageren op nieuwe situaties die ze niet herkennen (wat een mens vaak wel kan). Nogmaals: het blijven toch computers ;-) Als elke daadwerkelijke actie van een machine nog eerst door mensen wordt gecheckt, dan kan een black box algoritme wel degelijk gebruikt worden en kan deze goed ondersteunend zijn.

Om in het doktersvoorbeeld te blijven: een machine zou een eerste screening kunnen doen op een bepaalde aandoening (bijvoorbeeld een machine die getraind is om moedervlekken te herkennen en tevens deze te voorzien van de stempel goed- of kwaadaardig). De eerste selectie is dan gemaakt en een dokter kan het eindoordeel vellen met zijn laatste professionele blik. Nadelen kunnen echter zijn dat mensen misschien te snel met een (onschuldige) moedervlek bij de arts komen, waardoor de druk op diagnose toeneemt. Of als je te vaak voor niks (een onschuldige moedervlek) naar de dokter wordt gestuurd, wordt het vertrouwen in Machine Learning ook minder.

Kortom: we snappen dat een doktersadvies nogal nauw komt en precair is en dat een black box algoritme daar niet acceptabel is. Daarom kijken we liever naar situaties waarin het realistischer is om een combinatie van white box en black box algoritmes te gebruiken. Bijvoorbeeld projecten waarin beeldherkenning van belang is.

Beeldherkenning en black box algoritmes

In beeldherkenningsprojecten komt het maken van een fout namelijk niet zo nauw als in een situatie van leven en dood. Wanneer je bijvoorbeeld makelaar bent en een onderdeel van je functie is het inmeten van ramen, kozijnen en deuren, is het mogelijk om op dat specifieke deel gebruik te maken van Machine Learning of Deep Learning (een black box algoritme). Een voorbeeld is een project dat we gedaan hebben met een grote vastgoedbeheerder.

Door een computer ontzettend veel beelden te geven (dan bedoelen we echt veel) van ramen, deuren en kozijnen, weet hij op den duur zelf te herkennen wat wat is. Wanneer een makelaar dan een foto maakt van de voorzijde van een woning en deze als input aan de computer geeft, herkent hij zelf met welk onderdeel hij en jij te maken hebben en weet hij ook nog eens in te schatten wat de afmetingen zijn (want ook dat heb je met hem getraind). Jij weet als specialist wel of deze maten kloppen en je kunt de eerste paar keer een validatieproef uitvoeren. Het resultaat? Het bespaart je tijd: je hoeft niet meer zelf in te meten, maar alleen een foto te maken! Lees hier meer over dit project van Brink.

Zo zijn er nog meer beeldherkenningsprojecten waarin Deep Learning – en dus black box algoritmes – prima kunnen worden toegepast, zoals de videoschouwtrein op het spoor.

Wat is nu de beste keuze?

Zoals je leest zitten er aan beide algoritmes voordelen. We zetten ze graag nog eens voor je op een rijtje:

Black box algoritmes kunnen heel veel voorspellen en leveren snel resultaten, maar zijn niet interpreteerbaar.
White box algoritmes hebben wat langer de tijd nodig voordat ze bij een uitkomst zijn, maar elke stap in het proces is te interpreteren en zorgt daardoor vaak voor meer draagvlak en acceptatie van de oplossing.
Black box algoritmes scoren het hoogst op performance: ze kiezen altijd de beste oplossing (scheelt soms 1-2% met een white box algoritme), al weet je niet hoe tot deze oplossing gekomen is.
Ook al kiest een white box algoritme niet voor de beste oplossing, vaak is die oplossing in de praktijk toch beter, doordat deze realistischer is en doordat je weet hoe er aan deze oplossing gekomen is.
Een black box algoritme heeft heel veel data nodig om tot een conclusie te komen, terwijl er vaak aan het begin van een project nog weinig data beschikbaar is.
White box algoritmes kunnen ook met weinig data werken, doordat je die gaat analyseren en zo tot conclusies komt.

De conclusie

Onze conclusie is dan ook dat er per vraagstuk gekeken moet worden naar wat de beste keuze is. Een techniek of systeem is hierbij nooit leidend, we starten altijd vanuit de vraag. Al wil een klant nog zo graag iets met Deep Learning omdat hij met de innovaties mee wil gaan, dan zullen we altijd kijken of dit de beste optie is. We zien zeker de voordelen van black boxes, maar werken liever met feiten. We maken zaken graag interpreteerbaar, zodat er draagvlak voor de aangedragen oplossing ontstaat en mensen bewust de verandering willen doorvoeren. Verandermanagement vindt niet plaats door ‘dit is het, take it or leave it.’ Een black box algoritme kan in veel gevallen zeker helpend en ondersteunend zijn, maar is niet doorslaggevend. Een white box algoritme is op maat te maken, waardoor er altijd voor het optimale resultaat gekozen wordt. Daar is geen twijfel over mogelijk…

Wil jij ook een white box algoritme?

Eigenlijk is CQM een white box algoritme, want we zijn altijd transparant in de keuzes die we maken en trainen onze klanten ook in het gebruik van de modellen die we opleveren. Kennis delen we dus, altijd, zodat ook jij je keuzes kunt onderbouwen en draagvlak binnen je organisatie creëert. Interesse gewekt? Neem contact op met Monique!

Wil je daarnaast op de hoogte blijven van het laatste nieuws van CQM, volg ons op LinkedIn of meld je aan voor onze digitale nieuwsbrief.

Meer cases en voorbeelden white en black box algoritmes

Fotocredit: Pixabay.

Monique van den Broek helpt je graag verder Neem contact op