Predictive maintenance - Big Data versus Small Data in voorspelmodellen

Blog 4 van 6.

Het grote voordeel van predictive maintenance is dat je preventief onderhoud uitvoert op het moment dat het écht nodig is. In een andere blog heb ik een 5-stappenplan geschreven over hoe je storingen zou kunnen voorspellen. Afhankelijk van hoeveel data je tot je beschikking hebt, dient er bij het maken van een voorspelmodel (stap 4) een andere aanpak gekozen te worden. We maken onderscheid tussen de Big Data aanpak en de Small Data aanpak voor het voorspellen van verstoringen.

 

Big Data aanpak

Als er veel data beschikbaar zijn over het optreden van storingen is het mogelijk om statistische verbanden te zoeken tussen data van mogelijke voorspellers en data over het optreden van storingen. Hiervoor is het heel belangrijk om de data op te delen in een trainingset en een (hiermee ongecorreleerde) testset. Het maken en kiezen van modellen doe je op de trainingset. Met de testset kun je controleren of het model geen overfit betreft, maar echt voorspellende waarde heeft.

Als er heel veel mogelijke voorspellers zijn, bieden ook nieuwe data science technieken zoals machine learning en deep learning veel mogelijkheden om tot waardevolle voorspelmodellen te komen. Zo hebben wij met behulp van deep learning Volkerrail geholpen om defecten aan het spoor efficiënt te kunnen detecteren. Zie onze business case Slimme beeldherkenning maakt spoorinspectie vijf keer efficiënter.

 

Small Data aanpak

Juist in de procesindustrie waar storingen erg duur zijn en met preventief onderhoud zoveel mogelijk worden voorkomen, zijn vaak maar weinig data beschikbaar over faalmomenten. Een advanced statistics of machine learning aanpak werkt dan niet. Het is onmogelijk om de beschikbare data op te delen in een trainingset en een testset.

Wij kiezen er dan ook voor om heel gedegen met domein experts om tafel te zitten om samen een (fysisch) model te maken. Dit lijkt voor de domein experts in eerste instantie soms een verspilling van tijd (“Als we de oplossing wisten dan hadden we dit al wel eerder gedaan”), maar onze ervaring leert dat juist doordat wij met een frisse blik vragen stellen én natuurlijk een schat aan modelleerervaring meenemen, we samen veel verder komen. Het is zaak om in het model precies het juiste detailniveau te kiezen. Het moet gedetailleerd genoeg zijn om goede voorspellingen te kunnen maken zonder nodeloos complex te zijn.

Pas als we een model hebben waar iedereen vanuit de domeinkennis vertrouwen in heeft, gaan we dit model toetsen op de data.

 

Modelkeuze

In een goed model zal het aantal false negatives (je voorspelt dat er geen storing komt, maar deze komt wel) en false positives (je voorspelt een storing terwijl er niks aan de hand is) zo laag mogelijk zijn. Door dit te kwantificeren (bijvoorbeeld door middel van een ROC-curve) kun je modellen onderling vergelijken, de gewenste balans kiezen tussen false negatives en false positives en een besluit nemen of de voorspellingen van het model voldoende betrouwbaar zijn om het model te implementeren.

 

Aanbevolen:

 

Wilt u meer weten over wat predictive maintenance voor uw bedrijf kan betekenen?

Neem gerust even contact op met me voor een vrijblijvende afspraak.

Lieneke

 

 

Ir. Lieneke van Boxel-Spanjers

Ir. Lieneke van Boxel-Spanjers

Senior Consultant