Afstuderen: Marketing Intelligence en diepe wiskundige methoden

Marketing intelligence is één van de actieve werkgebieden van CQM. Hierin spelen de onderwerpen die voorkomen in vaak grote hoeveelheden product-reviews en forum posts een belangrijke rol: waar schrijven consumenten over? En welke bewoordingen gebruiken consumenten met betrekking tot een bepaald onderwerp? Antwoorden op deze vragen zijn voor onze klanten erg waardevol omdat ze direct inzicht geven in de Voice of the customer en daarmee richting geven aan het ontwikkelproces en/of de communicatie rondom een product of dienst.

Topic models

Eén manier om een antwoord te krijgen op deze vragen is om de documenten ‘handmatig’ te lezen. Automatische methoden bestaan ook; een eenvoudige techniek is het analyseren van woord-frequenties en deze bijvoorbeeld in een word-cloud weer te geven. Meer inzichtelijk zijn de zogenoemde topic models die abstracte ‘topics’ proberen te achterhalen uit een berg documenten. CQM heeft praktijkervaring met een bekende techniek met de geheimzinnige naam Latent Dirichlet Allocation (LDA). Om beter te begrijpen wat er diep onder de motorkap gebeurt en hoe dat verbeterd en uitgebreid kan worden, heeft Iris Koks onlangs haar afstudeerstage op dit onderwerp bij CQM gedaan.

Specifieke onderwerpen

Iris heeft een heel degelijke master thesis geschreven [1] waar zij terecht een 9 voor heeft gekregen. Een interessant verschil tussen de contexten van bestaande literatuur en die van CQM-projecten: de bestaande literatuur gaan meestal uit van een groot aantal documenten met heel uiteenlopende topics; denk bijvoorbeeld aan krantenartikelen (sport, economie, politiek). Echter in CQM-projecten is de context vaak wat uitdagender; de documenten gaan vaak over een bepaald producttype zoals bijvoorbeeld kinderwagens, waarbinnen de topics zeer specifiek zijn. Iris’ afstudeerstage heeft ons begrip van de complexe wereld rondom topic models doen toenemen, waarbij de onderliggende diepgaande wiskunde bovendien ook toepasbaar is in andere gebieden.

Multidisciplinair

Terugkijkend op het afstuderen, speelden er uiteenlopende uitdagingen: Bayesiaanse statistiek voor de fundamenten van topic models, algoritmiek om het haalbaar te maken, projectplanning omdat er zoveel te doen valt, taalkunde om stopwoorden te herkennen en verwijderen en om zinnen op te breken en een literatuurstudie om het landschap van voorgestelde uitbreidingen te verkennen... Het schakelen tussen de wereld van praktische projectuitvoering en de wereld van de Machine Learning en modellen is typisch een CQM-vaardigheid.

Nog betere implementatie

De scriptie van Iris leverde waardevolle inzichten op voor kansrijke vervolgrichtingen op het gebied van topic modelling en ook welke hoofdpaden we beter links kunnen laten liggen. Inmiddels werkt stagiair Cyril Crutzen aan een vervolg op de stage van Iris; hij onderzoekt snellere implementaties en verdere uitbreidingen.

 

[1] Latent Dirichlet Allocation, explained and improved upon for applications in marketing intelligence 

 

Data driven marketing

Wilt u meer weten over de product reviews en forum posts van uw klanten, zodat u deze kunt gebruiken in uw marketingstrategie? Wilt u direct inzicht in de Voice of the Customer? Neem dan eens contact op met Wieke, zij kan u er alles over vertellen.

 

Ook interessant:

Op de hoogte blijven van het laatste nieuws? Volg ons op LinkedIn of meld u aan en beheer hier de mailing die u van CQM wilt ontvangen.

Wieke Selten MSc

Wieke Selten MSc

Consultant