Better Decisions
For Better Life

Marketing Intelligence voor Managers – De Marketing Data Scientist

-

data scientistDeze blogreeks valt binnen ons thema ‘Management & BI’. Dit thema is bedoeld voor managers die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in begrijpelijke taal en zonder alle technische termen en hypes.

Als vervolg op de introductie blog over Data Science binnen Marketing   heb ik het deze keer over de functie van data scientist. Wat typeert een data scientist binnen het vakgebied marketing? Welke kwaliteiten heeft hij?

Introductie

De data scientist binnen marketing werkt aan de bedrijfsvragen die marketing heeft. Naarmate marketing moderner en daarmee meer customer-centric werkt, worden die vragen lastiger te beantwoorden. Het vaak grillige gedrag van klanten, prospects of anonieme bezoekers veroorzaakt dit. Wat zijn precies de data die helpen om betekenisvolle voorspellingen te kunnen doen rond aankoopgedrag? Of nog lastiger; welke data spelen een rol om bezoekers door de verschillende stadia van de buyer journey heen te helpen?

Een data scientist helpt om deze vragen zo specifiek mogelijk te maken, om een goed onderzoeksmodel op te stellen, om er tijdens het wetenschappelijke geborgde onderzoek (gaandeweg) de juiste data bij te vinden, om de verbanden te leggen en om de conclusies op een juiste manier te presenteren aan de besluitnemers.

Voor een marketing data scientist zijn drie hoofdkwaliteiten van belang:

  • Hacking skills
  • Math & statistics knowledge
  • Marketing expertise

Deze skills zijn afkomstig uit Jeff Leeks Data Scientist’s Toolbox. Hieronder licht ik ze toe.

Data_science_skills.png

Hacking Skills

Hacking kent vaak een wat negatieve lading, omdat het doel van hacking helaas niet altijd even waardevol is voor een bedrijf. Toch kun je de vaardigheden die nodig zijn om succesvol data science te beoefenen, vergelijken met de skills die hackers gebruiken bij hun activiteiten.

Het gaat hier om skills op twee belangrijke gebieden: enerzijds het gebruik van een programmeertaal om toegang te krijgen tot data, om ermee te spelen, om de data te analyseren en om de uitkomsten te presenteren (plotten). Anderzijds het vermogen om zelf oplossingen te vinden voor problemen die je tegen komt tijdens het onderzoek.

Programmeervaardigheden

Vaak wordt hierbij gebruik gemaakt van R of van Python. Hoewel Python prima voldoet, heeft R toch vaak de voorkeur omdat het in steeds sterkere mate de algemeen gebruikte taal is in het data science vakgebied. R is gebaseerd is op het oudere S – een statistics language – en is gebouwd om ‘programmeren’ toegankelijker te maken voor minder officiële of volwaardige programmeurs. Op R zijn inmiddels een grote hoeveelheid uitbreidingen (packages) gebouwd die ervoor zorgen dat je van de ruwste data naar het meest interactieve rapport kunt komen. De kracht van de taal en het brede gebruik van R, is de reden voor het ontstaan van een bewonderenswaardige club van ontwikkelaars die R. Zij maken R steeds rijker en zorgen ervoor dat de frequente functionele uitbreidingen onderling toch goed blijven samenspelen. Tegenwoordig valt of staat een open source taal als R bij haar ecosysteem.

Zelf-oplossend vermogen

Dit is het vermogen om er zelf op uit te gaan en oplossingen te vinden voor de (onverwachte) problemen die je altijd tegenkomt tijdens het uitvoeren van een onderzoek op basis van data. Er is immers veel nieuws onder de zon in het werkveld van de marketing data scientist. Het meeste hiervan is niet in een schoolboek terug te vinden. Het gebruiken van informatie waarvoor je zelf op zoek moet gaan bij andere data scientists en professionals in belendende vakgebieden en om met die informatie volhardend uit te zoeken hoe het jouw probleem kan oplossen, is een sleutelkwaliteit voor de data scientist. Hij moet dus niet alleen volhardend zijn in het vinden van een goede oplossing, hij moet ook bekend zijn in het data science ecosysteem van ontwikkelaars en collega’s.

Kennis van Mathematica en Statistiek

Het werk van de klassieke campaign developer was al verweven met statistiek. Dat is met de komst van moderne marketing alleen maar sterker geworden. Tegenwoordig hebben de vragen vanuit marketing voor de data scientist steeds vaker betrekking op het vinden van structuren en verbanden in de data. Daarbij spelen zaken als correlatie op basis van allerlei distributiemodellen een belangrijke rol. Ook voor het doen van goed aansluitende voorspellingen is een goede statistische basiskennis een vereiste. Het werk van een marketing data scientist is daarom doorspekt met het gebruik van statistische modellen.

Marketing kennis

Een goede marketing data scientist is ook een beetje marketer. Marketing is meer dan ‘root mean square error’. Met andere woorden: “it does not suffice to throw statistics at a marketing problem”. Het wordt lastig werken voor de data scientist als hij de basisterminologie van de marketing discipline niet goed kent en daardoor de vraagstelling niet in de juiste bedrijfscontext plaatst. Begrippen als treatment, target cell, retentie, churn, control group, A/B-testing, response, net sales, et cetera. moet hij goed kunnen plaatsen. Anders gaat hij op zoek naar de verkeerde data of onjuiste statistische methoden. Met als gevolg dat hij een verkeerd antwoord geeft op een onjuist geïnterpreteerde vraagstelling.

Marketing en de data scientist

Juist de combinatie van de drie genoemde hoofdgebieden onderscheidt de goede marketing data scientist. Let er daarbij goed op dat de terminologie voor marketing sterk in beweging is. Zeker in het licht van moderne marketing komen er tegenwoordig regelmatig nieuwe begrippen bij. Hierbij is het zelf-oplossend vermogen van de data scientist dus opnieuw van belang.

Naast zijn kennis en ervaring op de drie hierboven genoemde gebieden is het ook van groot belang voor een data scientist om een zekere wetenschappelijke discipline in zijn werk te hebben. De navolgbaarheid van onderzoek, het doen van objectieve observaties voordat conclusies getrokken worden en het goed vastleggen van het gevolgde pad ten behoeve van herhaalbaarheid, zullen zijn werk een stuk effectiever maken.

De data science reeks

Na deze blog over de rol van data scientists voor marketing, zal ik in de komende blog het werkproces van de data scientist eens wat verder gaan toelichten.

Wil je weten hoe jij data science kunt inzetten? Download dan onderstaan eBook. Dit eBook is een verzameling van blogs door Gerrit Versteeg geschreven over data science vanuit het perspectief van managers. Het biedt houvast aan managers die willen begrijpen hoe data science in hun omgeving kan worden gebruikt.

New Call-to-action

Laat hieronder een opmerking achter als je een bepaald onderwerp rond Marketing Intelligence wilt aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog binnen de reeks wordt besproken.