Marketing Intelligence voor Managers – Data Lake of Data Warehouse?
Deze blogreeks valt binnen ons thema ‘Management & BI’. Dit thema is bedoeld voor managers die wat meer willen weten over Business Intelligence, maar dan alleen de essentie, in begrijpelijke taal en zonder alle technische termen en hypes.
Voor moderne marketing is een data warehouse (dwh) onontbeerlijk. Het verzamelt en structureert al je klantdata, zodat je snel inzicht kunt krijgen in je customerbase en al haar attributen. Of je die data nu gebruikt voor een marketing applicatie of voor generieke BI-tools, zoals QlikSense of Tableau. In deze blog ga ik dieper in op het gebruik ervan en hoe we het dwh moeten positioneren ten opzichte van de meer ongestructureerde data uit het Data Lake.
De centrale opslag voor jouw klantdata
Een marketing dwh bevat alle voor marketing relevante data over je klanten en eventueel je geïdentificeerde prospects als je daarbij binnen de geldende privacy wetgeving blijft. Onder het dwh ligt een data-integratie tool die klantgegevens uit allerlei bronsystemen binnen je organisatie ophaalt, integreert en in het dwh opslaat. In het dwh worden deze gegevens bij elkaar gebracht en steeds aan één klantidentificatie gehangen. Denk hierbij bijvoorbeeld aan gegevens over website bezoek, contact met de service-desk, aankoopgeschiedenis en hoe ze producten gebruiken.
Het nut van een marketing data warehouse
Deze gestructureerde en centrale opslag voor klantgegevens is een schatkamer voor marketing. Op basis van het dwh kan marketing een 3600 klantbeeld samenstellen. Dat klantbeeld helpt marketing op meerdere manieren:
- Het kan naar kanalen worden gestuurd ter ondersteuning van de service- en verkoopprocessen tijdens een klantcontact.
- Het vormt de basis voor segmentatie en verdere verwerking naar Next Best Actions.
- Het vormt de basis voor voorspelmodellen waarbij alle beschikbare attributen kunnen worden onderzocht op hun voorspellende waarde, eventueel via self-learning software.
- Het biedt een robuust referentiekader voor data scientists bij data-exploratie en -analyse als zij werken met ongestructureerde data uit een data lake.
- Een consistent klantbeeld kan de basis vormen voor customer data management. Omdat alle gegevens onderling gerelateerd zijn - vooral bij klantidentificatie - kunnen problemen in klantdata (dubbele vastlegging, afwijkende attributen, etc.) snel worden geconstateerd en eventueel hersteld.
Het verschil tussen een data lake en een data warehouse
Het data lake en het data warehouse bewaren beide vaak veel data. Maar de opslagmethode verschilt sterk. De data in het dwh is gestructureerd, dat wil zeggen dat de data goed gedefinieerd is en de entiteiten in de data in onderlinge relatie gebracht zijn (geïntegreerd). Hierdoor is het afleiden van waardevolle marketing informatie relatief eenvoudig. Het data lake daarentegen kent “ongestructureerde” data. Veelal wordt hiermee bedoeld: zonder onderlinge relaties, dus niet geïntegreerd. Elke entiteit is als het ware los opgeslagen. In praktijk betekent dit dat data uit bronsystemen wordt onttrokken en vervolgens direct wordt opgeslagen in het data lake. Hierbij wordt geen rekening gehouden met de relaties die die entiteiten (kunnen) hebben met andere entiteiten in het data lake. Zo kan het voorkomen dat een data lake ook allerlei losse data bevat die in geïntegreerde vorm ook in het dwh is opgeslagen.
Het nut van een marketing data lake
Het data lake gebruik je niet om een compleet en robuust klantbeeld te scheppen. Daar heb je het marketing data warehouse voor, want daarin is alle brondata al geïntegreerd tot een consistent geheel. Het nut van een data lake zit voor marketing vooral in de mogelijkheid om data in een vroeg stadium te kunnen onderzoeken, zonder dat alle verbanden met andere data duidelijk moeten zijn. Je hoeft dus nog niet na te denken over de wijze waarop de databron precies samenhangt met andere data-elementen, maar kan direct beginnen met het onderzoeken van losse data-elementen. Data scientists kunnen bijvoorbeeld een ogenschijnlijke correlatie tussen losse data-elementen gaan onderzoeken. Op basis van dat soort onderzoek kun je uiteindelijk besluiten om sommige data-elementen ook in het (gestructureerde) data warehouse op te nemen.
Een data lake is gebaat bij de aanwezigheid van een data warehouse. Bij het onderzoeken van nieuwe data-elementen uit het data lake, is het voor data scientists erg prettig om gebruik te maken van data uit het data warehouse. De geborgde en consistente data uit het dwh vormt namelijk een goed referentiekader voor de interpretatie van losse data-elementen uit het data lake.
Conclusie
Een data warehouse is onmisbaar voor marketing, omdat je erg afhankelijk bent van een zo compleet en samenhangend mogelijk beeld van klanten. Soms is het voor marketing ook interessant om een data lake te hebben. Bijvoorbeeld als je de kwaliteit en de waarde wilt onderzoeken van allerlei data die nog niet in het data warehouse zit, maar die wel veelbelovend lijkt te zijn. Door deze ‘nieuwe’ data-elementen los op te slaan in het data lake, kun je deze data – buiten het reguliere, geborgde Marketing Intelligence proces - onderzoeken op hun eventuele waarde. Als je besluit dat een data lake ook waarde heeft voor jou, dan kun je dat data lake naast je normale data warehouse plaatsen, als een soort data laboratorium. Zo’n data lab kan je helpen om je data beter te leren kennen, voordat je de moeite neemt om deze data in het dwh te integreren.
Ben je nieuwsgierig naar de komende blogs over Marketing Intelligence? Abonneer je via onderstaande knop dan op het thema ‘Management & BI’. Zodra er een nieuwe blog in de reeks verschijnt, krijg je automatisch een seintje (per e-mail) met een link.
Laat hieronder een opmerking achter als je een bepaald onderwerp rond Marketing Intelligence wilt aandragen. Dan kan het zomaar voorkomen dat jouw situatie of vraag in een dedicated blog binnen de reeks wordt besproken.