Business Intelligence voor managers: Need-to-know #7 Datalogistiek
“Breng rust in je datalogistiek”.
Deze tiendelige blogreeks is onderdeel van de themareeks ‘Management & BI’. De blogreeks is bedoeld voor managers die wat meer willen weten over Business Intelligence, maar dan in begrijpelijke taal zonder alle technische termen en hypes. De blogs vormen een samenvatting van de inhoud van het 100 pagina’s lange eBook: “De 10 Need-to-Know’s, een introductie van Business Intelligence voor managers”.
Dit is de zevende blog in de reeks waarin we door een robuuste en rustige datalogistiek, het belang van goede cijfers vóór het belang van snelle cijfers stellen.
Managers willen vaak steeds sneller en eerder hun informatie hebben. De verleiding is dus groot om allerlei technische snufjes te gaan toepassen in het BI-proces om het te versnellen. Maar... hier zit een belangrijke keerzijde aan: hoe sneller het proces, des te ondoorzichtiger de verwerking. Een rustig tempo met goed gescheiden stappen brengt controleerbaarheid en daarmee zekerheid.
Ook jouw manager stelt goede cijfers vóór snelle cijfers.
Stap voor stap
De hoofdstappen in het data-logistieke proces in de BI-omgeving zijn:
- Ophalen data uit bronnen.
- Integreren van de brondata en opslag ervan in een relationeel model.
- Herstructureren van de data naar een dimensioneel model.
- Genereren en distribueren van management informatie.
Elke stap die je niet compleet uitvoert leidt tot onnodige complexiteit in de resulterende data, zoals tijdelijke relaties of het in zijn geheel ontbreken van relaties. Je kunt ervoor kiezen om niet te wachten met integreren of herstructureren totdat alle brondata binnen is. Dat betekent dan wel dat zodra de ontbrekende brondata alsnog binnenkomt, in het data warehouse allerlei data moet worden aangevuld of gecorrigeerd en relaties moeten worden omgelegd of geheel nieuw aangebracht. Dit zijn belangrijke oorzaken voor een onduidelijke en niet stabiele status van de uiteindelijk resulterende management-informatie.
Goede cijfers
Managers houden van cijfers waar ze van uit kunnen gaan, waar ze hun beslissingen op kunnen nemen met vertrouwen in goede informatie. Ze willen vandaag geen cijfers over de afgelopen week, die morgen opeens anders zijn omdat er vannacht nog wat extra klantgegevens worden bijgeladen. Zij zullen eerder zeggen; ‘ik wacht wel even tot de cijfers goed zijn, voordat ik ga reageren..!’.
Data controle
Het is dus goed om elke stap van het data logistieke BI-proces afzonderlijk en compleet uit te voeren. Om daarna de data te controleren en eventuele fouten te (laten) herstellen en te herladen, totdat uiteindelijk de data tot rust is gekomen. En om pas daarna de volgende processtap in te gaan.
Elke stap is navolgbaar en fouten worden direct aangepakt daar waar ze ontstaan. Dus geen wilde zoektocht naar waar het probleem ligt van een verdachte KPI op een uiteindelijk dashboard. Het lijkt misschien traag, maar draagt in grote mate bij aan betrouwbare en verklaarbare informatie.
Virtualisatie
Het ‘on-the-fly’ (real-time, in memory) uitvoeren van het complete BI-proces (ophalen, integreren, kantelen en distribueren) na opvraag van een rapport door een eindgebruiker, betekent dat het proces minder goed navolgbaar wordt. Dit omdat eventuele problemen niet meer goed zijn toe te wijzen aan een bepaalde processtap. Komt de foute KPI door een integratiefout van brondata? Door het herstructureren van de data? Door een ontbrekend gegeven? Door verkeerde logica bij het samenstellen van de KPI uit de brongegevens? Wat doe je precies als er een ‘error’ of - misschien nog erger - een verkeerd cijfer verschijnt in je rapport? Ga je praten met de leveranciers van de brondata? En waarover precies dan? Hoe bewijs je dat zijn data niet klopt? Hij heeft echt wel iets anders te doen!
Laat je niet gek maken
In het volgende blogartikel uit de reeks gaan we jou als manager helpen met het positioneren van Big Data: “Business Intelligence voor Managers, Need-to-know #8: Laat je niet gek maken door Big Data”. Een diepere uitleg, wat voorbeelden rond een robuuste data-logistiek en hoe om te gaan met real-time BI en data virtualisatie vind je in het gratis eBook “de 10 Need-to-Know’s rond BI voor de manager”. Als je op de hoogte wilt blijven wanneer de volgende blog in deze reeks verschijnt, dan kun je je hier abonneren op het thema Management & BI.