Data management Grip op Data

Gezien de toename van beschikbare informatie gaan veel organisaties steeds meer ‘data driven’ werken. Data geeft inzicht in de actuele status van het bedrijf, maar wordt ook gebruikt om beslissingen te nemen. Gebruik van data levert -ironisch genoeg- nog meer data op en kan leiden tot essentiële antwoorden. Tegelijkertijd levert het ook nieuwe vraagstukken op zoals: Over welke data beschikken wij nog meer binnen onze organisatie? Welke data gebruiken we en wat is daarvan de kwaliteit?
Vooral in grote organisaties komen deze vraagstukken veelvuldig voor. Doordat data steeds meer en gemakkelijker via het internet wordt gedeeld, ontbreekt vaak het overzicht van de beschikbare bronnen. Een gevolg hiervan kan zijn dat er binnen een team verschillende bronnen worden gebruikt om hetzelfde inzicht te krijgen. Hoe zorg je in dergelijke gevallen voor consistentie in gebruik van data(bronnen)? En wat betekent dat voor de datakwaliteit?
Kortom: vragen waarop je met datamanagement antwoord wilt hebben.

Rol Fitlancer:
De rol van onze dataspecialist is grofweg opgebouwd uit twee onderdelen.

Allereerst moet duidelijk zijn welke data er binnen een organisatie wordt gebruikt. Door het opzetten van een data catalogus in samenwerking met verschillende belanghebbenden (lees: data/source owners) is een eerste overzicht gecreëerd. Hierin staan alle databronnen incl. verantwoordelijke werknemer, doelen en type data beschreven. Om dit beter te borgen en om een betere uitwisseling van data plaats te laten vinden, is deze catalogus voor iedereen binnen de organisatie vrij toegankelijk gemaakt.
Bijkomend voordeel van deze catalogus is dat men nu direct helder heeft welke impact een verandering van de onderliggende bronsystemen op de data heeft. 

Vervolgens is onze Fitlancer aan de slag gegaan met datakwaliteit. Want wat is de kwaliteit van de beschikbare data? Is deze data vergankelijk? Is het volledig? Toont de data hetgeen we verwachten (met andere woorden: staan er letters als we tekst verwachten en een numerieke waarde als we getallen verwachten)? Samen met de betreffende stakeholders zijn de belangrijkste punten voor de minimaal benodigde datakwaliteit opgesteld. Aan de hand van deze punten is een Python dashboard gecreëerd om de datakwaliteit te monitoren.

Resultaat:
Door het opzetten van een datacatalogus is er beter inzicht in de gebruikte data en vindt er meer (betrouwbare) data uitwisseling plaats. Ook changes in data worden sneller opgepakt. Door gebruik van het Python dashboard wordt de kwaliteit van data automatisch inzichtelijk gemaakt wat leidt tot extra motivatie voor het verbeteren van de data(kwaliteit).
Bottomline: de totale keten heeft betrouwbaardere insights en betere grip op business decisions.

World Of Data