Door: Jasper
Het getal 52,07914602196062 is een meetgegeven. Het zou een zeer nauwkeurige meting van het gewicht (52 kilo) van een Reuzenkraak kunnen zijn, een van de grootste octopus soorten ter wereld. Het zou ook de topsnelheid (52 km/u) van een Blauwvintonijn kunnen zijn. Verander je de punt in een komma, en verzet je de komma een paar plekken, dan zou dit getal kunnen verwijzen naar een van de zwaarste potvissen (52.079,14602196062 kilo).
Zoals je ziet is data een weergave van een meetgegeven, in dit geval een simpel getal. Data wordt pas informatie als er afspraken worden gemaakt over wat deze getallen nu precies inhouden, en op welke manier ze worden weergegeven. Afhankelijk van de context, die het mogelijk maakt om gegevens met elkaar te vergelijken, kan data op veel verschillende manieren worden geïnterpreteerd.
Soms is een beetje context genoeg, maar het toevoegen van extra context maakt data vaak nog veel waardevoller. Neem de letter A. We kennen deze letter allemaal als de eerste letter van het alfabet. Afhankelijk van waar ter wereld je je bevindt, zal deze letter steeds net iets anders worden uitgesproken.
Naast een fonetische associatie kennen we ook een wetenschappelijke associatie. De A wordt in de genetica gebruikt als aanduiding voor adenosinemonofosfaat, een eiwit dat samen met andere eiwitten T*,* C **en G belangrijke informatie vastlegt in ons DNA. De waarde van een A wordt bepaald door de context van de T’s, C’s en G’s die eromheen liggen. Samen bepalen zij welke eiwitten er op welk moment in ons leven worden aangemaakt. Ze zorgen voor de groei van weefsels, en productie van hormonen. Om te voorkomen dat er een oor aan je been groeit, worden deze DNA ketens in cellen met verschillende functies op andere manieren opgevouwen. Deze informatie maakt ons door het verschil in context op meerdere niveaus tot wie wij zijn.
Hoewel ik als bioloog vaak genoeg dit soort data ben tegengekomen, ziet de data van onze klanten er vaak heel anders uit. Maar dat is het mooie van data, de inhoud kan dan wel heel verschillend zijn, het proces blijft vaak hetzelfde. Het combineren van verschillende soorten data zorgt bij onze klanten ook voor het waardevoller maken van de data, doordat je de gegevens in een andere context plaatst. Het uiteindelijke analyseren van deze data gebeurt vaak door de klanten zelf, die daarvoor data analisten en data scientists in dienst hebben. Maar bij het creëren van een context kunnen ze vaak wel wat hulp gebruiken. Daarom maken onze data engineers voor onze klanten een datawarehouse, zodat alle data in een bredere context geplaatst kan worden. Zo komt de waarde van hun data volledig tot zijn recht.
Datagedreven werken gaat erom dat je je data in de juiste context weet te plaatsen, en beslissingen kunt maken op basis van een volledige overzicht in plaats van een detail. Zo kun je aan het eerder genoemde 52.07914602196062 het getal 5.097794587678193 toevoegen. Als je deze coördinaten vervolgens invult in Google Maps kom je uit bij ons kantoor, en vertellen we je graag meer tijdens een kop koffie.