Deze zin horen we best vaak van onze klanten als we samen de scope van een bron bepalen. Vaak is dit een teken dat het tijd is om even goed op te letten en onze ervaring te delen. Want hoewel het aanlokkelijk lijkt om zoveel mogelijk data op te slaan voor mogelijke toekomstige analyses, biedt dit niet het meest optimale resultaat. Hieronder zet ik de belangrijkste overwegingen op een rij.

Kwantiteit boven kwaliteit?

Bij het verzamelen van gegevens, kunnen organisaties kwantiteit boven kwaliteit stellen, wat leidt tot willekeurige praktijken voor gegevensverzameling. Deze aanpak kan de relevantie en bruikbaarheid van de verzamelde gegevens verminderen, waardoor het moeilijker wordt om zinvolle inzichten te extraheren. Naarmate organisaties meer en meer data verzamelen, kunnen ze snel een punt bereiken waarop de hoeveelheid informatie overweldigend wordt: “Waar stond dit ook alweer?” “Wat was hier het idee van?”.

Deze overvloed kan leiden tot overbelasting, waardoor het moeilijker wordt om relevante inzichten te identificeren en daar vervolgens goed op te acteren.

Stel je voor dat je 3 landen mag kiezen voor een wereldreis, en ik je de keuze geef uit 50 of uit 5 landen. Welk lijstje heb je dan sneller klaar?

Afnemende opbrengsten

Hoewel het verzamelen van gegevens in eerste instantie kan leiden tot waardevolle inzichten, komt er een punt van afnemende opbrengsten. Zo ook bij de vraag:

“Kunnen we de data ook met een kleiner interval ontsluiten?”.

Vanaf een bepaald moment dragen de aanvullende data niet meer significant bij aan het verkrijgen van nieuwe inzichten of het verbeteren van besluitvormingsprocessen. Daarnaast bestaat ook het risico dat analyse wijst naar een oplossing die niet reëel is. Zo kan de data erop wijzen dat je gedurende enkele kwartiertjes op een dag bijna geen klanten in de winkel hebt. Het inhuren van een beveiliger gedurende die kwartiertjes is dan volgens de data misschien niet nodig. Leuk inzicht, maar met weinig impact, want die beveiliger gaat echt niet in dat kwartiertje op en neer naar huis fietsen. Zo spendeer je tijd aan een oplossing die niets oplevert.

Kosten en middelen

Het beheren en opslaan van grote hoeveelheden data vereist naast tijd en geld ook andere zaken, zoals een goede infrastructuur, voldoende opslagruimte en personeel. De kosten verbonden aan het verzamelen, opslaan en verwerken van gegevens kunnen de voordelen eenvoudig overstijgen, met name als je de gegevens niet effectief gebruikt. Naarmate de hoeveelheid data groeit en je het overzicht langzaam kwijtraakt, neemt ook de efficiëntie van het datagebruik af. Zonder vooropgezet plan, of goed geformuleerd probleem dat je wilt oplossen, wordt je een konijnenhol zonder eind ingezogen. Als je dan gaandeweg het probleem of de beoogde analyse nog moet gaan vormen, verlies je gegarandeerd kostbare tijd. Is die analyse nog wel zo waardevol, als je de helft van de mogelijke winst al hebt vergrabbeld doordat je zoveel tijd nodig had om tot dit inzicht te komen?  Daarnaast bestaat ook het risico dat we tijd en energie gaan verspillen aan een analyse omdat we er al zo veel tijd en energie in hebben gestopt (sunk cost fallacy).