Wat is een voorbeeld van big data?

4 weergave

Big data omvat diverse datatypes: gestructureerd (inventarisdatabases, financiële transacties), ongestructureerd (socialemediaberichten, videos) en gemengd (voor het trainen van AI-taalmodellen).

Opmerking 0 leuk

De boodschappenlijst als Big Data: Een verrassend voorbeeld

We horen steeds vaker over ‘big data’, maar wat houdt dat nu eigenlijk in? De term klinkt vaak abstract en verwijst naar enorme hoeveelheden data die onmogelijk handmatig te analyseren zijn. Maar big data is niet alleen beperkt tot de enorme datasets van Google of Facebook. Een verrassend voorbeeld, dichterbij dan je denkt, is je eigen digitale boodschappenlijst.

Laten we even kijken naar een simpele boodschappenlijst op je smartphone. Op het eerste gezicht lijkt dit een klein, overzichtelijk bestand. Maar laten we het eens vanuit het perspectief van big data bekijken.

Gestructureerde data: Je lijst bevat waarschijnlijk items met hun hoeveelheid (bijvoorbeeld: 2 liter melk, 1 kg aardappelen). Deze informatie is gestructureerd: ze volgt een duidelijk gedefinieerd schema. Vergelijk het met een database met producten, hoeveelheden en misschien zelfs prijzen. Als je al jaren je boodschappen op deze manier bijhoudt, ontstaat een aanzienlijke database met gestructureerde informatie over je consumptiepatroon.

Ongestructureerde data: Nu wordt het interessant. Wat als je naast de lijst ook notities toevoegt? Bijvoorbeeld: “Goede kaas kopen, liefst jong belegen.” Of: “Aardbeien kopen als ze in de aanbieding zijn.” Deze tekstuele notities zijn ongestructureerd: ze volgen geen vast formaat en zijn subjectief. Ze bevatten echter waardevolle informatie over je voorkeuren en beslissingsprocessen. Denk aan emoties (goede kaas!) en contextuele informatie (aanbiedingen). Deze ongestructureerde data is cruciaal om je gedrag te begrijpen.

Gemengde data: Stel je nu voor dat je je boodschappenlijst koppelt aan je locatiegegevens (via je smartphone). Je ziet dan waar je je boodschappen doet, op welk tijdstip en welke producten je in welke winkel koopt. Deze combinatie van gestructureerde (producten, hoeveelheden) en ongestructureerde (notities) data, aangevuld met geografische en temporele data, is een vorm van gemengde data. Een supermarktketen zou dit soort data kunnen gebruiken om hun assortiment te optimaliseren, hun winkels strategisch te plaatsen, of gerichte aanbiedingen te doen.

De schaal maakt het big data: Hoewel één enkele boodschappenlijst geen ‘big data’ is, verandert dat als je miljoenen mensen hun lijsten delen (anoniem natuurlijk!). Dan spreek je over enorme hoeveelheden gestructureerde, ongestructureerde en gemengde data die met geavanceerde technieken geanalyseerd kunnen worden. Deze analyse kan leiden tot waardevolle inzichten over consumentengedrag, trends en voorspellingen.

Dit simpele voorbeeld illustreert dat big data niet alleen bestaat uit abstracte, technologische concepten. Het zit verweven in ons dagelijks leven, vaak in kleinere, minder opvallende vormen. De essentie van big data is niet alleen de hoeveelheid, maar ook de diversiteit aan datatypes en het potentieel om waardevolle inzichten te genereren door slimme analyse.