Definition
Ustrukturerede data er information, der ikke følger et foruddefineret skema, såsom fri tekst, billeder, video eller lyd.
Formål
Formålet er at indfange komplekse, virkelige oplysninger, der ikke kan repræsenteres i strukturerede tabeller.
Vigtighed
- Repræsenterer størstedelen af de data, der genereres i dag.
- Muliggør avancerede AI-applikationer inden for syn, tale og NLP.
- Vanskelig at bearbejde og analysere uden AI.
- Giver udfordringer med lagring og styring.
Hvordan det virker
- Indsaml ustrukturerede data fra kilder (sociale medier, kameraer, sensorer).
- Gem i formater som JSON, multimedier eller rå logfiler.
- Anvend AI-modeller til at udtrække mening.
- Konvertér til strukturerede repræsentationer, når det er muligt.
- Brug i downstream-analyser og beslutningstagning.
Eksempler (den virkelige verden)
- Opslag på sociale medier brugt til trendanalyse.
- Medicinsk billeddannelse til diagnose.
- Chatlogfiler fra kundesupport.
Referencer / Yderligere læsning
- NIST Big Data Interoperabilitetsramme.
- ISO/IEC TR 20547 Big Data-standarder.
- EMC/IDC Digital Universe-rapport.
- Strukturerede og ustrukturerede data