Definition
Strukturerede data refererer til information organiseret i foruddefinerede formater såsom tabeller, databaser eller regneark. Det står i kontrast til ustrukturerede data som fritekst eller billeder.
Formål
Formålet er at muliggøre effektiv lagring, hentning og analyse af information. Strukturerede data understøtter datavidenskab og AI-systemer.
Vigtighed
- Let søgbar og maskinlæsbar.
- Giver pålideligt input til superviseret læring.
- Begrænset i at indfange kompleks virkelighedsnær variabilitet.
- Ofte kombineret med ustrukturerede data for at skabe mere omfattende modeller.
Hvordan det virker
- Indsaml data fra sensorer, transaktioner eller logfiler.
- Organiser i rækker og kolonner med defineret skema.
- Gem i relationelle eller NoSQL-databaser.
- Forespørgsler ved hjælp af SQL eller API'er.
- Brug som input til analyser eller ML-modeller.
Eksempler (den virkelige verden)
- Banktransaktioner gemt i strukturerede databaser.
- Hospitalsjournaler i strukturerede EHR-formater.
- Produktkataloger til e-handel.
Referencer / Yderligere læsning
- ISO/IEC 11179: Metadataregistre.
- NIST Big Data Interoperabilitetsramme.
- Kimball & Ross. Datavarehusværktøjssættet.
- Strukturerede og ustrukturerede data: