Definition
Indsamling af billeddata er processen med at indsamle visuelle datasæt til træning af computervisionssystemer. Kilderne omfatter kameraer, droner, satellitter og offentlige datasæt.
Formål
Formålet er at sikre, at modeller har forskellige eksempler på læring af visuelle mønstre på tværs af miljøer og use cases.
Vigtighed
- Kritisk for nøjagtigheden af computer vision-modeller.
- Skal inkludere varieret belysning, vinkler og demografi for at undgå bias.
- Rejser spørgsmål om privatliv og samtykke ved indsamling af menneskelige billeder.
- Høje krav til lagerplads og administration.
Hvordan det virker
- Definer projektmål og databehov.
- Indsaml billeder via sensorer, API'er eller lagre.
- Organiser og mærk metadata for sporbarhed.
- Opbevares sikkert til annotering og træning.
- Opdater løbende datasæt for relevans.
Eksempler (den virkelige verden)
- ImageNet: Storskala visuelt datasæt til AI.
- COCO-datasæt: indsamlede og kommenterede billeder til forskning.
- Google Street View: kameraindsamlede billeder til kortlægning og visuelle opgaver.
Referencer / Yderligere læsning
- ImageNet-projektet — Princeton & Stanford.
- COCO-datasæt — cocodataset.org.
- ISO/IEC TR 20547-5: Referencearkitektur for big data.
- Hvorfor er et billedtræningsdatasæt nødvendigt til computervision?