En AI-algoritme er kun så god som de data, du fodrer med den.
Det er hverken et dristig eller ukonventionelt udsagn. AI kunne have virket ret langt ude for et par årtier siden, men kunstig intelligens og maskinlæring er kommet rigtig langt siden da.
Computer vision helps computers understand and interpret labels and images. When you train your computer using the right kind of images datasets, it can gain the ability to detect, understand and identify various facial features, detect diseases, drive autonomous vehicles, and also save lives using multi-dimensional organ scanning.
Computer Vision Market forventes at nå $ 144.46 milliarder i 2028 fra beskedne $7.04 milliarder i 2020, der voksede med en CAGR på 45.64% mellem 2021 og 2028.
billeddatasæt du fodrer og træner dine maskinlærings- og computervisionsopgaver er afgørende for dit AI-projekts succes. Et kvalitetsdatasæt er ret svært at få. Afhængigt af kompleksiteten af dit projekt, kan det tage alt mellem et par dage og et par uger at få pålidelige og relevante datasæt til computervisionsformål.
Here, we provide you with a range (categorized for your ease) of open-source image datasets you can use right away.
Comprehensive List of Image Datasets to Train Your Computer Vision Model
Generel:
IMAGEnet
ImageNet er et meget brugt datasæt, og det kommer med forbløffende 1.2 millioner billeder kategoriseret i 1000 kategorier. Dette datasæt er organiseret i henhold til WorldNet-hierarkiet og kategoriseret i tre dele - træningsdata, billedetiketter og valideringsdata.
Kinetik 700
Kinetics 700 er et enormt datasæt af høj kvalitet med mere end 650,000 klip af 700 forskellige menneskelige handlingsklasser. Hvert af gruppesøgsmålene har omkring 700 videoklip. Klippene i datasættet har menneske-objekt og menneske-menneske-interaktioner, som viser sig at være ganske nyttige, når de genkender menneskelige handlinger i videoer.
CIFAR-10
CIFAR 10 er et af de største computer-vision-datasæt med 60000 32 x 32 farvebilleder, der repræsenterer ti forskellige klasser. Hver klasse har omkring 6000 billeder, der bruges til at træne computervisionsalgoritmer og maskinlæring.
Oxford-IIIT Pet Images Dataset
The pet image dataset comprises 37 categories with 200 images per class. These images vary in scale, pose, and lighting, and are accompanied by annotations for breed, head ROI, and pixel-level trimap segmentation.
Googles åbne billeder
With an impressive 9 million URLs, this is one of the largest image datasets on the list, containing millions of images labeled across 6,000 categories.
Plant Images
This compilation includes multiple image datasets featuring an impressive 1 million plant images, covering approximately 11 species.
Ansigtsgenkendelse:
Mærket Faces in the Wild
Labeled Faced in the Wild er et enormt datasæt, der indeholder mere end 13,230 billeder af næsten 5,750 mennesker fundet fra internettet. Dette datasæt af ansigter er designet til at gøre det nemmere at studere ubegrænset ansigtsgenkendelse.
CASIA WebFace
CASIA Web face er et veldesignet datasæt, der hjælper med maskinlæring og videnskabelig forskning om ubegrænset ansigtsgenkendelse. Med mere end 494,000 billeder af næsten 10,000 rigtige identiteter er den ideel til ansigtsidentifikation og verifikationsopgaver.
UMD Faces Datasæt
UMD står over for et velkommenteret datasæt, der indeholder to dele – stillbilleder og videorammer. Datasættet har mere end 367,800 ansigtsannotationer og 3.7 millioner kommenterede videorammer af motiver.
Ansigtsmaskegenkendelse
This dataset includes 853 images categorized into three classes: “with mask,” “without mask,” and “mask worn incorrectly,” along with their bounding boxes in PASCAL VOC format.
FERET
The FERET (Facial Recognition Technology Database) is a comprehensive image dataset containing over 14,000 annotated images of human faces.
Håndskriftsgenkendelse:
MNIST-database
MNIST er en database, der indeholder eksempler på håndskrevne cifre fra 0 til 9, og den har 60,000 og 10,000 trænings- og testbilleder. Udgivet i 1999, MNIST gør det nemmere at teste billedbehandlingssystemer i Deep Learning.
Datasæt med kunstige tegn
Artificial Characters Dataset er, som navnet antyder, kunstigt genererede data, der beskriver den engelske sprogstruktur med ti store bogstaver. Den kommer med mere end 6000 billeder.
Objektregistrering:
MS COCO
MS COCO eller Common Objects in Context er et objektgenkendelses- og billedtekstdatasæt.
Den har mere end 328,000 billeder med registrering af nøglepunkter, registrering af flere objekter, undertekster og annoteringer af segmenteringsmasker. Den kommer med 80 objektkategorier og fem billedtekster pr. billede.
LSUN
LSUN, forkortelse for Large-scale Scene Understanding, har mere end en million mærkede billeder i 20 objekt- og 10 scenekategorier. Nogle kategorier har tæt på 300,000 billeder, med 300 billeder specifikt til validering og 1000 billeder til testdata.
Hjem Objekter
Home Objects-datasættet indeholder kommenterede billeder af tilfældige objekter fra hele huset – køkken, stue og badeværelse. Dette datasæt har også et par kommenterede videoer og 398 uannoterede billeder designet til test.
Automotive:
Bybillede datasæt
Cityscape er datasættet, man skal gå til, når man leder efter forskellige videosekvenser optaget fra flere citaters gadescener. Disse billeder blev taget over lang tid og under forskellige vejr- og lysforhold. Annoteringerne er til 30 klasser af billeder opdelt i otte forskellige kategorier.
Barkley Deep Drive
Barkley DeepDrive er specielt designet til træning af autonome køretøjer, og den har mere end 100 tusind kommenterede videosekvenser. Det er en af de mest nyttige træningsdata for autonome køretøjer ved de skiftende vej- og køreforhold.
mapillary
Mapillary har over 750 millioner gadebilleder og trafikskilte verden over, hvilket er meget nyttigt til træning af visuelle perceptionsmodeller i maskinlæring og AI-algoritmer. Det giver dig mulighed for at udvikle autonome køretøjer, der imødekommer forskellige lys- og vejrforhold og synspunkter.
Medicinsk billeddannelse:
Covid-19 Open Research Dataset
Dette originale datasæt har omkring 6500 pixel-polygonale lungesegmenteringer om AP/PA røntgenbilleder af thorax. Derudover er 517 billeder af Covid-19 patienters røntgenbilleder med tags, der indeholder navn, placering, indlæggelsesdetaljer, resultat og mere, tilgængelige.
NIH-database med 100,000 røntgenbilleder af thorax
NIH-databasen er en af de mest omfattende offentligt tilgængelige datasæt, der indeholder 100,000 røntgenbilleder af thorax og relaterede data, der er nyttige for videnskabs- og forskningssamfundet. Den har endda billeder af patienter med fremskredne lungesygdomme.
Atlas over digital patologi
Atlas of Digital Pathology tilbyder adskillige histopatologiske patchbilleder, mere end 17,000 i alt, fra tæt på 100 kommenterede dias af forskellige organer. Dette datasæt er nyttigt til udvikling af computersyn og mønstergenkendelsessoftware.
Scenegenkendelse:
Indendørs scenegenkendelse
Indendørs Scene Recognition er et højt kategoriseret datasæt med næsten 15620 billeder af objekter og indendørs landskaber, der skal bruges i maskinlæring og datatræning. Den kommer med over 65 kategorier, og hver kategori har minimum 100 billeder.
xView
Som et af de bedst kendte offentligt tilgængelige datasæt indeholder xView tonsvis af kommenterede overheadbilleder fra forskellige komplekse og store scener. Med omkring 60 klasser og mere end en million objektforekomster er formålet med dette datasæt at give bedre katastrofehjælp ved hjælp af satellitbilleder.
Steder
Places, et datasæt bidraget af MIT, har over 1.8 millioner billeder fra 365 forskellige scenekategorier. Der er omkring 50 billeder i hver af disse kategorier til validering og 900 billeder til test. Det er muligt at lære dybe scenefunktioner for at etablere scenegenkendelse eller visuelle genkendelsesopgaver.
Underholdning:
IMDB WIKI Datasæt
IMDB – Wiki er en af de mest populære offentlige databaser over ansigter, der er passende mærket med alder, køn og navne. Det har også omkring 20 tusind ansigter af berømtheder og 62 tusind fra Wikipedia.
Kendis ansigter
Celeb Faces er en storstilet database med 200,000 kommenterede billeder af berømtheder. Billederne kommer med baggrundsstøj og posevariationer, hvilket gør dem værdifulde til træning af testsæt i computervisionsopgaver. Det er yderst fordelagtigt for at opnå højere nøjagtighed i ansigtsgenkendelse, redigering, lokalisering af ansigtsdele og mere.
Nu hvor du har en massiv liste over open source billeddatasæt til at give næring til dit kunstige intelligens-maskineri. Resultatet af dine AI- og maskinlæringsmodeller afhænger primært af kvaliteten af de datasæt, du fodrer og træner dem på. Hvis du vil have din AI-model til at frembringe nøjagtige forudsigelser, har den brug for kvalitetsdatasæt, der er aggregeret, tagget og mærket til perfektion. For at forstærke dit computervisionsystems succes skal du bruge kvalitetsbilleddatabaser, der er relevante for dit projektvision. Hvis du leder efter flere sådanne datasæt Klik her