Computer Vision

22+ mest eftertragtede Open-Source-datasæt til Computer Vision

En AI-algoritme er kun så god som de data, du fodrer med den.

Det er hverken et dristig eller ukonventionelt udsagn. AI kunne have virket ret langt ude for et par årtier siden, men kunstig intelligens og maskinlæring er kommet rigtig langt siden da.

Computer vision hjælper computere med at forstå og fortolke etiketter og billeder. Når du træner din computer ved at bruge den rigtige slags billeder, kan den få evnen til at opdage, forstå og identificere forskellige ansigtstræk, opdage sygdomme, køre autonome køretøjer og også redde liv ved hjælp af multidimensionel organscanning.

Computer Vision Market forventes at nå $ 144.46 milliarder i 2028 fra beskedne $7.04 milliarder i 2020, der voksede med en CAGR på 45.64% mellem 2021 og 2028.

Nogle af anvendelsesmulighederne for computersyn er:

  • Medicinsk billeddannelse
  • Autonomt køretøj
  • Ansigts- og objektgenkendelse
  • Fejlidentifikation
  • Scenedetektion

billeddatasæt du fodrer og træner dine maskinlærings- og computervisionsopgaver er afgørende for dit AI-projekts succes. Et kvalitetsdatasæt er ret svært at få. Afhængigt af kompleksiteten af ​​dit projekt, kan det tage alt mellem et par dage og et par uger at få pålidelige og relevante datasæt til computervisionsformål.

Her giver vi dig en række (kategoriseret for din lethed) af open source-datasæt, som du kan bruge med det samme.

Omfattende liste over Computer Vision-datasæt

Generel:

  1. IMAGEnet (Link)

    ImageNet er et meget brugt datasæt, og det kommer med forbløffende 1.2 millioner billeder kategoriseret i 1000 kategorier. Dette datasæt er organiseret i henhold til WorldNet-hierarkiet og kategoriseret i tre dele - træningsdata, billedetiketter og valideringsdata.

  2. Kinetik 700 (Link)

    Kinetics 700 er et enormt datasæt af høj kvalitet med mere end 650,000 klip af 700 forskellige menneskelige handlingsklasser. Hvert af gruppesøgsmålene har omkring 700 videoklip. Klippene i datasættet har menneske-objekt og menneske-menneske-interaktioner, som viser sig at være ganske nyttige, når de genkender menneskelige handlinger i videoer.

  3. CIFAR-10 (Link)

    CIFAR 10 er et af de største computer-vision-datasæt med 60000 32 x 32 farvebilleder, der repræsenterer ti forskellige klasser. Hver klasse har omkring 6000 billeder, der bruges til at træne computervisionsalgoritmer og maskinlæring.

Ansigtsgenkendelse:

ansigtsgenkendelse

  1. Mærket Faces in the Wild (Link)

    Labeled Faced in the Wild er et enormt datasæt, der indeholder mere end 13,230 billeder af næsten 5,750 mennesker fundet fra internettet. Dette datasæt af ansigter er designet til at gøre det nemmere at studere ubegrænset ansigtsgenkendelse.

  2. CASIA WebFace (Link)

    CASIA Web face er et veldesignet datasæt, der hjælper med maskinlæring og videnskabelig forskning om ubegrænset ansigtsgenkendelse. Med mere end 494,000 billeder af næsten 10,000 rigtige identiteter er den ideel til ansigtsidentifikation og verifikationsopgaver.

  3. UMD Faces Datasæt (Link)

    UMD står over for et velkommenteret datasæt, der indeholder to dele – stillbilleder og videorammer. Datasættet har mere end 367,800 ansigtsannotationer og 3.7 millioner kommenterede videorammer af motiver.

Håndskriftsgenkendelse:

  1. MNIST-database (Link)

    MNIST er en database, der indeholder eksempler på håndskrevne cifre fra 0 til 9, og den har 60,000 og 10,000 trænings- og testbilleder. Udgivet i 1999, MNIST gør det nemmere at teste billedbehandlingssystemer i Deep Learning.

  2. Datasæt med kunstige tegn (Link)

    Artificial Characters Dataset er, som navnet antyder, kunstigt genererede data, der beskriver den engelske sprogstruktur med ti store bogstaver. Den kommer med mere end 6000 billeder.

Lad os diskutere dit krav til AI -træningsdata i dag.

Objektregistrering:

  1. MS COCO (Link)

    MS COCO eller Common Objects in Context er et objektgenkendelses- og billedtekstdatasæt.

    Den har mere end 328,000 billeder med registrering af nøglepunkter, registrering af flere objekter, undertekster og annoteringer af segmenteringsmasker. Den kommer med 80 objektkategorier og fem billedtekster pr. billede.

  2. LSUN(Link)

    LSUN, forkortelse for Large-scale Scene Understanding, har mere end en million mærkede billeder i 20 objekt- og 10 scenekategorier. Nogle kategorier har tæt på 300,000 billeder, med 300 billeder specifikt til validering og 1000 billeder til testdata.

  3. Hjem Objekter(Link)

    Home Objects-datasættet indeholder kommenterede billeder af tilfældige objekter fra hele huset – køkken, stue og badeværelse. Dette datasæt har også et par kommenterede videoer og 398 uannoterede billeder designet til test.

Automotive:

  1. Bybillede datasæt (Link)

    Cityscape er datasættet, man skal gå til, når man leder efter forskellige videosekvenser optaget fra flere citaters gadescener. Disse billeder blev taget over lang tid og under forskellige vejr- og lysforhold. Annoteringerne er til 30 klasser af billeder opdelt i otte forskellige kategorier.

  2. Barkley Deep Drive (Link)

    Barkley DeepDrive er specielt designet til træning af autonome køretøjer, og den har mere end 100 tusind kommenterede videosekvenser. Det er en af ​​de mest nyttige træningsdata for autonome køretøjer ved de skiftende vej- og køreforhold.

  3. mapillary (Link)

    Mapillary har over 750 millioner gadebilleder og trafikskilte verden over, hvilket er meget nyttigt til træning af visuelle perceptionsmodeller i maskinlæring og AI-algoritmer. Det giver dig mulighed for at udvikle autonome køretøjer, der imødekommer forskellige lys- og vejrforhold og synspunkter.

Medicinsk billeddannelse:

  1. Covid-19 Open Research Dataset (Link)

    Dette originale datasæt har omkring 6500 pixel-polygonale lungesegmenteringer om AP/PA røntgenbilleder af thorax. Derudover er 517 billeder af Covid-19 patienters røntgenbilleder med tags, der indeholder navn, placering, indlæggelsesdetaljer, resultat og mere, tilgængelige.

  2. NIH-database med 100,000 røntgenbilleder af thorax (Link)

    NIH-databasen er en af ​​de mest omfattende offentligt tilgængelige datasæt, der indeholder 100,000 røntgenbilleder af thorax og relaterede data, der er nyttige for videnskabs- og forskningssamfundet. Den har endda billeder af patienter med fremskredne lungesygdomme.

  3. Atlas over digital patologi (Link)

    Atlas of Digital Pathology tilbyder adskillige histopatologiske patchbilleder, mere end 17,000 i alt, fra tæt på 100 kommenterede dias af forskellige organer. Dette datasæt er nyttigt til udvikling af computersyn og mønstergenkendelsessoftware.

Scenegenkendelse:

Scenegenkendelse

  1. Indendørs scenegenkendelse (Link)

    Indendørs Scene Recognition er et højt kategoriseret datasæt med næsten 15620 billeder af objekter og indendørs landskaber, der skal bruges i maskinlæring og datatræning. Den kommer med over 65 kategorier, og hver kategori har minimum 100 billeder.

  2. xView (Link)

    Som et af de bedst kendte offentligt tilgængelige datasæt indeholder xView tonsvis af kommenterede overheadbilleder fra forskellige komplekse og store scener. Med omkring 60 klasser og mere end en million objektforekomster er formålet med dette datasæt at give bedre katastrofehjælp ved hjælp af satellitbilleder.

  3. Steder (Link)

    Places, et datasæt bidraget af MIT, har over 1.8 millioner billeder fra 365 forskellige scenekategorier. Der er omkring 50 billeder i hver af disse kategorier til validering og 900 billeder til test. Det er muligt at lære dybe scenefunktioner for at etablere scenegenkendelse eller visuelle genkendelsesopgaver.

Underholdning:

  1. IMDB WIKI Datasæt (Link)

    IMDB – Wiki er en af ​​de mest populære offentlige databaser over ansigter, der er passende mærket med alder, køn og navne. Det har også omkring 20 tusind ansigter af berømtheder og 62 tusind fra Wikipedia.

  2. Kendis ansigter (Link)

    Celeb Faces er en storstilet database med 200,000 kommenterede billeder af berømtheder. Billederne kommer med baggrundsstøj og posevariationer, hvilket gør dem værdifulde til træning af testsæt i computervisionsopgaver. Det er yderst fordelagtigt for at opnå højere nøjagtighed i ansigtsgenkendelse, redigering, lokalisering af ansigtsdele og mere.

Nu hvor du har en massiv liste over open source billeddatasæt til at give næring til dit kunstige intelligens-maskineri. Resultatet af dine AI- og maskinlæringsmodeller afhænger primært af kvaliteten af ​​de datasæt, du fodrer og træner dem på. Hvis du vil have din AI-model til at frembringe nøjagtige forudsigelser, har den brug for kvalitetsdatasæt, der er aggregeret, tagget og mærket til perfektion. For at forstærke dit computervisionsystems succes skal du bruge kvalitetsbilleddatabaser, der er relevante for dit projektvision. Hvis du leder efter flere sådanne datasæt Klik her

Social Share

Du vil måske også kunne lide