Åbn datasæt

Opdag datasæt med open source, der får dig til at træne ML -modeller

Åbn datasæt

Open Source -datasæt for at komme i gang med AI/ML -modeller

Resultatet af dine AI & ML-modeller er kun lige så godt som de data, du bruger til at træne det - så den nøjagtighed, som du anvender til dataaggregering, og mærkning og identifikation af disse data er vigtig!

Så hvis du vil starte et nyt AI / ML-initiativ, og nu er du hurtigt klar over, at det at finde træningsdata af høj kvalitet vil være et af de mere udfordrende aspekter af dit projekt, da datasæt af høj kvalitet er det brændstof, der holder AI / ML-motor kører. Vi har samlet en liste over åbne datasæt, der er gratis at bruge og træne dine fremtidige AI / ML-modeller.

specialisering Datatype Datasætnavn Industri / Afd. Kommentar / brugssag Link
+NLP tekst anmeldelser Amazon E-handel Følelsesanalyse Link
+NLP tekst Wikipedia links data Generelt Link
+NLP tekst Standford Sentiment Treebank Underholdning Følelsesanalyse Link
+NLP tekst Twitter US Airline Sentiment Flyselskab Følelsesanalyse Link
+CV Billede Imagenet Generelt Link
+CV Billede Googles åbne billeder Generelt Link
+NLP tekst Cornell-filmdialoger Underholdning Dialoger Link
+NLP tekst MS MARCO Generelt Besvarelse af spørgsmål Link
+NLP tekst Naturlige spørgsmålsdatasæt Generelt Besvarelse af spørgsmål Link
+NLP tekst DBPedia Generelt Viden Graph Link
+NLP tekst YAGO Generelt Viden Graph Link
+NLP tekst FreeBase Generelt Viden Graph Link
+NLP tekst Ontonotes Generelt Semantisk rollemærkning Link
+CV Billede COCO Generelt Objektdetektion Link
+CV Billede PASCAL VOC Generelt Objektdetektion Link
+CV Billede Bybilleder Autonom kørsel Semantisk segmentering Link
+CV Billede MNIST Generelt Cifferklassificering Link
+CV Billede Mode-MNIST Retail Billedklassificering Link
+NLP Audio LibriSpeech Generelt ASR Link
+NLP Audio TED-LIUM Generelt ASR Link
+NLP Audio TIMIT Generelt Fonemgenkendelse Link
+NLP Audio Fælles stemme Generelt ASR Link
+NLP Audio VoxCeleb Generelt Højttalergenkendelse Link
+NLP tekst Wikipedia-dump Generelt Sprogmodellering Link
+NLP tekst Gigaword Nyheder Sprogmodellering Link
+NLP tekst IMDB Anmeldelser Underholdning Følelsesanalyse Link
+CV Video Kinetik-700 Generelt Handlingsgenkendelse Link
+CV Video UCF101 Generelt Handlingsgenkendelse Link
+CV Video HMDB51 Generelt Handlingsgenkendelse Link
+CV Billede CASIA-WebFace Generelt Face Recognition Link
+NLP tekst SQUAD Generelt Læseforståelse Link
+NLP tekst MultiNLI Generelt Naturlig sprogslutning Link
+NLP tekst SNLI Generelt Naturlig sprogslutning Link
+CV Billede Oxford Blomster 102 Botany Finkornet klassificering Link
+CV Billede CIFAR-10 Generelt Billedklassificering Link
+CV Billede CIFAR-100 Generelt Billedklassificering Link
+CV Billede VOC Personlayout Generelt Posevurdering Link
+CV Billede MPII Menneskelig Pose Generelt Posevurdering Link
+NLP tekst 20 nyhedsgrupper Generelt Tekstklassificering Link