Arabisk & thai & vietnamesisk & hindi & engelsk & kinesisk sprogdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 150k
Kommentar: Ja
Beskrivelse: Arabisk & thai & vietnamesisk & hindi & engelsk & kinesisk sprogdatasæt
Arabisk tekstdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 1k
Kommentar: Ja
Beskrivelse: Det arabiske tekstdatasæt indeholder en samling af teksteksempler skrevet på arabisk. Det omfatter forskellige former for indhold, såsom nyhedsartikler, indlæg på sociale medier, litteratur og dialog, der spænder over forskellige emner og skrivestile. Dette datasæt bruges til opgaver som naturlig sprogbehandling (NLP), tekstklassificering, sentimentanalyse og maskinoversættelse i arabiske sprogapplikationer.
Kinesisk & engelsk & tibetansk & uigurisk sprogdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 38k
Kommentar: Ja
Beskrivelse: Kinesisk & engelsk & tibetansk & uigurisk sprogdatasæt
Kinesisk og engelsk menudatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 60k
Kommentar: Ja
Beskrivelse: Det kinesiske og engelske menudatasæt indeholder billeder eller teksteksempler af restaurantmenuer, der indeholder både kinesiske og engelske sprog. Det inkluderer forskellige skrifttyper, layouts og menustrukturer, der præsenterer tosprogede retternavne, beskrivelser og priser. Dette datasæt er nyttigt til opgaver som optisk tegngenkendelse (OCR), maskinoversættelse og menudigitalisering i flersprogede indstillinger.
Kinesisk håndskrevet kompositionsdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 3k
Kommentar: Ja
Beskrivelse: Det kinesiske håndskrevne kompositionsdatasæt indeholder eksempler på håndskreven kinesisk tekst, herunder kompositioner, essays og anden tekst i lang form. Den har forskellige håndskriftsstile og kompleksitetsniveauer og bruges til opgaver som håndskriftsgenkendelse, tekstanalyse og maskinlæringsmodeltræning.
Kinesisk WIFI-prompt-datasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 1k
Kommentar: Ja
Beskrivelse: Det kinesiske WIFI-promptdatasæt består af teksteksempler fundet i WIFI-prompter og login-skærme skrevet på kinesisk. Det inkluderer typisk forskellige prompter, instruktioner og fejlmeddelelser relateret til at oprette forbindelse til eller administrere WIFI-netværk. Dette datasæt bruges til opgaver som tekstgenkendelse, naturlig sprogbehandling og forbedring af brugergrænseflader til netværksforbindelse.
Engelsk og kinesisk håndskriftsdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 12k
Kommentar: Ja
Beskrivelse: Det engelske og kinesiske håndskriftsdatasæt indeholder håndskrevne eksempler på både engelsk og kinesisk, der viser forskellige skrivestile og karakterkompleksiteter. Det bruges typisk til træning og evaluering af håndskriftsgenkendelsesmodeller, understøttelse af flersproget tekstanalyse og anden relateret forskning. Datasættet indeholder en bred vifte af tegn, cifre, ord og sætninger på begge sprog.
Engelsk og kinesisk Shopsign-datasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 30k
Kommentar: Ja
Beskrivelse: Det engelske og kinesiske Shopsign-datasæt indeholder billeder af butiksskilte med både engelsk og kinesisk tekst. Det fanger forskellige skilteelementer såsom butiksnavne, reklamer, kampagner og rutevejledninger, der vises i forskellige skrifttyper, stilarter og formater. Dette datasæt bruges til opgaver som tekstgenkendelse og genkendelse, flersproget sceneforståelse og forbedring af computersynsmodeller til fortolkning af tosproget skiltning.
Engelsk og kinesisk specialvinkeltekstdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 50k
Kommentar: Ja
Beskrivelse: Det engelske og kinesiske specialvinkeltekstdatasæt indeholder billeder af tekst vist i forskellige vinkler og orienteringer på både engelsk og kinesisk. Det inkluderer tekst fra kilder som skilte, reklamer og dokumenter, der ikke præsenteres i standard horisontale formater. Dette datasæt bruges til træning og evaluering af tekstgenkendelses- og genkendelsesmodeller, især dem, der er i stand til at håndtere tekst i ikke-traditionelle orienteringer og perspektiver.
Engelsk menudatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 20k
Kommentar: Ja
Beskrivelse: Det engelske menudatasæt indeholder billeder eller tekstprøver af restaurantmenuer skrevet på engelsk. Den har en række forskellige skrifttyper, layouts og formateringsstile, med indhold lige fra fadenavne til beskrivelser og priser. Dette datasæt bruges ofte til opgaver som optisk tegngenkendelse (OCR), tekstudtræk og menudigitalisering i fødevarerelaterede applikationer.
Engelske scener tekstdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 33k
Kommentar: Ja
Beskrivelse: Det engelske scenetekstdatasæt består af billeder, der indeholder naturlige scener med indlejret engelsk tekst. Teksten vises i forskellige former, såsom skilte, billboards og plakater, ofte i forskellige skrifttyper, størrelser og retninger. Dette datasæt bruges almindeligvis til træning og test af modeller i tekstgenkendelse, genkendelse og sceneforståelsesopgaver.
Håndskrevet tekstdatasæt
Brug Case: Dokument AI
Format: HEIC (billeder) og .mov (videoer)
Tælle: 94053
Kommentar: Ingen
Beskrivelse: Livefotos med håndskrevet tekst til japansk, koreansk og russisk
Optageenhed: iPhone & iPad kamera
Optagelsestilstand: - Aggressiv belysning/blænding - Kamerablitz tændt - Farvet lys - Lavt lys, ingen kamerablitz - Normal
Japansk og koreansk sprogdatasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 40k
Kommentar: Ja
Beskrivelse: Det japanske og koreanske sprogdatasæt indeholder teksteksempler på både japansk og koreansk. Den har en række indhold såsom sætninger, sætninger og ord, der omfatter forskellige sammenhænge og stilarter. Dette datasæt bruges til opgaver som naturlig sprogbehandling (NLP), maskinoversættelse og tekstanalyse i flersprogede applikationer.