Arabisk & thai & vietnamesisk & hindi & engelsk & kinesisk sprogdatasæt

Afgrænsningsramme+tekst

Arabisk & thai & vietnamesisk & hindi & engelsk & kinesisk sprogdatasæt

Brug Case: OCR

Format: Billede

Tælle: 150k

Kommentar: Ja

X

Beskrivelse: Arabisk & thai & vietnamesisk & hindi & engelsk & kinesisk sprogdatasæt

Arabisk tekstdatasæt

Afgrænsningsramme+tekst

Arabisk tekstdatasæt

Brug Case: OCR

Format: Billede

Tælle: 1k

Kommentar: Ja

X

Beskrivelse: Det arabiske tekstdatasæt indeholder en samling af teksteksempler skrevet på arabisk. Det omfatter forskellige former for indhold, såsom nyhedsartikler, indlæg på sociale medier, litteratur og dialog, der spænder over forskellige emner og skrivestile. Dette datasæt bruges til opgaver som naturlig sprogbehandling (NLP), tekstklassificering, sentimentanalyse og maskinoversættelse i arabiske sprogapplikationer.

Kinesisk & engelsk & tibetansk & uigurisk sprogdatasæt

Afgrænsningsramme+tekst

Kinesisk & engelsk & tibetansk & uigurisk sprogdatasæt

Brug Case: OCR

Format: Billede

Tælle: 38k

Kommentar: Ja

X

Beskrivelse: Kinesisk & engelsk & tibetansk & uigurisk sprogdatasæt

Kinesisk og engelsk menudatasæt

Afgrænsningsramme+tekst

Kinesisk og engelsk menudatasæt

Brug Case: OCR

Format: Billede

Tælle: 60k

Kommentar: Ja

X

Beskrivelse: Det kinesiske og engelske menudatasæt indeholder billeder eller teksteksempler af restaurantmenuer, der indeholder både kinesiske og engelske sprog. Det inkluderer forskellige skrifttyper, layouts og menustrukturer, der præsenterer tosprogede retternavne, beskrivelser og priser. Dette datasæt er nyttigt til opgaver som optisk tegngenkendelse (OCR), maskinoversættelse og menudigitalisering i flersprogede indstillinger.

Kinesisk håndskrevet kompositionsdatasæt

Afgrænsningsramme+tekst

Kinesisk håndskrevet kompositionsdatasæt

Brug Case: OCR

Format: Billede

Tælle: 3k

Kommentar: Ja

X

Beskrivelse: Det kinesiske håndskrevne kompositionsdatasæt indeholder eksempler på håndskreven kinesisk tekst, herunder kompositioner, essays og anden tekst i lang form. Den har forskellige håndskriftsstile og kompleksitetsniveauer og bruges til opgaver som håndskriftsgenkendelse, tekstanalyse og maskinlæringsmodeltræning.

Kinesisk WIFI-prompt-datasæt

Afgrænsningsramme+tekst

Kinesisk WIFI-prompt-datasæt

Brug Case: OCR

Format: Billede

Tælle: 1k

Kommentar: Ja

X

Beskrivelse: Det kinesiske WIFI-promptdatasæt består af teksteksempler fundet i WIFI-prompter og login-skærme skrevet på kinesisk. Det inkluderer typisk forskellige prompter, instruktioner og fejlmeddelelser relateret til at oprette forbindelse til eller administrere WIFI-netværk. Dette datasæt bruges til opgaver som tekstgenkendelse, naturlig sprogbehandling og forbedring af brugergrænseflader til netværksforbindelse.

Engelsk og kinesisk håndskriftsdatasæt

Afgrænsningsramme+tekst

Engelsk og kinesisk håndskriftsdatasæt

Brug Case: OCR

Format: Billede

Tælle: 12k

Kommentar: Ja

X

Beskrivelse: Det engelske og kinesiske håndskriftsdatasæt indeholder håndskrevne eksempler på både engelsk og kinesisk, der viser forskellige skrivestile og karakterkompleksiteter. Det bruges typisk til træning og evaluering af håndskriftsgenkendelsesmodeller, understøttelse af flersproget tekstanalyse og anden relateret forskning. Datasættet indeholder en bred vifte af tegn, cifre, ord og sætninger på begge sprog.

Engelsk og kinesisk Shopsign-datasæt

Afgrænsningsramme+tekst

Engelsk og kinesisk Shopsign-datasæt

Brug Case: OCR

Format: Billede

Tælle: 30k

Kommentar: Ja

X

Beskrivelse: Det engelske og kinesiske Shopsign-datasæt indeholder billeder af butiksskilte med både engelsk og kinesisk tekst. Det fanger forskellige skilteelementer såsom butiksnavne, reklamer, kampagner og rutevejledninger, der vises i forskellige skrifttyper, stilarter og formater. Dette datasæt bruges til opgaver som tekstgenkendelse og genkendelse, flersproget sceneforståelse og forbedring af computersynsmodeller til fortolkning af tosproget skiltning.

Engelsk og kinesisk specialvinkeltekstdatasæt

Afgrænsningsramme+tekst

Engelsk og kinesisk specialvinkeltekstdatasæt

Brug Case: OCR

Format: Billede

Tælle: 50k

Kommentar: Ja

X

Beskrivelse: Det engelske og kinesiske specialvinkeltekstdatasæt indeholder billeder af tekst vist i forskellige vinkler og orienteringer på både engelsk og kinesisk. Det inkluderer tekst fra kilder som skilte, reklamer og dokumenter, der ikke præsenteres i standard horisontale formater. Dette datasæt bruges til træning og evaluering af tekstgenkendelses- og genkendelsesmodeller, især dem, der er i stand til at håndtere tekst i ikke-traditionelle orienteringer og perspektiver.

Engelsk menudatasæt

Afgrænsningsramme+tekst

Engelsk menudatasæt

Brug Case: OCR

Format: Billede

Tælle: 20k

Kommentar: Ja

X

Beskrivelse: Det engelske menudatasæt indeholder billeder eller tekstprøver af restaurantmenuer skrevet på engelsk. Den har en række forskellige skrifttyper, layouts og formateringsstile, med indhold lige fra fadenavne til beskrivelser og priser. Dette datasæt bruges ofte til opgaver som optisk tegngenkendelse (OCR), tekstudtræk og menudigitalisering i fødevarerelaterede applikationer.

Engelske scener tekstdatasæt

Afgrænsningsramme+tekst

Engelske scener tekstdatasæt

Brug Case: OCR

Format: Billede

Tælle: 33k

Kommentar: Ja

X

Beskrivelse: Det engelske scenetekstdatasæt består af billeder, der indeholder naturlige scener med indlejret engelsk tekst. Teksten vises i forskellige former, såsom skilte, billboards og plakater, ofte i forskellige skrifttyper, størrelser og retninger. Dette datasæt bruges almindeligvis til træning og test af modeller i tekstgenkendelse, genkendelse og sceneforståelsesopgaver.

Håndskrevet tekstdatasæt

Håndskrevet tekstdatasæt

Brug Case: Dokument AI

Format: HEIC (billeder) og .mov (videoer)

Tælle: 94053

Kommentar: Ingen

X

Beskrivelse: Livefotos med håndskrevet tekst til japansk, koreansk og russisk

Optageenhed: iPhone & iPad kamera

Optagelsestilstand: - Aggressiv belysning/blænding - Kamerablitz tændt - Farvet lys - Lavt lys, ingen kamerablitz - Normal

Japansk og koreansk sprogdatasæt

Afgrænsningsramme+tekst

Japansk og koreansk sprogdatasæt

Brug Case: OCR

Format: Billede

Tælle: 40k

Kommentar: Ja

X

Beskrivelse: Det japanske og koreanske sprogdatasæt indeholder teksteksempler på både japansk og koreansk. Den har en række indhold såsom sætninger, sætninger og ord, der omfatter forskellige sammenhænge og stilarter. Dette datasæt bruges til opgaver som naturlig sprogbehandling (NLP), maskinoversættelse og tekstanalyse i flersprogede applikationer.