Bankcheckdatasæt (Document AI)

Syntetisk bankcheck

Bankcheckdatasæt (Document AI)

Brug Case: OCR

Format: .jpg

Tælle: 2023

Kommentar: Ingen

X

Beskrivelse: Bankcheckdatasættet (Document AI): Syntetiske bankchecks består af kunstigt genererede checkbilleder designet til at replikere udseendet og indholdet af rigtige checks. Det omfatter forskellige elementer såsom betalingsmodtagernavne, beløb, datoer, underskrifter og checknumre. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), kontrolbehandling og automatiseret dataudtræk, hvilket giver et kontrolleret miljø til modeludvikling uden hensynet til privatlivets fred ved rigtige checks.

Optagelsestilstand: - Klikkede billeder - Scannet - Webscrapper

Bankudtogsdatasæt (Document AI)

Syntetiske kontoudtog

Bankudtogsdatasæt (Document AI)

Brug Case: OCR

Format: .jpg, png

Tælle: 5366

Kommentar: Ingen

X

Beskrivelse: Bankudtogsdatasættet (Document AI): Syntetiske kontoudtog inkluderer kunstigt genererede kontoudtog designet til at simulere rigtige finansielle dokumenter. Den indeholder forskellige transaktionsregistreringer, datoer, beløb og kontodetaljer, struktureret til at afspejle virkelige formater og indhold. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), dataudtræk og dokumentanalyse, hvilket tilbyder et kontrolleret miljø uden privatlivsproblemerne med faktiske økonomiske data.

Optagelsestilstand: - Scannet - Bankkontoudtog - Webscrapper

Kinesiske regninger datasæt

Afgrænsningsramme+tekst

Kinesiske regninger datasæt

Brug Case: OCR

Format: Billede

Tælle: 6k

Kommentar: Ja

X

Beskrivelse: Det kinesiske regningsdatasæt indeholder billeder eller teksteksempler af forskellige typer regninger, såsom fakturaer, kvitteringer og kontoudtog, skrevet på kinesisk. Den har forskellige formater og indhold, herunder varebeskrivelser, beløb og datoer. Dette datasæt bruges til opgaver som optisk tegngenkendelse (OCR), behandling af finansielle dokumenter og automatiseret dataudtræk.

Datasæt for lønsedler (Document AI)

Datasæt for lønsedler (Document AI)

Brug Case: OCR

Format: .jpg

Tælle: 2010

Kommentar: Ingen

X

Beskrivelse: Lønsedler-datasættet (Document AI): Syntetiske lønsedler består af billeder af kunstigt genererede lønsedler uden anmærkninger. Den indeholder forskellige lønsedlerformater og detaljer såsom medarbejdernavne, lønninger og datoer, der bruges til træning og test af Document AI-systemer i opgaver som OCR og dokumentbehandling.

Optagelsestilstand: - Scannet - Webscrapper

Trykt regulær/kursiv tekstdatasæt (Document AI)

Trykt regulær/kursiv tekstdatasæt (Document AI)

Brug Case: Dokument AI

Format: HEIC (billeder) og .mov (videoer)

Tælle: 23930

Kommentar: Ingen

X

Beskrivelse: Livefotos med håndskrevet tekst til japansk, koreansk og russisk

Optageenhed: iPhone & iPad kamera

Optagelsestilstand: - Aggressiv belysning/blænding - Kamerablitz tændt - Farvet lys - Lavt lys, ingen kamerablitz - Normal