Bankcheckdatasæt (Document AI)
Syntetisk bankcheck
Brug Case: OCR
Format: .jpg
Tælle: 2023
Kommentar: Ingen
Beskrivelse: Bankcheckdatasættet (Document AI): Syntetiske bankchecks består af kunstigt genererede checkbilleder designet til at replikere udseendet og indholdet af rigtige checks. Det omfatter forskellige elementer såsom betalingsmodtagernavne, beløb, datoer, underskrifter og checknumre. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), kontrolbehandling og automatiseret dataudtræk, hvilket giver et kontrolleret miljø til modeludvikling uden hensynet til privatlivets fred ved rigtige checks.
Optagelsestilstand: - Klikkede billeder - Scannet - Webscrapper
Bankudtogsdatasæt (Document AI)
Syntetiske kontoudtog
Brug Case: OCR
Format: .jpg, png
Tælle: 5366
Kommentar: Ingen
Beskrivelse: Bankudtogsdatasættet (Document AI): Syntetiske kontoudtog inkluderer kunstigt genererede kontoudtog designet til at simulere rigtige finansielle dokumenter. Den indeholder forskellige transaktionsregistreringer, datoer, beløb og kontodetaljer, struktureret til at afspejle virkelige formater og indhold. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), dataudtræk og dokumentanalyse, hvilket tilbyder et kontrolleret miljø uden privatlivsproblemerne med faktiske økonomiske data.
Optagelsestilstand: - Scannet - Bankkontoudtog - Webscrapper
Kinesiske regninger datasæt
Afgrænsningsramme+tekst
Brug Case: OCR
Format: Billede
Tælle: 6k
Kommentar: Ja
Beskrivelse: Det kinesiske regningsdatasæt indeholder billeder eller teksteksempler af forskellige typer regninger, såsom fakturaer, kvitteringer og kontoudtog, skrevet på kinesisk. Den har forskellige formater og indhold, herunder varebeskrivelser, beløb og datoer. Dette datasæt bruges til opgaver som optisk tegngenkendelse (OCR), behandling af finansielle dokumenter og automatiseret dataudtræk.
Datasæt for lønsedler (Document AI)
Brug Case: OCR
Format: .jpg
Tælle: 2010
Kommentar: Ingen
Beskrivelse: Lønsedler-datasættet (Document AI): Syntetiske lønsedler består af billeder af kunstigt genererede lønsedler uden anmærkninger. Den indeholder forskellige lønsedlerformater og detaljer såsom medarbejdernavne, lønninger og datoer, der bruges til træning og test af Document AI-systemer i opgaver som OCR og dokumentbehandling.
Optagelsestilstand: - Scannet - Webscrapper
Trykt regulær/kursiv tekstdatasæt (Document AI)
Brug Case: Dokument AI
Format: HEIC (billeder) og .mov (videoer)
Tælle: 23930
Kommentar: Ingen
Beskrivelse: Livefotos med håndskrevet tekst til japansk, koreansk og russisk
Optageenhed: iPhone & iPad kamera
Optagelsestilstand: - Aggressiv belysning/blænding - Kamerablitz tændt - Farvet lys - Lavt lys, ingen kamerablitz - Normal