Bankcheckdatasæt (Document AI)

Bankcheckdatasæt (Document AI)

Brug Case: OCR

Format: .jpg

Tælle: 2023

Kommentar: Ingen

X

Beskrivelse: Bankcheckdatasættet (Document AI): Syntetiske bankchecks består af kunstigt genererede checkbilleder designet til at replikere udseendet og indholdet af rigtige checks. Det omfatter forskellige elementer såsom betalingsmodtagernavne, beløb, datoer, underskrifter og checknumre. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), kontrolbehandling og automatiseret dataudtræk, hvilket giver et kontrolleret miljø til modeludvikling uden hensynet til privatlivets fred ved rigtige checks.

Optagelsestilstand: - Klikkede billeder - Scannet - Webscrapper

Bankudtogsdatasæt (Document AI)

Bankudtogsdatasæt (Document AI)

Brug Case: OCR

Format: .jpg, png

Tælle: 5366

Kommentar: Ingen

X

Beskrivelse: Bankudtogsdatasættet (Document AI): Syntetiske kontoudtog inkluderer kunstigt genererede kontoudtog designet til at simulere rigtige finansielle dokumenter. Den indeholder forskellige transaktionsregistreringer, datoer, beløb og kontodetaljer, struktureret til at afspejle virkelige formater og indhold. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), dataudtræk og dokumentanalyse, hvilket tilbyder et kontrolleret miljø uden privatlivsproblemerne med faktiske økonomiske data.

Optagelsestilstand: - Scannet - Bankkontoudtog - Webscrapper

Kinesiske regninger datasæt

Kinesiske regninger datasæt

Brug Case: OCR

Format: Billede

Tælle: 6k

Kommentar: Ja

X

Beskrivelse: Det kinesiske regningsdatasæt indeholder billeder eller teksteksempler af forskellige typer regninger, såsom fakturaer, kvitteringer og kontoudtog, skrevet på kinesisk. Den har forskellige formater og indhold, herunder varebeskrivelser, beløb og datoer. Dette datasæt bruges til opgaver som optisk tegngenkendelse (OCR), behandling af finansielle dokumenter og automatiseret dataudtræk.

Dokumenter / OCR – Arabisk og engelsk OCR-indholdsdatasæt

Dokumenter / OCR – Arabisk og engelsk OCR-indholdsdatasæt

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 1,321

Kommentar: Ingen

X

Beskrivelse: Samling af arabisk og engelsk indholdsbilleder: Billede + annotering til OCR

Dokumenter / OCR – Stregkodevideoer datasæt

Dokumenter / OCR – Stregkodevideoer datasæt

Brug Case: Dokumenter / OCR

Format: Videoer

Tælle: 2,767

Kommentar: Ingen

X

Beskrivelse: Stregkodevideoer (Code128, UPC/EAN, PDF417, Aztec, Multikode)

Dokumenter / OCR – Datasæt med buet, trykt tekst

Dokumenter / OCR – Datasæt med buet, trykt tekst

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 18,986

Kommentar: Ingen

X

Beskrivelse: Buet trykt tekst: Saml billeder med buet tekst eller tekst med ikke-lineær grundlinje

Dokumenter / OCR – Finansielle dokumenter (bank, lønseddel, skat, USA)

Dokumenter / OCR – Finansielle dokumenter (bank, lønseddel, skat, USA)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 26,446

Kommentar: Ingen

X

Beskrivelse: Finansielle dokumenter: Bankudtog, check, lønseddel, skat, realkreditlån, forsikringskrav (USA)

Dokumenter / OCR – Finansielle dokumenter (Fase 1 – Boliglån)

Dokumenter / OCR – Finansielle dokumenter (Fase 1 – Boliglån)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 9,192

Kommentar: Ingen

X

Beskrivelse: Finansielle dokumenter (fase 1) realkreditdatasæt – udskriv, scan, fotografér

Dokumenter / OCR – Finansielle dokumenter (Fase 2 – Forsikring)

Dokumenter / OCR – Finansielle dokumenter (Fase 2 – Forsikring)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 7,636

Kommentar: Ingen

X

Beskrivelse: Finansielle dokumenter (fase 2) Forsikringsdatasæt – udskriv, scan, fotografér

Dokumenter / OCR – Håndskrevet tekstdatasæt (JP/KR/RU)

Dokumenter / OCR – Håndskrevet tekstdatasæt (JP/KR/RU)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 106,313

Kommentar: Ingen

X

Beskrivelse: Håndskrevet tekst: LivePhotos med håndskrevet tekst (japansk, koreansk, russisk)

Dokumenter / OCR – Fakturadatasæt med afgrænsningsboksannotation

Dokumenter / OCR – Fakturadatasæt med afgrænsningsboksannotation

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 87

Kommentar: Ja

X

Beskrivelse: Fakturadatasæt med afgrænsningsboksannotationer inkluderer scannede eller digitale fakturaer, hvor nøglefelter som fakturanummer, dato, leverandøroplysninger, linjeposter og samlede beløb er mærket med afgrænsningsbokse, hvilket gør det muligt for AI-modeller præcist at registrere og udtrække struktureret information fra ustrukturerede dokumenter.

Dokumenter / OCR – LivePhotos med trykt tekst (JP/KR/RU)

Dokumenter / OCR – LivePhotos med trykt tekst (JP/KR/RU)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 4,944

Kommentar: Ingen

X

Beskrivelse: LivePhotos med trykt tekst (japansk, koreansk, russisk)

Dokumenter / OCR – Flersproget datasæt for kvitteringer/fakturaer

Dokumenter / OCR – Flersproget datasæt for kvitteringer/fakturaer

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 8,961

Kommentar: Ingen

X

Beskrivelse: Det flersprogede datasæt for kvitteringer og fakturaer omfatter forskellige finansielle dokumenter på flere sprog, hvilket gør det muligt for AI-modeller at træne i tværsproget tekstgenkendelse, udtrækning af nøglefelter og dokumentforståelse.

Dokumenter / OCR – Syntetiske bankudtog (40 skabeloner)

Dokumenter / OCR – Syntetiske bankudtog (40 skabeloner)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 1,290

Kommentar: Ingen

X

Beskrivelse: Bankudtog - Unik skabelon - 40: Syntetiske bankudtog

Dokumenter / OCR – Syntetiske lønsedler (60 skabeloner)

Dokumenter / OCR – Syntetiske lønsedler (60 skabeloner)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 2,010

Kommentar: Ingen

X

Beskrivelse: Check - Unik skabelon - 60: Syntetiske lønsedler

Dokumenter / OCR – Syntetiske lønsedler (130 skabeloner)

Dokumenter / OCR – Syntetiske lønsedler (130 skabeloner)

Brug Case: Dokumenter / OCR

Format: Billeder

Tælle: 2,023

Kommentar: Ingen

X

Beskrivelse: Lønsedler - Unik skabelon - 130: Syntetisk bankcheck

Datasæt for lønsedler (Document AI)

Datasæt for lønsedler (Document AI)

Brug Case: OCR

Format: .jpg

Tælle: 2010

Kommentar: Ingen

X

Beskrivelse: Lønsedler-datasættet (Document AI): Syntetiske lønsedler består af billeder af kunstigt genererede lønsedler uden anmærkninger. Den indeholder forskellige lønsedlerformater og detaljer såsom medarbejdernavne, lønninger og datoer, der bruges til træning og test af Document AI-systemer i opgaver som OCR og dokumentbehandling.

Optagelsestilstand: - Scannet - Webscrapper