Bankcheckdatasæt (Document AI)
Brug Case: OCR
Format: .jpg
Tælle: 2023
Kommentar: Ingen
Beskrivelse: Bankcheckdatasættet (Document AI): Syntetiske bankchecks består af kunstigt genererede checkbilleder designet til at replikere udseendet og indholdet af rigtige checks. Det omfatter forskellige elementer såsom betalingsmodtagernavne, beløb, datoer, underskrifter og checknumre. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), kontrolbehandling og automatiseret dataudtræk, hvilket giver et kontrolleret miljø til modeludvikling uden hensynet til privatlivets fred ved rigtige checks.
Optagelsestilstand: - Klikkede billeder - Scannet - Webscrapper
Bankudtogsdatasæt (Document AI)
Brug Case: OCR
Format: .jpg, png
Tælle: 5366
Kommentar: Ingen
Beskrivelse: Bankudtogsdatasættet (Document AI): Syntetiske kontoudtog inkluderer kunstigt genererede kontoudtog designet til at simulere rigtige finansielle dokumenter. Den indeholder forskellige transaktionsregistreringer, datoer, beløb og kontodetaljer, struktureret til at afspejle virkelige formater og indhold. Dette datasæt bruges til at træne og evaluere Document AI-systemer i opgaver som optisk tegngenkendelse (OCR), dataudtræk og dokumentanalyse, hvilket tilbyder et kontrolleret miljø uden privatlivsproblemerne med faktiske økonomiske data.
Optagelsestilstand: - Scannet - Bankkontoudtog - Webscrapper
Kinesiske regninger datasæt
Brug Case: OCR
Format: Billede
Tælle: 6k
Kommentar: Ja
Beskrivelse: Det kinesiske regningsdatasæt indeholder billeder eller teksteksempler af forskellige typer regninger, såsom fakturaer, kvitteringer og kontoudtog, skrevet på kinesisk. Den har forskellige formater og indhold, herunder varebeskrivelser, beløb og datoer. Dette datasæt bruges til opgaver som optisk tegngenkendelse (OCR), behandling af finansielle dokumenter og automatiseret dataudtræk.
Dokumenter / OCR – Arabisk og engelsk OCR-indholdsdatasæt
Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 1,321
Kommentar: Ingen
Beskrivelse: Samling af arabisk og engelsk indholdsbilleder: Billede + annotering til OCR
Dokumenter / OCR – Stregkodevideoer datasæt

Brug Case: Dokumenter / OCR
Format: Videoer
Tælle: 2,767
Kommentar: Ingen
Beskrivelse: Stregkodevideoer (Code128, UPC/EAN, PDF417, Aztec, Multikode)
Dokumenter / OCR – Datasæt med buet, trykt tekst

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 18,986
Kommentar: Ingen
Beskrivelse: Buet trykt tekst: Saml billeder med buet tekst eller tekst med ikke-lineær grundlinje
Dokumenter / OCR – Finansielle dokumenter (bank, lønseddel, skat, USA)

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 26,446
Kommentar: Ingen
Beskrivelse: Finansielle dokumenter: Bankudtog, check, lønseddel, skat, realkreditlån, forsikringskrav (USA)
Dokumenter / OCR – Finansielle dokumenter (Fase 1 – Boliglån)
Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 9,192
Kommentar: Ingen
Beskrivelse: Finansielle dokumenter (fase 1) realkreditdatasæt – udskriv, scan, fotografér
Dokumenter / OCR – Finansielle dokumenter (Fase 2 – Forsikring)

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 7,636
Kommentar: Ingen
Beskrivelse: Finansielle dokumenter (fase 2) Forsikringsdatasæt – udskriv, scan, fotografér
Dokumenter / OCR – Håndskrevet tekstdatasæt (JP/KR/RU)

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 106,313
Kommentar: Ingen
Beskrivelse: Håndskrevet tekst: LivePhotos med håndskrevet tekst (japansk, koreansk, russisk)
Dokumenter / OCR – Fakturadatasæt med afgrænsningsboksannotation

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 87
Kommentar: Ja
Beskrivelse: Fakturadatasæt med afgrænsningsboksannotationer inkluderer scannede eller digitale fakturaer, hvor nøglefelter som fakturanummer, dato, leverandøroplysninger, linjeposter og samlede beløb er mærket med afgrænsningsbokse, hvilket gør det muligt for AI-modeller præcist at registrere og udtrække struktureret information fra ustrukturerede dokumenter.
Dokumenter / OCR – LivePhotos med trykt tekst (JP/KR/RU)
Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 4,944
Kommentar: Ingen
Beskrivelse: LivePhotos med trykt tekst (japansk, koreansk, russisk)
Dokumenter / OCR – Flersproget datasæt for kvitteringer/fakturaer

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 8,961
Kommentar: Ingen
Beskrivelse: Det flersprogede datasæt for kvitteringer og fakturaer omfatter forskellige finansielle dokumenter på flere sprog, hvilket gør det muligt for AI-modeller at træne i tværsproget tekstgenkendelse, udtrækning af nøglefelter og dokumentforståelse.
Dokumenter / OCR – Syntetiske bankudtog (40 skabeloner)

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 1,290
Kommentar: Ingen
Beskrivelse: Bankudtog - Unik skabelon - 40: Syntetiske bankudtog
Dokumenter / OCR – Syntetiske lønsedler (60 skabeloner)

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 2,010
Kommentar: Ingen
Beskrivelse: Check - Unik skabelon - 60: Syntetiske lønsedler
Dokumenter / OCR – Syntetiske lønsedler (130 skabeloner)

Brug Case: Dokumenter / OCR
Format: Billeder
Tælle: 2,023
Kommentar: Ingen
Beskrivelse: Lønsedler - Unik skabelon - 130: Syntetisk bankcheck
Datasæt for lønsedler (Document AI)

Brug Case: OCR
Format: .jpg
Tælle: 2010
Kommentar: Ingen
Beskrivelse: Lønsedler-datasættet (Document AI): Syntetiske lønsedler består af billeder af kunstigt genererede lønsedler uden anmærkninger. Den indeholder forskellige lønsedlerformater og detaljer såsom medarbejdernavne, lønninger og datoer, der bruges til træning og test af Document AI-systemer i opgaver som OCR og dokumentbehandling.
Optagelsestilstand: - Scannet - Webscrapper

