Electronic Health Records (EHR) Datasæt til AI & ML-projekter
Off-the-shelf Electronic Health Records (EHR) Datasæt for at komme i gang med dit Healthcare AI-projekt.
Tilslut den datakilde, du har manglet i dag
Find de rigtige elektroniske sundhedsjournaler (EPJ)-data til din sundhedspleje AI
Forbedre dine maskinlæringsmodeller med klassens bedste træningsdata. Elektroniske journaler eller EPJ er medicinske journaler, der indeholder patientens sygehistorie, diagnoser, recept, behandlingsplaner, vaccinations- eller immuniseringsdatoer, allergier, røntgenbilleder (CT-scanning, MR, røntgenstråler) og laboratorietests og mere. Vores off-the-shelf datakatalog gør det nemt for dig at få medicinsk træningsdata, du kan stole på.
Off-the-Shelf Electronic Health Records (EPJ):
- 5.1M + optager og lægefilmfiler i 31 specialiteter
- Medicinske journaler fra den virkelige verden til at træne Clinical NLP og andre Document AI-modeller
- Metadataoplysninger som MRN (Anonymiseret), Indlæggelsesdato, Udskrivningsdato, Opholdslængde, Køn, Patientklasse, Betaler, Finansklasse, Stat, Udskrivningsdisposition, Alder, DRG, DRG Beskrivelse, $ Refusion, AMLOS, GMLOS, Risiko for dødelighed, sygdoms sværhedsgrad, grouper, hospitals postnummer osv.
- Lægejournaler fra forskellige amerikanske stater og regioner - Nordøst (46%), Syd (9%), Midtvest (3%), Vest (28%), Andre (14%)
- Lægejournaler, der tilhører alle dækkede patientklasser - indlæggelse, ambulant (klinisk, genoptræning, tilbagevendende, kirurgisk dagpleje), nødsituation.
- Lægejournaler tilhørende alle patientaldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
- Patient kønsforhold på 46 % (mand) og 54 % (kvinde)
- PII-redigerede dokumenter, der overholder Safe Harbor-retningslinjerne i overensstemmelse med HIPAA
EHR-data efter placering
Lokation | Tekstdokumenter |
---|---|
NorthEast | 4,473,573 |
Syd | 1,801,716 |
Midtvest | 781,701 |
Vest | 1,509,109 |
EHR-data efter større diagnosekategori
EHR-data efter større diagnosekategori | Tekstdokumenter |
---|---|
Alkohol / stofbrug og alkohol / stofinducerede organiske mentale lidelser | 48,717 |
I alt inklusive alt (Tilfælde med og uden MDC-kategori) | 8,566,687 |
Sager uden refusion genereret (MDC ikke specificeret) | 790,697 |
Polikliniske sager (MDC ikke specificeret) | 1,980,606 |
Sager, der bruger en specialgruppe som 3M (MDC ikke specificeret) | 1,619,682 |
I alt med MDC | 4,175,702 |
Alkohol-/stofbrug eller inducerede psykiske lidelser | 48,717 |
Burns | 444 |
Eye | 3,549 |
Mandligt reproduktionssystem | 9,230 |
Infektioner hos humant immundefektvirus | 12,422 |
Myeloproliferative sygdomme og lidelser, dårligt differentierede svulster | 15,620 |
Faktorer, der påvirker sundhedsstatus og andre kontakter med sundhedstjenester | 21,294 |
Kvindeligt reproduktionssystem | 17,010 |
Øre, næse, mund og hals | 22,987 |
Flere signifikante traumer | 27,902 |
Kredsløbssygdomme | 589,730 |
Blod, bloddannende organer, immunologiske lidelser | 48,990 |
Skader, forgiftning og toksiske virkninger af stoffer | 64,097 |
Hud, subkutan væv og bryst | 89,577 |
Lever og galdeveje | 127,172 |
Endokrine, ernæringsmæssige og metaboliske sygdomme og lidelser | 142,808 |
Nyfødte og andre nyfødte med tilstande, der stammer fra den perinatale periode | 163,605 |
Graviditet, fødsel og Puerperium | 165,303 |
Nyre og urinveje | 209,561 |
Psykiske sygdomme og lidelser | 282,501 |
Nervous System | 316,243 |
Fordøjelsessystemet | 346,369 |
Muskuloskeletalsystemet og bindevæv | 329,344 |
Åndedrætssystem | 561,983 |
Infektiøse og parasitære sygdomme | 559,244 |
Vi beskæftiger os med alle typer af datalicenser, dvs. tekst, lyd, video eller billede. Datasættene består af medicinske datasæt til ML: Lægediktationsdatasæt, lægekliniske noter, medicinske samtaledatasæt, medicinsk transskriptionsdatasæt, læge-patientsamtale, medicinske tekstdata, medicinske billeder – CT-scanning, MR, ultralyd (opsamlet basis tilpassede krav) .
Kan du ikke finde det, du leder efter?
Nye hyldevare medicinske datasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af sundhedstræning
Ofte stillede spørgsmål (FAQ)
EHR-data (elektronisk patientjournal) er en digital registrering af en patients sygehistorie. Den indeholder detaljer som diagnoser, behandlinger, laboratorieresultater, recepter og billeddiagnostiske data.
EHR-data bruges til at træne AI-modeller til klinisk beslutningsstøtte, sygdomsforudsigelse, personlig behandlingsplanlægning og automatisering af sundhedsvæsenet.
Ja, alle EHR-data anonymiseres for at fjerne personligt identificerbare oplysninger (PII) og overholde privatlivsreglerne.
EHR-data indeholder detaljer som patientdemografi, sygehistorie, diagnoser, behandlingsplaner, laboratorietestresultater, radiologiske billeder (f.eks. CT, MR, røntgenbilleder), recepter og immuniseringsjournaler.
Ja, dataene overholder HIPAA, GDPR og andre globale privatlivsstandarder for at sikre sikker og etisk brug.
Ja, datasæt kan skræddersys baseret på specifikke medicinske specialer, regioner, patientdemografi eller projektkrav.
Ja, datasættene leveres i standardformater (f.eks. JSON, CSV) for nem integration i AI- og ML-arbejdsgange.
Data gennemgår grundige validerings- og kvalitetskontroller for at sikre nøjagtighed, konsistens og pålidelighed.
Omkostningerne afhænger af faktorer som datamængde, tilpasning og projektets omfang. Vi beder dig om at udfylde formularen "Kontakt os" med dine behov for at modtage det bedste tilbud.
Leveringstider varierer afhængigt af projektets størrelse og kompleksitet, men er designet til at overholde aftalte deadlines.
EHR-datasæt gør det muligt for AI-systemer at levere bedre diagnostik, prædiktiv indsigt og personlig behandling, hvilket forbedrer patientresultater og effektiviteten i sundhedsvæsenet.