Electronic Health Records (EHR) Datasæt til AI & ML-projekter
Off-the-shelf Electronic Health Records (EHR) Datasæt for at komme i gang med dit Healthcare AI-projekt.
Tilslut de medicinske data, du har manglet i dag
Find de rigtige elektroniske sundhedsjournaler (EPJ)-data til din sundhedspleje AI
Forbedre dine maskinlæringsmodeller med klassens bedste træningsdata. Elektroniske journaler eller EPJ er medicinske journaler, der indeholder patientens sygehistorie, diagnoser, recept, behandlingsplaner, vaccinations- eller immuniseringsdatoer, allergier, røntgenbilleder (CT-scanning, MR, røntgenstråler) og laboratorietests og mere. Vores off-the-shelf datakatalog gør det nemt for dig at få medicinsk træningsdata, du kan stole på.
Off-the-Shelf Electronic Health Records (EPJ):
- 5.1M + optager og lægefilmfiler i 31 specialiteter
- Medicinske journaler fra den virkelige verden til at træne Clinical NLP og andre Document AI-modeller
- Metadataoplysninger som MRN (Anonymiseret), Indlæggelsesdato, Udskrivningsdato, Opholdslængde, Køn, Patientklasse, Betaler, Finansklasse, Stat, Udskrivningsdisposition, Alder, DRG, DRG Beskrivelse, $ Refusion, AMLOS, GMLOS, Risiko for dødelighed, sygdoms sværhedsgrad, grouper, hospitals postnummer osv.
- Lægejournaler fra forskellige amerikanske stater og regioner - Nordøst (46%), Syd (9%), Midtvest (3%), Vest (28%), Andre (14%)
- Lægejournaler, der tilhører alle dækkede patientklasser - indlæggelse, ambulant (klinisk, genoptræning, tilbagevendende, kirurgisk dagpleje), nødsituation.
- Lægejournaler tilhørende alle patientaldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
- Patient kønsforhold på 46 % (mand) og 54 % (kvinde)
- PII-redigerede dokumenter, der overholder Safe Harbor-retningslinjerne i overensstemmelse med HIPAA
EHR-data efter placering
Placering | Tekstdokumenter |
---|---|
NorthEast | 4,473,573 |
Syd | 1,801,716 |
Midtvest | 781,701 |
Vest | 1,509,109 |
EHR-data efter større diagnosekategori
EHR-data efter større diagnosekategori | Tekstdokumenter |
---|---|
Kredsløbssygdomme | 589,730 |
Infektiøse og parasitære sygdomme | 559,244 |
Åndedrætssystem | 561,983 |
Muskuloskeletalsystemet og bindevæv | 329,344 |
Fordøjelsessystemet | 346,369 |
Nervous System | 316,243 |
Psykiske sygdomme og lidelser | 282,501 |
Nyre og urinveje | 209,561 |
Graviditet, fødsel og Puerperium | 165,303 |
Nyfødte og andre nyfødte med tilstande, der stammer fra den perinatale periode | 163,605 |
Endokrine, ernæringsmæssige og metaboliske sygdomme og lidelser | 142,808 |
Lever og galdeveje | 127,172 |
Hud, subkutan væv og bryst | 89,577 |
Skader, forgiftning og toksiske virkninger af stoffer | 64,097 |
Blod, bloddannende organer, immunologiske lidelser | 48,990 |
Alkohol / stofbrug og alkohol / stofinducerede organiske mentale lidelser | 48,717 |
Flere signifikante traumer | 27,902 |
Øre, næse, mund og hals | 22,987 |
Kvindeligt reproduktionssystem | 17,010 |
Faktorer, der påvirker sundhedsstatus og andre kontakter med sundhedstjenester | 21,294 |
Myeloproliferative sygdomme og lidelser, dårligt differentierede svulster | 15,620 |
Infektioner hos humant immundefektvirus | 12,422 |
Mandligt reproduktionssystem | 9,230 |
Eye | 3,549 |
Burns | 444 |
Alkohol-/stofbrug eller inducerede psykiske lidelser | 48,717 |
I alt med MDC | 4,175,702 |
Sager, der bruger en specialgruppe som 3M (MDC ikke specificeret) | 1,619,682 |
Polikliniske sager (MDC ikke specificeret) | 1,980,606 |
Sager uden refusion genereret (MDC ikke specificeret) | 790,697 |
I alt inklusive alt (Tilfælde med og uden MDC-kategori) | 8,566,687 |
Vi beskæftiger os med alle typer af datalicenser, dvs. tekst, lyd, video eller billede. Datasættene består af medicinske datasæt til ML: Lægediktationsdatasæt, lægekliniske noter, medicinske samtaledatasæt, medicinsk transskriptionsdatasæt, læge-patientsamtale, medicinske tekstdata, medicinske billeder – CT-scanning, MR, ultralyd (opsamlet basis tilpassede krav) .
Kan du ikke finde det, du leder efter?
Nye hyldevare medicinske datasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af sundhedstræning
Ofte stillede spørgsmål (FAQ)
EPJ-data refererer til den digitale version af en patients sygehistorie, som inkluderer deres behandlinger, medicinske tests og andre sundhedsrelaterede oplysninger, vedligeholdt af sundhedspersonale over tid.
EMR (Electronic Medical Record) indeholder standard medicinske data indsamlet på én udbyders kontor. EHR (Electronic Health Record) er et bredere system, der inkluderer EMR, men som også integrerer data fra forskellige sundhedsudbydere, hvilket giver en mere omfattende patienthistorie.
EPJ-data indsamles gennem digitale input fra sundhedspersonale under patientbesøg, fra laboratorieresultater, billeddannelsessystemer og andre diagnostiske værktøjer. Det gemmes derefter elektronisk i EPJ-systemer.
EPJ-data bruges til at spore patientbehandling over tid, hjælpe sundhedsudbydere med beslutningstagning, lette faktureringsprocesser, støtte forskning og forbedre den overordnede patientbehandlingskvalitet og -resultater.
Køb af EPJ-data involverer strenge privatlivs- og lovgivningsmæssige overvejelser. Typisk kan du ikke direkte købe individuelle patientjournaler. Dog er aggregerede og afidentificerede datasæt tilgængelige fra forskningsorganisationer, datamæglere eller specialiserede sundhedsdataleverandører som os, efter de korrekte etiske og juridiske retningslinjer.