Electronic Health Records (EHR) Datasæt til AI & ML-projekter
Off-the-shelf Electronic Health Records (EHR) Datasæt for at komme i gang med dit Healthcare AI-projekt.
Tilslut den datakilde, du har manglet i dag
Find de rigtige elektroniske sundhedsjournaler (EPJ)-data til din sundhedspleje AI
Forbedre dine maskinlæringsmodeller med klassens bedste træningsdata. Elektroniske journaler eller EPJ er medicinske journaler, der indeholder patientens sygehistorie, diagnoser, recept, behandlingsplaner, vaccinations- eller immuniseringsdatoer, allergier, røntgenbilleder (CT-scanning, MR, røntgenstråler) og laboratorietests og mere. Vores off-the-shelf datakatalog gør det nemt for dig at få medicinsk træningsdata, du kan stole på.
Off-the-Shelf Electronic Health Records (EPJ):
- 5.1M + optager og lægefilmfiler i 31 specialiteter
- Medicinske journaler fra den virkelige verden til at træne Clinical NLP og andre Document AI-modeller
- Metadataoplysninger som MRN (Anonymiseret), Indlæggelsesdato, Udskrivningsdato, Opholdslængde, Køn, Patientklasse, Betaler, Finansklasse, Stat, Udskrivningsdisposition, Alder, DRG, DRG Beskrivelse, $ Refusion, AMLOS, GMLOS, Risiko for dødelighed, sygdoms sværhedsgrad, grouper, hospitals postnummer osv.
- Lægejournaler fra forskellige amerikanske stater og regioner - Nordøst (46%), Syd (9%), Midtvest (3%), Vest (28%), Andre (14%)
- Lægejournaler, der tilhører alle dækkede patientklasser - indlæggelse, ambulant (klinisk, genoptræning, tilbagevendende, kirurgisk dagpleje), nødsituation.
- Lægejournaler tilhørende alle patientaldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
- Patient kønsforhold på 46 % (mand) og 54 % (kvinde)
- PII-redigerede dokumenter, der overholder Safe Harbor-retningslinjerne i overensstemmelse med HIPAA
EHR-data efter placering
Lokation | Tekstdokumenter |
---|---|
NorthEast | 4,473,573 |
Syd | 1,801,716 |
Midtvest | 781,701 |
Vest | 1,509,109 |
EHR-data efter større diagnosekategori
EHR-data efter større diagnosekategori | Tekstdokumenter |
---|---|
Alkohol / stofbrug og alkohol / stofinducerede organiske mentale lidelser | 48,717 |
I alt inklusive alt (Tilfælde med og uden MDC-kategori) | 8,566,687 |
Sager uden refusion genereret (MDC ikke specificeret) | 790,697 |
Polikliniske sager (MDC ikke specificeret) | 1,980,606 |
Sager, der bruger en specialgruppe som 3M (MDC ikke specificeret) | 1,619,682 |
I alt med MDC | 4,175,702 |
Alkohol-/stofbrug eller inducerede psykiske lidelser | 48,717 |
Burns | 444 |
Eye | 3,549 |
Mandligt reproduktionssystem | 9,230 |
Infektioner hos humant immundefektvirus | 12,422 |
Myeloproliferative sygdomme og lidelser, dårligt differentierede svulster | 15,620 |
Faktorer, der påvirker sundhedsstatus og andre kontakter med sundhedstjenester | 21,294 |
Kvindeligt reproduktionssystem | 17,010 |
Øre, næse, mund og hals | 22,987 |
Flere signifikante traumer | 27,902 |
Kredsløbssygdomme | 589,730 |
Blod, bloddannende organer, immunologiske lidelser | 48,990 |
Skader, forgiftning og toksiske virkninger af stoffer | 64,097 |
Hud, subkutan væv og bryst | 89,577 |
Lever og galdeveje | 127,172 |
Endokrine, ernæringsmæssige og metaboliske sygdomme og lidelser | 142,808 |
Nyfødte og andre nyfødte med tilstande, der stammer fra den perinatale periode | 163,605 |
Graviditet, fødsel og Puerperium | 165,303 |
Nyre og urinveje | 209,561 |
Psykiske sygdomme og lidelser | 282,501 |
Nervous System | 316,243 |
Fordøjelsessystemet | 346,369 |
Muskuloskeletalsystemet og bindevæv | 329,344 |
Åndedrætssystem | 561,983 |
Infektiøse og parasitære sygdomme | 559,244 |
Vi beskæftiger os med alle typer af datalicenser, dvs. tekst, lyd, video eller billede. Datasættene består af medicinske datasæt til ML: Lægediktationsdatasæt, lægekliniske noter, medicinske samtaledatasæt, medicinsk transskriptionsdatasæt, læge-patientsamtale, medicinske tekstdata, medicinske billeder – CT-scanning, MR, ultralyd (opsamlet basis tilpassede krav) .
Kan du ikke finde det, du leder efter?
Nye hyldevare medicinske datasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af sundhedstræning
Ofte stillede spørgsmål (FAQ)
EPJ-data refererer til den digitale version af en patients sygehistorie, som inkluderer deres behandlinger, medicinske tests og andre sundhedsrelaterede oplysninger, vedligeholdt af sundhedspersonale over tid.
EMR (Electronic Medical Record) indeholder standard medicinske data indsamlet på én udbyders kontor. EHR (Electronic Health Record) er et bredere system, der inkluderer EMR, men som også integrerer data fra forskellige sundhedsudbydere, hvilket giver en mere omfattende patienthistorie.
EPJ-data indsamles gennem digitale input fra sundhedspersonale under patientbesøg, fra laboratorieresultater, billeddannelsessystemer og andre diagnostiske værktøjer. Det gemmes derefter elektronisk i EPJ-systemer.
EPJ-data bruges til at spore patientbehandling over tid, hjælpe sundhedsudbydere med beslutningstagning, lette faktureringsprocesser, støtte forskning og forbedre den overordnede patientbehandlingskvalitet og -resultater.
Køb af EPJ-data involverer strenge privatlivs- og lovgivningsmæssige overvejelser. Typisk kan du ikke direkte købe individuelle patientjournaler. Dog er aggregerede og afidentificerede datasæt tilgængelige fra forskningsorganisationer, datamæglere eller specialiserede sundhedsdataleverandører som os, efter de korrekte etiske og juridiske retningslinjer.