Electronic Health Records (EHR) Datasæt til AI & ML-projekter

Off-the-shelf Electronic Health Records (EHR) Datasæt for at komme i gang med dit Healthcare AI-projekt.

Elektroniske sundhedsjournaler (ehr) data

Tilslut den datakilde, du har manglet i dag

Find de rigtige elektroniske sundhedsjournaler (EPJ)-data til din sundhedspleje AI

Forbedre dine maskinlæringsmodeller med klassens bedste træningsdata. Elektroniske journaler eller EPJ er medicinske journaler, der indeholder patientens sygehistorie, diagnoser, recept, behandlingsplaner, vaccinations- eller immuniseringsdatoer, allergier, røntgenbilleder (CT-scanning, MR, røntgenstråler) og laboratorietests og mere. Vores off-the-shelf datakatalog gør det nemt for dig at få medicinsk træningsdata, du kan stole på.

Off-the-Shelf Electronic Health Records (EPJ):

  • 5.1M + optager og lægefilmfiler i 31 specialiteter
  • Medicinske journaler fra den virkelige verden til at træne Clinical NLP og andre Document AI-modeller
  • Metadataoplysninger som MRN (Anonymiseret), Indlæggelsesdato, Udskrivningsdato, Opholdslængde, Køn, Patientklasse, Betaler, Finansklasse, Stat, Udskrivningsdisposition, Alder, DRG, DRG Beskrivelse, $ Refusion, AMLOS, GMLOS, Risiko for dødelighed, sygdoms sværhedsgrad, grouper, hospitals postnummer osv.
  • Lægejournaler fra forskellige amerikanske stater og regioner - Nordøst (46%), Syd (9%), Midtvest (3%), Vest (28%), Andre (14%)
  • Lægejournaler, der tilhører alle dækkede patientklasser - indlæggelse, ambulant (klinisk, genoptræning, tilbagevendende, kirurgisk dagpleje), nødsituation.
  • Lægejournaler tilhørende alle patientaldersgrupper <10 år (7.9%), 11-20 år (5.7%), 21-30 år (10.9%), 31-40 år (11.7%), 41-50 år (10.4% ), 51-60 år (13.8%), 61-70 år (16.1%), 71-80 år (13.3%), 81-90 år (7.8%), 90+ år (2.4%)
  • Patient kønsforhold på 46 % (mand) og 54 % (kvinde)
  • PII-redigerede dokumenter, der overholder Safe Harbor-retningslinjerne i overensstemmelse med HIPAA
EHR-data efter placering
LokationTekstdokumenter
NorthEast4,473,573
Syd1,801,716
Midtvest781,701
Vest1,509,109
EHR-data efter større diagnosekategori
EHR-data efter større diagnosekategoriTekstdokumenter
Alkohol / stofbrug og alkohol / stofinducerede organiske mentale lidelser
48,717

I alt inklusive alt (Tilfælde med og uden MDC-kategori)

8,566,687
Sager uden refusion genereret (MDC ikke specificeret)
790,697
Polikliniske sager (MDC ikke specificeret)
1,980,606
Sager, der bruger en specialgruppe som 3M (MDC ikke specificeret)
1,619,682
                                                                                  I alt med MDC
4,175,702
Alkohol-/stofbrug eller inducerede psykiske lidelser48,717
Burns
444
Eye
3,549
Mandligt reproduktionssystem
9,230
Infektioner hos humant immundefektvirus
12,422
Myeloproliferative sygdomme og lidelser, dårligt differentierede svulster
15,620
Faktorer, der påvirker sundhedsstatus og andre kontakter med sundhedstjenester
21,294
Kvindeligt reproduktionssystem
17,010
Øre, næse, mund og hals
22,987
Flere signifikante traumer
27,902
Kredsløbssygdomme589,730
Blod, bloddannende organer, immunologiske lidelser
48,990
Skader, forgiftning og toksiske virkninger af stoffer
64,097
Hud, subkutan væv og bryst
89,577
Lever og galdeveje
127,172
Endokrine, ernæringsmæssige og metaboliske sygdomme og lidelser
142,808
Nyfødte og andre nyfødte med tilstande, der stammer fra den perinatale periode
163,605
Graviditet, fødsel og Puerperium
165,303
Nyre og urinveje
209,561
Psykiske sygdomme og lidelser
282,501
Nervous System
316,243
Fordøjelsessystemet
346,369
Muskuloskeletalsystemet og bindevæv329,344
Åndedrætssystem561,983
Infektiøse og parasitære sygdomme559,244

Vi beskæftiger os med alle typer af datalicenser, dvs. tekst, lyd, video eller billede. Datasættene består af medicinske datasæt til ML: Lægediktationsdatasæt, lægekliniske noter, medicinske samtaledatasæt, medicinsk transskriptionsdatasæt, læge-patientsamtale, medicinske tekstdata, medicinske billeder – CT-scanning, MR, ultralyd (opsamlet basis tilpassede krav) .

Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldevare medicinske datasæt bliver indsamlet på tværs af alle datatyper 

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af sundhedstræning

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.

EHR-data (elektronisk patientjournal) er en digital registrering af en patients sygehistorie. Den indeholder detaljer som diagnoser, behandlinger, laboratorieresultater, recepter og billeddiagnostiske data.

EHR-data bruges til at træne AI-modeller til klinisk beslutningsstøtte, sygdomsforudsigelse, personlig behandlingsplanlægning og automatisering af sundhedsvæsenet.

Ja, alle EHR-data anonymiseres for at fjerne personligt identificerbare oplysninger (PII) og overholde privatlivsreglerne.

EHR-data indeholder detaljer som patientdemografi, sygehistorie, diagnoser, behandlingsplaner, laboratorietestresultater, radiologiske billeder (f.eks. CT, MR, røntgenbilleder), recepter og immuniseringsjournaler.

Ja, dataene overholder HIPAA, GDPR og andre globale privatlivsstandarder for at sikre sikker og etisk brug.

Ja, datasæt kan skræddersys baseret på specifikke medicinske specialer, regioner, patientdemografi eller projektkrav.

Ja, datasættene leveres i standardformater (f.eks. JSON, CSV) for nem integration i AI- og ML-arbejdsgange.

Data gennemgår grundige validerings- og kvalitetskontroller for at sikre nøjagtighed, konsistens og pålidelighed.

Omkostningerne afhænger af faktorer som datamængde, tilpasning og projektets omfang. Vi beder dig om at udfylde formularen "Kontakt os" med dine behov for at modtage det bedste tilbud.

Leveringstider varierer afhængigt af projektets størrelse og kompleksitet, men er designet til at overholde aftalte deadlines.

EHR-datasæt gør det muligt for AI-systemer at levere bedre diagnostik, prædiktiv indsigt og personlig behandling, hvilket forbedrer patientresultater og effektiviteten i sundhedsvæsenet.