DICOM medicinsk billeddannelsesdatasæt til avancerede AI/ML-applikationer i sundhedsvæsenet
Afidentificeret DICOM-billeddatasæt med bevarede metadata – og valgfrie radiologistudierapporter – for at fremskynde modeltræning, validering og klinisk forskning.
DICOM-billeddannelsesdata bygget til virkelige kunstige intelligenser
Shaip tilbyder AI-klar DICOM medicinske billeddannelsesdatasæt designet til at hjælpe AI-teams inden for sundhedsvæsenet med at opbygge, træne og validere robuste modeller til diagnose, triage og beslutningsstøtte – ved hjælp af anonymiserede data, der bevarer klinisk værdi.
Datasæt-øjebliksbillede
- Samlede studier:10M +
- Topgeografiske områder (efter undersøgelser): USA, Brasilien og Indien
- Repræsenterede modaliteter: CR, CT, US, DX, MR, MG, OT, RF, NM, Mammografi
- Repræsenterede kropsdele: Bryst, mave, hoved, rygsøjle, nakke, hjerte og mere
Almindelige anvendelsesscenarier for DICOM-billeddatasæt
Træn diagnostiske billeddannelsesmodeller for kunstig intelligens
- Detektion af abnormaliteter
- Sygdomsklassificering
- Sværhedsgradsscoring/stadieinddeling
- Triageprioritering
- Understøtter udvikling af multimodalitet
Valider og benchmark modelydelse
- Evaluer modelnøjagtigheden på bredere populationer
- Benchmark-præstation efter modalitet/kropsregion
- Kør ekstern validering for at reducere overtilpasning
Forbedr modelrobustheden på tværs af enheder og websteder
- Testgeneralisering på tværs af scannere/leverandører
- Reducer ydeevnetab ved implementering på nye hospitaler
Byg multimodal AI (billede + radiologirapport)
- Udled svage etiketter fra rapportsprog
- Træn modeller, der er afstemt med rapportfortællinger
- Skab rapportbevidst triage og beslutningsstøtte
Klinisk forskning og kohorteoprettelse
- Filtrer kohorter efter modalitet/kropsdel/tid
- Støt retrospektive studier
- Fremskynd hypotesetestning, samtidig med at du opretholder privatlivskontroller
Annotering og oprettelse af ground-truth til ML-træning
- Klassifikationsmærker
- Afgrænsningskasser
- Segmenteringsmasker
Hvad du modtager i DICOM-billeddatasættet
1. DICOM-pixeldata (billederne)
Alle billeder er anonymiserede på pixelniveau:
- Tekst på billeder er redigeret eller pseudonymiseret
- "De-facing"-artefakter kan introduceres, når ansigtsrekonstruktion er mulig (f.eks. CT med høj opløsning).
3. Studierapport (valgfri, når tilgængelig)
Ustruktureret fortællende tekst skrevet af radiologen/lægen med Safe Harbor-anonymisering og samme datoforskydningstilgang anvendt.
2. DICOM-metadata (med Safe Harbor)
Alle standard DICOM-metadata bevares til levering, mens HIPAA Safe Harbor-identifikatorer anonymiseres, herunder:
- Patientnavn erstattet med patient-ID
- Patient-ID kryptografisk hashet
- Institutionsnavn erstattet med et alternativt navn
- Datoer ændret inden for 365 dage (konsistent skift på patientniveau).
4. Brugerdefinerede metadata (valgfri værditilvækst)
Valgfrie afledte metadata kan omfatte:
- Analyseret patientalder
- SNOMED-tags (fra rapport)
- Positive enheder (fra rapport)
- Bopælsland (fra adresse)
- Imputeret race / Imputeret etnicitet (afledte felter)
DICOM-deidentifikationsmetoder med fokus på privatliv
Datasættet bruger kryptografisk hashing og pseudonymisering for at overholde HIPAA, samtidig med at den kliniske anvendelighed bevares og følsomme data beskyttes.
Beskyttelse på pixelniveau
Redigering/pseudonymisering af indbrændt tekst og fjernelse af facing efter behov.
Metadatabeskyttelse
Safe Harbor-identifikatorer anonymiseres, mens standard DICOM-metadata bevares.
Datoskift
Datoer forskydes inden for et interval på 365 dage på patientniveau for at bevare tidsmæssige sammenhænge på tværs af studier.
Demografisk gulvbelægning
Visse felter er begrænset/med en bundgrænse for at reducere risikoen for genidentifikation (f.eks. alder, vægt, størrelse og visse etnicitetsværdier).
Kan du ikke finde det, du leder efter?
Nye hyldevare medicinske datasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af sundhedstræning
Ofte stillede spørgsmål (FAQ)
1. Hvad er et DICOM-billeddatasæt?
Et DICOM-billeddatasæt er en samling af medicinske billedstudier, der er gemt i DICOM-standarden, herunder pixeldata og kliniske metadata, som almindeligvis bruges til at træne og validere AI-modeller inden for sundhedsvæsenet.
2. Hvad er inkluderet i dette DICOM-billeddatasæt?
Afhængigt af licensomfanget kan det omfatte DICOM-pixeldata, bevarede (anonyme) DICOM-metadata, valgfrie studierapporter og valgfrie, værdiskabende, brugerdefinerede metadata.
3. Er billederne afidentificerede?
Ja. Billeder anonymiseres på pixelniveau, herunder redigering/pseudonymisering af tekst på billeder og fjernelse af facing efter behov.
4. Er DICOM-metadataene bevaret?
Standard DICOM-metadata bevares til levering, mens HIPAA Safe Harbor-identifikatorer anonymiseres (f.eks. patient-/institutionsidentifikatorer og datoer).
5. Hvordan håndteres datoer?
Datoer kan ændres inden for 365 dage og anvendes konsekvent på patientniveau for at bevare relativ timing på tværs af studier.
6. Er radiologi-/studierapporter inkluderet?
Når det er muligt og der er licens til det, kan studierapporter (ustruktureret fortællende tekst) inkluderes med pseudonymiserede identifikatorer.
7. Hvilke brugerdefinerede metadata kan være tilgængelige?
Valgmulighederne kan omfatte analyseret patientalder, SNOMED-tags, positive enheder, bopælsland og andre afledte felter.
8. Kan jeg anmode om en specifik kohorte (modalitet, kropsdel, geografi osv.)?
Ja – del dit målområde og dine filtre, så foreslår Shaip det bedst egnede datasætudsnit baseret på tilgængelighed.
9. Hvordan licenserer jeg datasættet?
Indsend dine krav via kontaktformularen. Vores team vil bekræfte tilgængelighed, omfang, licensvilkår og leveringsmuligheder.