HIPAA-kompatible lægedikteringslyddata til sundhedsvæsenets AI

Accelerer innovation inden for sundhedsvæsenets AI ved hjælp af standard lægedikteringslyddata, der overholder privatlivs- og HIPAA-reglerne.

Læge diktering lyddatasæt

Medicinske lyddatasæt af høj kvalitet til smartere AI-modeller

Vores anonymiserede sundhedsdatasæt indeholder lydfiler fra 31 forskellige specialer, omhyggeligt dikteret af læger. Disse optagelser indfanger detaljerede beskrivelser af patienters kliniske tilstande og plejeplaner, der er afledt af virkelige læge-patient-interaktioner på hospitaler og i kliniske omgivelser. Dette datasæt er fuldt ud i overensstemmelse med privatlivsreglerne og er ideelt til træning af avancerede AI-modeller inden for sundhedsvæsenet.

Medicinske lyddata efter køn
Specialiseret Patientlydfiler (spilletid i timer) Samlet antal lydfiler
I alt257,9775,172,766
Mand58,8502,444,910
Kvinde113,4061,290,900
Ukendt85,7211,436,956
Medicinske lyddata efter speciale
Specialiseret Patientlydfiler (spilletid i timer) Samlet antal lydfiler
I alt257,9775,172,766
Ulykke og nødsituation9359
Allergi og immunologi115222202
Anæstesiologi67722280
Anæstetika19
APRN1631693
Kardiologi675041566721
Kardiotorakisk17122
Cardiothoracic kirurgi110
Klinisk hæmatologi02
Kolon og rektal kirurgi7162
Kolorektal kirurg45984
Kritisk plejemedicin2204328
Tandlæge165
Dermatologi77123014
Diætist og ernæringsekspert44736
Nødmedicin4911112518
Endokrinologi2057052
ENT7010175477
Familiemedicin1767106733
Gastroenterologisk145840365
Generel medicin1405757
Almindelig praksis411318
Generel kirurgi203871744
Gynækologi3269103370
Håndkirurgi245
Hæmatologi2588125
hospitalist5931142529
Smitsom sygdom49314001
Intern medicin15410445591
Interventionel kardiologi151143035
Maternal-føtal medicin511355
Neonatologi104524760
nefrologi73520334
Neurologi226963774
Neurokirurgi46211990
Kernemedicin223
OBGYN3562122303
Oncology293882996
Oftalmologi131641047
Optometri331066
Ortopædi5665164483
otolaryngology3433100811
Patologi1664097
Pædiatrisk pulmonologi440
Pædiatrisk speciale35682
Pædiatrisk kirurgi223
Pediatrics8779271
Fysisk medicin og rehabilitering134723523
Fysioterapeut1141713
Læge Asst.638
Podiatrisk kirurgi424
Podiatry47312296
Primary Care65120120
Psykiatri212060381
pulmonology129035290
Stråling onkologi2396558
Radiologi334599641
Rheumatology2938729
SICU125
Talepatologi328
Kirurgisk onkologi2175758
Brystkirurgi1073336
Transplantationskirurgi611535
Urologi317096934
Øvre gastrointestinale kirurgi458
VASKULÆR KIRURGI19156
Vaskulær/Generelt9268
Sårbehandling15211
Medicinske lyddata efter enhed
Specialiseret Patientlydfiler (spilletid i timer) Samlet antal lydfiler
I alt257,9775,172,766
IPHONE66632,382
Digital Recorder1,65922,377
Blandetype69,8181,408,679
SmartPhone51,5331,306,405
SpeechMic10,329257,730
Telefonisk diktat120,8672,071,557
Ukendt3,10473,636

Vi beskæftiger os med alle typer af datalicenser, dvs. tekst, lyd, video eller billede. Datasættene består af medicinske datasæt til ML: Lægediktationsdatasæt, lægekliniske noter, medicinske samtaledatasæt, medicinsk transskriptionsdatasæt, læge-patientsamtale, medicinske tekstdata, medicinske billeder – CT-scanning, MR, ultralyd (opsamlet basis tilpassede krav) .

Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldevare medicinske datasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af sundhedstræning

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.

Lægediktatdata består af lydfiler, hvor læger beskriver en patients kliniske tilstand, behandlingsplan eller sygehistorie under konsultationer eller hospitalsbesøg.

Disse data er afgørende for træning af AI-modeller i talegenkendelse, naturlig sprogbehandling (NLP) og automatisering af klinisk dokumentation. Det hjælper med at opbygge systemer til transskribering, analyse og forbedring af arbejdsgange inden for sundhedsdokumentation.

Datasættet indeholder 257,977 timers lægediktat fra den virkelige verden fra 31 medicinske specialer. Lyd optages ved hjælp af forskellige enheder, herunder telefoner, digitale optagere, smartphones og talemikrofoner.

Ja, alle lydfiler afidentificeres for at fjerne personligt identificerbare oplysninger (PII) og dermed sikre patientfortrolighed.

Ja, datasættene overholder HIPAA- og Safe Harbor-retningslinjerne samt andre globale privatlivsstandarder.

Ja, datasæt kan skræddersys til specifikke specialer, demografiske oplysninger eller optageenhedstyper baseret på projektets krav.

Absolut. Datasættene er omfattende med millioner af lydfiler, hvilket gør dem velegnede til både små og store AI/ML-projekter.

De medicinske lyddata og tilhørende transskriptioner leveres i standardformater, der problemfrit kan integreres i talegenkendelses- og NLP-modeller (natural language processing).

Lyddataene gennemgår strenge kvalitetskontroller, og domæneeksperter validerer annoteringer for at sikre nøjagtighed og pålidelighed.

Prisen afhænger af faktorer som datamængde, tilpasning og projektets omfang. Vi beder dig om at udfylde formularen "Kontakt os" med dine behov for at modtage det bedste tilbud.

Leveringstider varierer afhængigt af projektets størrelse og kompleksitet, men er struktureret til at overholde deadlines effektivt.

Disse datasæt forbedrer AI-funktioner i forbindelse med automatisering af klinisk dokumentation, forbedring af transkriptionsnøjagtigheden og bedre beslutningstagning for sundhedsudbydere.