Lægedikteringslyddatasæt til AI i sundhedsvæsenet
Adgang til 257,977 timers medicinsk lyddata på tværs af 31 specialer
Tilslut den datakilde, du har manglet i dag
Lægedikteringslyddatasæt til maskinlæring
Vores anonymiserede datasæt for sundhedsvæsenet indeholder 31 forskellige lydfiler fra specialer dikteret af læger, der beskriver patienters kliniske tilstand og plejeplan baseret på læge-patient-møder på hospitalet/klinisk.
Off-the-Shelf Læge Dikteringslydfiler:
- 257,977 timers datasæt med medicinsk lyd fra den virkelige verden fra 31 specialer til træning af ASR-modeller for sundhedsvæsenet
- Dikteringslyd optaget fra forskellige enheder som telefondiktering (54.3 %), digital optager (24.9 %), talemikrofon (5.4 %), smarttelefon (2.7 %) og ukendt (12.7 %)
- PII-redigeret lyd og transskriptioner, der overholder Safe Harbor-retningslinjerne i overensstemmelse med HIPAA
Medicinske lyddata efter køn
Specialiseret | Patientlydfiler (spilletid i timer) | Samlet antal lydfiler |
---|---|---|
I alt | 257,977 | 5,172,766 |
Mand | 58,850 | 2,444,910 |
Kvinde | 113,406 | 1,290,900 |
Ukendt | 85,721 | 1,436,956 |
Medicinske lyddata efter speciale
Specialiseret | Patientlydfiler (spilletid i timer) | Samlet antal lydfiler |
---|---|---|
Smerte medicin | 1 | 11 |
Podiatrisk kirurgi | 4 | 24 |
Plastikkirurgi – speciale | 13 | 183 |
Læge Asst. | 6 | 38 |
Fysioterapeut | 114 | 1713 |
Fysisk medicin og rehabilitering | 1347 | 23523 |
Pediatrics | 877 | 9271 |
Pædiatrisk kirurgi | 2 | 23 |
Pædiatrisk speciale | 35 | 682 |
Pædiatrisk pulmonologi | 4 | 40 |
Børnetandlæg | 15 | 420 |
Patologi | 1143 | 43462 |
PANP | 10760 | 145960 |
Podiatry | 892 | 12056 |
Pain Management | 2 | 30 |
otolaryngology | 995 | 19548 |
osteopatisk | 310 | 5566 |
Ortopædisk | 4849 | 145053 |
Ortopædi og sportsmedicin | 149 | 3165 |
Oral kirurgi | 1 | 13 |
Oral- og kæbekirurg | 1 | 8 |
Oftalmologi | 609 | 19299 |
OPERATIV PLEJE | 0 | 5 |
Oncology | 6816 | 82300 |
Ergoterapeut | 8 | 68 |
Kirurgi | 14431 | 236788 |
Sårbehandling | 15 | 211 |
Vaskulær/Generelt | 9 | 268 |
VASKULÆR KIRURGI | 19 | 156 |
Urologi | 3170 | 96934 |
Øvre gastrointestinale kirurgi | 4 | 58 |
Ukendt | 42269 | 748054 |
Traumer og ortopædi | 140 | 1308 |
Transplant | 3 | 32 |
Brystkirurgi | 4 | 37 |
Thorax medicin | 5 | 27 |
Kirurgisk speciale | 22 | 290 |
Kirurgisk lægeassistent | 0 | 3 |
Arbejdsmedicin | 79 | 763 |
Sportsmedicin | 3 | 49 |
Taleterapi | 29 | 327 |
Rheumatology | 13 | 124 |
Resident | 46 | 641 |
Rehabilitering | 2515 | 30078 |
Radiologi | 10962 | 630983 |
Pulmonal | 3809 | 64368 |
Psykoterapi (speciale) | 50 | 229 |
Psykiatri | 8871 | 70269 |
PRIMÆR PLEJE | 1 | 7 |
Sygdomsforebyggelse | 21 | 191 |
Dental | 55 | 1233 |
Generelt | 26 | 313 |
Gastroenterologisk | 3127 | 62158 |
Familie praksis | 262 | 2498 |
Familie sygeplejerske praktiserende læge | 424 | 9018 |
Family Medicine | 13639 | 263480 |
Endokrinologi | 219 | 3212 |
Specialist på skadestuen | 30 | 378 |
Emergency | 3675 | 62256 |
ED lægeassistent | 0 | 70 |
Øre, Næse Og Hals | 51 | 658 |
Diagnostisk radiologi | 255 | 7591 |
Dermatologi | 148 | 3474 |
Almen tandlægepraksis | 2 | 25 |
Critical Care | 707 | 9645 |
Klinisk fysiologi | 50 | 160 |
Klinisk hæmatologi | 0 | 2 |
Cardiothoracic kirurgi | 1 | 10 |
Kardiotorakisk | 17 | 122 |
Kardiologi | 67504 | 1566721 |
APRN | 163 | 1693 |
Anæstetika | 1 | 9 |
Anæstesiologi | 677 | 22280 |
Allergi og immunologi | 1152 | 22202 |
Ulykke og nødsituation | 9 | 359 |
IH-Industriel Sundhed | 73 | 945 |
OB / GYN | 2424 | 42739 |
Sygeplejerske – Familie | 9 | 113 |
Sygeplejerskepraksis | 81 | 432 |
Neurokirurgi | 86 | 755 |
Neurologi | 1476 | 17786 |
Neuro/TBI | 173 | 1157 |
nefrologi | 2431 | 39821 |
Medicin | 5 | 122 |
Medicinsk onkologi | 16 | 67 |
Intern medicin, lungemedicin, kritisk plejemedicin og søvnmedicin | 5 | 102 |
Intern medicin og nefrologi | 15 | 111 |
Intern Medicin | 42604 | 623072 |
I alt | 257,977 | 5,172,766 |
hospitalist | 99 | 1493 |
Hospice og palliativ medicin | 4 | 41 |
HIM | 0 | 19 |
Hæmatologi - Onkologi | 22 | 394 |
Gynækologi | 4 | 25 |
GI | 55 | 550 |
Geriatrisk medicin | 461 | 5323 |
Generel kirurgi | 237 | 2220 |
Generel kirurg | 27 | 893 |
Generel psykiatri | 3 | 36 |
Generel medicin | 30 | 327 |
Medicinske lyddata efter enhed
Specialiseret | Patientlydfiler (spilletid i timer) | Samlet antal lydfiler |
---|---|---|
I alt | 257,977 | 5,172,766 |
IPHONE | 666 | 32,382 |
Digital Recorder | 1,659 | 22,377 |
Blandetype | 69,818 | 1,408,679 |
SmartPhone | 51,533 | 1,306,405 |
SpeechMic | 10,329 | 257,730 |
Telefonisk diktat | 120,867 | 2,071,557 |
Ukendt | 3,104 | 73,636 |
Vi beskæftiger os med alle typer af datalicenser, dvs. tekst, lyd, video eller billede. Datasættene består af medicinske datasæt til ML: Lægediktationsdatasæt, lægekliniske noter, medicinske samtaledatasæt, medicinsk transskriptionsdatasæt, læge-patientsamtale, medicinske tekstdata, medicinske billeder – CT-scanning, MR, ultralyd (opsamlet basis tilpassede krav) .
Kan du ikke finde det, du leder efter?
Nye hyldevare medicinske datasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af sundhedstræning
Ofte stillede spørgsmål (FAQ)
1. Hvad er lyddata fra lægediktering?
Lægediktatdata består af lydfiler, hvor læger beskriver en patients kliniske tilstand, behandlingsplan eller sygehistorie under konsultationer eller hospitalsbesøg.
2. Hvorfor er lyddata fra lægediktering vigtige for AI/ML-projekter?
Disse data er afgørende for træning af AI-modeller i talegenkendelse, naturlig sprogbehandling (NLP) og automatisering af klinisk dokumentation. Det hjælper med at opbygge systemer til transskribering, analyse og forbedring af arbejdsgange inden for sundhedsdokumentation.
3. Hvilke typer medicinske lyddatasæt er tilgængelige?
Datasættet indeholder 257,977 timers lægediktat fra den virkelige verden fra 31 medicinske specialer. Lyd optages ved hjælp af forskellige enheder, herunder telefoner, digitale optagere, smartphones og talemikrofoner.
4. Er de medicinske lyddata afidentificerede?
Ja, alle lydfiler afidentificeres for at fjerne personligt identificerbare oplysninger (PII) og dermed sikre patientfortrolighed.
5. Overholder datasættet HIPAA og andre regler?
Ja, datasættene overholder HIPAA- og Safe Harbor-retningslinjerne samt andre globale privatlivsstandarder.
6. Kan datasættene tilpasses?
Ja, datasæt kan skræddersys til specifikke specialer, demografiske oplysninger eller optageenhedstyper baseret på projektets krav.
7. Er disse datasæt skalerbare til store projekter?
Absolut. Datasættene er omfattende med millioner af lydfiler, hvilket gør dem velegnede til både små og store AI/ML-projekter.
8. Hvordan integreres dataene i AI-modeller?
De medicinske lyddata og tilhørende transskriptioner leveres i standardformater, der problemfrit kan integreres i talegenkendelses- og NLP-modeller (natural language processing).
9. Hvordan sikres datakvaliteten?
Lyddataene gennemgår strenge kvalitetskontroller, og domæneeksperter validerer annoteringer for at sikre nøjagtighed og pålidelighed.
10. Er datasættene skalerbare til store AI-projekter?
Prisen afhænger af faktorer som datamængde, tilpasning og projektets omfang. Vi beder dig om at udfylde formularen "Kontakt os" med dine behov for at modtage det bedste tilbud.
11. Hvad er leveringstidspunkterne for disse datasæt?
Leveringstider varierer afhængigt af projektets størrelse og kompleksitet, men er struktureret til at overholde deadlines effektivt.
12. Hvordan kan datasæt med lægers dikteringslyd forbedre kunstig intelligens i sundhedsvæsenet?
Disse datasæt forbedrer AI-funktioner i forbindelse med automatisering af klinisk dokumentation, forbedring af transkriptionsnøjagtigheden og bedre beslutningstagning for sundhedsudbydere.