Syntetiske sundhedssamtaler til ASR

Muliggør udvikling af omgivende teknologi gennem syntetiske sundhedssamtaler

Ambient teknologi

Over 2000 timers lyddata indsamlet og transskriberet i kliniske omgivelser

I det hurtigt udviklende domæne af Conversational AI er en af ​​de bemærkelsesværdige applikationer i sundhedssektoren, hvor teknologi bruges til at strømline udbyder-patient-interaktioner. Vores klient, et førende navn inden for sundhedsteknologi, henvendte sig til Shaip med et krav om at forbedre deres Automatic Speech Recognition (ASR) model for bedre at forstå og transskribere samtaler med flere højttalere i kliniske omgivelser. På grund af reglerne om privatlivets fred var det en udfordring at opnå dialoger i den virkelige verden; derfor var ideen at skabe og transskribere syntetiske, men realistiske interaktioner mellem sundhedsudbydere og patienter.

Bind

2,000 timer eller ca 12,000 til 24,000 individuelle syntetiske interaktioner af 10 minutters gennemsnitlig varighed.

Objektiv

Vores primære mål var at generere omkring 2,000 timers lydoptagelser, oversætte til 12,000 til 24,000 omhyggeligt udformede syntetiske interaktioner, der legemliggør en mangfoldighed i køn, alder, accenter og medicinske roller. Dette omfattende og autentiske datasæt, designet til at efterligne kliniske dialoger i den virkelige verden, blev skabt under streng overholdelse af privatlivsbestemmelser såsom HIPAA. De syntetiske interaktioner tjente som et rigt datasæt, der var medvirkende til at træne og forfine vores klients ASR-model, hvilket væsentligt forbedrede dens færdigheder i at håndtere samtaler i den virkelige verden i kliniske omgivelser.

 

Mål

Udfordringer

Regulatory Compliance

Det kan være udfordrende at sikre overholdelse af privatlivslovgivningen såsom HIPAA og samtidig skabe realistiske, men syntetiske sundhedsinteraktioner.

Overholdelse af lovgivningen

Dataægthed og mangfoldighed

At skabe syntetiske interaktioner, der nøjagtigt efterligner kliniske dialoger i den virkelige verden, mens de omfatter en bred vifte af scenarier, accenter, aldre og medicinske roller, kræver en omhyggelig tilgang og dyb domæneviden.

Dataægthed og mangfoldighed

Kvalitetssikring

At opnå et højt niveau af nøjagtighed i transskription, såsom den målrettede 95 % Word Accuracy Rate (WER) og 90 % Tag Accuracy Rate (TER), kræver strenge kvalitetssikringsprocesser.

Tekniske egenskaber

Det er en væsentlig udfordring at sikre, at den tekniske infrastruktur, herunder optagelses- og transskriptionsplatformene, kan håndtere mængden af ​​data og opretholde kvaliteten.

Rekruttering og uddannelse af ressourcer

Det kan være ret udfordrende at rekruttere personer med medicinsk baggrund til rollespil og sikre, at de overholder realistiske scenarier, mens de opretholder et naturligt samtaleflow. Derudover kræver uddannelse af transkriptionister til at overholde strenge kvalitetsretningslinjer en betydelig indsats og ekspertise.

Fremgangsmåde/løsning

Lydindsamling og transskription

  • Scenarieoprettelse: Udviklede realistiske scenarier, der afspejler almindelige ikke-hastende tilstande, man støder på i familiemedicinsk praksis for voksne, såsom hypertension, diabetes og smertebehandling.
  • Rollespil: Rekruterede personer med medicinsk baggrund til rollespil som sundhedsudbydere og patienter, der overholder de angivne scenarier og simulerer kliniske samtaler i den virkelige verden.
  • Indspilning: Brugte Shaip Work Mobile App til at optage lyd, hvilket sikrede en mangfoldig repræsentation med hensyn til køn, alder, accenter og faglig baggrund blandt deltagerne.

Validering og transskription

  • Udførte valideringsscripts for at sikre nøjagtigheden og kvaliteten af ​​lydfilerne.
  • Transskriptioner blev udført på Bhasha-platformen under overholdelse af specifikke retningslinjer, og sikret ordret teksttransskription med præcis diarisering.
  • Kommenterede metadata, herunder højttaler-id, alder, køn, modersmål og medicinsk træning/erfaring, som var afgørende for klientens modeltræningsformål.

Kvalitetssikring

  • Omfattende kvalitetstjek af CQA & PMO sikrede et transkriptionskvalitetsmål på 95 % Word Accuracy Rate (WER) og 90 % Tag Accuracy Rate (TER).

Datalevering

  • Strukturerede dataene på en klar, organiseret måde og leverede dem i batches sammen med detaljerede batchnotater og kulturmapper.
  • Sørgede for, at alle data, inklusive lydfiler, transskriptioner og metadata, var nøjagtigt mærket og formateret i henhold til kundens specifikationer.

Feedback og iteration

Etablerede en robust feedback-loop med klienten for at identificere eventuelle mangler og sikre, at der blev foretaget rettelser og leveret et komplet, nøjagtigt datasæt.

Vigtigste resultater

  • Succesfuld indsamling og transskription af 2000 timers syntetiske sundhedsinteraktioner.
  • Hurtig og præcis transskription med en bemærkelsesværdig nøjagtighedsrate, hvilket bidrager væsentligt til kundens mål om at forbedre deres ASR-model.
  • Demonstrerede Shaips evne til at håndtere store, komplekse projekter med en omhyggelig tilgang til kvalitet og nøjagtighed.

Resultat

Det omhyggeligt udførte projekt faciliteret af Shaip resulterede i et rigt datasæt, der i væsentlig grad bidrog til forbedringen af ​​kundens ASR-model. De syntetiske interaktioner skabte en realistisk repræsentation af kliniske dialoger, der hjalp klienten med at opnå en mere robust og pålidelig taletjeneste til sundhedsmiljøer. Gennem en struktureret og velkoordineret tilgang sikrede Shaip en succesfuld levering af et komplekst projekt inden for den fastsatte tidsramme, hvilket styrkede sin ekspertise i at styre storstilede samtale-AI-projekter inden for sundhedsområdet.

Vores samarbejde med Shaip fremmede vores projekt i Ambient Technology og Conversational AI inden for sundhedsvæsenet markant. Deres ekspertise i at skabe og transskribere syntetiske sundhedsdialoger gav et solidt grundlag, der viste potentialet i syntetiske data til at overvinde regulatoriske udfordringer. Med Shaip navigerede vi disse forhindringer og er nu et skridt tættere på at realisere vores vision om intuitive sundhedsløsninger.

Gylden-5-stjernet

Accelerer din Healthcare AI
applikationsudvikling med 100%