Forbedring af onkologisk NLP-forskning
Onkologisk datapræcision: Licensering, afidentifikation og annotering til NLP-modelinnovation
Revolutionerende kræftbehandling med banebrydende NLP-teknologier
Klienten, en stor aktør i sundhedssektoren, krævede en avanceret NLP-løsning for at behandle en betydelig mængde onkologiske journaler. Som en del af et centralt initiativ til at forfine onkologisk forskning er behovet for at balancere detaljeret dataanalyse med strenge privatlivsstandarder altafgørende. Dette casestudie skitserer vores bidrag til at forbedre klientens forskningsbestræbelser gennem high-fidelity dataannotering, streng afidentifikationspraksis og anvendelsen af Natural Language Processing (NLP) teknikker, alt sammen inden for de lovgivningsmæssige rammer, der leveres af HIPAA.
Bind
Udfordringer
Projektet krævede en nuanceret forståelse af klinisk dokumentation, præcis identifikation af medicinske enheder og evnen til at anvende negationsetiketter præcist, alt sammen inden for en sikker ramme, der beskytter patientens privatliv i henhold til HIPAA-reglerne. Bestræbelsen krævede ikke kun teknisk ekspertise i håndtering af store mængder komplekse data, men også en strategisk tilgang til at inkorporere feedback og opretholde kvalitet på tværs af alle stadier af annoteringsprocessen.
Detaljeret beskrivelse af tjenester
Boligtype | Beskrivelse |
Omfattende klinisk datadækning | Spænder forskellige notetyper, plejeindstillinger og onkologiske subspecialiteter, hvilket sikrer et robust datasæt, der afspejler forskellige kliniske scenarier. |
Strenge afidentifikation | Sikring af, at alle mærkede poster er afidentificeret i overensstemmelse med HIPAA's Safe Harbor-metode, hvilket sikrer kundens tillid til databeskyttelse og sikkerhed. |
Retningslinjer for anmærkning | Oprettelse og implementering af standard retningslinjer for dataanmærkninger til udarbejdelse af mærkede poster i overensstemmelse med HIPAA-standarder. |
Avancerede annoteringsstrategier | Manuel annotering af 10,000 sider med onkologi-relaterede optegnelser blev udført med et detaljeret fokus på at identificere negationsstatusser og anden relevant information i overensstemmelse med etablerede retningslinjer. |
Strenge kvalitetssikring | Opnå den specificerede kvalitetsstandard skitseret i vejledningen |
Løsning
Vores tilgang involverede følgende nøglestrategier:
Tilpasset onkologisk datasæt kompilering
Fra et stort arkiv med over 5 MN EHR'er blev en nøje udvalgt delmængde af data udtrukket, med det formål at imødekomme klientens specialiserede krav til onkologiske data med fokus på genomiske entiteter. Indsamlingsprocessen involverede oprettelse af en udtømmende liste over tumormarkører, gener, varianter og TNM-stadier, ved at anvende søgeordssøgninger til at lokalisere dokumenter, der er rigelige af disse data. Regulære udtryk blev brugt til at identificere en række genetiske variationer og kræftstadier. Denne tilgang, kombineret med en bred datadækning omfattende forskellige dokumenttyper, specialer, plejeindstillinger og data fra flere læger, sikrede et omfattende og relevant onkologisk datasæt.
Strenge afidentifikation
Processen fulgte nøje HIPAA's Safe Harbor-metode til afidentifikation, som garanterer kundens tillid til databeskyttelse og sikkerhed. Dette indebærer at fjerne alle beskyttede sundhedsoplysninger (PHI) og erstatte dem med mærkede pladsholdere, hvorved dataenes anvendelighed bevares, samtidig med at patientens fortrolighed beskyttes.
Afidentifikationsvariabler
Boligtype | Underkategori |
Navn | Patientnavn, Lægens navn, Sygeplejerskens praktiserende læges navn, Familiemedlemsnavn, Lægehusets navn, Klinikkens navn, Plejehjemmets navn, Firmanavn, Universitetets navn |
Alder | |
Dato | Datomønster, Måned Årsmønster, Dag Månedsmønster, Dag Årsmønster, Dag, Måned, År, Sæson |
Lokation | Land, stat, by, gade, postnummer, værelsesnummer, suitenummer, etagenummer |
ID | CPR-nummer, journalnummer, sygesikringsmodtagernummer, kontonummer, certifikat-/licensnummer, biometrisk id, journal-id, adgangsnummer, køretøjets identifikationsnummer, Nummerpladenummer Enhedsidentifikatorer og serienummer |
Kontakt | Telefonnummer, faxnummer, e-mail-adresse, web-URL, IP-adresse |
Eksempel:
Den 25. september 2106, kl. 11:00, blev Mr. Harry Pace, 90 år gammel, indlagt på Forrest General Hospital til en planlagt hofteoperation, tidligere konsulteret af hans primære læge Dr. Jose Martin, og overværet af Kendra Reith, MD. Under sit ophold var han under pleje af Mary Hu, NP, og Suzan Ray, RN, og R. Charles Melancon, PA, blev også konsulteret. Hans operation, der blev udført samme dag som indlæggelsen, var vellykket uden komplikationer. Efter operationen blev Mr. Pace overført til værelse 202, etage 2, for at komme sig. Hans kone, Emma Pace, var til stede hele vejen igennem og fik alle nødvendige opdateringer. Under hans korte ophold blev hans lægejournaler, inklusive MRN MR99062619 og konto KV000014764, håndteret i overensstemmelse med standardprotokollerne fra Gracewood Nursing Home, hans tidligere bopæl. Han blev udskrevet senere samme dag til Oakland Ambulatorieklinik for yderligere rekreation. Gennem hele processen blev alle procedurer dokumenteret og sikret med overholdelse af fortrolighedsstandarder.
Eksempel: Afidentificeret
On [Datomønster]11:00, Mr. [Patientens navn], alderen [Alder], blev optaget til [Navn på lægecenter] til en planlagt hofteoperation, tidligere konsulteret af hans primære læge Dr. [Lægens navn], og overværet af [Lægens navn] MD. Under sit ophold var han under opsyn af [Sygeplejerske], NP, og [Sygeplejerske], RN, med [Lægens navn], PA, bliver også hørt. Hans operation, der blev udført samme dag som indlæggelsen, var vellykket uden komplikationer. Efter operationen, Mr. [Patientens navn] blev overført til værelsesnr. [Værelsesnummer], Etage nr. [Etagenummer], til bedring. Hans kone, [familiemedlems navn], var til stede hele vejen igennem og fik alle nødvendige opdateringer. Under hans korte ophold, hans lægejournaler, herunder MRN [journalnummer] og konto [Kontonummer], blev håndteret i henhold til standardprotokollerne for [Navn på plejehjem], hans tidligere bopæl. Han blev senere samme dag udskrevet til pleje af [Kliniknavn] til yderligere rekreation. Gennem hele processen blev alle procedurer dokumenteret og sikret med overholdelse af fortrolighedsstandarder.
Retningslinjer for annotering og avancerede annoteringsteknikker
Shaip var medvirkende til at etablere og implementere standardretningslinjer for dataanmærkninger og sikrede, at alle mærkede poster blev udarbejdet konsekvent og i overensstemmelse med HIPAA-standarder. Desuden blev 10,000 sider fra forskellige medicinske journaler omhyggeligt kommenteret med fokus på den detaljerede mærkning af negationsstatusser og andre klinisk relevante enheder, herunder forskellige onkologiske subspecialiteter. Annoteringen blev udført af et team af ekspertannotatorer med specialiseret viden inden for onkologi og regler om databeskyttelse.
Komplekse anmærkningskriterier
Boligtype | Underkategori |
Datoannotation (onkologi) | Diagnose Dato, Stage Date, Debut, Procedure Date, Med Date Started, Med Date Ended, Radiation Date Started, Radiation Date Ended |
Sygdom (onkologi) | Kræftproblem, histologi, klinisk status, kropssted, adfærd, karakter, kræftstadie, TNM-stadium, tumormarkørtest, dimensioner, kode |
Behandling (onkologi) | Kræftmedicin, lægemiddeldosering, hyppighed, kræftkirurgi, operationsresultat, strålingsmodalitet, stråledosering |
Genomics | Variationskode, genundersøgt, metode, prøve |
negationen | Negativ, Mulig negativ, Usikker, Mulig positiv |
Klinisk NER | Kræftproblem – Kropssted, Histologi – Kropssted, Adfærd – Kropssted, Kræftkirurgi – Relationer Kropssted, strålingsmodalitet – Kropssted, Histologi – Grad, Kræftproblem – Dimension |
Eksempel:
Erklæring om onkologi klinisk note
"Patienten Jane Doe blev diagnosticeret med Stage IIIB ikke-småcellet lungekræft (NSCLC), specifikt adenokarcinom, den 03/05/2023. Kræften er placeret i højre nederste del af lungen. Det er klassificeret som T3N2M0 i henhold til TNM-stadiesystemet, med en tumorstørrelse på 5 cm x 3 cm. En EGFR exon 19 deletion blev identificeret gennem PCR-analyse af tumorbiopsiprøven. Kemoterapi med Carboplatin AUC 5 og Pemetrexed 500 mg/m² blev påbegyndt den 03/20/2023 og skal administreres hver 3. uge. Ekstern strålebehandling (EBRT) ved en dosis på 60 Gy i 30 fraktioner påbegyndt den 04/01/2023. Patientens behandling er i gang, og der er ingen tegn på hjernemetastaser på den nylige MR-scanning. Muligheden for lymfvaskulær invasion er endnu ikke fastlagt, og patientens tolerance for den fulde kemoterapi-kur er fortsat usikker.
Erklæring om onkologi klinisk note
Strenge kvalitetssikring
Implementerede en fleksibel projektstyringsramme, der lettede den effektive integration af kundefeedback og samtidig opretholdt strenge kvalitetsstandarder. En omfattende kvalitetssikringsprotokol blev håndhævet, tilpasset retningslinjerne for at nå de nødvendige kvalitetsbenchmarks. Denne protokol indeholdt successive runder af gennemgang og verifikation, der sikrede præcisionen og pålideligheden af de kommenterede data. Et sådant omhyggeligt kvalitetstilsyn er afgørende for at skabe en pålidelig NLP-løsning, som er afgørende for informeret klinisk beslutningstagning og forskningsmæssig ekspertise.
Resultat
Succesfuldt leveret 10,000 højkvalitets, afidentificerede mærkede poster, hvilket giver et sikkert og værdifuldt datasæt til kundens NLP-modeludvikling. Den omhyggelige anvendelse af NLP og overholdelse af HIPAA afidentifikationsstandarder resulterede i et meget raffineret datasæt, der vil understøtte klientens igangværende og fremtidige onkologiske forskningsindsats, og i sidste ende sigte mod at forbedre onkologiske patientresultater og plejeeffektivitet.
Succesen med projektet illustrerer vores evne til at håndtere komplekse medicinske data med præcision, hvilket bidrager til kundens mål om at forbedre patientbehandlingsresultater og accelerere tempoet i sundhedsinnovation.
Vores partnerskab med Shaip har været medvirkende til at fremme vores NLP-kapaciteter inden for det onkologiske domæne. Den professionelle håndtering af 10,000 medicinske journaler, kommenteret med detaljeret negation og andre kliniske enheder, demonstrerede deres forpligtelse til ekspertise og compliance. Desuden har deres forpligtelse til privatlivsstandarder som HIPAA givet os uvurderlige ressourcer til at drive vores AI-initiativer med at udvikle banebrydende onkologiske behandlinger og diagnostik fremad.