Forbedring af onkologisk NLP-forskning

Onkologisk datapræcision: Licensering, afidentifikation og annotering til NLP-modelinnovation

Onkologi nlp

Revolutionerende kræftbehandling med banebrydende NLP-teknologier

Klienten, en stor aktør i sundhedssektoren, krævede en avanceret NLP-løsning for at behandle en betydelig mængde onkologiske journaler. Som en del af et centralt initiativ til at forfine onkologisk forskning er behovet for at balancere detaljeret dataanalyse med strenge privatlivsstandarder altafgørende. Dette casestudie skitserer vores bidrag til at forbedre klientens forskningsbestræbelser gennem high-fidelity dataannotering, streng afidentifikationspraksis og anvendelsen af ​​Natural Language Processing (NLP) teknikker, alt sammen inden for de lovgivningsmæssige rammer, der leveres af HIPAA.

Bind

Datalicens + Data De-id
10 Sider
Onkologiske forhold
10 Sider
Ikke-onkologisk domæne
10 Sider
negationen
10 Sider
Onkologisk domæne
10 Sider
NER + Relationskortlægning
10 Sider

Udfordringer

Projektet krævede en nuanceret forståelse af klinisk dokumentation, præcis identifikation af medicinske enheder og evnen til at anvende negationsetiketter præcist, alt sammen inden for en sikker ramme, der beskytter patientens privatliv i henhold til HIPAA-reglerne. Bestræbelsen krævede ikke kun teknisk ekspertise i håndtering af store mængder komplekse data, men også en strategisk tilgang til at inkorporere feedback og opretholde kvalitet på tværs af alle stadier af annoteringsprocessen.

Mål

Detaljeret beskrivelse af tjenester

BoligtypeBeskrivelse
Omfattende klinisk datadækningSpænder forskellige notetyper, plejeindstillinger og onkologiske subspecialiteter, hvilket sikrer et robust datasæt, der afspejler forskellige kliniske scenarier.
Strenge afidentifikationSikring af, at alle mærkede poster er afidentificeret i overensstemmelse med HIPAA's Safe Harbor-metode, hvilket sikrer kundens tillid til databeskyttelse og sikkerhed.
Retningslinjer for anmærkningOprettelse og implementering af standard retningslinjer for dataanmærkninger til udarbejdelse af mærkede poster i overensstemmelse med HIPAA-standarder.
Avancerede annoteringsstrategierManuel annotering af 10,000 sider med onkologi-relaterede optegnelser blev udført med et detaljeret fokus på at identificere negationsstatusser og anden relevant information i overensstemmelse med etablerede retningslinjer.
Strenge kvalitetssikringOpnå den specificerede kvalitetsstandard skitseret i vejledningen

Løsning

Vores tilgang involverede følgende nøglestrategier:

Tilpasset onkologisk datasæt kompilering

Fra et stort arkiv med over 5 MN EHR'er blev en nøje udvalgt delmængde af data udtrukket, med det formål at imødekomme klientens specialiserede krav til onkologiske data med fokus på genomiske entiteter. Indsamlingsprocessen involverede oprettelse af en udtømmende liste over tumormarkører, gener, varianter og TNM-stadier, ved at anvende søgeordssøgninger til at lokalisere dokumenter, der er rigelige af disse data. Regulære udtryk blev brugt til at identificere en række genetiske variationer og kræftstadier. Denne tilgang, kombineret med en bred datadækning omfattende forskellige dokumenttyper, specialer, plejeindstillinger og data fra flere læger, sikrede et omfattende og relevant onkologisk datasæt.

Onkologisk datasæt kompilering

Strenge afidentifikation

Processen fulgte nøje HIPAA's Safe Harbor-metode til afidentifikation, som garanterer kundens tillid til databeskyttelse og sikkerhed. Dette indebærer at fjerne alle beskyttede sundhedsoplysninger (PHI) og erstatte dem med mærkede pladsholdere, hvorved dataenes anvendelighed bevares, samtidig med at patientens fortrolighed beskyttes.

Afidentifikationsvariabler

BoligtypeUnderkategori
NavnPatientnavn, Lægens navn, Sygeplejerskens praktiserende læges navn, Familiemedlemsnavn, Lægehusets navn, Klinikkens navn, Plejehjemmets navn, Firmanavn, Universitetets navn
Alder 
DatoDatomønster, Måned Årsmønster, Dag Månedsmønster, Dag Årsmønster, Dag, Måned, År, Sæson
LokationLand, stat, by, gade, postnummer, værelsesnummer, suitenummer, etagenummer
IDCPR-nummer, journalnummer, sygesikringsmodtagernummer, kontonummer, certifikat-/licensnummer, biometrisk id, journal-id, adgangsnummer, køretøjets identifikationsnummer, Nummerpladenummer Enhedsidentifikatorer og serienummer
KontaktTelefonnummer, faxnummer, e-mail-adresse, web-URL, IP-adresse

Eksempel:

Den 25. september 2106, kl. 11:00, blev Mr. Harry Pace, 90 år gammel, indlagt på Forrest General Hospital til en planlagt hofteoperation, tidligere konsulteret af hans primære læge Dr. Jose Martin, og overværet af Kendra Reith, MD. Under sit ophold var han under pleje af Mary Hu, NP, og Suzan Ray, RN, og R. Charles Melancon, PA, blev også konsulteret. Hans operation, der blev udført samme dag som indlæggelsen, var vellykket uden komplikationer. Efter operationen blev Mr. Pace overført til værelse 202, etage 2, for at komme sig. Hans kone, Emma Pace, var til stede hele vejen igennem og fik alle nødvendige opdateringer. Under hans korte ophold blev hans lægejournaler, inklusive MRN MR99062619 og konto KV000014764, håndteret i overensstemmelse med standardprotokollerne fra Gracewood Nursing Home, hans tidligere bopæl. Han blev udskrevet senere samme dag til Oakland Ambulatorieklinik for yderligere rekreation. Gennem hele processen blev alle procedurer dokumenteret og sikret med overholdelse af fortrolighedsstandarder.

Eksempel: Afidentificeret

On [Datomønster]11:00, Mr. [Patientens navn], alderen [Alder], blev optaget til [Navn på lægecenter] til en planlagt hofteoperation, tidligere konsulteret af hans primære læge Dr. [Lægens navn], og overværet af [Lægens navn] MD. Under sit ophold var han under opsyn af [Sygeplejerske], NP, og [Sygeplejerske], RN, med [Lægens navn], PA, bliver også hørt. Hans operation, der blev udført samme dag som indlæggelsen, var vellykket uden komplikationer. Efter operationen, Mr. [Patientens navn] blev overført til værelsesnr. [Værelsesnummer], Etage nr. [Etagenummer], til bedring. Hans kone, [familiemedlems navn], var til stede hele vejen igennem og fik alle nødvendige opdateringer. Under hans korte ophold, hans lægejournaler, herunder MRN [journalnummer] og konto [Kontonummer], blev håndteret i henhold til standardprotokollerne for [Navn på plejehjem], hans tidligere bopæl. Han blev senere samme dag udskrevet til pleje af [Kliniknavn] til yderligere rekreation. Gennem hele processen blev alle procedurer dokumenteret og sikret med overholdelse af fortrolighedsstandarder.

Retningslinjer for annotering og avancerede annoteringsteknikker

Shaip var medvirkende til at etablere og implementere standardretningslinjer for dataanmærkninger og sikrede, at alle mærkede poster blev udarbejdet konsekvent og i overensstemmelse med HIPAA-standarder. Desuden blev 10,000 sider fra forskellige medicinske journaler omhyggeligt kommenteret med fokus på den detaljerede mærkning af negationsstatusser og andre klinisk relevante enheder, herunder forskellige onkologiske subspecialiteter. Annoteringen blev udført af et team af ekspertannotatorer med specialiseret viden inden for onkologi og regler om databeskyttelse.

Komplekse anmærkningskriterier

BoligtypeUnderkategori
Datoannotation (onkologi)Diagnose Dato, Stage Date, Debut, Procedure Date, Med Date Started, Med Date Ended, Radiation Date Started, Radiation Date Ended
Sygdom (onkologi)Kræftproblem, histologi, klinisk status, kropssted, adfærd, karakter, kræftstadie, TNM-stadium, tumormarkørtest, dimensioner, kode
Behandling (onkologi)Kræftmedicin, lægemiddeldosering, hyppighed, kræftkirurgi, operationsresultat, strålingsmodalitet, stråledosering
GenomicsVariationskode, genundersøgt, metode, prøve
negationenNegativ, Mulig negativ, Usikker, Mulig positiv
Klinisk NERKræftproblem – Kropssted, Histologi – Kropssted, Adfærd – Kropssted, Kræftkirurgi – Relationer Kropssted, strålingsmodalitet – Kropssted, Histologi – Grad, Kræftproblem – Dimension

Eksempel:

Onkologisk klinisk noteerklæring

Erklæring om onkologi klinisk note

"Patienten Jane Doe blev diagnosticeret med Stage IIIB ikke-småcellet lungekræft (NSCLC), specifikt adenokarcinom, den 03/05/2023. Kræften er placeret i højre nederste del af lungen. Det er klassificeret som T3N2M0 i henhold til TNM-stadiesystemet, med en tumorstørrelse på 5 cm x 3 cm. En EGFR exon 19 deletion blev identificeret gennem PCR-analyse af tumorbiopsiprøven. Kemoterapi med Carboplatin AUC 5 og Pemetrexed 500 mg/m² blev påbegyndt den 03/20/2023 og skal administreres hver 3. uge. Ekstern strålebehandling (EBRT) ved en dosis på 60 Gy i 30 fraktioner påbegyndt den 04/01/2023. Patientens behandling er i gang, og der er ingen tegn på hjernemetastaser på den nylige MR-scanning. Muligheden for lymfvaskulær invasion er endnu ikke fastlagt, og patientens tolerance for den fulde kemoterapi-kur er fortsat usikker.

Erklæring om onkologi klinisk note

Onkologisk klinisk noteerklæring

Strenge kvalitetssikring

Implementerede en fleksibel projektstyringsramme, der lettede den effektive integration af kundefeedback og samtidig opretholdt strenge kvalitetsstandarder. En omfattende kvalitetssikringsprotokol blev håndhævet, tilpasset retningslinjerne for at nå de nødvendige kvalitetsbenchmarks. Denne protokol indeholdt successive runder af gennemgang og verifikation, der sikrede præcisionen og pålideligheden af ​​de kommenterede data. Et sådant omhyggeligt kvalitetstilsyn er afgørende for at skabe en pålidelig NLP-løsning, som er afgørende for informeret klinisk beslutningstagning og forskningsmæssig ekspertise.

Resultat

Succesfuldt leveret 10,000 højkvalitets, afidentificerede mærkede poster, hvilket giver et sikkert og værdifuldt datasæt til kundens NLP-modeludvikling. Den omhyggelige anvendelse af NLP og overholdelse af HIPAA afidentifikationsstandarder resulterede i et meget raffineret datasæt, der vil understøtte klientens igangværende og fremtidige onkologiske forskningsindsats, og i sidste ende sigte mod at forbedre onkologiske patientresultater og plejeeffektivitet.

Succesen med projektet illustrerer vores evne til at håndtere komplekse medicinske data med præcision, hvilket bidrager til kundens mål om at forbedre patientbehandlingsresultater og accelerere tempoet i sundhedsinnovation.

Vores partnerskab med Shaip har været medvirkende til at fremme vores NLP-kapaciteter inden for det onkologiske domæne. Den professionelle håndtering af 10,000 medicinske journaler, kommenteret med detaljeret negation og andre kliniske enheder, demonstrerede deres forpligtelse til ekspertise og compliance. Desuden har deres forpligtelse til privatlivsstandarder som HIPAA givet os uvurderlige ressourcer til at drive vores AI-initiativer med at udvikle banebrydende onkologiske behandlinger og diagnostik fremad.

Gylden-5-stjernet

Accelerer din Healthcare AI
applikationsudvikling med 100%