Navngivet enhedsgenkendelse (NER)

Definition

Named Entity Recognition (NER) er en NLP-opgave, der identificerer og klassificerer enheder i tekst, såsom personer, organisationer, steder, datoer eller produkter.

Formål

Formålet er at strukturere ustruktureret tekst ved at udtrække nøgleenheder. Det understøtter søgning, informationsudtrækning og opbygning af vidensdiagrammer.

Vigtighed

  • Grundlæggende for informationssøgning og NLP-pipelines.
  • Fejl spreder sig til downstream-applikationer.
  • Domænespecifik NER (f.eks. medicinsk, juridisk) kræver brugerdefinerede datasæt.
  • Relateret til opgaver som entitetslinkning og relationsudtrækning.

Hvordan det virker

  1. Indsamle og forbehandle tekst.
  2. Annoter datasæt med enhedskategorier.
  3. Træn modeller på mærkede eksempler (CRF'er, transformere).
  4. Forudsig enheder i uset tekst.
  5. Valider nøjagtighed med testdata.

Eksempler (den virkelige verden)

  • spaCy: open source NLP-bibliotek med indbygget NER.
  • Stanford CoreNLP: leverer værktøjer til genkendelse af navngivne enheder.
  • Finansiel NLP: udtrækker virksomhedsnavne fra rapporter.

Referencer / Yderligere læsning

Fortæl os, hvordan vi kan hjælpe med dit næste AI-initiativ.

Saip
Beskyttelse af personlige oplysninger

Denne hjemmeside bruger cookies, så vi kan give dig den bedst mulige brugeroplevelse. Cookieoplysninger gemmes i din browser og udfører funktioner som at genkende dig, når du vender tilbage til vores hjemmeside og hjælper vores team til at forstå, hvilke dele af hjemmesiden du finder mest interessante og nyttige.