Definition
Chatbot-træningsdata består af eksempelsamtaler, intentioner og svar, der bruges til at træne samtalebaserede AI-systemer. Det kan omfatte ofte stillede spørgsmål, transskriptioner og mærkede dialogflows.
Formål
Formålet er at give eksempler, der hjælper chatbots med at forstå brugerinput og generere passende svar. Det sikrer pålidelig ydeevne i samtaler i den virkelige verden.
Vigtighed
- Bestemmer nøjagtigheden og naturligheden af chatbot-svar.
- Træningsdata af dårlig kvalitet resulterer i irrelevante eller forkerte svar.
- Skal løbende opdateres for at afspejle nyt sprog og nye tendenser.
- Kan overlappe med intentiongenkendelse og NLU-datasæt.
Hvordan det virker
- Indsaml dialoger, ofte stillede spørgsmål og supporttransskriptioner.
- Mærk data med intentioner og enheder.
- Opdel i trænings- og valideringssæt.
- Træn chatbot-modeller ved hjælp af overvåget læring eller finjustering.
- Test ydeevne med brugerforespørgsler fra den virkelige verden.
Eksempler (den virkelige verden)
- Microsoft Bot Framework: trænet i domænespecifikke chatdata.
- Google Dialogflow: bruger kommenterede intentioner og enheder til træning.
- Finjustering af OpenAI ChatGPT: trænet på kuraterede samtaler.
Referencer / Yderligere læsning
- Opbygning af chatbots — Stanford CS224U-forelæsninger.
- AI-træningsdata til chatbot
- Dialogtilstandssporingsudfordring (DSTC) — Microsoft Research.
- Krammeansigt Samtale AI-modeller — Krammeansigt.