Definition
Lydtranskription er processen med at konvertere talesprog til skrevet tekst. Det skaber strukturerede tekstdata fra rå taleoptagelser.
Formål
Formålet er at gøre tale søgbar, analyserbar og brugbar til opgaver med behandling af naturligt sprog. Det bruges i vid udstrækning inden for tilgængelighed, medier og forretningsanalyse.
Vigtighed
- Aktiverer undertekster og tilgængelighedstjenester.
- Giver tekstinput til træning af NLP-modeller.
- Kvaliteten afhænger af nøjagtigheden af tale-til-tekst-konverteringen.
- Følsom over for baggrundsstøj, accenter og optagekvalitet.
Hvordan det virker
- Optag eller importer lydfiler.
- Opdel talen i mindre enheder.
- Anvend automatiseret talegenkendelse (ASR) eller manuel transskription.
- Ret og validér tekst for nøjagtighed.
- Gem transskriptioner med tidsstempler eller metadata, hvis det er nødvendigt.
Eksempler (den virkelige verden)
- Rev: transskriptionstjeneste til medier og virksomheder.
- Otter.ai: AI-baseret mødetransskription i realtid.
- YouTube: genererer undertekster ved hjælp af ASR-modeller.
Referencer / Yderligere læsning
- Automatisk talegenkendelse — NIST.
- ISO/IEC 15938-4: Beskrivelse af multimedieindhold — ISO.
- Tale- og sprogbehandling — Jurafsky & Martin, Stanford.