Tale-til-tekst

Tale-til-tekst

Definition

Tale-til-tekst (STT) er processen med automatisk at konvertere talesprog til skrevet tekst ved hjælp af AI-modeller. Det er tæt forbundet med ASR.

Formål

Formålet er at gøre talt indhold tilgængeligt og søgbart. Det bruges i vid udstrækning inden for transskription, tilgængelighed og digitale assistenter.

Vigtighed

  • Understøtter tilgængelighed for hørehæmmede brugere.
  • Leverer transskriptioner af møder og forelæsninger.
  • Nøjagtigheden afhænger af accenter og støjforhold.
  • Bruges i næsten alle stemmestyrede applikationer.

Hvordan det virker

  1. Optag lydinput.
  2. Forbehandl og normaliser lydsignal.
  3. Anvend ASR-modeller til at genkende ord.
  4. Transskription af outputtekst.
  5. Gennemgå eller korriger med menneskelig tilsyn om nødvendigt.

Eksempler (den virkelige verden)

  • Google Cloud tale-til-tekst API.
  • Microsoft Azure taletjenester.
  • Transskription af Otter.ai-møder.

Referencer / Yderligere læsning

Fortæl os, hvordan vi kan hjælpe med dit næste AI-initiativ.