Tekst-til-tale (TTS)

Tekst-til-tale (TTS)

Definition

Tekst-til-tale (TTS) er den teknologi, der konverterer skrevet tekst til tale ved hjælp af AI-modeller.

Formål

Formålet er at levere naturlig stemmeoutput til tilgængeligheds-, virtuelle assistenter- og medieapplikationer.

Vigtighed

  • Kritisk for tilgængelighed for synshandicappede brugere.
  • Udbredt anvendt i digitale assistenter og IVR-systemer.
  • Risikerer at syntetiske stemmer bliver brugt til svindel.
  • Kvalitet afhænger af prosodi og naturlighed.

Hvordan det virker

  1. Inputteksten behandles og normaliseres.
  2. Tekst omdannes til fonemer.
  3. Akustiske modeller genererer talefunktioner.
  4. Vokodere syntetiserer bølgeformer.
  5. Outputlyd leveres til brugerne.

Eksempler (den virkelige verden)

  • Google Cloud TTS: genererer naturlige stemmer til apps.
  • Amazon Polly: tekst-til-tale-tjeneste.
  • Apple Siri: stemmeoutput fra tekst.

Referencer / Yderligere læsning

Fortæl os, hvordan vi kan hjælpe med dit næste AI-initiativ.