vietnamesisk datasæt
Bộ dữ liệu tiếng Việt
Oversigt
Titel
vietnamesisk Sprogdatasæt
Datasættype
Generel samtale
Beskrivelse
Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, nordlige (f.eks. Hanoi), centrale og sydlige (f.eks. Ho Chi Minh City).
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
295
Prøvefrekvens
8 kHz
Audio Channel
Dual
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
vietnamesisk
Sprog
vietnamesisk
Køn
Kvinde 400, mand 380, Ukendte 2
Antal højttalere
782
Alder
18-50
Oversigt
Titel
vietnamesisk Sprogdatasæt
Datasættype
Medie lyd
Beskrivelse
Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
257
Prøvefrekvens
16 kHz
Audio Channel
Mono
Optageplatform
Web Sourcing
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
vietnamesisk
Sprog
vietnamesisk
Køn
Kvinde 249, mand 200, Ukendte 45
Antal højttalere
494
Alder
18-50
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning