Dansk Datasæt
Dansk Datasæt
Oversigt
Titel
Danske Sprogdatasæt
Datasættype
Generel samtale
Beskrivelse
Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) – 15-60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
372
Prøvefrekvens
8 kHz
Audio Channel
Dual
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Danmark
Sprog
Danske
Køn
Kvinde 311, Mand 417, Ukendt 0
Antal højttalere
728
Alder
18-50
Oversigt
Titel
Danske Sprogdatasæt
Datasættype
Medie lyd
Beskrivelse
Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
664
Prøvefrekvens
16 kHz
Audio Channel
Mono
Optageplatform
Web Sourcing
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Danmark
Sprog
Danske
Køn
Kvinde 369, Mand 864, Ukendt 27
Antal højttalere
1,260
Alder
18-50
Oversigt
Titel
Dansk Sprog Datasæt
Datasættype
TTS
Beskrivelse
Enkelt-ytring optagelser, som har tendens til at falde i 5 til 30 sekunders rækkevidde, dansk fra Danmark.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
2,579
Prøvefrekvens
48 kHz
Audio Channel
Mono
Optageplatform
Mobile App
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Danmark
Sprog
Danske
Køn
Kvinde 1551, Mand 1233, Ukendt 42
Antal højttalere
2,826
Alder
18-50
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning