Dansk Datasæt
Oversigt
Titel
Dansk Sprog Datasæt
Datasættype
Wake Word
Beskrivelse
Wake Words / Voice Command / Trigger Word / Keyphrase-indsamling af data
- 50 højttalere
- 4 unikke nøglesætninger pr. højttaler
- 10 lydfiler pr. unik nøglesætning
- 40 samlede optagne ytringer pr. højttaler
Datasætdetaljer
Samlet antal timer
2,000 lydbånd
Prøvefrekvens
16 kHz
Audio Channel
1 kanal
Optageplatform
Mobile App
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Danske
Sprog
Danske
Køn
Kvinde 50 %, Mand 50 %, Ukendt 10 %
Antal højttalere
50
Alder
18-50
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning