Arabisk datasæt
مجموعة البيانات العربية
Oversigt
Titel
Arabisk sprog datasæt
Datasættype
Generel samtale
Beskrivelse
Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) – 15-60 minutter, arabisk fra Golflandene.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
292
Prøvefrekvens
8 kHz
Audio Channel
Dual
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
arabisk
Sprog
arabisk
Køn
Kvinde: 171, Mand: 534 og Ukendt: 1
Antal højttalere
706
Alder
18-50
Oversigt
Titel
Arabisk sprog datasæt
Datasættype
TTS
Beskrivelse
Optagelser med enkelt ytring, som har tendens til at falde i intervallet 5 til 30 sekunder.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
1,947
Prøvefrekvens
48 kHz
Audio Channel
Mono
Optageplatform
Mobile App
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
arabisk
Sprog
arabisk
Køn
Kvinde 838 Mand 1209 Ukendt 78
Antal højttalere
2,125
Alder
18-50
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning