Arabisk datasæt
مجموعة البيانات العربية
Højkvalitets arabisk generel samtale og tekst-til-tale (TTS) til AI og talemodeller
Oversigt
Titel (sprog)
Arabisk sprog datasæt
Datasættyper
Callcenter, Generel samtale, Musik, Manuskriptmonolog
Land
arabisk
Produktbeskrivelse
Dette datasæt inkluderer uskripterede syntetiske agent-kunde-telefonsamtaler (5-15 minutter), naturlige menneske-til-menneske-telefonsamtaler på Golfarabisk (15-60 minutter) og sanglyd med transskriptioner, hvilket leverer forskellige taledata til træning og evaluering af tale- og sprogteknologier.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Call center | 8 kHz | 2 højttalere | Dual | 62:52:19 | På forespørgsel |
| Call center | 8 kHz | 2 højttalere | Mono | 1,025:09:19 | På forespørgsel |
| Generel samtale | 8 kHz | 2 højttalere | Dual | 254:16:34 | 626 |
| Musik | 48 kHz | Enkel højttaler | Mono | 03:17:21 | 10 |
| Manuskriptmonolog | 48 kHz | Enkel højttaler | Mono | 4,249:00:00 | 2,125 |
| Manuskriptmonolog | 24 kHz | Enkel højttaler | Mono | 2,300:00:00 | På forespørgsel |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning