Arabisk datasæt

مجموعة البيانات العربية

Højkvalitets arabisk generel samtale og tekst-til-tale (TTS) til AI og talemodeller

Oversigt

Titel (sprog)

Arabisk sprog datasæt

Datasættyper

Callcenter, Generel samtale, Musik, Manuskriptmonolog

Land

arabisk

Produktbeskrivelse

Dette datasæt inkluderer uskripterede syntetiske agent-kunde-telefonsamtaler (5-15 minutter), naturlige menneske-til-menneske-telefonsamtaler på Golfarabisk (15-60 minutter) og sanglyd med transskriptioner, hvilket leverer forskellige taledata til træning og evaluering af tale- og sprogteknologier.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Datasættype Sampling Rate Højttalere Kanal Samlede timer Samlet antal højttalere
Call center 8 kHz 2 højttalere Dual 62:52:19 På forespørgsel
Call center 8 kHz 2 højttalere Mono 1,025:09:19 På forespørgsel
Generel samtale 8 kHz 2 højttalere Dual 254:16:34 626
Musik 48 kHz Enkel højttaler Mono 03:17:21 10
Manuskriptmonolog 48 kHz Enkel højttaler Mono 4,249:00:00 2,125
Manuskriptmonolog 24 kHz Enkel højttaler Mono 2,300:00:00 På forespørgsel

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Amazon
Google
microsoft
Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Dette felt er til validering og bør overlades uændret.
  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.