Arabisk datasæt

مجموعة البيانات العربية

Arabisk generel samtale af høj kvalitet og podcast-datasæt til kunstig intelligens og talemodeller

Oversigt

Titel

Arabisk sprog datasæt

Datasættype

Generel samtale

Beskrivelse

Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) – 15-60 minutter, arabisk fra Golflandene.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

292

Prøvefrekvens

8 kHz

Audio Channel

Dual

Optageplatform

desktop

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

arabisk

Sprog

arabisk

Køn

Kvinde 838 Mand 1209 Ukendt 78

Antal højttalere

706

Alder

18-50

Oversigt

Titel

Arabisk sprog datasæt

Datasættype

TTS

Beskrivelse

Optagelser med enkelt ytring, som har tendens til at falde i intervallet 5 til 30 sekunder.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

1,947

Prøvefrekvens

48 kHz

Audio Channel

Mono

Optageplatform

Mobile App

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

arabisk

Sprog

arabisk

Køn

Kvinde 838 Mand 1209 Ukendt 78

Antal højttalere

2,125

Alder

18-50

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Amazon
Google
microsoft
Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.
  • Dette felt er til validering og bør overlades uændret.