African American Vernacular Datasæt

Afro-amerikanske folkstaal datastel

Afroamerikansk sprogligt callcenter af høj kvalitet og podcastdatasæt til kunstig intelligens og talemodeller

Oversigt

Titel

Afroamerikansk sprogdatasæt

Datasættype

Callcenter

Beskrivelse

Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

211

Prøvefrekvens

8 kHz

Audio Channel

Dual

Optageplatform

desktop

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

African American

Sprog

Afroamerikansk sprog

Køn

Kvinde: 612, Mand: 1242 og Ukendt: 12

Antal højttalere

1,866

Alder

18-50

Oversigt

Titel

Afroamerikansk sprogdatasæt

Datasættype

Podcast

Beskrivelse

Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

154

Prøvefrekvens

16 kHz

Audio Channel

Mono

Optageplatform

Web Sourcing

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

African American

Sprog

Afroamerikansk sprog

Køn

Kvinde: 151, Mand: 150 og Ukendt: 10

Antal højttalere

311

Alder

18-50

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Amazon
Google
microsoft
Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.
  • Dette felt er til validering og bør overlades uændret.