Afrikaans Datasæt

Afrikaanse Datastel

Højkvalitets afrikaans generel samtale og podcast-datasæt til kunstig intelligens og talemodeller

Oversigt

Titel

Afrikaans sprogdatasæt

Datasættype

Generelle samtaledata

Beskrivelse

Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) – 15-60 minutter, afrikaans tales i Afrika.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

368

Prøvefrekvens

8 kHz

Audio Channel

Dual

Optageplatform

desktop

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

Afrikaans

Sprog

Afrikaans

Køn

Kvinde: 502, Mand: 390 og Ukendt: 2

Antal højttalere

894

Alder

18-50

Oversigt

Titel

Afrikaans sprogdatasæt

Datasættype

Podcast

Beskrivelse

Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Samlet antal timer

658

Prøvefrekvens

16 kHz

Audio Channel

Mono

Optageplatform

Web Sourcing

Lyd Format

. Wav

Transskriptionsformat

.json

WER (%)

5

Demografiske datasæt

Land

Afrikaans

Sprog

Afrikaans

Køn

Kvinde: 750, Mand: 1,278 og Ukendt: 52

Antal højttalere

2,080

Alder

18-50

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Amazon
Google
microsoft
Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.
  • Dette felt er til validering og bør overlades uændret.