Malayalam datasæt
മലയാളം ഡാറ്റാസെറ്റ്
Højkvalitets malayalam callcenter, generel samtale og podcastdatasæt til kunstig intelligens og talemodeller
Oversigt
Titel
malayalam Sprogdatasæt
Datasættype
Callcenter
Beskrivelse
Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
60
Prøvefrekvens
8 Khz
Audio Channel
Dual
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Indien
Sprog
malayalam
Køn
Mand: 421, Kvinde: 119 og Ukendt: 0
Antal højttalere
540
Alder
18-50
Oversigt
Titel
malayalam Sprogdatasæt
Datasættype
Generel samtale
Beskrivelse
Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
100
Prøvefrekvens
8 Khz
Audio Channel
Dual
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Indien
Sprog
malayalam
Køn
Mand: 222, Kvinde: 80 og Ukendt: 0
Antal højttalere
302
Alder
18-50
Oversigt
Titel
malayalam Sprogdatasæt
Datasættype
Podcast
Beskrivelse
Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
40
Prøvefrekvens
16 Khz
Audio Channel
Mono
Optageplatform
Web Sourcing
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Indien
Sprog
malayalam
Køn
Mand: 53, Kvinde: 26 og Ukendt: 0
Antal højttalere
79
Alder
18-50
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.

Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning