Malayalam datasæt
മലയാളം ഡാറ്റാസെറ്റ്
Højkvalitets malayalam-generel samtale og podcastdatasæt til AI og talemodeller
Oversigt
Titel (sprog)
Malayalam-sprogdatasæt
Datasættyper
Generel samtale, mediedata (podcast)
Land
Indien
Beskrivelse
Dette datasæt indeholder uskripterede syntetiske telefonsamtaler mellem en agent og en kunde (5-15 minutter) og licenserbare lyd- eller videofiler i det offentlige domæne, såsom interviews og podcasts med 1 til 5 deltagere (15-60 minutter).
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Generel samtale | 8 kHz | 2 højttalere | Dual | 70:46:30 | 576 |
| Generel samtale | 8 kHz | 2 højttalere | Dual | 149:39:33 | 296 |
| Mediedata | 16 kHz | Flere højttalere | Mono | 12:39:24 | 81 |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning