Assamisk datasæt
অসমীয়া ডাটাছেট
Assamesisk callcenter, generel samtale og podcast-datasæt af høj kvalitet til AI- og talemodeller
Oversigt
Titel (sprog)
Assamisk sprog datasæt
Datasættyper
Callcenter, generel samtale, mediedata (podcastdata)
Land
Indien
Beskrivelse
Uskriptbaserede, syntetiske telefonsamtaler mellem en agent og en kunde er tilgængelige med en omtrentlig varighed på mellem 5 og 15 minutter. Derudover er licenserbare, offentligt tilgængelige lyd- eller videofiler, såsom interviews, podcasts og lignende indhold med 1 til 5 deltagere, tilgængelige med en omtrentlig varighed på mellem 15 og 60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Call center | 44 kHz | 2 højttalere | Dual | 35:41:55 | 420 |
| Generel samtale | 8 kHz | 2 højttalere | Dual | 96:24:41 | 252 |
| Mediedata | 16 kHz | Flere højttalere | Mono | 28:41:59 | 122 |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning