Bengalsk datasæt
বাংলা ডেটাসেট
Bengali-opkaldscenter af høj kvalitet, generel samtale og podcast-datasæt til kunstig intelligens og talemodeller
Oversigt
Titel (sprog)
Bengalsk sprogdatasæt
Datasættyper
Callcenter, Generel samtale, Mediedata (Podcastdata), Skrevet monolog
Land
Indien
Beskrivelse
Uskriptbaserede, syntetiske telefonsamtaler mellem en agent og en kunde er tilgængelige med en omtrentlig varighed på mellem 5 og 15 minutter. Derudover er licenserbare, offentligt tilgængelige lyd- eller videofiler, såsom interviews, podcasts og lignende indhold med 1 til 5 deltagere, tilgængelige med en omtrentlig varighed på mellem 15 og 60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Call center | 8 kHz | 2 højttalere | Dual | 117:03:45 | 498 |
| Generel samtale | 8 kHz | 2 højttalere | Dual | 168:13:39 | 458 |
| Mediedata | 16 kHz | Flere højttalere | Mono | 24:58:58 | 90 |
| Manuskriptmonolog | 24 kHz | Enkel højttaler | Mono | 2,300:00:00 | På forespørgsel |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning