malaysisk datasæt
Indstil data Melayu
Malaysisk callcenter-, generel samtale- og podcastdatasæt af høj kvalitet til AI- og talemodeller
Oversigt
Titel (sprog)
Malaysisk sprogdatasæt
Datasættyper
Callcenter, generel samtale, mediedata (podcastdata)
Land
Malaysia, Indonesien, Brunei og Singapore
Beskrivelse
Uskripterede telefonsamtaler mellem to personer på malaysisk fra Malaysia er tilgængelige med varigheder på 15 til 60 minutter, sammen med licenserbare lyd- eller videofiler i det offentlige domæne, såsom interviews og podcasts med 1 til 5 deltagere, også fra 15 til 60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Generel samtale | 8 kHz | 2 højttalere | Dual | 239:49:43 | 432 |
| Generel samtale | 48 kHz | 2 højttalere | Mono | 90:19:23 | 140 |
| Mediedata | 16 kHz | Multipal-højttalere | Mono | 343:57:16 | 907 |
| Call center | 8 kHz | 2 højttalere | Mono | 2,000:00:00 | På forespørgsel |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning