malaysisk datasæt

Indstil data Melayu

Malaysisk callcenter-, generel samtale- og podcastdatasæt af høj kvalitet til AI- og talemodeller

Oversigt

Titel (sprog)

Malaysisk sprogdatasæt

Datasættyper

Callcenter, generel samtale, mediedata (podcastdata)

Land

Malaysia, Indonesien, Brunei og Singapore

Beskrivelse

Uskripterede telefonsamtaler mellem to personer på malaysisk fra Malaysia er tilgængelige med varigheder på 15 til 60 minutter, sammen med licenserbare lyd- eller videofiler i det offentlige domæne, såsom interviews og podcasts med 1 til 5 deltagere, også fra 15 til 60 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Datasættype Sampling Rate Højttalere Kanal Samlede timer Samlet antal højttalere
Generel samtale 8 kHz 2 højttalere Dual 239:49:43 432
Generel samtale 48 kHz 2 højttalere Mono 90:19:23 140
Mediedata 16 kHz Multipal-højttalere Mono 343:57:16 907
Call center 8 kHz 2 højttalere Mono 2,000:00:00 På forespørgsel

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Amazon
Google
microsoft
Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Dette felt er til validering og bør overlades uændret.
  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.