Malayalam datasæt

മലയാളം ഡാറ്റാസെറ്റ്

Højkvalitets malayalam-generel samtale og podcastdatasæt til AI og talemodeller

Oversigt

Titel (sprog)

Malayalam-sprogdatasæt

Datasættyper

Generel samtale, mediedata (podcast)

Land

Indien

Beskrivelse

Dette datasæt indeholder uskripterede syntetiske telefonsamtaler mellem en agent og en kunde (5-15 minutter) og licenserbare lyd- eller videofiler i det offentlige domæne, såsom interviews og podcasts med 1 til 5 deltagere (15-60 minutter).

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Datasættype Sampling Rate Højttalere Kanal Samlede timer Samlet antal højttalere
Generel samtale 8 kHz 2 højttalere Dual 70:46:30 576
Generel samtale 8 kHz 2 højttalere Dual 149:39:33 296
Mediedata 16 kHz Flere højttalere Mono 12:39:24 81

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Amazon
Google
microsoft
Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Dette felt er til validering og bør overlades uændret.
  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.