Bengalsk datasæt

বাংলা ডেটাসেট

Bengali-opkaldscenter af høj kvalitet, generel samtale og podcast-datasæt til kunstig intelligens og talemodeller

Oversigt

Titel (sprog)

Bengalsk sprogdatasæt

Datasættyper

Callcenter, Generel samtale, Mediedata (Podcastdata), Skrevet monolog

Land

Indien

Beskrivelse

Uskriptbaserede, syntetiske telefonsamtaler mellem en agent og en kunde er tilgængelige med en omtrentlig varighed på mellem 5 og 15 minutter. Derudover er licenserbare, offentligt tilgængelige lyd- eller videofiler, såsom interviews, podcasts og lignende indhold med 1 til 5 deltagere, tilgængelige med en omtrentlig varighed på mellem 15 og 60 minutter.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Datasættype Sampling Rate Højttalere Kanal Samlede timer Samlet antal højttalere
Call center 8 kHz 2 højttalere Dual 117:03:45 498
Generel samtale 8 kHz 2 højttalere Dual 168:13:39 458
Mediedata 16 kHz Flere højttalere Mono 24:58:58 90
Manuskriptmonolog 24 kHz Enkel højttaler Mono 2,300:00:00 På forespørgsel

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Dette felt er til validering og bør overlades uændret.
  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.