amerikansk engelsk datasæt

Datasæt af høj kvalitet i amerikansk engelsk til AI og talemodeller

Oversigt

Titel (sprog)

US engelsk sprogdatasæt

Datasættyper

Callcenter, Medier (Podcast), Medicinsk

Land

United States

Beskrivelse

Dette datasæt indeholder uskripterede syntetiske agent-kunde-samtaler (5-15 minutter), licenserbare public domain lyd- eller videofiler såsom interviews og podcasts med 1 til 5 deltagere (15-60 minutter) samt medie- og medicinske datasættyper til omfattende forskning i tale og sprog.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Datasætdetaljer

Datasættype Sampling Rate Højttalere Kanal Samlede timer Samlet antal højttalere
Call center 8 kHz 2 højttalere Mono 10,196:00:00 1,052
Call center 8 kHz 2 højttalere Dual 597:26:43 På forespørgsel
Mediedata 16 kHz Flere højttalere Mono 620:23:43 5,466
Medicin 8 kHz 2 højttalere Mono 1,480:30:33 697

Fremhævede klienter

Styrke teams til at opbygge verdensledende AI-produkter.

Shaip kontakt os

Kan du ikke finde det, du leder efter?

Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper

Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning

  • Dette felt er til validering og bør overlades uændret.
  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik og Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.