amerikansk engelsk datasæt
Datasæt af høj kvalitet i amerikansk engelsk til AI og talemodeller
Oversigt
Titel (sprog)
US engelsk sprogdatasæt
Datasættyper
Callcenter, Medier (Podcast), Medicinsk
Land
United States
Beskrivelse
Dette datasæt indeholder uskripterede syntetiske agent-kunde-samtaler (5-15 minutter), licenserbare public domain lyd- eller videofiler såsom interviews og podcasts med 1 til 5 deltagere (15-60 minutter) samt medie- og medicinske datasættyper til omfattende forskning i tale og sprog.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Call center | 8 kHz | 2 højttalere | Mono | 10,196:00:00 | 1,052 |
| Call center | 8 kHz | 2 højttalere | Dual | 597:26:43 | På forespørgsel |
| Mediedata | 16 kHz | Flere højttalere | Mono | 620:23:43 | 5,466 |
| Medicin | 8 kHz | 2 højttalere | Mono | 1,480:30:33 | 697 |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning