Kinesisk engelsk datasæt
中英文数据集
Oversigt
Titel
Kinesisk engelsk Sprogdatasæt
Datasættype
Callcenter
Beskrivelse
Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
169
Prøvefrekvens
8 kHz
Audio Channel
Dual
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Kina
Sprog
Kinesisk engelsk
Køn
Kvinde 1790, Mand 523, Ukendt 13
Antal højttalere
2,326
Alder
18-50
Oversigt
Titel
Kinesisk engelsk Sprogdatasæt
Datasættype
Medie lyd
Beskrivelse
Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
249
Prøvefrekvens
16 kHz
Audio Channel
Mono
Optageplatform
Web Sourcing
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Kina
Sprog
Kinesisk engelsk
Køn
Kvinde 126, Mand 346, Ukendt 6
Antal højttalere
478
Alder
18-50
Oversigt
Titel
Wuhan Sprogdatasæt
Datasættype
Spontan dialog
Samlet antal timer
500
Prøvefrekvens
16 kHz
kinesisk Sprogdatasæt
TTS
300
16 kHz
Hokkienese Sprogdatasæt
Spontan dialog
100
16 kHz
Shanghai Sprogdatasæt
Spontan dialog
500
16 kHz
Sichuan Sprogdatasæt
Spontan dialog
500
16 kHz
engelsk (kinesisk) Sprogdatasæt
Spontant manuskript
2,000
16 kHz
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning