Polsk datasæt
Polski dansk dansk
Oversigt
Titel
polsk Sprogdatasæt
Datasættype
Medie lyd
Beskrivelse
Licenserbare offentlige lyd-/videofiler såsom interviews, podcasts osv. – 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
269
Prøvefrekvens
16 kHz
Audio Channel
Mono
Optageplatform
Web Sourcing
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Polen
Sprog
polsk
Køn
Kvinde 173, Mand 354, Ukendt 6
Antal højttalere
533
Alder
18-50
Oversigt
Titel
polsk Sprogdatasæt
Datasættype
TTS
Beskrivelse
Optagelser med enkelt ytring, som har tendens til at falde i intervallet 5 til 30 sekunder.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
1,482
Prøvefrekvens
48 kHz
Audio Channel
Mono
Optageplatform
Mobile App
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Polen
Sprog
polsk
Køn
Kvinde 1324, Mand 701, Ukendt 24
Antal højttalere
2,049
Alder
18-50
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning