Tysk datasæt
Deutscher Datensatz
Tysk callcenter af høj kvalitet og IVR-datasæt til kunstig intelligens og talemodeller
Oversigt
Titel (sprog)
Tysk sprog datasæt
Datasættyper
Callcenter, Generel samtale, Musik, Manuskriptmonolog
Land
Tyskland
Beskrivelse
Uscripterede, syntetiske telefonsamtaler mellem en agent og en kunde er tilgængelige med en omtrentlig varighed på 5 til 15 minutter, sammen med datatyperne H2H, H2M og scriptede monologer.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Call center | 8 kHz | 2 højttalere | Dual | 64:17:27 | På forespørgsel |
| H2H | 8 kHz | 2 højttalere | Mono | 60:00:00 | 96 |
| H2M | 8 kHz | 2 højttalere | Mono | 88:00:00 | 659 |
| Manuskriptmonolog | 24 kHz | Enkel højttaler | Mono | 1,600:00:00 | På forespørgsel |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning
Oversigt
Emne
Tysk Sprogdatasæt
Datasættype
Callcenter
Beskrivelse
Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
64
Prøvefrekvens
8 kHz
Audio Channel
Stereo
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Tysk
Sprog
Tysk
Køn
Kvinde 478, Mand 1440, Ukendt 0
Antal højttalere
1,918
Alder
18-50
Oversigt
Emne
Tysk Sprogdatasæt
Datasættype
IVR
Beskrivelse
Menneske til maskine. En IVR type flow, hvor der er en TTS prompt (f.eks. ”Hvordan kan jeg hjælpe dig”) efterfulgt af en spontan menneskelig reaktion.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
Samlet antal timer
200
Prøvefrekvens
8 kHz
Audio Channel
Stereo
Optageplatform
desktop
Lyd Format
. Wav
Transskriptionsformat
.json
WER (%)
5
Demografiske datasæt
Land
Tysk
Sprog
Tysk
Køn
Kvinde 10115, Mand 8750, Ukendt 0
Antal højttalere
18,865
Alder
18-50