Thai datasæt
ชุดข้อมูลภาษาไทย
Højkvalitets thailandsk generel samtale, manuskriptbaseret monolog og mediedatasæt (podcast) til AI og talemodeller
Oversigt
Titel (sprog)
Thai sprogdatasæt
Datasættyper
Generel samtale, Medier (podcast), Skrevet monolog
Land
Thailand
Produktbeskrivelse
Dette datasæt indeholder uskripterede telefonsamtaler mellem to personer på hebraisk fra Israel (15-60 minutter), licenserbare lyd- eller videofiler i det offentlige domæne med 1 til 5 deltagere (15-60 minutter) og skripterede monologer, hvor en enkelt taler leverer foruddefineret indhold til træning og evaluering af tale- og sprogmodeller.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Datasætdetaljer
| Datasættype | Sampling Rate | Højttalere | Kanal | Samlede timer | Samlet antal højttalere |
|---|---|---|---|---|---|
| Generel samtale | 8 kHz | 2 højttalere | Dual | 211:48:42 | 170 |
| Mediedata | 16 kHz | Enkel højttaler | Mono | 249:14:31 | 670 |
| Manuskriptmonolog | 24 kHz | Enkel højttaler | Mono | 500:00:00 | På forespørgsel |
Fremhævede klienter
Styrke teams til at opbygge verdensledende AI-produkter.
Kan du ikke finde det, du leder efter?
Nye hyldedatasæt bliver indsamlet på tværs af alle datatyper
Kontakt os nu for at give slip på dine bekymringer om dataindsamling af lyd/taletræning