Mest betroede tjenester til indsamling af taledata til din AI
Træn dine NLP -modeller, VA'er, TTS -prototyper og mere med samtaledata af høj kvalitet med vores tjenester til indsamling af lyd- og taledata
Opdag lyddatapipelines uden flaskehalse
Fremhævede klienter
Professionel lyd-/stemmedataindsamlingstjenester
Ethvert emne. Ethvert scenarie.
Hos Shaip ligger vores ekspertise i at skabe højkvalitets taledatasæt designet til forskellige AI/ML-krav. Vi tilbyder et bredt udvalg af sprog og optager i forskellige indstillinger, hvilket gør vores datasæt omfattende og tilpasningsdygtige. Odit fokus er på at fodre modeller med den højeste mængde brugerdefinerede taledata på mindst mulig tid. Med os ombord kan du forvente:
- Kurateret højkvalitets flersproget lyd-/stemmedata for at forbedre nøjagtigheden
- Højest mulig niveau af domænespecificitet til target forskelligartet scenarie setup
- Skaler din ML-model, så den passer til forskellig demografi og vertikaler
- Optagelsesmiljøer: Studio kvalitet, med krystalklar lyd med minimal baggrundsstøj, & Naturlige miljøer, hvor optagelser inkorporerer omgivende lyde for at efterligne situationer i den virkelige verden.
100 +
55K +
Timer med taledata
250 +
Projekter
60 +
Sprog (100+ dialekter)
8 / 16 / 44 / 48 kHz
Samplingfrekvens
Vores ekspertise
Juster lyddata til smartere NLP-modeller
Shaip tilbyder ende-til-ende-tale-/lyddataindsamlingstjenester på over 100+ sprog for at gøre det muligt for stemmeaktiverede teknologier at imødekomme et mangfoldigt sæt publikum over hele kloden. Vi kan arbejde på projekter af enhver størrelse og størrelse; fra licensering af eksisterende lyddatasæt på hylden til administration af tilpasset indsamling af lyddata til lydtranskription og annotering. Uanset hvor stort dit taledataindsamlingsprojekt er, kan vi tilpasse lydopsamlingstjenesterne til dine behov for at bygge NLP-datasæt af høj kvalitet, der målretter mod dialekter, toner og sprog. Vælg mellem vores brede udvalg af taledatasæt og ressourcer til indsamling af lyddata til intelligente opsætninger, der muliggør stemme.
Monolog scripted & spontan tale
Den fokuserer på at behandle tale fra en enkelt taler. Udnyt scriptede prompter til at føres ind i enkeltkanals lydfiler, hvilket sikrer opfangning af unikke talemønstre, toner og nuancer, der er specifikke for den enkelte.
Dialog scripted & spontan tale
Interaktion med to personer, replikerer samtaler og dialoger fra den virkelige verden med flersproget eksponering via to-kanals filer og transskriberede ressourcer.
Gruppe / Muti-party
Samtaler
Diskussioner med flere personer, indfanger gruppedynamik, overlapninger og varierede toner for præcist at træne talemodeller.
Wake-word / Key Phrase / Ytring Collection
Træn AI'er til at identificere nøglesætninger eller vække ord eller ytringer med lignende betydninger ved at bruge forskellige, rige og autentiske ytringer til avanceret naturlig sprogbehandling og -forståelse.
Akustiske data
Kollektion
Vi kan professionelt optage lyddata i studiekvalitet, hvad enten det er restauranter, kontorer eller hjem eller fra forskellige miljøer og sprog, mens vi dækker et bredere akustisk område (omfattende lyddatasæt).
Automatisk talegenkendelse (ASR)
Forbedre nøjagtigheden af dine automatiske talegenkendelsessystemer (ASR) ved at have adgang til state-of-art diversificerede tale-/lyddatasæt fra en bred vifte af demografi.
Flersproget tale/lydtræningsdata
Vores dygtige sprogfolk over hele kloden tilbyder flersprogede lyd-/taledata på forskellige sprog og dialekter. Denne indsats fremmer global kommunikation og bygger bro over sprogbarrierer og bidrager til mere inkluderende og effektive AI-løsninger.
Tekst-til-tale
(TTS)
Byg en tekst-til-tale (TTS) flersproget model med hjælp fra vores globale arbejdsstyrke, som hjælper dig med at indsamle taledata på 150+ sprog og dialekter for at forbedre dine AI-modeller fra kontrol i bilen til chatbots og læringsløsninger med høj- kvalitetslyddata.
Call center
Samtaler
Ægte udvekslinger mellem agenter og kunder, der understøtter adskillige sprog såsom spansk, tysk, amerikansk engelsk, bengali, japansk, kinesisk og hindi.
Succeshistorier
Samtale AI-datasæt med over 3k timers data på tværs af 8 sprog
På udkig efter at bygge en flersproget platform til indiske sprog, samarbejdede klienten med Shaip om at indsamle, segmentere og transskribere store datasæt på flere indiske sprog. Dette ville hjælpe med at udvikle effektive talemodeller, der kunne drive kundens innovative nye platform.
problem: Over 3,000 timers lyddata indsamlet på 8 indiske sprog, segmenteret og transskriberet for at udvikle automatisk talegenkendelse.
Opløsning: Vi leverede dataindsamling, segmentering, transskription og leverede JSON-filer med metadata. Vi indsamlede 3000 timers lyddata på 8 indiske sprog i skala til kundens taleteknologiprojekt.
Grunde til at vælge Shaip som din troværdige taledataindsamlingspartner
Mennesker
Dedikerede og uddannede hold:
- 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
- Godkendt projektledelsesteam
- Erfaren produktudviklingsteam
- Talent Pool Sourcing & Onboarding Team
Proces
Højeste proceseffektivitet sikres med:
- Robust 6 Sigma Stage-Gate-proces
- Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
- Løbende forbedring og feedback
perron
Den patenterede platform giver fordele:
- Web-baseret ende-til-ende platform
- Upåklagelig kvalitet
- Hurtigere TAT
- Problemfri levering
Mennesker
Dedikerede og uddannede hold:
- 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
- Godkendt projektledelsesteam
- Erfaren produktudviklingsteam
- Talent Pool Sourcing & Onboarding Team
Proces
Højeste proceseffektivitet sikres med:
- Robust 6 Sigma Stage-Gate-proces
- Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
- Løbende forbedring og feedback
perron
Den patenterede platform giver fordele:
- Web-baseret ende-til-ende platform
- Upåklagelig kvalitet
- Hurtigere TAT
- Problemfri levering
Off-the-shelf Tale / Audio Datasæt
Detaljer | Corpus ID (Unikt) | Søgeord | Sprogdatasæt | Sprogkode | Prøvefrekvens | Datasættype | Samlede lydtimer | Kort beskrivelse | Datasætbeskrivelse | Audio Channel | Optageplatform | WER (%) | Lyd Format | Transskriptionsformat | Use Case | Antal højttalere | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
New York English_GC_8 | New York engelsk | New York engelsk | da_DK | 8 kHz | Generel samtale | 107 | New York engelsk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 118, Mand 114, Ukendt 0 | Kontakt | |
Russisk_SM_48 | russisk | russisk | ru-RU | 48 kHz | Manuskriptmonolog | 2,398 | Russisk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1689 Mand 1937 Ukendt 214 | Kontakt | |
Punjabi_MA | punjabi | Punjabi (I pipeline) | punjabi | Medie lyd | 40 | Punjabi (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_GC | punjabi | Punjabi (I pipeline) | punjabi | Generel samtale | 100 | Punjabi (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_CC_8 | punjabi | Punjabi (I pipeline) | punjabi | Callcenter | 60 | Punjabi (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Polsk Polen_SM_48 | Polsk (Polen) | Polsk (Polen) | PL-PL | 48 kHz | Manuskriptmonolog | 1,482 | Polsk Polen - Manuskriptmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1324 Mand 701 Ukendt 24 | Kontakt | |
Polsk_MA_16 | polsk | polsk | pl_PL | 16 kHz | Medie lyd | 269 | Polsk medie lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 173 Mand 354 Ukendt 6 | Kontakt | |
Oriya_MA | oriya | Oriya (I Pipeline) | eller_IN | Medie lyd | 40 | Oriya (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_GC | oriya | Oriya (I Pipeline) | eller_IN | Generel samtale | 100 | Oriya (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_CC_8 | oriya | Oriya (I Pipeline) | eller_IN | Callcenter | 60 | Oriya (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
New Zealand_MA_16 | New Zealand engelsk | New Zealand engelsk | da_NZ | 16 kHz | Medie lyd | 400 | New Zealand engelske medier lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 367, mand 678, Ukendt 26 | Kontakt | |
New Zealand_GC_8 | New Zealand engelsk | New Zealand engelsk | da_NZ | 8 kHz | Generel samtale | 148 | New Zealand engelsk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 167, mand 121, Ukendt 4 | Kontakt | |
New York English_MA_16 | New York engelsk | New York engelsk | da_DK | 16 kHz | Medie lyd | 140 | New York engelske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 66, Mand 230, Ukendt 11 | Kontakt | |
Skotsk_GC_8 | Skotsk (engelsk accent) | Skotsk (engelsk accent) | da_AB | 8 kHz | Generel samtale | 292 | Skotske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 285 , Mand 260, Ukendt 3 | Kontakt | |
New York English_CC_8 | New York engelsk | New York engelsk | da_DK | 8 kHz | Callcenter | 103 | New York engelsk Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 610, Mand 532, Ukendt 0 | Kontakt | |
Holland_SM_48 | Hollandsk | Hollandsk | nl-NL | 48 kHz | Manuskriptmonolog | 1,205 | hollandsk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1285 Mand 531 Ukendt 3 | Kontakt | |
Mexicansk_SM_48 | Spansk (Mexico) | Spansk (Mexico) | es-MX | 48 kHz | Manuskriptmonolog | 1,492 | Mexicansk spansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1016 Mand 1069 Ukendt 95 | Kontakt | |
Marathi_MA | Marathi | Marathi (I Pipeline) | mr_IN | Medie lyd | 40 | Marathi (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_GC | Marathi | Marathi (I Pipeline) | mr_IN | Generel samtale | 100 | Marathi (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_CC_8 | Marathi | Marathi (I Pipeline) | mr_IN | Callcenter | 60 | Marathi (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_MA | malayalam | Malayalam (I pipeline) | ml_IN | Medie lyd | 40 | Malayalam (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_GC | malayalam | Malayalam (I pipeline) | ml_IN | Generel samtale | 100 | Malayalam (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_CC_8 | malayalam | Malayalam (I pipeline) | ml_IN | Callcenter | 60 | Malayalam (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malay_MA_16 | Malay | Malay | ms_MIN | 16 kHz | Medie lyd | 344 | Malay Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 236, Mand 626, Ukendt 47 | Kontakt | |
Malay_GC_8 | Malay | Malay | ms_MIN | 8 kHz | Generel samtale | 266 | Malayisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, malaysisk i Malaysia | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 316, Mand 176, Ukendt 0 | Kontakt | |
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Generel samtale | 553 | Telugu generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 574 , Mand 564, Ukendt 0 | Kontakt | |
UK English_WW_16 | UK engelsk | UK engelsk | da_dk | 16 kHz | Wake Word | 200 højttalere | Wake Word engelsk engelsk | nøglesætningsindsamling af data
| 1 kanal | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Køn: 50 % mænd, 50 % kvinder, +/- 10 %. | Kontakt | |
Welsh_GC_8 | walisisk (engelsk accent) | walisisk (engelsk accent) | da_WL | 8 kHz | Generel samtale | 278 | walisiske generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 270, Mand 324, Ukendt 0 | Kontakt | |
Vietnamesisk_MA_16 | vietnamesisk | vietnamesisk | vi_VN | 16 kHz | Medie lyd | 257 | vietnamesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 249, mand 200, Ukendte 45 | Kontakt | |
Vietnamesisk_GC_8 | vietnamesisk | vietnamesisk | vi_VN | 8 kHz | Generel samtale | 295 | Vietnamesiske generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, nordlige (f.eks. Hanoi), centrale og sydlige (f.eks. Ho Chi Minh City). | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 400, mand 380, Ukendte 2 | Kontakt | |
Tyrkisk Tyrkiet_SM_48 | Tyrkisk Tyrkiet | Tyrkisk Tyrkiet | tr-TR | 48 kHz | Manuskriptmonolog | 2,027 | Tyrkisk Tyrkiet | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1561 Mand 1241 Ukendt 31 | Kontakt | |
Thai_MA_8 | Thai | Thai | th_TH | 16 kHz | Medie lyd | 173 | Thai medie lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 143, Mand 502, Ukendt 26 | Kontakt | |
Thai_GC_8 | Thai | Thai | th_TH | 8 kHz | Generel samtale | 183 | Thai generel samtale | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, et uformelt register brugt mellem venner | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 338, Mand 96, Ukendt 8 | Kontakt | |
Telugu_MA | telugu | Telugu (I pipeline) | te_IN | Medie lyd | 20 | Telugu (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC | telugu | Telugu (I pipeline) | te_IN | Generel samtale | 50 | Telugu (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_CC_8 | telugu | Telugu (I pipeline) | te_IN | Callcenter | 30 | Telugu (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Medie lyd | 648 | Telugu Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 207, Mand 963, Ukendt 2 | Kontakt | |
Koreansk_SM_48 | koreansk | koreansk | ko-KR | 48 kHz | Manuskriptmonolog | 1,955 | Koreansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1195 Mand 1134 Ukendt 122 | Kontakt | |
Tamil_MA | tamil | Tamil (I pipeline) | ta_IN | Medie lyd | 40 | Tamil (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_GC | tamil | Tamil (I pipeline) | ta_IN | Generel samtale | 100 | Tamil (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_CC_8 | tamil | Tamil (I pipeline) | ta_IN | Callcenter | 60 | Tamil (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Svensk_MA_16 | Svensk | Svensk | sv_SE | 16 kHz | Medie lyd | 278 | Svenske mediers lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 195, Mand 500, Ukendt 21 | Kontakt | |
Svensk_CC_8 | Svensk | Svensk | sv_SE | 8 kHz | Callcenter | 250 | Svenske Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1581, Mand 727, Ukendt 2 | Kontakt | |
Swahili_MA_16 | Swahili | Swahili | sw_KE | 16 kHz | Medie lyd | 265 | Swahili Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 118, Mand 493, Ukendt 25 | Kontakt | |
Swahili_CC_8 | Swahili | Swahili | sw_KE | 8 kHz | Callcenter | 230 | Swahili Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 611, Mand 833, Ukendt 0 | Kontakt | |
Sydafrikansk engelsk_MA_16 | Sydafrikansk engelsk | Sydafrikansk engelsk | da_ZA | 16 kHz | Medie lyd | 251 | Sydafrikanske engelske mediers lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 235, Mand 432, Ukendt 36 | Kontakt | |
Sydafrikansk engelsk_CC_8 | Sydafrikansk engelsk | Sydafrikansk engelsk | da_ZA | 8 kHz | Callcenter | 261 | South African English Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1274 , Mand 935 , Ukendt 1 | Kontakt | |
Singapore_MA_16 | Singapore engelsk | Singapore engelsk | da_SG | 16 kHz | Medie lyd | 247 | Singapore Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 160, Mand 455, Ukendt 37 | Kontakt | |
Singapore_CC_8 | Singapore engelsk | Singapore engelsk | da_SG | 8 kHz | Callcenter | 218 | Singapore Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 2139 , Mand 884, Ukendt 21 | Kontakt | |
Boston_CC_8 | Boston engelsk | Boston engelsk | da_DK | 8 kHz | Callcenter | 177 | Boston Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 605, Mand: 711 og Ukendt: 0 | Kontakt | |
Engelsk Deep South_CC_8 | Engelsk Deep South | Engelsk Deep South | da_DK | 8 kHz | Callcenter | 151 | Engelsk Deep South Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 221 , Mand 1004 , Ukendt 7 | Kontakt | |
Danish_SM_48 | Danske | Danske | da-DK | 48 kHz | Manuskriptmonolog | 2,579 | Dansk skriftmonolog | Enkelt-ytring optagelser, som har tendens til at falde i 5 til 30 sekunders rækkevidde, dansk fra Danmark | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1551 Mand 1233 Ukendt 42 | Kontakt | |
Danish_MA_16 | Danske | Danske | da_DK | 16 kHz | Medie lyd | 664 | Danske Medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 369, Mand: 864, Ukendt: 27 | Kontakt | |
Danish_GC_8 | Danske | Danske | da_DK | 8 kHz | Generel samtale | 372 | Danske almindelige samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 311, Mand: 417, Ukendt: 0 | Kontakt | |
Traditionel kinesisk_SM_48 | Traditionelt kinesisk | Traditionelt kinesisk | zh-TW | 48 kHz | Manuskriptmonolog | 1,028 | Traditionelt kinesisk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1069 Mand 262 Ukendt 3 | Kontakt | |
Kinesisk forenklet_SM_48 | Forenklet kinesisk | Forenklet kinesisk | zh-CN | 48 kHz | Manuskriptmonolog | 2,762 | Forenklet kinesisk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1920 Mand 1535 Ukendt 270 | Kontakt | |
kinesisk_MA_16 | Kinesisk engelsk | Kinesisk engelsk | da_DK | 16 kHz | Medie lyd | 249 | Kinesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 126, Mand: 346 og Ukendt: 6 | Kontakt | |
kinesisk_CC_8 | Kinesisk engelsk | Kinesisk engelsk | da_DK | 8 kHz | Callcenter | 169 | Kinesiske Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 1790, Mand: 523 og Ukendt: 13 | Kontakt | |
Canadisk_SM_48 | Canadisk fransk | Canadisk fransk | fr-CA | 48 kHz | Manuskriptmonolog | 1,222 | Canadisk fransk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 974 Mand 631 Ukendt 1 | Kontakt | |
Boston_MA_16 | Boston engelsk | Boston engelsk | da_DK | 16 kHz | Medie lyd | 93 | Boston Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 43, Mand: 181 og Ukendt: 2 | Kontakt | |
Boston_GC_8 | Boston engelsk | Boston engelsk | da_DK | 8 kHz | Generel samtale | 32 | Boston generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 53, Mand: 83 og Ukendt: 0 | Kontakt | |
Engelsk Deep South_GC_8 | Engelsk Deep South | Engelsk Deep South | da_DK | 8 kHz | Generel samtale | 56 | Engelsk Deep South Generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 99, Mand 31, Ukendt 0 | Kontakt | |
Bengali_MA | bengalsk | Bengali (I Pipeline) | bn_IN | Medie lyd | 40 | Bengali (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_GC | bengalsk | Bengali (I Pipeline) | bn_IN | Generel samtale | 100 | Bengali (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_CC_8 | bengalsk | Bengali (I Pipeline) | bn_IN | Callcenter | 60 | Bengali (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_MA | Assamesisk | Assamisk (I pipeline) | som i | Medie lyd | 40 | Assamisk (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_GC | Assamesisk | Assamisk (I pipeline) | som i | Generel samtale | 100 | Assamisk (I Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamisk_CC_8 | Assamesisk | Assamisk (I pipeline) | som i | Callcenter | 60 | Assamesiske (I Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Arabisk_SM_48 | arabisk | arabisk | ar-SA | 48 kHz | Manuskriptmonolog | 1,947 | Monolog med arabisk skrift | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 838 Mand 1209 Ukendt 78 | Kontakt | |
Arabisk_GC_8 | arabisk | arabisk | ar_AE | 8 kHz | Generel samtale | 292 | Arabisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, arabisk fra Golflandene | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 171, Mand: 534 og Ukendt: 1 | Kontakt | |
Afrikaans_MA_16 | Afrikaans | Afrikaans | af_ZA | 16 kHz | Medie lyd | 658 | afrikanske mediefiler | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 750, Mand: 1278 og Ukendt: 52 | Kontakt | |
Afrikaans_GC_8 | Afrikaans | Afrikaans | af_ZA | 8 kHz | Generel samtale | 368 | Afrikaans generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, afrikaans tales i Afrika | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 502, Mand: 390 og Ukendt: 2 | Kontakt | |
da_US_MA_16 | Afroamerikansk sprog | Afroamerikansk sprog | da_DK | 16 kHz | Medie lyd | 154 | African American Vernacular Media data | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 151, Mand: 150 og Ukendt: 10 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Medie lyd | 216 | HINGLISH Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 75, Mand 380, Ukendt 0 | Kontakt | |
Koreansk_MA_16 | koreansk | koreansk | ko_KR | 16 kHz | Medie lyd | 204 | Koreanske medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 70 Mand 303, Ukendt 25 | Kontakt | |
Koreansk_CC_8 | koreansk | koreansk | ko_KR | 8 kHz | Callcenter | 107 | Koreanske Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1086, Mand 210, Ukendt 4 | Kontakt | |
Kannada_MA | Kannada | Kannada (I Pipeline) | kn_IN | Medie lyd | 40 | Kannada (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_GC | Kannada | Kannada (I Pipeline) | kn_IN | Generel samtale | 100 | Kannada (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_CC_8 | Kannada | Kannada (I Pipeline) | kn_IN | Callcenter | 60 | Kannada (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Japansk_SM_48 | japansk | japansk | ja-JP | 48 kHz | Manuskriptmonolog | 2,335 | Japansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1460 Mand 1221 Ukendt 194 | Kontakt | |
Irsk_GC_8 | Irish | Irish | da_IE | 8 kHz | Generel samtale | 192 | Irske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 213 , Mand 153 , Ukendt 0 | Kontakt | |
Indonesisk_MA_16 | indonesisk | indonesisk | jeg gjorde | 16 kHz | Medie lyd | 643 | Indonesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 746, Mand 1507, Ukendt 129 | Kontakt | |
Indonesisk_GC_8 | indonesisk | indonesisk | jeg gjorde | 8 kHz | Generel samtale | 496 | Indonesiske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, indonesisk | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 524, Mand 454, Ukendt 2 | Kontakt | |
Hispanic_MA_16 | Spansk engelsk | Spansk engelsk | da_DK | 16 kHz | Medie lyd | 155 | Hispanic Call Media-lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 140, Mand 219, Ukendt 5 | Kontakt | |
Hispanic_CC_8 | Spansk engelsk | Spansk engelsk | da_DK | 8 kHz | Callcenter | 212 | Hispanic Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 822, Mand 1262, Ukendt 0 | Kontakt | |
da_US_CC_8 | Afroamerikansk sprog | Afroamerikansk sprog | da_DK | 8 kHz | Call-center | 211 | African American Vernacular Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 612, Mand: 1242 og Ukendt: 12 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Callcenter | 208 | HINGLISH Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 822, Mand 1262, Ukendt 0 | Kontakt | |
Hindi_SM_48 | Hindi | Hindi | hi-IN | 48 kHz | Manuskriptmonolog | 2,867 | Hindi scripted monolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1977 Mand 1864 Ukendt 147 | Kontakt | |
Hindi_MA_16 | Hindi | Hindi | hej_IN | 16 kHz | Medie lyd | 219 | Hindi Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 83 , Mand 309, Ukendt 0 | Kontakt | |
Hebraisk_MA_16 | hebraisk | hebraisk | han_IL | 16 kHz | Medie lyd | 427 | Hebraiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 361 , Mand 513, Ukendt 13 | Kontakt | |
Hebraisk_Generel Samtale_8 | hebraisk | hebraisk | han_IL | 8 kHz | Generel samtale | 399 | Hebraisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, hebraisk i Israel | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 414 , Mand 399 , Ukendt 1 | Kontakt | |
Gujarati_MA | gujarati | Gujarati (I pipeline) | gu_IN | Medie lyd | 40 | Gujarati (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_GC | gujarati | Gujarati (I pipeline) | gu_IN | Generel samtale | 100 | Gujarati (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_CC_8 | gujarati | Gujarati (I pipeline) | gu_IN | Callcenter | 60 | Gujarati (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tysk_IVR_8 | Tysk | Tysk | de-De | 8 kHz | IVR | 200 | Tyske IVR-data | Menneske til maskine. En IVR type flow, hvor der er en TTS prompt (f.eks. "Hvordan kan jeg hjælpe dig") efterfulgt af en spontan menneskelig reaktion | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 10115 Mand 8750 Ukendt 0 | Kontakt | ||
Tysk_CC_8 | Tysk | Tysk | de-De | 8 kHz | Callcenter | 64 | Tyske Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 478 Mand 1440 Ukendt 0 | Kontakt | ||
Engelsk Deep South_MA_16 | Engelsk Deep South | Engelsk Deep South | da_DK | 16 kHz | Medie lyd | 266 | Engelske Deep South Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 204, Mand 356, Ukendt 21 | Kontakt |
Tjenester tilbydes
Ekspert indsamling af lyddata er ikke alle-hands-on-deck til omfattende AI-opsætninger. Hos Shaip kan du endda overveje følgende tjenester for at gøre modeller langt mere udbredte end normalt:
Indsamling af tekstdata
Tjenester
Den sande værdi af Shaip kognitive dataindsamlingstjenester er, at det giver organisationer nøglen til at låse op for kritisk information, der findes i ustrukturerede data
Services til indsamling af billeddata
Sørg for, at din computervisionsmodel identificerer hvert billede præcist for problemfrit at kunne træne fremtidens næste generation af AI-modeller
Services til indsamling af videodata
Fokuser nu på computersyn sammen med NLP til træning af dine modeller i at identificere objekter, individer, afskrækkende midler og andre visuelle elementer til perfektion
Anbefalede ressourcer
Tilbyder
Lydkommentar til intelligente AI'er
Lydkommentartjenester har været en af Shaips styrke siden begyndelsen. Udvikle, træne og forbedre konversations-AI, chatbots og talegenkendelsesmotorer med vores avancerede lydannoteringstjenester.
Købervejledning
Købervejledning: Komplet guide til konversations-AI
Den chatbot, du har talt med, kører på et avanceret konversations-AI-system, der er trænet, testet og bygget ved hjælp af tonsvis af talegenkendelsesdatasæt.
Datakatalog
Off-the-Shelf Tale Data Katalog & Licens
Der er en lang række almindelige applikationer til taledata i AI-projekter. Vi tilbyder dig enorme mængder af højkvalitetsdata klar til din stemmegenkendelse.
Vil du bygge dit eget lyddatasæt?
Få kontakt med vores interne taledataindsamlingsekspert for at opsætte et lydlager, der bedst passer til dit behov
Ofte stillede spørgsmål (FAQ)
Indsamling af taledata for en ML-model refererer til processen med at indsamle lydoptagelser af talt sprog. Denne samling hjælper med at træne og forfine maskinlæringsalgoritmer, især dem, der er centreret om at forstå og behandle menneskelige stemmer.
Når du søger at indsamle lyddata til Automatic Speech Recognition (ASR), bør du starte med at definere dit projekts specifikke behov, herunder det ønskede sprog, accent og taletype. Når du har indstillet disse parametre, skal du sikre dig, at du opnår alle nødvendige tilladelser for at respektere brugernes privatliv. Brug derefter passende optageenheder eller software til at fange klare lydeksempler. Hver optagelse bør omhyggeligt annoteres med dens transskription eller andre relevante metadata og opbevares systematisk for nem adgang.
Et taledatasæt i maskinlæring er afgørende for træning, test og validering af modeller, der er skræddersyet til at genkende, transskribere eller fortolke talesprog. Sådanne datasæt baner vejen for et utal af applikationer, fra stemmeassistenter og transskriptionstjenester til stemmebiometri.
For at indsamle præcise data fra forskellige sprog og accenter er samarbejde med modersmål med den ønskede sproglige baggrund afgørende. Sigt efter et varieret og repræsentativt udvalg, der dækker et bredt spektrum af demografiske nuancer. Anvend standardiseret optageudstyr i ensartede miljøer for at sikre lydkonsistens. Og vigtigst af alt, annotér hvert datastykke med detaljerede transskriptioner og metadata, der angiver det specifikke sprog og accent.