Mest betroede tjenester til indsamling af taledata til din AI
Træn dine NLP -modeller, VA'er, TTS -prototyper og mere med samtaledata af høj kvalitet med vores tjenester til indsamling af lyd- og taledata
Opdag lyddatapipelines uden flaskehalse
Fremhævede klienter
Professionel lyd-/stemmedataindsamlingstjenester
Ethvert emne. Ethvert scenarie.
Hos Shaip ligger vores ekspertise i at skabe højkvalitets taledatasæt designet til forskellige AI/ML-krav. Vi tilbyder et bredt udvalg af sprog og optager i forskellige indstillinger, hvilket gør vores datasæt omfattende og tilpasningsdygtige. Odit fokus er på at fodre modeller med den højeste mængde brugerdefinerede taledata på mindst mulig tid. Med os ombord kan du forvente:
- Kurateret højkvalitets flersproget lyd-/stemmedata for at forbedre nøjagtigheden
- Højest mulig niveau af domænespecificitet til target forskelligartet scenarie setup
- Skaler din ML-model, så den passer til forskellig demografi og vertikaler
- Optagelsesmiljøer: Studio kvalitet, med krystalklar lyd med minimal baggrundsstøj, & Naturlige miljøer, hvor optagelser inkorporerer omgivende lyde for at efterligne situationer i den virkelige verden.
100 +
55K +
Timer med taledata
250 +
Projekter
60 +
Sprog (100+ dialekter)
8 / 16 / 44 / 48 kHz
Samplingfrekvens
Vores ekspertise
Juster lyddata til smartere NLP-modeller
Shaip tilbyder ende-til-ende-tale-/lyddataindsamlingstjenester på over 100+ sprog for at gøre det muligt for stemmeaktiverede teknologier at imødekomme et mangfoldigt sæt publikum over hele kloden. Vi kan arbejde på projekter af enhver størrelse og størrelse; fra licensering af eksisterende lyddatasæt på hylden til administration af tilpasset indsamling af lyddata til lydtranskription og annotering. Uanset hvor stort dit taledataindsamlingsprojekt er, kan vi tilpasse lydopsamlingstjenesterne til dine behov for at bygge NLP-datasæt af høj kvalitet, der målretter mod dialekter, toner og sprog. Vælg mellem vores brede udvalg af taledatasæt og ressourcer til indsamling af lyddata til intelligente opsætninger, der muliggør stemme.
Monolog Speech Collection
Den fokuserer på at behandle tale fra en enkelt taler. Udnyt scriptede prompter til at føres ind i enkeltkanals lydfiler, hvilket sikrer opfangning af unikke talemønstre, toner og nuancer, der er specifikke for den enkelte.
Dialogtale
Samling
Interaktion med to personer, replikerer samtaler og dialoger fra den virkelige verden med flersproget eksponering via to-kanals filer og transskriberede ressourcer.
Gruppe / Muti-party
Samtaler
Diskussioner med flere personer, indfanger gruppedynamik, overlapninger og varierede toner for præcist at træne talemodeller.
Samling af naturlige sprogudtalelser
Træn AI'er til at identificere sætninger eller vække ord med lignende betydninger ved hjælp af forskellige, rige og autentiske ytringer til avanceret naturlig sprogbehandling og -forståelse.
Akustiske data
Samling
Vi kan professionelt optage lyddata i studiekvalitet, hvad enten det er restauranter, kontorer eller hjem eller fra forskellige miljøer og sprog, mens vi dækker et bredere akustisk område (omfattende lyddatasæt).
Automatisk talegenkendelse (ASR)
Forbedre nøjagtigheden af dine automatiske talegenkendelsessystemer (ASR) ved at have adgang til state-of-art diversificerede tale-/lyddatasæt fra en bred vifte af demografi.
Flersproget tale/lydtræningsdata
Vores dygtige sprogfolk over hele kloden tilbyder flersprogede lyd-/taledata på forskellige sprog og dialekter. Denne indsats fremmer global kommunikation og bygger bro over sprogbarrierer og bidrager til mere inkluderende og effektive AI-løsninger.
Tekst-til-tale
(TTS)
Byg en tekst-til-tale (TTS) flersproget model med hjælp fra vores globale arbejdsstyrke, som hjælper dig med at indsamle taledata på 150+ sprog og dialekter for at forbedre dine AI-modeller fra kontrol i bilen til chatbots og læringsløsninger med høj- kvalitetslyddata.
Call center
Optagelser
Ægte udvekslinger mellem agenter og kunder, der understøtter adskillige sprog såsom spansk, tysk, amerikansk engelsk, bengali, japansk, kinesisk og hindi.
Succeshistorier
Samtale AI-datasæt med over 3k timers data på tværs af 8 sprog
På udkig efter at bygge en flersproget platform til indiske sprog, samarbejdede klienten med Shaip om at indsamle, segmentere og transskribere store datasæt på flere indiske sprog. Dette ville hjælpe med at udvikle effektive talemodeller, der kunne drive kundens innovative nye platform.
problem: Over 3,000 timers lyddata indsamlet på 8 indiske sprog, segmenteret og transskriberet for at udvikle automatisk talegenkendelse.
Opløsning: Vi leverede dataindsamling, segmentering, transskription og leverede JSON-filer med metadata. Vi indsamlede 3000 timers lyddata på 8 indiske sprog i skala til kundens taleteknologiprojekt.
Grunde til at vælge Shaip som din troværdige taledataindsamlingspartner
Mennesker
Dedikerede og uddannede hold:
- 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
- Godkendt projektledelsesteam
- Erfaren produktudviklingsteam
- Talent Pool Sourcing & Onboarding Team
Proces
Højeste proceseffektivitet sikres med:
- Robust 6 Sigma Stage-Gate-proces
- Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
- Løbende forbedring og feedback
perron
Den patenterede platform giver fordele:
- Web-baseret ende-til-ende platform
- Upåklagelig kvalitet
- Hurtigere TAT
- Problemfri levering
Mennesker
Dedikerede og uddannede hold:
- 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
- Godkendt projektledelsesteam
- Erfaren produktudviklingsteam
- Talent Pool Sourcing & Onboarding Team
Proces
Højeste proceseffektivitet sikres med:
- Robust 6 Sigma Stage-Gate-proces
- Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
- Løbende forbedring og feedback
perron
Den patenterede platform giver fordele:
- Web-baseret ende-til-ende platform
- Upåklagelig kvalitet
- Hurtigere TAT
- Problemfri levering
Off-the-shelf Tale / Audio Datasæt
Detaljer | Corpus ID (Unikt) | Søgeord | Sprogdatasæt | Sprogkode | Prøvefrekvens | Datasættype | Samlede lydtimer | Kort beskrivelse | Datasætbeskrivelse | Audio Channel | Optageplatform | WER (%) | Lyd Format | Transskriptionsformat | Use Case | Antal højttalere | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
da_US_CC_8 | Afroamerikansk sprog | Afroamerikansk sprog | da_DK | 8 kHz | Call-center | 211 | African American Vernacular Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 612, Mand: 1242 og Ukendt: 12 | Kontakt | |
da_US_MA_16 | Afroamerikansk sprog | Afroamerikansk sprog | da_DK | 16 kHz | Medie lyd | 154 | African American Vernacular Media data | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 151, Mand: 150 og Ukendt: 10 | Kontakt | |
Afrikaans_GC_8 | Afrikaans | Afrikaans | af_ZA | 8 kHz | Generel samtale | 368 | Afrikaans generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, afrikaans tales i Afrika | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 502, Mand: 390 og Ukendt: 2 | Kontakt | |
Afrikaans_MA_16 | Afrikaans | Afrikaans | af_ZA | 16 kHz | Medie lyd | 658 | afrikanske mediefiler | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 750, Mand: 1278 og Ukendt: 52 | Kontakt | |
Arabisk_GC_8 | arabisk | arabisk | ar_AE | 8 kHz | Generel samtale | 292 | Arabisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, arabisk fra Golflandene | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 171, Mand: 534 og Ukendt: 1 | Kontakt | |
Arabisk_SM_48 | arabisk | arabisk | ar-SA | 48 kHz | Manuskriptmonolog | 1,947 | Monolog med arabisk skrift | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 838 Mand 1209 Ukendt 78 | Kontakt | |
Assamisk_CC_8 | Assamesisk | Assamisk (I pipeline) | som i | Callcenter | 60 | Assamesiske (I Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_GC | Assamesisk | Assamisk (I pipeline) | som i | Generel samtale | 100 | Assamisk (I Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_MA | Assamesisk | Assamisk (I pipeline) | som i | Medie lyd | 40 | Assamisk (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_CC_8 | bengalsk | Bengali (I Pipeline) | bn_IN | Callcenter | 60 | Bengali (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_GC | bengalsk | Bengali (I Pipeline) | bn_IN | Generel samtale | 100 | Bengali (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_MA | bengalsk | Bengali (I Pipeline) | bn_IN | Medie lyd | 40 | Bengali (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Boston_CC_8 | Boston engelsk | Boston engelsk | da_DK | 8 kHz | Callcenter | 177 | Boston Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 605, Mand: 711 og Ukendt: 0 | Kontakt | |
Boston_GC_8 | Boston engelsk | Boston engelsk | da_DK | 8 kHz | Generel samtale | 32 | Boston generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 53, Mand: 83 og Ukendt: 0 | Kontakt | |
Boston_MA_16 | Boston engelsk | Boston engelsk | da_DK | 16 kHz | Medie lyd | 93 | Boston Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 43, Mand: 181 og Ukendt: 2 | Kontakt | |
Canadisk_SM_48 | Canadisk fransk | Canadisk fransk | fr-CA | 48 kHz | Manuskriptmonolog | 1,222 | Canadisk fransk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 974 Mand 631 Ukendt 1 | Kontakt | |
kinesisk_CC_8 | Kinesisk engelsk | Kinesisk engelsk | da_DK | 8 kHz | Callcenter | 169 | Kinesiske Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 1790, Mand: 523 og Ukendt: 13 | Kontakt | |
kinesisk_MA_16 | Kinesisk engelsk | Kinesisk engelsk | da_DK | 16 kHz | Medie lyd | 249 | Kinesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 126, Mand: 346 og Ukendt: 6 | Kontakt | |
Kinesisk forenklet_SM_48 | Forenklet kinesisk | Forenklet kinesisk | zh-CN | 48 kHz | Manuskriptmonolog | 2,762 | Forenklet kinesisk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1920 Mand 1535 Ukendt 270 | Kontakt | |
Traditionel kinesisk_SM_48 | Traditionelt kinesisk | Traditionelt kinesisk | zh-TW | 48 kHz | Manuskriptmonolog | 1,028 | Traditionelt kinesisk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1069 Mand 262 Ukendt 3 | Kontakt | |
Danish_GC_8 | Danske | Danske | da_DK | 8 kHz | Generel samtale | 372 | Danske almindelige samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 311, Mand: 417, Ukendt: 0 | Kontakt | |
Danish_MA_16 | Danske | Danske | da_DK | 16 kHz | Medie lyd | 664 | Danske Medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 369, Mand: 864, Ukendt: 27 | Kontakt | |
Danish_SM_48 | Danske | Danske | da-DK | 48 kHz | Manuskriptmonolog | 2,579 | Dansk skriftmonolog | Enkelt-ytring optagelser, som har tendens til at falde i 5 til 30 sekunders rækkevidde, dansk fra Danmark | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1551 Mand 1233 Ukendt 42 | Kontakt | |
Engelsk Deep South_CC_8 | Engelsk Deep South | Engelsk Deep South | da_DK | 8 kHz | Callcenter | 151 | Engelsk Deep South Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 221 , Mand 1004 , Ukendt 7 | Kontakt | |
Engelsk Deep South_GC_8 | Engelsk Deep South | Engelsk Deep South | da_DK | 8 kHz | Generel samtale | 56 | Engelsk Deep South Generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 99, Mand 31, Ukendt 0 | Kontakt | |
Engelsk Deep South_MA_16 | Engelsk Deep South | Engelsk Deep South | da_DK | 16 kHz | Medie lyd | 266 | Engelske Deep South Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 204, Mand 356, Ukendt 21 | Kontakt | |
Tysk_CC_8 | Tysk | Tysk | de-De | 8 kHz | Callcenter | 64 | Tyske Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 478 Mand 1440 Ukendt 0 | Kontakt | ||
Tysk_IVR_8 | Tysk | Tysk | de-De | 8 kHz | IVR | 200 | Tyske IVR-data | Menneske til maskine. En IVR type flow, hvor der er en TTS prompt (f.eks. "Hvordan kan jeg hjælpe dig") efterfulgt af en spontan menneskelig reaktion | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 10115 Mand 8750 Ukendt 0 | Kontakt | ||
Gujarati_CC_8 | gujarati | Gujarati (I pipeline) | gu_IN | Callcenter | 60 | Gujarati (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_GC | gujarati | Gujarati (I pipeline) | gu_IN | Generel samtale | 100 | Gujarati (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_MA | gujarati | Gujarati (I pipeline) | gu_IN | Medie lyd | 40 | Gujarati (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Hebraisk_Generel Samtale_8 | hebraisk | hebraisk | han_IL | 8 kHz | Generel samtale | 399 | Hebraisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, hebraisk i Israel | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 414 , Mand 399 , Ukendt 1 | Kontakt | |
Hebraisk_MA_16 | hebraisk | hebraisk | han_IL | 16 kHz | Medie lyd | 427 | Hebraiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 361 , Mand 513, Ukendt 13 | Kontakt | |
Hindi_MA_16 | Hindi | Hindi | hej_IN | 16 kHz | Medie lyd | 219 | Hindi Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 83 , Mand 309, Ukendt 0 | Kontakt | |
Hindi_SM_48 | Hindi | Hindi | hi-IN | 48 kHz | Manuskriptmonolog | 2,867 | Hindi scripted monolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1977 Mand 1864 Ukendt 147 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Callcenter | 208 | HINGLISH Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 822, Mand 1262, Ukendt 0 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Medie lyd | 216 | HINGLISH Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 75, Mand 380, Ukendt 0 | Kontakt | |
Hispanic_CC_8 | Spansk engelsk | Spansk engelsk | da_DK | 8 kHz | Callcenter | 212 | Hispanic Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 822, Mand 1262, Ukendt 0 | Kontakt | |
Hispanic_MA_16 | Spansk engelsk | Spansk engelsk | da_DK | 16 kHz | Medie lyd | 155 | Hispanic Call Media-lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 140, Mand 219, Ukendt 5 | Kontakt | |
Indonesisk_GC_8 | indonesisk | indonesisk | jeg gjorde | 8 kHz | Generel samtale | 496 | Indonesiske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, indonesisk | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 524, Mand 454, Ukendt 2 | Kontakt | |
Indonesisk_MA_16 | indonesisk | indonesisk | jeg gjorde | 16 kHz | Medie lyd | 643 | Indonesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 746, Mand 1507, Ukendt 129 | Kontakt | |
Irsk_GC_8 | Irish | Irish | da_IE | 8 kHz | Generel samtale | 192 | Irske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 213 , Mand 153 , Ukendt 0 | Kontakt | |
Japansk_SM_48 | japansk | japansk | ja-JP | 48 kHz | Manuskriptmonolog | 2,335 | Japansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1460 Mand 1221 Ukendt 194 | Kontakt | |
Kannada_CC_8 | Kannada | Kannada (I Pipeline) | kn_IN | Callcenter | 60 | Kannada (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_GC | Kannada | Kannada (I Pipeline) | kn_IN | Generel samtale | 100 | Kannada (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_MA | Kannada | Kannada (I Pipeline) | kn_IN | Medie lyd | 40 | Kannada (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Koreansk_CC_8 | koreansk | koreansk | ko_KR | 8 kHz | Callcenter | 107 | Koreanske Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1086, Mand 210, Ukendt 4 | Kontakt | |
Koreansk_MA_16 | koreansk | koreansk | ko_KR | 16 kHz | Medie lyd | 204 | Koreanske medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 70 Mand 303, Ukendt 25 | Kontakt | |
Koreansk_SM_48 | koreansk | koreansk | ko-KR | 48 kHz | Manuskriptmonolog | 1,955 | Koreansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1195 Mand 1134 Ukendt 122 | Kontakt | |
Malay_GC_8 | Malay | Malay | ms_MIN | 8 kHz | Generel samtale | 266 | Malayisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, malaysisk i Malaysia | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 316, Mand 176, Ukendt 0 | Kontakt | |
Malay_MA_16 | Malay | Malay | ms_MIN | 16 kHz | Medie lyd | 344 | Malay Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 236, Mand 626, Ukendt 47 | Kontakt | |
Malayalam_CC_8 | malayalam | Malayalam (I pipeline) | ml_IN | Callcenter | 60 | Malayalam (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_GC | malayalam | Malayalam (I pipeline) | ml_IN | Generel samtale | 100 | Malayalam (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_MA | malayalam | Malayalam (I pipeline) | ml_IN | Medie lyd | 40 | Malayalam (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_CC_8 | Marathi | Marathi (I Pipeline) | mr_IN | Callcenter | 60 | Marathi (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_GC | Marathi | Marathi (I Pipeline) | mr_IN | Generel samtale | 100 | Marathi (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_MA | Marathi | Marathi (I Pipeline) | mr_IN | Medie lyd | 40 | Marathi (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Mexicansk_SM_48 | Spansk (Mexico) | Spansk (Mexico) | es-MX | 48 kHz | Manuskriptmonolog | 1,492 | Mexicansk spansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1016 Mand 1069 Ukendt 95 | Kontakt | |
Holland_SM_48 | Hollandsk | Hollandsk | nl-NL | 48 kHz | Manuskriptmonolog | 1,205 | hollandsk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1285 Mand 531 Ukendt 3 | Kontakt | |
New York English_CC_8 | New York engelsk | New York engelsk | da_DK | 8 kHz | Callcenter | 103 | New York engelsk Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 610, Mand 532, Ukendt 0 | Kontakt | |
New York English_GC_8 | New York engelsk | New York engelsk | da_DK | 8 kHz | Generel samtale | 107 | New York engelsk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 118, Mand 114, Ukendt 0 | Kontakt | |
New York English_MA_16 | New York engelsk | New York engelsk | da_DK | 16 kHz | Medie lyd | 140 | New York engelske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 66, Mand 230, Ukendt 11 | Kontakt | |
New Zealand_GC_8 | New Zealand engelsk | New Zealand engelsk | da_NZ | 8 kHz | Generel samtale | 148 | New Zealand engelsk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 167, mand 121, Ukendt 4 | Kontakt | |
New Zealand_MA_16 | New Zealand engelsk | New Zealand engelsk | da_NZ | 16 kHz | Medie lyd | 400 | New Zealand engelske medier lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 367, mand 678, Ukendt 26 | Kontakt | |
Oriya_CC_8 | oriya | Oriya (I Pipeline) | eller_IN | Callcenter | 60 | Oriya (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_GC | oriya | Oriya (I Pipeline) | eller_IN | Generel samtale | 100 | Oriya (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_MA | oriya | Oriya (I Pipeline) | eller_IN | Medie lyd | 40 | Oriya (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Polsk_MA_16 | polsk | polsk | pl_PL | 16 kHz | Medie lyd | 269 | Polsk medie lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 173 Mand 354 Ukendt 6 | Kontakt | |
Polsk Polen_SM_48 | Polsk (Polen) | Polsk (Polen) | PL-PL | 48 kHz | Manuskriptmonolog | 1,482 | Polsk Polen - Manuskriptmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1324 Mand 701 Ukendt 24 | Kontakt | |
Punjabi_CC_8 | punjabi | Punjabi (I pipeline) | punjabi | Callcenter | 60 | Punjabi (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_GC | punjabi | Punjabi (I pipeline) | punjabi | Generel samtale | 100 | Punjabi (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_MA | punjabi | Punjabi (I pipeline) | punjabi | Medie lyd | 40 | Punjabi (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Russisk_SM_48 | russisk | russisk | ru-RU | 48 kHz | Manuskriptmonolog | 2,398 | Russisk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1689 Mand 1937 Ukendt 214 | Kontakt | |
Skotsk_GC_8 | Skotsk (engelsk accent) | Skotsk (engelsk accent) | da_AB | 8 kHz | Generel samtale | 292 | Skotske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 285 , Mand 260, Ukendt 3 | Kontakt | |
Singapore_CC_8 | Singapore engelsk | Singapore engelsk | da_SG | 8 kHz | Callcenter | 218 | Singapore Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 2139 , Mand 884, Ukendt 21 | Kontakt | |
Singapore_MA_16 | Singapore engelsk | Singapore engelsk | da_SG | 16 kHz | Medie lyd | 247 | Singapore Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 160, Mand 455, Ukendt 37 | Kontakt | |
Sydafrikansk engelsk_CC_8 | Sydafrikansk engelsk | Sydafrikansk engelsk | da_ZA | 8 kHz | Callcenter | 261 | South African English Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1274 , Mand 935 , Ukendt 1 | Kontakt | |
Sydafrikansk engelsk_MA_16 | Sydafrikansk engelsk | Sydafrikansk engelsk | da_ZA | 16 kHz | Medie lyd | 251 | Sydafrikanske engelske mediers lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 235, Mand 432, Ukendt 36 | Kontakt | |
Swahili_CC_8 | Swahili | Swahili | sw_KE | 8 kHz | Callcenter | 230 | Swahili Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 611, Mand 833, Ukendt 0 | Kontakt | |
Swahili_MA_16 | Swahili | Swahili | sw_KE | 16 kHz | Medie lyd | 265 | Swahili Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 118, Mand 493, Ukendt 25 | Kontakt | |
Svensk_CC_8 | Svensk | Svensk | sv_SE | 8 kHz | Callcenter | 250 | Svenske Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1581, Mand 727, Ukendt 2 | Kontakt | |
Svensk_MA_16 | Svensk | Svensk | sv_SE | 16 kHz | Medie lyd | 278 | Svenske mediers lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 195, Mand 500, Ukendt 21 | Kontakt | |
Tamil_CC_8 | tamil | Tamil (I pipeline) | ta_IN | Callcenter | 60 | Tamil (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_GC | tamil | Tamil (I pipeline) | ta_IN | Generel samtale | 100 | Tamil (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_MA | tamil | Tamil (I pipeline) | ta_IN | Medie lyd | 40 | Tamil (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Generel samtale | 553 | Telugu generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 574 , Mand 564, Ukendt 0 | Kontakt | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Medie lyd | 648 | Telugu Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 207, Mand 963, Ukendt 2 | Kontakt | |
Telugu_CC_8 | telugu | Telugu (I pipeline) | te_IN | Callcenter | 30 | Telugu (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC | telugu | Telugu (I pipeline) | te_IN | Generel samtale | 50 | Telugu (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_MA | telugu | Telugu (I pipeline) | te_IN | Medie lyd | 20 | Telugu (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Thai_GC_8 | Thai | Thai | th_TH | 8 kHz | Generel samtale | 183 | Thai generel samtale | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, et uformelt register brugt mellem venner | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 338, Mand 96, Ukendt 8 | Kontakt | |
Thai_MA_8 | Thai | Thai | th_TH | 16 kHz | Medie lyd | 173 | Thai medie lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 143, Mand 502, Ukendt 26 | Kontakt | |
Tyrkisk Tyrkiet_SM_48 | Tyrkisk Tyrkiet | Tyrkisk Tyrkiet | tr-TR | 48 kHz | Manuskriptmonolog | 2,027 | Tyrkisk Tyrkiet | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1561 Mand 1241 Ukendt 31 | Kontakt | |
Vietnamesisk_GC_8 | vietnamesisk | vietnamesisk | vi_VN | 8 kHz | Generel samtale | 295 | Vietnamesiske generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, nordlige (f.eks. Hanoi), centrale og sydlige (f.eks. Ho Chi Minh City). | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 400, mand 380, Ukendte 2 | Kontakt | |
Vietnamesisk_MA_16 | vietnamesisk | vietnamesisk | vi_VN | 16 kHz | Medie lyd | 257 | vietnamesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 249, mand 200, Ukendte 45 | Kontakt | |
Welsh_GC_8 | walisisk (engelsk accent) | walisisk (engelsk accent) | da_WL | 8 kHz | Generel samtale | 278 | walisiske generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 270, Mand 324, Ukendt 0 | Kontakt | |
UK English_WW_16 | UK engelsk | UK engelsk | da_dk | 16 kHz | Wake Word | 200 højttalere | Wake Word engelsk engelsk | nøglesætningsindsamling af data
| 1 kanal | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Køn: 50 % mænd, 50 % kvinder, +/- 10 %. | Kontakt |
Tjenester tilbydes
Ekspert indsamling af lyddata er ikke alle-hands-on-deck til omfattende AI-opsætninger. Hos Shaip kan du endda overveje følgende tjenester for at gøre modeller langt mere udbredte end normalt:
Indsamling af tekstdata
Tjenester
Den sande værdi af Shaip kognitive dataindsamlingstjenester er, at det giver organisationer nøglen til at låse op for kritisk information, der findes i ustrukturerede data
Services til indsamling af billeddata
Sørg for, at din computervisionsmodel identificerer hvert billede præcist for problemfrit at kunne træne fremtidens næste generation af AI-modeller
Services til indsamling af videodata
Fokuser nu på computersyn sammen med NLP til træning af dine modeller i at identificere objekter, individer, afskrækkende midler og andre visuelle elementer til perfektion
Anbefalede ressourcer
Tilbyder
Lydkommentar til intelligente AI'er
Lydkommentartjenester har været en af Shaips styrke siden begyndelsen. Udvikle, træne og forbedre konversations-AI, chatbots og talegenkendelsesmotorer med vores avancerede lydannoteringstjenester.
Købervejledning
Købervejledning: Komplet guide til konversations-AI
Den chatbot, du har talt med, kører på et avanceret konversations-AI-system, der er trænet, testet og bygget ved hjælp af tonsvis af talegenkendelsesdatasæt.
Datakatalog
Off-the-Shelf Tale Data Katalog & Licens
Der er en lang række almindelige applikationer til taledata i AI-projekter. Vi tilbyder dig enorme mængder af højkvalitetsdata klar til din stemmegenkendelse.
Vil du bygge dit eget lyddatasæt?
Få kontakt med vores interne taledataindsamlingsekspert for at opsætte et lydlager, der bedst passer til dit behov
Ofte stillede spørgsmål (FAQ)
Indsamling af taledata for en ML-model refererer til processen med at indsamle lydoptagelser af talt sprog. Denne samling hjælper med at træne og forfine maskinlæringsalgoritmer, især dem, der er centreret om at forstå og behandle menneskelige stemmer.
Når du søger at indsamle lyddata til Automatic Speech Recognition (ASR), bør du starte med at definere dit projekts specifikke behov, herunder det ønskede sprog, accent og taletype. Når du har indstillet disse parametre, skal du sikre dig, at du opnår alle nødvendige tilladelser for at respektere brugernes privatliv. Brug derefter passende optageenheder eller software til at fange klare lydeksempler. Hver optagelse bør omhyggeligt annoteres med dens transskription eller andre relevante metadata og opbevares systematisk for nem adgang.
Et taledatasæt i maskinlæring er afgørende for træning, test og validering af modeller, der er skræddersyet til at genkende, transskribere eller fortolke talesprog. Sådanne datasæt baner vejen for et utal af applikationer, fra stemmeassistenter og transskriptionstjenester til stemmebiometri.
For at indsamle præcise data fra forskellige sprog og accenter er samarbejde med modersmål med den ønskede sproglige baggrund afgørende. Sigt efter et varieret og repræsentativt udvalg, der dækker et bredt spektrum af demografiske nuancer. Anvend standardiseret optageudstyr i ensartede miljøer for at sikre lydkonsistens. Og vigtigst af alt, annotér hvert datastykke med detaljerede transskriptioner og metadata, der angiver det specifikke sprog og accent.