Mest betroede tjenester til indsamling af taledata til din AI
Træn dine NLP -modeller, VA'er, TTS -prototyper og mere med samtaledata af høj kvalitet med vores tjenester til indsamling af lyd- og taledata
Opdag lyddatapipelines uden flaskehalse.
Fremhævede klienter
Hvorfor er taletræningsdatasæt nødvendigt for behandling af naturligt sprog?
Har du nogensinde lagt mærke til, at din smartphone VA, dvs. Siri, Bixby eller noget andet, interagerer? Den måde, de besvarer hvert spørgsmål og analyserer og præsenterer resultater i henhold til dine krav!
Så meget som disse VA'er fascinerer os, skal disse intelligente ressourcer og programmer trænes gradvist for at kunne reagere så præcist. Dette er grunden til, at du bør overveje at outsource indsamling af tale/lyd og stemmedata til specialiserede dataindsamlingsvirksomheder med validerende faglig ekspertise.
Investering i indsamling af lyddata forbereder din påståede NLP til at henvende sig til et flersproget publikum. Ikke bare det, taledataindsamling til NLP, som og når den håndteres af en ekspert, tager endda højde for indsamling i felten, semantisk analyse og lydtransskription. Med professionelle taledataindsamlingsløsninger kan du:
- Anskaf lyddatasæt af høj kvalitet for at forbedre nøjagtigheden
- Målret forskellige scenarier opsætning
- Indsaml flersprogede AI -træningsdata
- Skaler din ML-model, så den passer til forskellig demografi og vertikaler
Professionelle tjenester til indsamling af lyd / stemme til NLP
Ethvert emne. Ethvert scenarie.
Intelligente NLP -systemer er alt andet end generiske. Afhængigt af programmets funktionalitet er du muligvis nødt til at fokusere på rumlige og flersprogede lyddatatjenester, som kun kan tilbydes af velrenommerede virksomheder til indsamling af tale-/lyddata. Det er her, Shaip kommer ind i tingene som en yderst pålidelig udbyder af dataforbindelser, der sætter en ære i at gøre de tunge løft for dine angiveligt intelligente AI'er.
Hos Shaip er vores primære fokus på fodring af modeller med den højest mulige mængde tilpassede taleprøver på mindst mulig tid. Hos os om bord kan du forvente:
- Kurateret lyd-/stemmedataindsamling til NLP
- Skræddersyede programmer, der reagerer i henhold til specifikke brugssager
- Gør minedatabasen med lyddatasæt klar
- Mønster-specifik og automatiseret databehandling
- Højest mulige niveau af domænespecificitet
- Hurtigere markedsføring med accelererede AI -modeller
Vores ekspertise
Juster lyddata til at forberede smarte NLP -modeller
Shaip tilbyder ende-til-ende-tale-/lyddataindsamlingstjenester på over 100+ sprog for at gøre det muligt for stemmeaktiverede teknologier at imødekomme et mangfoldigt sæt publikum over hele kloden. Vi kan arbejde på projekter af enhver størrelse og størrelse; fra licensering af eksisterende lyddatasæt på hylden til administration af tilpasset indsamling af lyddata til lydtranskription og annotering. Uanset hvor stort dit taledataindsamlingsprojekt er, kan vi tilpasse lydopsamlingstjenesterne til dine behov for at bygge NLP-datasæt af høj kvalitet, der målretter mod dialekter, toner og sprog. Vælg mellem vores brede udvalg af taledatasæt og ressourcer til indsamling af lyddata til intelligente opsætninger, der muliggør stemme.
Monolog Speech Collection
Håndter tale-baserede krav vedrørende en selvstændig højttaler til dine Text-to-Speed prototyper og transskription-specifikke krav med scripted promptfeed via enkeltkanalsfiler.
Dialogtale
Samling
Opsæt intelligente virtuelle assistenter, hastighedsspecifikke chatbots og modeller med automatisk talegenkendelse med flersproget eksponering via tokanalsfiler og transkriberede ressourcer.
Akustiske data
Samling
Vi kan professionelt optage lyddata i studiokvalitet, det være sig restauranter, kontorer eller hjem eller fra forskellige miljøer og sprog gennem vores globale netværk af samarbejdspartnere, samtidig med at vi dækker et bredere akustisk område
Samling af naturlige sprogudtalelser
Træn smarte kommercielle opsætninger til at identificere anderledes udtalte kundesætninger med lignende betydning for at gøre AI'erne mere autonome med tiden
Digital / virtuel
assistenter
Fokuser på at opbygge din kommende Virtual Assistant ved at træne modeller med forbehold for menneskelig tale, flersproget eksponering, kontekstuel analyse og NLU.
Automatisk talegenkendelse (ASR)
Forbedre nøjagtigheden af dine automatiske talegenkendelsessystemer (ASR) ved at have adgang til state-of-art diversificerede tale-/lyddatasæt fra en bred vifte af demografi.
Flersproget tale/lydtræningsdata
Vores højtuddannede sprogprofessionelle over hele kloden tilbyder flersprogede lyd-/taletræningsdata på flere sprog og dialekter, herunder arabisk, dansk, kinesisk, afrikaans, Singapore, New Zealand, hebraisk, indonesisk, irsk, koreansk, malaysisk, polsk, skotsk, svensk , fransk, tysk, vietnamesisk, thai, italiensk, spansk og mere.
Tekst-til-tale
(TTS)
For at tilbyde en bedre brugeroplevelse med TTS er det afgørende at udvikle et system, der lyder naturligt. Byg en tekst-til-tale (TTS) flersproget model med hjælp fra vores globale arbejdsstyrke, som hjælper dig med at indsamle taledata på 150+ sprog og dialekter for at forbedre dine AI-modeller fra kontrol i bilen til chatbots og læringsløsninger med høj- kvalitetslyddata.
Grunde til at vælge Shaip som din troværdige taledataindsamlingspartner
Mennesker
Dedikerede og uddannede hold:
- 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
- Godkendt projektledelsesteam
- Erfaren produktudviklingsteam
- Talent Pool Sourcing & Onboarding Team
Behandle
Højeste proceseffektivitet sikres med:
- Robust 6 Sigma Stage-Gate-proces
- Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
- Løbende forbedring og feedback
perron
Den patenterede platform giver fordele:
- Web-baseret ende-til-ende platform
- Upåklagelig kvalitet
- Hurtigere TAT
- Problemfri levering
Mennesker
Dedikerede og uddannede hold:
- 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
- Godkendt projektledelsesteam
- Erfaren produktudviklingsteam
- Talent Pool Sourcing & Onboarding Team
Behandle
Højeste proceseffektivitet sikres med:
- Robust 6 Sigma Stage-Gate-proces
- Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
- Løbende forbedring og feedback
perron
Den patenterede platform giver fordele:
- Web-baseret ende-til-ende platform
- Upåklagelig kvalitet
- Hurtigere TAT
- Problemfri levering
Sprog: Indsamlede lyddatasæt
Off-the-shelf Tale / Audio Datasæt
Detaljer | Corpus ID (Unikt) | Søgeord | Sprogdatasæt | Sprogkode | Prøvefrekvens | Datasættype | Samlede lydtimer | Kort beskrivelse | Datasætbeskrivelse | Audio Channel | Optageplatform | WER (%) | Lyd Format | Transskriptionsformat | Use Case | Antal højttalere | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
da_US_CC_8 | Afroamerikansk sprog | Afroamerikansk sprog | da_DK | 8 kHz | Call-center | 211 | African American Vernacular Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 612, Mand: 1242 og Ukendt: 12 | Kontakt | |
da_US_MA_16 | Afroamerikansk sprog | Afroamerikansk sprog | da_DK | 16 kHz | Medie lyd | 154 | African American Vernacular Media data | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 151, Mand: 150 og Ukendt: 10 | Kontakt | |
Afrikaans_GC_8 | Afrikaans | Afrikaans | af_ZA | 8 kHz | Generel samtale | 368 | Afrikaans generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, afrikaans tales i Afrika | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 502, Mand: 390 og Ukendt: 2 | Kontakt | |
Afrikaans_MA_16 | Afrikaans | Afrikaans | af_ZA | 16 kHz | Medie lyd | 658 | afrikanske mediefiler | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 750, Mand: 1278 og Ukendt: 52 | Kontakt | |
Arabisk_GC_8 | Arabic | Arabic | ar_AE | 8 kHz | Generel samtale | 292 | Arabisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, arabisk fra Golflandene | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 171, Mand: 534 og Ukendt: 1 | Kontakt | |
Arabisk_SM_48 | Arabic | Arabic | ar-SA | 48 kHz | Manuskriptmonolog | 1,947 | Monolog med arabisk skrift | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 838 Mand 1209 Ukendt 78 | Kontakt | |
Assamisk_CC_8 | Assamesisk | Assamisk (I pipeline) | som i | Callcenter | 60 | Assamesiske (I Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_GC | Assamesisk | Assamisk (I pipeline) | som i | Generel samtale | 100 | Assamisk (I Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Assamese_MA | Assamesisk | Assamisk (I pipeline) | som i | Medie lyd | 40 | Assamisk (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_CC_8 | bengali | Bengali (I Pipeline) | bn_IN | Callcenter | 60 | Bengali (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_GC | bengali | Bengali (I Pipeline) | bn_IN | Generel samtale | 100 | Bengali (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Bengali_MA | bengali | Bengali (I Pipeline) | bn_IN | Medie lyd | 40 | Bengali (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Boston_CC_8 | Boston engelsk | Boston engelsk | da_DK | 8 kHz | Callcenter | 177 | Boston Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 605, Mand: 711 og Ukendt: 0 | Kontakt | |
Boston_GC_8 | Boston engelsk | Boston engelsk | da_DK | 8 kHz | Generel samtale | 32 | Boston generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 53, Mand: 83 og Ukendt: 0 | Kontakt | |
Boston_MA_16 | Boston engelsk | Boston engelsk | da_DK | 16 kHz | Medie lyd | 93 | Boston Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 43, Mand: 181 og Ukendt: 2 | Kontakt | |
Canadisk_SM_48 | Canadisk fransk | Canadisk fransk | fr-CA | 48 kHz | Manuskriptmonolog | 1,222 | Canadisk fransk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 974 Mand 631 Ukendt 1 | Kontakt | |
kinesisk_CC_8 | Kinesisk engelsk | Kinesisk engelsk | da_DK | 8 kHz | Callcenter | 169 | Kinesiske Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 1790, Mand: 523 og Ukendt: 13 | Kontakt | |
kinesisk_MA_16 | Kinesisk engelsk | Kinesisk engelsk | da_DK | 16 kHz | Medie lyd | 249 | Kinesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 126, Mand: 346 og Ukendt: 6 | Kontakt | |
Kinesisk forenklet_SM_48 | Forenklet kinesisk | Forenklet kinesisk | zh-CN | 48 kHz | Manuskriptmonolog | 2,762 | Forenklet kinesisk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1920 Mand 1535 Ukendt 270 | Kontakt | |
Traditionel kinesisk_SM_48 | Traditionelt kinesisk | Traditionelt kinesisk | zh-TW | 48 kHz | Manuskriptmonolog | 1,028 | Traditionelt kinesisk | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1069 Mand 262 Ukendt 3 | Kontakt | |
Danish_GC_8 | Dansk | Dansk | da_DK | 8 kHz | Generel samtale | 372 | Danske almindelige samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 311, Mand: 417, Ukendt: 0 | Kontakt | |
Danish_MA_16 | Dansk | Dansk | da_DK | 16 kHz | Medie lyd | 664 | Danske Medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde: 369, Mand: 864, Ukendt: 27 | Kontakt | |
Danish_SM_48 | Dansk | Dansk | da-DK | 48 kHz | Manuskriptmonolog | 2,579 | Dansk skriftmonolog | Enkelt-ytring optagelser, som har tendens til at falde i 5 til 30 sekunders rækkevidde, dansk fra Danmark | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1551 Mand 1233 Ukendt 42 | Kontakt | |
Engelsk Deep South_CC_8 | Engelsk Deep South | Engelsk Deep South | da_DK | 8 kHz | Callcenter | 151 | Engelsk Deep South Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 221 , Mand 1004 , Ukendt 7 | Kontakt | |
Engelsk Deep South_GC_8 | Engelsk Deep South | Engelsk Deep South | da_DK | 8 kHz | Generel samtale | 56 | Engelsk Deep South Generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 99, Mand 31, Ukendt 0 | Kontakt | |
Engelsk Deep South_MA_16 | Engelsk Deep South | Engelsk Deep South | da_DK | 16 kHz | Medie lyd | 266 | Engelske Deep South Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 204, Mand 356, Ukendt 21 | Kontakt | |
Tysk_CC_8 | Tysk | Tysk | de-De | 8 kHz | Callcenter | 64 | Tyske Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 478 Mand 1440 Ukendt 0 | Kontakt | ||
Tysk_IVR_8 | Tysk | Tysk | de-De | 8 kHz | IVR | 200 | Tyske IVR-data | Menneske til maskine. En IVR type flow, hvor der er en TTS prompt (f.eks. "Hvordan kan jeg hjælpe dig") efterfulgt af en spontan menneskelig reaktion | Mono | desktop | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 10115 Mand 8750 Ukendt 0 | Kontakt | ||
Gujarati_CC_8 | gujarati | Gujarati (I pipeline) | gu_IN | Callcenter | 60 | Gujarati (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_GC | gujarati | Gujarati (I pipeline) | gu_IN | Generel samtale | 100 | Gujarati (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Gujarati_MA | gujarati | Gujarati (I pipeline) | gu_IN | Medie lyd | 40 | Gujarati (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Hebraisk_Generel Samtale_8 | hebraisk | hebraisk | han_IL | 8 kHz | Generel samtale | 399 | Hebraisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, hebraisk i Israel | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 414 , Mand 399 , Ukendt 1 | Kontakt | |
Hebraisk_MA_16 | hebraisk | hebraisk | han_IL | 16 kHz | Medie lyd | 427 | Hebraiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 361 , Mand 513, Ukendt 13 | Kontakt | |
Hindi_MA_16 | Hindi | Hindi | hej_IN | 16 kHz | Medie lyd | 219 | Hindi Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 83 , Mand 309, Ukendt 0 | Kontakt | |
Hindi_SM_48 | Hindi | Hindi | hi-IN | 48 kHz | Manuskriptmonolog | 2,867 | Hindi scripted monolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1977 Mand 1864 Ukendt 147 | Kontakt | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Callcenter | 208 | HINGLISH Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 822, Mand 1262, Ukendt 0 | Kontakt | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Medie lyd | 216 | HINGLISH Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 75, Mand 380, Ukendt 0 | Kontakt | |
Hispanic_CC_8 | Spansk engelsk | Spansk engelsk | da_DK | 8 kHz | Callcenter | 212 | Hispanic Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 822, Mand 1262, Ukendt 0 | Kontakt | |
Hispanic_MA_16 | Spansk engelsk | Spansk engelsk | da_DK | 16 kHz | Medie lyd | 155 | Hispanic Call Media-lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 140, Mand 219, Ukendt 5 | Kontakt | |
Indonesisk_GC_8 | indonesisk | indonesisk | jeg gjorde | 8 kHz | Generel samtale | 496 | Indonesiske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, indonesisk | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 524, Mand 454, Ukendt 2 | Kontakt | |
Indonesisk_MA_16 | indonesisk | indonesisk | jeg gjorde | 16 kHz | Medie lyd | 643 | Indonesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 746, Mand 1507, Ukendt 129 | Kontakt | |
Irsk_GC_8 | Irish | Irish | da_IE | 8 kHz | Generel samtale | 192 | Irske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 213 , Mand 153 , Ukendt 0 | Kontakt | |
Japansk_SM_48 | japansk | japansk | ja-JP | 48 kHz | Manuskriptmonolog | 2,335 | Japansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1460 Mand 1221 Ukendt 194 | Kontakt | |
Kannada_CC_8 | Kannada | Kannada (I Pipeline) | kn_IN | Callcenter | 60 | Kannada (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_GC | Kannada | Kannada (I Pipeline) | kn_IN | Generel samtale | 100 | Kannada (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Kannada_MA | Kannada | Kannada (I Pipeline) | kn_IN | Medie lyd | 40 | Kannada (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Koreansk_CC_8 | Korean | Korean | ko_KR | 8 kHz | Callcenter | 107 | Koreanske Call-center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1086, Mand 210, Ukendt 4 | Kontakt | |
Koreansk_MA_16 | Korean | Korean | ko_KR | 16 kHz | Medie lyd | 204 | Koreanske medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 70 Mand 303, Ukendt 25 | Kontakt | |
Koreansk_SM_48 | Korean | Korean | ko-KR | 48 kHz | Manuskriptmonolog | 1,955 | Koreansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1195 Mand 1134 Ukendt 122 | Kontakt | |
Malay_GC_8 | Malay | Malay | ms_MIN | 8 kHz | Generel samtale | 266 | Malayisk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, malaysisk i Malaysia | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 316, Mand 176, Ukendt 0 | Kontakt | |
Malay_MA_16 | Malay | Malay | ms_MIN | 16 kHz | Medie lyd | 344 | Malay Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 236, Mand 626, Ukendt 47 | Kontakt | |
Malayalam_CC_8 | malayalam | Malayalam (I pipeline) | ml_IN | Callcenter | 60 | Malayalam (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_GC | malayalam | Malayalam (I pipeline) | ml_IN | Generel samtale | 100 | Malayalam (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Malayalam_MA | malayalam | Malayalam (I pipeline) | ml_IN | Medie lyd | 40 | Malayalam (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_CC_8 | Marathi | Marathi (I Pipeline) | mr_IN | Callcenter | 60 | Marathi (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_GC | Marathi | Marathi (I Pipeline) | mr_IN | Generel samtale | 100 | Marathi (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Marathi_MA | Marathi | Marathi (I Pipeline) | mr_IN | Medie lyd | 40 | Marathi (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Mexicansk_SM_48 | Spansk (Mexico) | Spansk (Mexico) | es-MX | 48 kHz | Manuskriptmonolog | 1,492 | Mexicansk spansk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1016 Mand 1069 Ukendt 95 | Kontakt | |
Holland_SM_48 | Hollandsk | Hollandsk | nl-NL | 48 kHz | Manuskriptmonolog | 1,205 | hollandsk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1285 Mand 531 Ukendt 3 | Kontakt | |
New York English_CC_8 | New York engelsk | New York engelsk | da_DK | 8 kHz | Callcenter | 103 | New York engelsk Call-center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 610, Mand 532, Ukendt 0 | Kontakt | |
New York English_GC_8 | New York engelsk | New York engelsk | da_DK | 8 kHz | Generel samtale | 107 | New York engelsk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 118, Mand 114, Ukendt 0 | Kontakt | |
New York English_MA_16 | New York engelsk | New York engelsk | da_DK | 16 kHz | Medie lyd | 140 | New York engelske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 66, Mand 230, Ukendt 11 | Kontakt | |
New Zealand_GC_8 | New Zealand engelsk | New Zealand engelsk | da_NZ | 8 kHz | Generel samtale | 148 | New Zealand engelsk generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 167, mand 121, Ukendt 4 | Kontakt | |
New Zealand_MA_16 | New Zealand engelsk | New Zealand engelsk | da_NZ | 16 kHz | Medie lyd | 400 | New Zealand engelske medier lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 367, mand 678, Ukendt 26 | Kontakt | |
Oriya_CC_8 | oriya | Oriya (I Pipeline) | eller_IN | Callcenter | 60 | Oriya (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_GC | oriya | Oriya (I Pipeline) | eller_IN | Generel samtale | 100 | Oriya (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Oriya_MA | oriya | Oriya (I Pipeline) | eller_IN | Medie lyd | 40 | Oriya (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Polsk_MA_16 | polsk | polsk | pl_PL | 16 kHz | Medie lyd | 269 | Polsk medie lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 173 Mand 354 Ukendt 6 | Kontakt | |
Polsk Polen_SM_48 | Polsk (Polen) | Polsk (Polen) | PL-PL | 48 kHz | Manuskriptmonolog | 1,482 | Polsk Polen - Manuskriptmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1324 Mand 701 Ukendt 24 | Kontakt | |
Punjabi_CC_8 | punjabi | Punjabi (I pipeline) | punjabi | Callcenter | 60 | Punjabi (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_GC | punjabi | Punjabi (I pipeline) | punjabi | Generel samtale | 100 | Punjabi (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Punjabi_MA | punjabi | Punjabi (I pipeline) | punjabi | Medie lyd | 40 | Punjabi (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Russisk_SM_48 | russisk | russisk | ru-RU | 48 kHz | Manuskriptmonolog | 2,398 | Russisk skriftmonolog | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1689 Mand 1937 Ukendt 214 | Kontakt | |
Skotsk_GC_8 | Skotsk (engelsk accent) | Skotsk (engelsk accent) | da_AB | 8 kHz | Generel samtale | 292 | Skotske generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 285 , Mand 260, Ukendt 3 | Kontakt | |
Singapore_CC_8 | Singapore engelsk | Singapore engelsk | da_SG | 8 kHz | Callcenter | 218 | Singapore Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 2139 , Mand 884, Ukendt 21 | Kontakt | |
Singapore_MA_16 | Singapore engelsk | Singapore engelsk | da_SG | 16 kHz | Medie lyd | 247 | Singapore Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 160, Mand 455, Ukendt 37 | Kontakt | |
Sydafrikansk engelsk_CC_8 | Sydafrikansk engelsk | Sydafrikansk engelsk | da_ZA | 8 kHz | Callcenter | 261 | South African English Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1274 , Mand 935 , Ukendt 1 | Kontakt | |
Sydafrikansk engelsk_MA_16 | Sydafrikansk engelsk | Sydafrikansk engelsk | da_ZA | 16 kHz | Medie lyd | 251 | Sydafrikanske engelske mediers lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 235, Mand 432, Ukendt 36 | Kontakt | |
Swahili_CC_8 | Swahili | Swahili | sw_KE | 8 kHz | Callcenter | 230 | Swahili Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 611, Mand 833, Ukendt 0 | Kontakt | |
Swahili_MA_16 | Swahili | Swahili | sw_KE | 16 kHz | Medie lyd | 265 | Swahili Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 118, Mand 493, Ukendt 25 | Kontakt | |
Svensk_CC_8 | Svensk | Svensk | sv_SE | 8 kHz | Callcenter | 250 | Svenske Call-Center data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1581, Mand 727, Ukendt 2 | Kontakt | |
Svensk_MA_16 | Svensk | Svensk | sv_SE | 16 kHz | Medie lyd | 278 | Svenske mediers lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 195, Mand 500, Ukendt 21 | Kontakt | |
Tamil_CC_8 | tamil | Tamil (I pipeline) | ta_IN | Callcenter | 60 | Tamil (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_GC | tamil | Tamil (I pipeline) | ta_IN | Generel samtale | 100 | Tamil (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Tamil_MA | tamil | Tamil (I pipeline) | ta_IN | Medie lyd | 40 | Tamil (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Generel samtale | 553 | Telugu generelle samtaledata | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 574 , Mand 564, Ukendt 0 | Kontakt | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Medie lyd | 648 | Telugu Media lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 207, Mand 963, Ukendt 2 | Kontakt | |
Telugu_CC_8 | telugu | Telugu (I pipeline) | te_IN | Callcenter | 30 | Telugu (In Pipeline) Call-Center-data | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_GC | telugu | Telugu (I pipeline) | te_IN | Generel samtale | 50 | Telugu (In Pipeline) Generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Telugu_MA | telugu | Telugu (I pipeline) | te_IN | Medie lyd | 20 | Telugu (In Pipeline) Medielyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kontakt | ||||
Thai_GC_8 | Thai | Thai | th_TH | 8 kHz | Generel samtale | 183 | Thai generel samtale | Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, et uformelt register brugt mellem venner | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 338, Mand 96, Ukendt 8 | Kontakt | |
Thai_MA_8 | Thai | Thai | th_TH | 16 kHz | Medie lyd | 173 | Thai medie lyd | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 143, Mand 502, Ukendt 26 | Kontakt | |
Tyrkisk Tyrkiet_SM_48 | Tyrkisk Tyrkiet | Tyrkisk Tyrkiet | tr-TR | 48 kHz | Manuskriptmonolog | 2,027 | Tyrkisk Tyrkiet | Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder | Mono | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 1561 Mand 1241 Ukendt 31 | Kontakt | |
Vietnamesisk_GC_8 | vietnamesisk | vietnamesisk | vi_VN | 8 kHz | Generel samtale | 295 | Vietnamesiske generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, nordlige (f.eks. Hanoi), centrale og sydlige (f.eks. Ho Chi Minh City). | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 400, mand 380, Ukendte 2 | Kontakt | |
Vietnamesisk_MA_16 | vietnamesisk | vietnamesisk | vi_VN | 16 kHz | Medie lyd | 257 | vietnamesiske medier lyddata | Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter | Mono | Web Sourcing | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 249, mand 200, Ukendte 45 | Kontakt | |
Welsh_GC_8 | walisisk (engelsk accent) | walisisk (engelsk accent) | da_WL | 8 kHz | Generel samtale | 278 | walisiske generelle samtaledata | Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, | Dual | desktop | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Kvinde 270, Mand 324, Ukendt 0 | Kontakt | |
UK English_WW_16 | UK engelsk | UK engelsk | da_dk | 16 kHz | Wake Word | 200 højttalere | Wake Word engelsk engelsk | nøglesætningsindsamling af data
| 1 kanal | Mobile App | 5.0 | . Wav | .json | ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling | Køn: 50 % mænd, 50 % kvinder, +/- 10 %. | Kontakt |
Tjenester tilbydes
Ekspert indsamling af lyddata er ikke alle-hands-on-deck til omfattende AI-opsætninger. Hos Shaip kan du endda overveje følgende tjenester for at gøre modeller langt mere udbredte end normalt:
Indsamling af tekstdata
Services
Den sande værdi af Shaip kognitive dataindsamlingstjenester er, at det giver organisationer nøglen til at låse op for kritisk information, der findes i ustrukturerede data
Services til indsamling af billeddata
Sørg for, at din computervisionsmodel identificerer hvert billede præcist for problemfrit at kunne træne fremtidens næste generation af AI-modeller
Services til indsamling af videodata
Fokuser nu på computersyn sammen med NLP til træning af dine modeller i at identificere objekter, individer, afskrækkende midler og andre visuelle elementer til perfektion
Anbefalede ressourcer
Tilbyder
Lydkommentar til intelligente AI'er
Lydkommentartjenester har været en af Shaips styrke siden begyndelsen. Udvikle, træne og forbedre konversations-AI, chatbots og talegenkendelsesmotorer med vores avancerede lydannoteringstjenester.
Købervejledning
Købervejledning: Komplet guide til konversations-AI
Den chatbot, du har talt med, kører på et avanceret konversations-AI-system, der er trænet, testet og bygget ved hjælp af tonsvis af talegenkendelsesdatasæt.
Datakatalog
Off-the-Shelf Tale Data Katalog & Licens
Der er en lang række almindelige applikationer til taledata i AI-projekter. Vi tilbyder dig enorme mængder af højkvalitetsdata klar til din stemmegenkendelse.
Vil du bygge dit eget lyddatasæt?
Få kontakt med vores interne taledataindsamlingsekspert for at opsætte et lydlager, der bedst passer til dit behov