Mest betroede tjenester til indsamling af taledata til din AI

Træn dine NLP -modeller, VA'er, TTS -prototyper og mere med samtaledata af høj kvalitet med vores tjenester til indsamling af lyd- og taledata

Indsamling af lyddata

Opdag lyddatapipelines uden flaskehalse.

Fremhævede klienter

Hvorfor er taletræningsdatasæt nødvendigt for behandling af naturligt sprog?

Har du nogensinde lagt mærke til, at din smartphone VA, dvs. Siri, Bixby eller noget andet, interagerer? Den måde, de besvarer hvert spørgsmål og analyserer og præsenterer resultater i henhold til dine krav!

Så meget som disse VA'er fascinerer os, skal disse intelligente ressourcer og programmer trænes gradvist for at kunne reagere så præcist. Dette er grunden til, at du bør overveje at outsource indsamling af tale/lyd og stemmedata til specialiserede dataindsamlingsvirksomheder med validerende faglig ekspertise.

Investering i indsamling af lyddata forbereder din påståede NLP til at henvende sig til et flersproget publikum. Ikke bare det, taledataindsamling til NLP, som og når den håndteres af en ekspert, tager endda højde for indsamling i felten, semantisk analyse og lydtransskription. Med professionelle taledataindsamlingsløsninger kan du:

  • Anskaf lyddatasæt af høj kvalitet for at forbedre nøjagtigheden
  • Målret forskellige scenarier opsætning
  • Indsaml flersprogede AI -træningsdata
  • Skaler din ML-model, så den passer til forskellig demografi og vertikaler

Professionelle tjenester til indsamling af lyd / stemme til NLP

Ethvert emne. Ethvert scenarie.

Intelligente NLP -systemer er alt andet end generiske. Afhængigt af programmets funktionalitet er du muligvis nødt til at fokusere på rumlige og flersprogede lyddatatjenester, som kun kan tilbydes af velrenommerede virksomheder til indsamling af tale-/lyddata. Det er her, Shaip kommer ind i tingene som en yderst pålidelig udbyder af dataforbindelser, der sætter en ære i at gøre de tunge løft for dine angiveligt intelligente AI'er.

Hos Shaip er vores primære fokus på fodring af modeller med den højest mulige mængde tilpassede taleprøver på mindst mulig tid. Hos os om bord kan du forvente:

Talesamling
  • Kurateret lyd-/stemmedataindsamling til NLP
  • Skræddersyede programmer, der reagerer i henhold til specifikke brugssager
  • Gør minedatabasen med lyddatasæt klar
  • Mønster-specifik og automatiseret databehandling
  • Højest mulige niveau af domænespecificitet
  • Hurtigere markedsføring med accelererede AI -modeller

Vores ekspertise

Juster lyddata til at forberede smarte NLP -modeller

Shaip tilbyder ende-til-ende-tale-/lyddataindsamlingstjenester på over 100+ sprog for at gøre det muligt for stemmeaktiverede teknologier at imødekomme et mangfoldigt sæt publikum over hele kloden. Vi kan arbejde på projekter af enhver størrelse og størrelse; fra licensering af eksisterende lyddatasæt på hylden til administration af tilpasset indsamling af lyddata til lydtranskription og annotering. Uanset hvor stort dit taledataindsamlingsprojekt er, kan vi tilpasse lydopsamlingstjenesterne til dine behov for at bygge NLP-datasæt af høj kvalitet, der målretter mod dialekter, toner og sprog. Vælg mellem vores brede udvalg af taledatasæt og ressourcer til indsamling af lyddata til intelligente opsætninger, der muliggør stemme.

Monolog tale

Monolog Speech Collection

Håndter tale-baserede krav vedrørende en selvstændig højttaler til dine Text-to-Speed ​​prototyper og transskription-specifikke krav med scripted promptfeed via enkeltkanalsfiler.

Dialogtale

Dialogtale
Samling

Opsæt intelligente virtuelle assistenter, hastighedsspecifikke chatbots og modeller med automatisk talegenkendelse med flersproget eksponering via tokanalsfiler og transkriberede ressourcer.

Akustisk tale

Akustiske data
Samling

Vi kan professionelt optage lyddata i studiokvalitet, det være sig restauranter, kontorer eller hjem eller fra forskellige miljøer og sprog gennem vores globale netværk af samarbejdspartnere, samtidig med at vi dækker et bredere akustisk område

Naturligt sprogudtalelse

Samling af naturlige sprogudtalelser

Træn smarte kommercielle opsætninger til at identificere anderledes udtalte kundesætninger med lignende betydning for at gøre AI'erne mere autonome med tiden

Digitale virtuelle assistenter

Digital / virtuel
assistenter

Fokuser på at opbygge din kommende Virtual Assistant ved at træne modeller med forbehold for menneskelig tale, flersproget eksponering, kontekstuel analyse og NLU.

Automatisk talegenkendelse

Automatisk talegenkendelse (ASR)

Forbedre nøjagtigheden af ​​dine automatiske talegenkendelsessystemer (ASR) ved at have adgang til state-of-art diversificerede tale-/lyddatasæt fra en bred vifte af demografi.

Naturligt sprogudtalelse

Flersproget tale/lydtræningsdata

Vores højtuddannede sprogprofessionelle over hele kloden tilbyder flersprogede lyd-/taletræningsdata på flere sprog og dialekter, herunder arabisk, dansk, kinesisk, afrikaans, Singapore, New Zealand, hebraisk, indonesisk, irsk, koreansk, malaysisk, polsk, skotsk, svensk , fransk, tysk, vietnamesisk, thai, italiensk, spansk og mere.

Digitale virtuelle assistenter

Tekst-til-tale
(TTS)

For at tilbyde en bedre brugeroplevelse med TTS er det afgørende at udvikle et system, der lyder naturligt. Byg en tekst-til-tale (TTS) flersproget model med hjælp fra vores globale arbejdsstyrke, som hjælper dig med at indsamle taledata på 150+ sprog og dialekter for at forbedre dine AI-modeller fra kontrol i bilen til chatbots og læringsløsninger med høj- kvalitetslyddata.

Grunde til at vælge Shaip som din troværdige taledataindsamlingspartner

Mennesker

Mennesker

Dedikerede og uddannede hold:

  • 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
  • Godkendt projektledelsesteam
  • Erfaren produktudviklingsteam
  • Talent Pool Sourcing & Onboarding Team
Behandle

Behandle

Højeste proceseffektivitet sikres med:

  • Robust 6 Sigma Stage-Gate-proces
  • Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
  • Løbende forbedring og feedback
perron

perron

Den patenterede platform giver fordele:

  • Web-baseret ende-til-ende platform
  • Upåklagelig kvalitet
  • Hurtigere TAT
  • Problemfri levering

Sprog: Indsamlede lyddatasæt

Off-the-shelf Tale / Audio Datasæt

DetaljerSprogdatasætPrøvefrekvensDatasættypeSamlede lydtimerKort beskrivelseDatasætbeskrivelseAudio ChannelOptageplatformWER (%)Lyd FormatTransskriptionsformatUse CaseAntal højttalereCTA
Taleda_US_CC_8Afroamerikansk sprogAfroamerikansk sprogda_DK8 kHzCall-center211African American Vernacular Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 612, Mand: 1242 og Ukendt: 12
Taleda_US_MA_16Afroamerikansk sprogAfroamerikansk sprogda_DK16 kHzMedie lyd154African American Vernacular Media dataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 151, Mand: 150 og Ukendt: 10
TaleAfrikaans_GC_8AfrikaansAfrikaansaf_ZA8 kHzGenerel samtale368Afrikaans generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, afrikaans tales i AfrikaDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 502, Mand: 390 og Ukendt: 2
TaleAfrikaans_MA_16AfrikaansAfrikaansaf_ZA16 kHzMedie lyd658afrikanske mediefilerLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 750, Mand: 1278 og Ukendt: 52
TaleArabisk_GC_8ArabicArabicar_AE8 kHzGenerel samtale292Arabisk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, arabisk fra GolflandeneDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 171, Mand: 534 og Ukendt: 1
TaleArabisk_SM_48ArabicArabicar-SA48 kHzManuskriptmonolog1,947Monolog med arabisk skriftOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 838 Mand 1209 Ukendt 78
TaleAssamisk_CC_8AssamesiskAssamisk (I pipeline) som iCallcenter60Assamesiske (I Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_GCAssamesiskAssamisk (I pipeline) som iGenerel samtale100Assamisk (I Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_MAAssamesiskAssamisk (I pipeline) som iMedie lyd40Assamisk (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_CC_8bengaliBengali (I Pipeline) bn_INCallcenter60Bengali (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_GCbengaliBengali (I Pipeline) bn_INGenerel samtale100Bengali (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_MAbengaliBengali (I Pipeline) bn_INMedie lyd40Bengali (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBoston_CC_8Boston engelskBoston engelskda_DK8 kHzCallcenter177Boston Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 605, Mand: 711 og Ukendt: 0
TaleBoston_GC_8Boston engelskBoston engelskda_DK8 kHzGenerel samtale32Boston generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 53, Mand: 83 og Ukendt: 0
TaleBoston_MA_16Boston engelskBoston engelskda_DK16 kHzMedie lyd93Boston Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 43, Mand: 181 og Ukendt: 2
TaleCanadisk_SM_48Canadisk franskCanadisk franskfr-CA48 kHzManuskriptmonolog1,222Canadisk franskOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 974 Mand 631 Ukendt 1
Talekinesisk_CC_8Kinesisk engelskKinesisk engelskda_DK8 kHzCallcenter169Kinesiske Call-center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 1790, Mand: 523 og Ukendt: 13
Talekinesisk_MA_16Kinesisk engelskKinesisk engelskda_DK16 kHzMedie lyd249Kinesiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 126, Mand: 346 og Ukendt: 6
TaleKinesisk forenklet_SM_48Forenklet kinesiskForenklet kinesiskzh-CN48 kHzManuskriptmonolog2,762Forenklet kinesiskOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1920 Mand 1535 Ukendt 270
TaleTraditionel kinesisk_SM_48Traditionelt kinesiskTraditionelt kinesiskzh-TW48 kHzManuskriptmonolog1,028Traditionelt kinesiskOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1069 Mand 262 Ukendt 3
TaleDanish_GC_8DanskDanskda_DK8 kHzGenerel samtale372Danske almindelige samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 311, Mand: 417, Ukendt: 0
TaleDanish_MA_16DanskDanskda_DK16 kHzMedie lyd664Danske Medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 369, Mand: 864, Ukendt: 27
TaleDanish_SM_48DanskDanskda-DK48 kHzManuskriptmonolog2,579Dansk skriftmonologEnkelt-ytring optagelser, som har tendens til at falde i 5 til 30 sekunders rækkevidde, dansk fra DanmarkMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1551 Mand 1233 Ukendt 42
TaleEngelsk Deep South_CC_8Engelsk Deep SouthEngelsk Deep Southda_DK8 kHzCallcenter151Engelsk Deep South Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 221 , Mand 1004 , Ukendt 7
TaleEngelsk Deep South_GC_8Engelsk Deep SouthEngelsk Deep Southda_DK8 kHzGenerel samtale56Engelsk Deep South Generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 99, Mand 31, Ukendt 0
TaleEngelsk Deep South_MA_16Engelsk Deep SouthEngelsk Deep Southda_DK16 kHzMedie lyd266Engelske Deep South Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 204, Mand 356, Ukendt 21
TaleTysk_CC_8TyskTyskde-De8 kHzCallcenter64Tyske Call-center data Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Monodesktop. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 478 Mand 1440 Ukendt 0
TaleTysk_IVR_8TyskTyskde-De8 kHz IVR200Tyske IVR-dataMenneske til maskine. En IVR type flow, hvor der er en TTS prompt (f.eks. "Hvordan kan jeg hjælpe dig") efterfulgt af en spontan menneskelig reaktionMonodesktop. Wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Kvinde 10115 Mand 8750 Ukendt 0
TaleGujarati_CC_8gujaratiGujarati (I pipeline) gu_INCallcenter60Gujarati (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_GCgujaratiGujarati (I pipeline) gu_INGenerel samtale100Gujarati (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_MAgujaratiGujarati (I pipeline) gu_INMedie lyd40Gujarati (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleHebraisk_Generel Samtale_8hebraiskhebraiskhan_IL8 kHzGenerel samtale399Hebraisk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, hebraisk i IsraelDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 414 , Mand 399 , Ukendt 1
TaleHebraisk_MA_16hebraiskhebraiskhan_IL16 kHzMedie lyd427Hebraiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 361 , Mand 513, Ukendt 13
TaleHindi_MA_16HindiHindihej_IN16 kHzMedie lyd219Hindi Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 83 , Mand 309, Ukendt 0
TaleHindi_SM_48HindiHindihi-IN48 kHzManuskriptmonolog2,867Hindi scripted monologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1977 Mand 1864 Ukendt 147
TaleHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCallcenter208HINGLISH Call-center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 822, Mand 1262, Ukendt 0
TaleHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedie lyd216HINGLISH MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 75, Mand 380, Ukendt 0
TaleHispanic_CC_8Spansk engelskSpansk engelskda_DK8 kHzCallcenter212Hispanic Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 822, Mand 1262, Ukendt 0
TaleHispanic_MA_16Spansk engelskSpansk engelskda_DK16 kHzMedie lyd155Hispanic Call Media-lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 140, Mand 219, Ukendt 5
TaleIndonesisk_GC_8indonesiskindonesiskjeg gjorde8 kHzGenerel samtale496Indonesiske generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, indonesiskDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 524, Mand 454, Ukendt 2
TaleIndonesisk_MA_16indonesiskindonesiskjeg gjorde16 kHzMedie lyd643Indonesiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 746, Mand 1507, Ukendt 129
TaleIrsk_GC_8IrishIrishda_IE8 kHzGenerel samtale192Irske generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 213 , Mand 153 , Ukendt 0
TaleJapansk_SM_48japanskjapanskja-JP48 kHzManuskriptmonolog2,335Japansk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1460 Mand 1221 Ukendt 194
TaleKannada_CC_8KannadaKannada (I Pipeline) kn_INCallcenter60Kannada (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_GCKannadaKannada (I Pipeline) kn_INGenerel samtale100Kannada (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_MAKannadaKannada (I Pipeline) kn_INMedie lyd40Kannada (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKoreansk_CC_8KoreanKoreanko_KR8 kHzCallcenter107Koreanske Call-center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1086, Mand 210, Ukendt 4
TaleKoreansk_MA_16KoreanKoreanko_KR16 kHzMedie lyd204Koreanske medielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 70 Mand 303, Ukendt 25
TaleKoreansk_SM_48KoreanKoreanko-KR48 kHzManuskriptmonolog1,955Koreansk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1195 Mand 1134 Ukendt 122
TaleMalay_GC_8MalayMalayms_MIN8 kHzGenerel samtale266Malayisk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, malaysisk i MalaysiaDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 316, Mand 176, Ukendt 0
TaleMalay_MA_16MalayMalayms_MIN16 kHzMedie lyd344Malay Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 236, Mand 626, Ukendt 47
TaleMalayalam_CC_8malayalamMalayalam (I pipeline) ml_INCallcenter60Malayalam (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_GCmalayalamMalayalam (I pipeline) ml_INGenerel samtale100Malayalam (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_MAmalayalamMalayalam (I pipeline) ml_INMedie lyd40Malayalam (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_CC_8MarathiMarathi (I Pipeline) mr_INCallcenter60Marathi (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_GCMarathiMarathi (I Pipeline) mr_INGenerel samtale100Marathi (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_MAMarathiMarathi (I Pipeline) mr_INMedie lyd40Marathi (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMexicansk_SM_48Spansk (Mexico)Spansk (Mexico)es-MX48 kHzManuskriptmonolog1,492Mexicansk spansk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1016 Mand 1069 Ukendt 95
TaleHolland_SM_48HollandskHollandsknl-NL48 kHzManuskriptmonolog1,205hollandsk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1285 Mand 531 Ukendt 3
TaleNew York English_CC_8New York engelskNew York engelskda_DK8 kHzCallcenter103New York engelsk Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 610, Mand 532, Ukendt 0
TaleNew York English_GC_8New York engelskNew York engelskda_DK8 kHzGenerel samtale107New York engelsk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 118, Mand 114, Ukendt 0
TaleNew York English_MA_16New York engelskNew York engelskda_DK16 kHzMedie lyd140New York engelske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 66, Mand 230, Ukendt 11
TaleNew Zealand_GC_8New Zealand engelsk New Zealand engelsk da_NZ8 kHzGenerel samtale148New Zealand engelsk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 167, mand 121, Ukendt 4
TaleNew Zealand_MA_16New Zealand engelsk New Zealand engelsk da_NZ16 kHzMedie lyd400New Zealand engelske medier lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 367, mand 678, Ukendt 26
TaleOriya_CC_8oriyaOriya (I Pipeline) eller_INCallcenter60Oriya (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_GCoriyaOriya (I Pipeline) eller_INGenerel samtale100Oriya (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_MAoriyaOriya (I Pipeline) eller_INMedie lyd40Oriya (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePolsk_MA_16polskpolskpl_PL16 kHzMedie lyd269Polsk medie lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 173 Mand 354 Ukendt 6
TalePolsk Polen_SM_48Polsk (Polen)Polsk (Polen)PL-PL48 kHzManuskriptmonolog1,482Polsk Polen - ManuskriptmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1324 Mand 701 Ukendt 24
TalePunjabi_CC_8punjabiPunjabi (I pipeline) punjabiCallcenter60Punjabi (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_GCpunjabiPunjabi (I pipeline) punjabiGenerel samtale100Punjabi (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_MApunjabiPunjabi (I pipeline) punjabi Medie lyd40Punjabi (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleRussisk_SM_48russiskrussiskru-RU48 kHzManuskriptmonolog2,398Russisk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1689 Mand 1937 Ukendt 214
TaleSkotsk_GC_8Skotsk (engelsk accent)Skotsk (engelsk accent)da_AB8 kHzGenerel samtale292Skotske generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 285 , Mand 260, Ukendt 3
TaleSingapore_CC_8Singapore engelskSingapore engelskda_SG8 kHzCallcenter218Singapore Call-Center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 2139 , Mand 884, Ukendt 21
TaleSingapore_MA_16Singapore engelskSingapore engelskda_SG16 kHzMedie lyd247Singapore Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 160, Mand 455, Ukendt 37
TaleSydafrikansk engelsk_CC_8Sydafrikansk engelskSydafrikansk engelskda_ZA8 kHzCallcenter261South African English Call-Center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1274 , Mand 935 , Ukendt 1
TaleSydafrikansk engelsk_MA_16Sydafrikansk engelskSydafrikansk engelskda_ZA16 kHzMedie lyd251Sydafrikanske engelske mediers lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 235, Mand 432, Ukendt 36
TaleSwahili_CC_8SwahiliSwahilisw_KE8 kHzCallcenter230Swahili Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 611, Mand 833, Ukendt 0
TaleSwahili_MA_16SwahiliSwahilisw_KE16 kHzMedie lyd265Swahili Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 118, Mand 493, Ukendt 25
TaleSvensk_CC_8SvenskSvensksv_SE8 kHzCallcenter250Svenske Call-Center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1581, Mand 727, Ukendt 2
TaleSvensk_MA_16SvenskSvensksv_SE16 kHzMedie lyd278Svenske mediers lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 195, Mand 500, Ukendt 21
TaleTamil_CC_8tamilTamil (I pipeline) ta_INCallcenter60Tamil (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_GCtamilTamil (I pipeline) ta_INGenerel samtale100Tamil (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_MAtamil Tamil (I pipeline) ta_INMedie lyd40Tamil (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GC_8telugutelugute_IN8 kHzGenerel samtale553Telugu generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 574 , Mand 564, Ukendt 0
TaleTelugu_MA_16telugutelugute_IN16 kHzMedie lyd648Telugu Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 207, Mand 963, Ukendt 2
TaleTelugu_CC_8teluguTelugu (I pipeline) te_INCallcenter30Telugu (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GCteluguTelugu (I pipeline) te_INGenerel samtale50Telugu (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_MAteluguTelugu (I pipeline) te_INMedie lyd20Telugu (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleThai_GC_8ThaiThaith_TH8 kHzGenerel samtale183Thai generel samtaleUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, et uformelt register brugt mellem vennerDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 338, Mand 96, Ukendt 8
TaleThai_MA_8ThaiThaith_TH16 kHzMedie lyd173Thai medie lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 143, Mand 502, Ukendt 26
TaleTyrkisk Tyrkiet_SM_48Tyrkisk TyrkietTyrkisk Tyrkiettr-TR48 kHzManuskriptmonolog2,027Tyrkisk TyrkietOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1561 Mand 1241 Ukendt 31
TaleVietnamesisk_GC_8vietnamesiskvietnamesiskvi_VN8 kHzGenerel samtale295Vietnamesiske generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, nordlige (f.eks. Hanoi), centrale og sydlige (f.eks. Ho Chi Minh City).Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 400, mand 380, Ukendte 2
TaleVietnamesisk_MA_16vietnamesiskvietnamesiskvi_VN16 kHzMedie lyd257vietnamesiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 249, mand 200, Ukendte 45
TaleWelsh_GC_8walisisk (engelsk accent)walisisk (engelsk accent)da_WL8 kHzGenerel samtale278walisiske generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 270, Mand 324, Ukendt 0
TaleUK English_WW_16UK engelskUK engelskda_dk16 kHzWake Word200 højttalereWake Word engelsk engelsknøglesætningsindsamling af data
  • 200 højttalere
  • 4 unikke nøglesætninger pr. højttaler
  • 25-30 gentagne nøglesætningsoptagelser pr. unik nøglesætning
  • 25-30 lydfiler pr. unik nøglesætning
  • 120 samlede optagne ytringer pr. højttaler
1 kanalMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKøn: 50 % mænd, 50 % kvinder, +/- 10 %.

Tjenester tilbydes

Ekspert indsamling af lyddata er ikke alle-hands-on-deck til omfattende AI-opsætninger. Hos Shaip kan du endda overveje følgende tjenester for at gøre modeller langt mere udbredte end normalt:

Indsamling af tekstdata

Indsamling af tekstdata
Services

Den sande værdi af Shaip kognitive dataindsamlingstjenester er, at det giver organisationer nøglen til at låse op for kritisk information, der findes i ustrukturerede data

Indsamling af billeddata

Services til indsamling af billeddata

Sørg for, at din computervisionsmodel identificerer hvert billede præcist for problemfrit at kunne træne fremtidens næste generation af AI-modeller

Video Dataindsamling

Services til indsamling af videodata

Fokuser nu på computersyn sammen med NLP til træning af dine modeller i at identificere objekter, individer, afskrækkende midler og andre visuelle elementer til perfektion

Shaip Kontakt os

Vil du bygge dit eget lyddatasæt?

Få kontakt med vores interne taledataindsamlingsekspert for at opsætte et lydlager, der bedst passer til dit behov

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.