Mest betroede tjenester til indsamling af taledata til din AI

Træn dine NLP -modeller, VA'er, TTS -prototyper og mere med samtaledata af høj kvalitet med vores tjenester til indsamling af lyd- og taledata

Indsamling af lyddata

Opdag lyddatapipelines uden flaskehalse

Fremhævede klienter

Professionel lyd-/stemmedataindsamlingstjenester

Ethvert emne. Ethvert scenarie.

Hos Shaip ligger vores ekspertise i at skabe højkvalitets taledatasæt designet til forskellige AI/ML-krav. Vi tilbyder et bredt udvalg af sprog og optager i forskellige indstillinger, hvilket gør vores datasæt omfattende og tilpasningsdygtige. Odit fokus er på at fodre modeller med den højeste mængde brugerdefinerede taledata på mindst mulig tid. Med os ombord kan du forvente: 

Talesamling
  • Kurateret højkvalitets flersproget lyd-/stemmedata for at forbedre nøjagtigheden
  • Højest mulig niveau af domænespecificitet til target forskelligartet scenarie setup
  •  Skaler din ML-model, så den passer til forskellig demografi og vertikaler
  • Optagelsesmiljøer: Studio kvalitet, med krystalklar lyd med minimal baggrundsstøj, & Naturlige miljøer, hvor optagelser inkorporerer omgivende lyde for at efterligne situationer i den virkelige verden.

100 +

Lande

55K +

Timer med taledata

250 +

Projekter

60 +

Sprog (100+ dialekter)

8 / 16 / 44 / 48 kHz

Samplingfrekvens

Vores ekspertise

Juster lyddata til smartere NLP-modeller

Shaip tilbyder ende-til-ende-tale-/lyddataindsamlingstjenester på over 100+ sprog for at gøre det muligt for stemmeaktiverede teknologier at imødekomme et mangfoldigt sæt publikum over hele kloden. Vi kan arbejde på projekter af enhver størrelse og størrelse; fra licensering af eksisterende lyddatasæt på hylden til administration af tilpasset indsamling af lyddata til lydtranskription og annotering. Uanset hvor stort dit taledataindsamlingsprojekt er, kan vi tilpasse lydopsamlingstjenesterne til dine behov for at bygge NLP-datasæt af høj kvalitet, der målretter mod dialekter, toner og sprog. Vælg mellem vores brede udvalg af taledatasæt og ressourcer til indsamling af lyddata til intelligente opsætninger, der muliggør stemme.

Monolog tale

Monolog Speech Collection

Den fokuserer på at behandle tale fra en enkelt taler. Udnyt scriptede prompter til at føres ind i enkeltkanals lydfiler, hvilket sikrer opfangning af unikke talemønstre, toner og nuancer, der er specifikke for den enkelte.

Dialog tale

Dialogtale
Samling

Interaktion med to personer, replikerer samtaler og dialoger fra den virkelige verden med flersproget eksponering via to-kanals filer og transskriberede ressourcer.

Samtaler med flere parter

Gruppe / Muti-party
Samtaler

Diskussioner med flere personer, indfanger gruppedynamik, overlapninger og varierede toner for præcist at træne talemodeller.

Naturlig sproglig ytring

Samling af naturlige sprogudtalelser

Træn AI'er til at identificere sætninger eller vække ord med lignende betydninger ved hjælp af forskellige, rige og autentiske ytringer til avanceret naturlig sprogbehandling og -forståelse.

Akustisk tale

Akustiske data
Samling

Vi kan professionelt optage lyddata i studiekvalitet, hvad enten det er restauranter, kontorer eller hjem eller fra forskellige miljøer og sprog, mens vi dækker et bredere akustisk område (omfattende lyddatasæt).

Automatisk talegenkendelse

Automatisk talegenkendelse (ASR)

Forbedre nøjagtigheden af ​​dine automatiske talegenkendelsessystemer (ASR) ved at have adgang til state-of-art diversificerede tale-/lyddatasæt fra en bred vifte af demografi.

Naturlig sproglig ytring

Flersproget tale/lydtræningsdata

Vores dygtige sprogfolk over hele kloden tilbyder flersprogede lyd-/taledata på forskellige sprog og dialekter. Denne indsats fremmer global kommunikation og bygger bro over sprogbarrierer og bidrager til mere inkluderende og effektive AI-løsninger.

Digitale virtuelle assistenter

Tekst-til-tale
(TTS)

Byg en tekst-til-tale (TTS) flersproget model med hjælp fra vores globale arbejdsstyrke, som hjælper dig med at indsamle taledata på 150+ sprog og dialekter for at forbedre dine AI-modeller fra kontrol i bilen til chatbots og læringsløsninger med høj- kvalitetslyddata.

Call center optagelser

Call center
Optagelser

Ægte udvekslinger mellem agenter og kunder, der understøtter adskillige sprog såsom spansk, tysk, amerikansk engelsk, bengali, japansk, kinesisk og hindi.

Succeshistorier

Samtale AI-datasæt med over 3k timers data på tværs af 8 sprog

På udkig efter at bygge en flersproget platform til indiske sprog, samarbejdede klienten med Shaip om at indsamle, segmentere og transskribere store datasæt på flere indiske sprog. Dette ville hjælpe med at udvikle effektive talemodeller, der kunne drive kundens innovative nye platform.

problem: Over 3,000 timers lyddata indsamlet på 8 indiske sprog, segmenteret og transskriberet for at udvikle automatisk talegenkendelse.

Opløsning: Vi leverede dataindsamling, segmentering, transskription og leverede JSON-filer med metadata. Vi indsamlede 3000 timers lyddata på 8 indiske sprog i skala til kundens taleteknologiprojekt.

Casestudie til indsamling af taledata

Grunde til at vælge Shaip som din troværdige taledataindsamlingspartner

Mennesker

Mennesker

Dedikerede og uddannede hold:

  • 30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
  • Godkendt projektledelsesteam
  • Erfaren produktudviklingsteam
  • Talent Pool Sourcing & Onboarding Team
Proces

Proces

Højeste proceseffektivitet sikres med:

  • Robust 6 Sigma Stage-Gate-proces
  • Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
  • Løbende forbedring og feedback
perron

perron

Den patenterede platform giver fordele:

  • Web-baseret ende-til-ende platform
  • Upåklagelig kvalitet
  • Hurtigere TAT
  • Problemfri levering

Off-the-shelf Tale / Audio Datasæt

DetaljerSprogdatasætPrøvefrekvensDatasættypeSamlede lydtimerKort beskrivelseDatasætbeskrivelseAudio ChannelOptageplatformWER (%)Lyd FormatTransskriptionsformatUse CaseAntal højttalereCTA
Taleda_US_CC_8Afroamerikansk sprogAfroamerikansk sprogda_DK8 kHzCall-center211African American Vernacular Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 612, Mand: 1242 og Ukendt: 12
Taleda_US_MA_16Afroamerikansk sprogAfroamerikansk sprogda_DK16 kHzMedie lyd154African American Vernacular Media dataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 151, Mand: 150 og Ukendt: 10
TaleAfrikaans_GC_8AfrikaansAfrikaansaf_ZA8 kHzGenerel samtale368Afrikaans generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, afrikaans tales i AfrikaDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 502, Mand: 390 og Ukendt: 2
TaleAfrikaans_MA_16AfrikaansAfrikaansaf_ZA16 kHzMedie lyd658afrikanske mediefilerLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 750, Mand: 1278 og Ukendt: 52
TaleArabisk_GC_8arabiskarabiskar_AE8 kHzGenerel samtale292Arabisk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, arabisk fra GolflandeneDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 171, Mand: 534 og Ukendt: 1
TaleArabisk_SM_48arabiskarabiskar-SA48 kHzManuskriptmonolog1,947Monolog med arabisk skriftOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 838 Mand 1209 Ukendt 78
TaleAssamisk_CC_8AssamesiskAssamisk (I pipeline) som iCallcenter60Assamesiske (I Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_GCAssamesiskAssamisk (I pipeline) som iGenerel samtale100Assamisk (I Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleAssamese_MAAssamesiskAssamisk (I pipeline) som iMedie lyd40Assamisk (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_CC_8bengalskBengali (I Pipeline) bn_INCallcenter60Bengali (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_GCbengalskBengali (I Pipeline) bn_INGenerel samtale100Bengali (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBengali_MAbengalskBengali (I Pipeline) bn_INMedie lyd40Bengali (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleBoston_CC_8Boston engelskBoston engelskda_DK8 kHzCallcenter177Boston Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 605, Mand: 711 og Ukendt: 0
TaleBoston_GC_8Boston engelskBoston engelskda_DK8 kHzGenerel samtale32Boston generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 53, Mand: 83 og Ukendt: 0
TaleBoston_MA_16Boston engelskBoston engelskda_DK16 kHzMedie lyd93Boston Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 43, Mand: 181 og Ukendt: 2
TaleCanadisk_SM_48Canadisk franskCanadisk franskfr-CA48 kHzManuskriptmonolog1,222Canadisk franskOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 974 Mand 631 Ukendt 1
Talekinesisk_CC_8Kinesisk engelskKinesisk engelskda_DK8 kHzCallcenter169Kinesiske Call-center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 1790, Mand: 523 og Ukendt: 13
Talekinesisk_MA_16Kinesisk engelskKinesisk engelskda_DK16 kHzMedie lyd249Kinesiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 126, Mand: 346 og Ukendt: 6
TaleKinesisk forenklet_SM_48Forenklet kinesiskForenklet kinesiskzh-CN48 kHzManuskriptmonolog2,762Forenklet kinesiskOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1920 Mand 1535 Ukendt 270
TaleTraditionel kinesisk_SM_48Traditionelt kinesiskTraditionelt kinesiskzh-TW48 kHzManuskriptmonolog1,028Traditionelt kinesiskOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1069 Mand 262 Ukendt 3
TaleDanish_GC_8DanskeDanskeda_DK8 kHzGenerel samtale372Danske almindelige samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 311, Mand: 417, Ukendt: 0
TaleDanish_MA_16DanskeDanskeda_DK16 kHzMedie lyd664Danske Medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde: 369, Mand: 864, Ukendt: 27
TaleDanish_SM_48DanskeDanskeda-DK48 kHzManuskriptmonolog2,579Dansk skriftmonologEnkelt-ytring optagelser, som har tendens til at falde i 5 til 30 sekunders rækkevidde, dansk fra DanmarkMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1551 Mand 1233 Ukendt 42
TaleEngelsk Deep South_CC_8Engelsk Deep SouthEngelsk Deep Southda_DK8 kHzCallcenter151Engelsk Deep South Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 221 , Mand 1004 , Ukendt 7
TaleEngelsk Deep South_GC_8Engelsk Deep SouthEngelsk Deep Southda_DK8 kHzGenerel samtale56Engelsk Deep South Generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 99, Mand 31, Ukendt 0
TaleEngelsk Deep South_MA_16Engelsk Deep SouthEngelsk Deep Southda_DK16 kHzMedie lyd266Engelske Deep South Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 204, Mand 356, Ukendt 21
TaleTysk_CC_8TyskTyskde-De8 kHzCallcenter64Tyske Call-center data Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Monodesktop. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 478 Mand 1440 Ukendt 0
TaleTysk_IVR_8TyskTyskde-De8 kHz IVR200Tyske IVR-dataMenneske til maskine. En IVR type flow, hvor der er en TTS prompt (f.eks. "Hvordan kan jeg hjælpe dig") efterfulgt af en spontan menneskelig reaktionMonodesktop. Wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Kvinde 10115 Mand 8750 Ukendt 0
TaleGujarati_CC_8gujaratiGujarati (I pipeline) gu_INCallcenter60Gujarati (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_GCgujaratiGujarati (I pipeline) gu_INGenerel samtale100Gujarati (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleGujarati_MAgujaratiGujarati (I pipeline) gu_INMedie lyd40Gujarati (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleHebraisk_Generel Samtale_8hebraiskhebraiskhan_IL8 kHzGenerel samtale399Hebraisk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, hebraisk i IsraelDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 414 , Mand 399 , Ukendt 1
TaleHebraisk_MA_16hebraiskhebraiskhan_IL16 kHzMedie lyd427Hebraiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 361 , Mand 513, Ukendt 13
TaleHindi_MA_16HindiHindihej_IN16 kHzMedie lyd219Hindi Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 83 , Mand 309, Ukendt 0
TaleHindi_SM_48HindiHindihi-IN48 kHzManuskriptmonolog2,867Hindi scripted monologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1977 Mand 1864 Ukendt 147
TaleHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCallcenter208HINGLISH Call-center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 822, Mand 1262, Ukendt 0
TaleHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedie lyd216HINGLISH MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 75, Mand 380, Ukendt 0
TaleHispanic_CC_8Spansk engelskSpansk engelskda_DK8 kHzCallcenter212Hispanic Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 822, Mand 1262, Ukendt 0
TaleHispanic_MA_16Spansk engelskSpansk engelskda_DK16 kHzMedie lyd155Hispanic Call Media-lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 140, Mand 219, Ukendt 5
TaleIndonesisk_GC_8indonesiskindonesiskjeg gjorde8 kHzGenerel samtale496Indonesiske generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, indonesiskDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 524, Mand 454, Ukendt 2
TaleIndonesisk_MA_16indonesiskindonesiskjeg gjorde16 kHzMedie lyd643Indonesiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 746, Mand 1507, Ukendt 129
TaleIrsk_GC_8IrishIrishda_IE8 kHzGenerel samtale192Irske generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 213 , Mand 153 , Ukendt 0
TaleJapansk_SM_48japanskjapanskja-JP48 kHzManuskriptmonolog2,335Japansk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1460 Mand 1221 Ukendt 194
TaleKannada_CC_8KannadaKannada (I Pipeline) kn_INCallcenter60Kannada (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_GCKannadaKannada (I Pipeline) kn_INGenerel samtale100Kannada (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKannada_MAKannadaKannada (I Pipeline) kn_INMedie lyd40Kannada (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleKoreansk_CC_8koreanskkoreanskko_KR8 kHzCallcenter107Koreanske Call-center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1086, Mand 210, Ukendt 4
TaleKoreansk_MA_16koreanskkoreanskko_KR16 kHzMedie lyd204Koreanske medielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 70 Mand 303, Ukendt 25
TaleKoreansk_SM_48koreanskkoreanskko-KR48 kHzManuskriptmonolog1,955Koreansk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1195 Mand 1134 Ukendt 122
TaleMalay_GC_8MalayMalayms_MIN8 kHzGenerel samtale266Malayisk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, malaysisk i MalaysiaDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 316, Mand 176, Ukendt 0
TaleMalay_MA_16MalayMalayms_MIN16 kHzMedie lyd344Malay Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 236, Mand 626, Ukendt 47
TaleMalayalam_CC_8malayalamMalayalam (I pipeline) ml_INCallcenter60Malayalam (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_GCmalayalamMalayalam (I pipeline) ml_INGenerel samtale100Malayalam (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMalayalam_MAmalayalamMalayalam (I pipeline) ml_INMedie lyd40Malayalam (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_CC_8MarathiMarathi (I Pipeline) mr_INCallcenter60Marathi (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_GCMarathiMarathi (I Pipeline) mr_INGenerel samtale100Marathi (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMarathi_MAMarathiMarathi (I Pipeline) mr_INMedie lyd40Marathi (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleMexicansk_SM_48Spansk (Mexico)Spansk (Mexico)es-MX48 kHzManuskriptmonolog1,492Mexicansk spansk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1016 Mand 1069 Ukendt 95
TaleHolland_SM_48HollandskHollandsknl-NL48 kHzManuskriptmonolog1,205hollandsk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1285 Mand 531 Ukendt 3
TaleNew York English_CC_8New York engelskNew York engelskda_DK8 kHzCallcenter103New York engelsk Call-center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 610, Mand 532, Ukendt 0
TaleNew York English_GC_8New York engelskNew York engelskda_DK8 kHzGenerel samtale107New York engelsk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 118, Mand 114, Ukendt 0
TaleNew York English_MA_16New York engelskNew York engelskda_DK16 kHzMedie lyd140New York engelske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 66, Mand 230, Ukendt 11
TaleNew Zealand_GC_8New Zealand engelsk New Zealand engelsk da_NZ8 kHzGenerel samtale148New Zealand engelsk generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 167, mand 121, Ukendt 4
TaleNew Zealand_MA_16New Zealand engelsk New Zealand engelsk da_NZ16 kHzMedie lyd400New Zealand engelske medier lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 367, mand 678, Ukendt 26
TaleOriya_CC_8oriyaOriya (I Pipeline) eller_INCallcenter60Oriya (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_GCoriyaOriya (I Pipeline) eller_INGenerel samtale100Oriya (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleOriya_MAoriyaOriya (I Pipeline) eller_INMedie lyd40Oriya (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePolsk_MA_16polskpolskpl_PL16 kHzMedie lyd269Polsk medie lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 173 Mand 354 Ukendt 6
TalePolsk Polen_SM_48Polsk (Polen)Polsk (Polen)PL-PL48 kHzManuskriptmonolog1,482Polsk Polen - ManuskriptmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1324 Mand 701 Ukendt 24
TalePunjabi_CC_8punjabiPunjabi (I pipeline) punjabiCallcenter60Punjabi (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_GCpunjabiPunjabi (I pipeline) punjabiGenerel samtale100Punjabi (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TalePunjabi_MApunjabiPunjabi (I pipeline) punjabi Medie lyd40Punjabi (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleRussisk_SM_48russiskrussiskru-RU48 kHzManuskriptmonolog2,398Russisk skriftmonologOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1689 Mand 1937 Ukendt 214
TaleSkotsk_GC_8Skotsk (engelsk accent)Skotsk (engelsk accent)da_AB8 kHzGenerel samtale292Skotske generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 285 , Mand 260, Ukendt 3
TaleSingapore_CC_8Singapore engelskSingapore engelskda_SG8 kHzCallcenter218Singapore Call-Center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 2139 , Mand 884, Ukendt 21
TaleSingapore_MA_16Singapore engelskSingapore engelskda_SG16 kHzMedie lyd247Singapore Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 160, Mand 455, Ukendt 37
TaleSydafrikansk engelsk_CC_8Sydafrikansk engelskSydafrikansk engelskda_ZA8 kHzCallcenter261South African English Call-Center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1274 , Mand 935 , Ukendt 1
TaleSydafrikansk engelsk_MA_16Sydafrikansk engelskSydafrikansk engelskda_ZA16 kHzMedie lyd251Sydafrikanske engelske mediers lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 235, Mand 432, Ukendt 36
TaleSwahili_CC_8SwahiliSwahilisw_KE8 kHzCallcenter230Swahili Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 611, Mand 833, Ukendt 0
TaleSwahili_MA_16SwahiliSwahilisw_KE16 kHzMedie lyd265Swahili Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 118, Mand 493, Ukendt 25
TaleSvensk_CC_8SvenskSvensksv_SE8 kHzCallcenter250Svenske Call-Center dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1581, Mand 727, Ukendt 2
TaleSvensk_MA_16SvenskSvensksv_SE16 kHzMedie lyd278Svenske mediers lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 195, Mand 500, Ukendt 21
TaleTamil_CC_8tamilTamil (I pipeline) ta_INCallcenter60Tamil (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_GCtamilTamil (I pipeline) ta_INGenerel samtale100Tamil (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTamil_MAtamil Tamil (I pipeline) ta_INMedie lyd40Tamil (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GC_8telugutelugute_IN8 kHzGenerel samtale553Telugu generelle samtaledataUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 574 , Mand 564, Ukendt 0
TaleTelugu_MA_16telugutelugute_IN16 kHzMedie lyd648Telugu Media lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 207, Mand 963, Ukendt 2
TaleTelugu_CC_8teluguTelugu (I pipeline) te_INCallcenter30Telugu (In Pipeline) Call-Center-dataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_GCteluguTelugu (I pipeline) te_INGenerel samtale50Telugu (In Pipeline) Generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleTelugu_MAteluguTelugu (I pipeline) te_INMedie lyd20Telugu (In Pipeline) MedielyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
TaleThai_GC_8ThaiThaith_TH8 kHzGenerel samtale183Thai generel samtaleUscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, et uformelt register brugt mellem vennerDualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 338, Mand 96, Ukendt 8
TaleThai_MA_8ThaiThaith_TH16 kHzMedie lyd173Thai medie lydLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 143, Mand 502, Ukendt 26
TaleTyrkisk Tyrkiet_SM_48Tyrkisk TyrkietTyrkisk Tyrkiettr-TR48 kHzManuskriptmonolog2,027Tyrkisk TyrkietOptagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunderMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 1561 Mand 1241 Ukendt 31
TaleVietnamesisk_GC_8vietnamesiskvietnamesiskvi_VN8 kHzGenerel samtale295Vietnamesiske generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, nordlige (f.eks. Hanoi), centrale og sydlige (f.eks. Ho Chi Minh City).Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 400, mand 380, Ukendte 2
TaleVietnamesisk_MA_16vietnamesiskvietnamesiskvi_VN16 kHzMedie lyd257vietnamesiske medier lyddataLicenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutterMonoWeb Sourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 249, mand 200, Ukendte 45
TaleWelsh_GC_8walisisk (engelsk accent)walisisk (engelsk accent)da_WL8 kHzGenerel samtale278walisiske generelle samtaledataUscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,Dualdesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKvinde 270, Mand 324, Ukendt 0
TaleUK English_WW_16UK engelskUK engelskda_dk16 kHzWake Word200 højttalereWake Word engelsk engelsknøglesætningsindsamling af data
  • 200 højttalere
  • 4 unikke nøglesætninger pr. højttaler
  • 25-30 gentagne nøglesætningsoptagelser pr. unik nøglesætning
  • 25-30 lydfiler pr. unik nøglesætning
  • 120 samlede optagne ytringer pr. højttaler
1 kanalMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingKøn: 50 % mænd, 50 % kvinder, +/- 10 %.

Tjenester tilbydes

Ekspert indsamling af lyddata er ikke alle-hands-on-deck til omfattende AI-opsætninger. Hos Shaip kan du endda overveje følgende tjenester for at gøre modeller langt mere udbredte end normalt:

Indsamling af tekstdata

Indsamling af tekstdata
Tjenester

Den sande værdi af Shaip kognitive dataindsamlingstjenester er, at det giver organisationer nøglen til at låse op for kritisk information, der findes i ustrukturerede data

Indsamling af billeddata

Services til indsamling af billeddata

Sørg for, at din computervisionsmodel identificerer hvert billede præcist for problemfrit at kunne træne fremtidens næste generation af AI-modeller

Indsamling af videodata

Services til indsamling af videodata

Fokuser nu på computersyn sammen med NLP til træning af dine modeller i at identificere objekter, individer, afskrækkende midler og andre visuelle elementer til perfektion

Shaip kontakt os

Vil du bygge dit eget lyddatasæt?

Få kontakt med vores interne taledataindsamlingsekspert for at opsætte et lydlager, der bedst passer til dit behov

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik , Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.

Indsamling af taledata for en ML-model refererer til processen med at indsamle lydoptagelser af talt sprog. Denne samling hjælper med at træne og forfine maskinlæringsalgoritmer, især dem, der er centreret om at forstå og behandle menneskelige stemmer.

Når du søger at indsamle lyddata til Automatic Speech Recognition (ASR), bør du starte med at definere dit projekts specifikke behov, herunder det ønskede sprog, accent og taletype. Når du har indstillet disse parametre, skal du sikre dig, at du opnår alle nødvendige tilladelser for at respektere brugernes privatliv. Brug derefter passende optageenheder eller software til at fange klare lydeksempler. Hver optagelse bør omhyggeligt annoteres med dens transskription eller andre relevante metadata og opbevares systematisk for nem adgang.

Et taledatasæt i maskinlæring er afgørende for træning, test og validering af modeller, der er skræddersyet til at genkende, transskribere eller fortolke talesprog. Sådanne datasæt baner vejen for et utal af applikationer, fra stemmeassistenter og transskriptionstjenester til stemmebiometri.

For at indsamle præcise data fra forskellige sprog og accenter er samarbejde med modersmål med den ønskede sproglige baggrund afgørende. Sigt efter et varieret og repræsentativt udvalg, der dækker et bredt spektrum af demografiske nuancer. Anvend standardiseret optageudstyr i ensartede miljøer for at sikre lydkonsistens. Og vigtigst af alt, annotér hvert datastykke med detaljerede transskriptioner og metadata, der angiver det specifikke sprog og accent.