Mest betroede tjenester til indsamling af taledata til din AI

Q: Hvordan indsamler man lyddata til ASR (Automatic Speech Recognition)?

Når du tilstræber at indsamle lyddata til Automatic Speech Recognition (ASR), bør du starte med at definere dit projekts specifikke behov, herunder det ønskede sprog, accent og taletype. Når du har indstillet disse parametre, skal du sikre dig, at du opnår alle nødvendige tilladelser for at respektere brugernes privatliv. Brug derefter passende optageenheder eller software til at fange klare lydeksempler. Hver optagelse bør omhyggeligt annoteres med dens transskription eller andre relevante metadata og opbevares systematisk for nem adgang.

Træn dine NLP -modeller, VA'er, TTS -prototyper og mere med samtaledata af høj kvalitet med vores tjenester til indsamling af lyd- og taledata

Opdag lyddatapipelines uden flaskehalse

Kontakt os

Fremhævede klienter

Tidligere

Næste

Professionel lyd-/stemmedataindsamlingstjenester

Ethvert emne. Ethvert scenarie.

Hos Shaip ligger vores ekspertise i at skabe højkvalitets taledatasæt designet til forskellige AI/ML-krav. Vi tilbyder et bredt udvalg af sprog og optager i forskellige indstillinger, hvilket gør vores datasæt omfattende og tilpasningsdygtige. Odit fokus er på at fodre modeller med den højeste mængde brugerdefinerede taledata på mindst mulig tid. Med os ombord kan du forvente:

Kurateret højkvalitets flersproget lyd-/stemmedata for at forbedre nøjagtigheden
Højest mulig niveau af domænespecificitet til target forskelligartet scenarie setup

Skaler din ML-model, så den passer til forskellig demografi og vertikaler
Optagelsesmiljøer: Studio kvalitet, med krystalklar lyd med minimal baggrundsstøj, & Naturlige miljøer, hvor optagelser inkorporerer omgivende lyde for at efterligne situationer i den virkelige verden.

100 +

Lande

55K +

Timer med taledata

250 +

Projekter

60 +

Sprog (100+ dialekter)

8 / 16 / 44 / 48 kHz

Samplingfrekvens

Vores ekspertise

Juster lyddata til smartere NLP-modeller

Shaip tilbyder ende-til-ende-tale-/lyddataindsamlingstjenester på over 100+ sprog for at gøre det muligt for stemmeaktiverede teknologier at imødekomme et mangfoldigt sæt publikum over hele kloden. Vi kan arbejde på projekter af enhver størrelse og størrelse; fra licensering af eksisterende lyddatasæt på hylden til administration af tilpasset indsamling af lyddata til lydtranskription og annotering. Uanset hvor stort dit taledataindsamlingsprojekt er, kan vi tilpasse lydopsamlingstjenesterne til dine behov for at bygge NLP-datasæt af høj kvalitet, der målretter mod dialekter, toner og sprog. Vælg mellem vores brede udvalg af taledatasæt og ressourcer til indsamling af lyddata til intelligente opsætninger, der muliggør stemme.

Succeshistorier

Samtale AI-datasæt med over 3k timers data på tværs af 8 sprog

På udkig efter at bygge en flersproget platform til indiske sprog, samarbejdede klienten med Shaip om at indsamle, segmentere og transskribere store datasæt på flere indiske sprog. Dette ville hjælpe med at udvikle effektive talemodeller, der kunne drive kundens innovative nye platform.

problem: Over 3,000 timers lyddata indsamlet på 8 indiske sprog, segmenteret og transskriberet for at udvikle automatisk talegenkendelse.

Opløsning: Vi leverede dataindsamling, segmentering, transskription og leverede JSON-filer med metadata. Vi indsamlede 3000 timers lyddata på 8 indiske sprog i skala til kundens taleteknologiprojekt.

Grunde til at vælge Shaip som din troværdige taledataindsamlingspartner

Mennesker

Dedikerede og uddannede hold:

30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
Godkendt projektledelsesteam
Erfaren produktudviklingsteam
Talent Pool Sourcing & Onboarding Team

Proces

Højeste proceseffektivitet sikres med:

Robust 6 Sigma Stage-Gate-proces
Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
Løbende forbedring og feedback

perron

Den patenterede platform giver fordele:

Web-baseret ende-til-ende platform
Upåklagelig kvalitet
Hurtigere TAT
Problemfri levering

Mennesker

Dedikerede og uddannede hold:

30,000+ samarbejdspartnere til oprettelse af data, mærkning og kvalitetssikring
Godkendt projektledelsesteam
Erfaren produktudviklingsteam
Talent Pool Sourcing & Onboarding Team

Proces

Højeste proceseffektivitet sikres med:

Robust 6 Sigma Stage-Gate-proces
Et dedikeret team med 6 Sigma-sorte bælter - Nøgleprocessejere og overholdelse af kvalitet
Løbende forbedring og feedback

perron

Den patenterede platform giver fordele:

Web-baseret ende-til-ende platform
Upåklagelig kvalitet
Hurtigere TAT
Problemfri levering

Off-the-shelf Tale / Audio Datasæt

Corpus ID (Unikt)	Søgeord	Sprogdatasæt	Sprogkode	Prøvefrekvens	Datasættype	Samlede lydtimer	Kort beskrivelse	Datasætbeskrivelse	Audio Channel	Optageplatform	WER (%)	Lyd Format	Transskriptionsformat	Use Case	Antal højttalere	CTA
da_US_CC_8	Afroamerikansk sprog	Afroamerikansk sprog	da_DK	8 kHz	Call-center	211	African American Vernacular Call-center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 612, Mand: 1242 og Ukendt: 12	Kontakt
da_US_MA_16	Afroamerikansk sprog	Afroamerikansk sprog	da_DK	16 kHz	Medie lyd	154	African American Vernacular Media data	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 151, Mand: 150 og Ukendt: 10	Kontakt
Afrikaans_GC_8	Afrikaans	Afrikaans	af_ZA	8 kHz	Generel samtale	368	Afrikaans generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, afrikaans tales i Afrika	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 502, Mand: 390 og Ukendt: 2	Kontakt
Afrikaans_MA_16	Afrikaans	Afrikaans	af_ZA	16 kHz	Medie lyd	658	afrikanske mediefiler	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 750, Mand: 1278 og Ukendt: 52	Kontakt
Arabisk_GC_8	arabisk	arabisk	ar_AE	8 kHz	Generel samtale	292	Arabisk generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, arabisk fra Golflandene	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 171, Mand: 534 og Ukendt: 1	Kontakt
Arabisk_SM_48	arabisk	arabisk	ar-SA	48 kHz	Manuskriptmonolog	1,947	Monolog med arabisk skrift	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 838 Mand 1209 Ukendt 78	Kontakt
Assamisk_CC_8	Assamesisk	Assamisk (I pipeline)	som i		Callcenter	60	Assamesiske (I Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Assamese_GC	Assamesisk	Assamisk (I pipeline)	som i		Generel samtale	100	Assamisk (I Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Assamese_MA	Assamesisk	Assamisk (I pipeline)	som i		Medie lyd	40	Assamisk (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Bengali_CC_8	bengalsk	Bengali (I Pipeline)	bn_IN		Callcenter	60	Bengali (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Bengali_GC	bengalsk	Bengali (I Pipeline)	bn_IN		Generel samtale	100	Bengali (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Bengali_MA	bengalsk	Bengali (I Pipeline)	bn_IN		Medie lyd	40	Bengali (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Boston_CC_8	Boston engelsk	Boston engelsk	da_DK	8 kHz	Callcenter	177	Boston Call-center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 605, Mand: 711 og Ukendt: 0	Kontakt
Boston_GC_8	Boston engelsk	Boston engelsk	da_DK	8 kHz	Generel samtale	32	Boston generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 53, Mand: 83 og Ukendt: 0	Kontakt
Boston_MA_16	Boston engelsk	Boston engelsk	da_DK	16 kHz	Medie lyd	93	Boston Media lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 43, Mand: 181 og Ukendt: 2	Kontakt
Canadisk_SM_48	Canadisk fransk	Canadisk fransk	fr-CA	48 kHz	Manuskriptmonolog	1,222	Canadisk fransk	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 974 Mand 631 Ukendt 1	Kontakt
kinesisk_CC_8	Kinesisk engelsk	Kinesisk engelsk	da_DK	8 kHz	Callcenter	169	Kinesiske Call-center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 1790, Mand: 523 og Ukendt: 13	Kontakt
kinesisk_MA_16	Kinesisk engelsk	Kinesisk engelsk	da_DK	16 kHz	Medie lyd	249	Kinesiske medier lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 126, Mand: 346 og Ukendt: 6	Kontakt
Kinesisk forenklet_SM_48	Forenklet kinesisk	Forenklet kinesisk	zh-CN	48 kHz	Manuskriptmonolog	2,762	Forenklet kinesisk	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1920 Mand 1535 Ukendt 270	Kontakt
Traditionel kinesisk_SM_48	Traditionelt kinesisk	Traditionelt kinesisk	zh-TW	48 kHz	Manuskriptmonolog	1,028	Traditionelt kinesisk	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1069 Mand 262 Ukendt 3	Kontakt
Danish_GC_8	Danske	Danske	da_DK	8 kHz	Generel samtale	372	Danske almindelige samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 311, Mand: 417, Ukendt: 0	Kontakt
Danish_MA_16	Danske	Danske	da_DK	16 kHz	Medie lyd	664	Danske Medier lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde: 369, Mand: 864, Ukendt: 27	Kontakt
Danish_SM_48	Danske	Danske	da-DK	48 kHz	Manuskriptmonolog	2,579	Dansk skriftmonolog	Enkelt-ytring optagelser, som har tendens til at falde i 5 til 30 sekunders rækkevidde, dansk fra Danmark	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1551 Mand 1233 Ukendt 42	Kontakt
Engelsk Deep South_CC_8	Engelsk Deep South	Engelsk Deep South	da_DK	8 kHz	Callcenter	151	Engelsk Deep South Call-center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 221 , Mand 1004 , Ukendt 7	Kontakt
Engelsk Deep South_GC_8	Engelsk Deep South	Engelsk Deep South	da_DK	8 kHz	Generel samtale	56	Engelsk Deep South Generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 99, Mand 31, Ukendt 0	Kontakt
Engelsk Deep South_MA_16	Engelsk Deep South	Engelsk Deep South	da_DK	16 kHz	Medie lyd	266	Engelske Deep South Media lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 204, Mand 356, Ukendt 21	Kontakt
Tysk_CC_8	Tysk	Tysk	de-De	8 kHz	Callcenter	64	Tyske Call-center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Mono	desktop		. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 478 Mand 1440 Ukendt 0	Kontakt
Tysk_IVR_8	Tysk	Tysk	de-De	8 kHz	IVR	200	Tyske IVR-data	Menneske til maskine. En IVR type flow, hvor der er en TTS prompt (f.eks. "Hvordan kan jeg hjælpe dig") efterfulgt af en spontan menneskelig reaktion	Mono	desktop		. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 10115 Mand 8750 Ukendt 0	Kontakt
Gujarati_CC_8	gujarati	Gujarati (I pipeline)	gu_IN		Callcenter	60	Gujarati (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Gujarati_GC	gujarati	Gujarati (I pipeline)	gu_IN		Generel samtale	100	Gujarati (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Gujarati_MA	gujarati	Gujarati (I pipeline)	gu_IN		Medie lyd	40	Gujarati (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Hebraisk_Generel Samtale_8	hebraisk	hebraisk	han_IL	8 kHz	Generel samtale	399	Hebraisk generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, hebraisk i Israel	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 414 , Mand 399 , Ukendt 1	Kontakt
Hebraisk_MA_16	hebraisk	hebraisk	han_IL	16 kHz	Medie lyd	427	Hebraiske medier lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 361 , Mand 513, Ukendt 13	Kontakt
Hindi_MA_16	Hindi	Hindi	hej_IN	16 kHz	Medie lyd	219	Hindi Media lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 83 , Mand 309, Ukendt 0	Kontakt
Hindi_SM_48	Hindi	Hindi	hi-IN	48 kHz	Manuskriptmonolog	2,867	Hindi scripted monolog	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1977 Mand 1864 Ukendt 147	Kontakt
HINGLISH_CC_8	Hinglish	Hinglish	hg_IN	8 kHz	Callcenter	208	HINGLISH Call-center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 822, Mand 1262, Ukendt 0	Kontakt
HINGLISH_MA_16	Hinglish	Hinglish	hg_IN	16 kHz	Medie lyd	216	HINGLISH Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 75, Mand 380, Ukendt 0	Kontakt
Hispanic_CC_8	Spansk engelsk	Spansk engelsk	da_DK	8 kHz	Callcenter	212	Hispanic Call-center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 822, Mand 1262, Ukendt 0	Kontakt
Hispanic_MA_16	Spansk engelsk	Spansk engelsk	da_DK	16 kHz	Medie lyd	155	Hispanic Call Media-lyd	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 140, Mand 219, Ukendt 5	Kontakt
Indonesisk_GC_8	indonesisk	indonesisk	jeg gjorde	8 kHz	Generel samtale	496	Indonesiske generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, indonesisk	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 524, Mand 454, Ukendt 2	Kontakt
Indonesisk_MA_16	indonesisk	indonesisk	jeg gjorde	16 kHz	Medie lyd	643	Indonesiske medier lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 746, Mand 1507, Ukendt 129	Kontakt
Irsk_GC_8	Irish	Irish	da_IE	8 kHz	Generel samtale	192	Irske generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 213 , Mand 153 , Ukendt 0	Kontakt
Japansk_SM_48	japansk	japansk	ja-JP	48 kHz	Manuskriptmonolog	2,335	Japansk skriftmonolog	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1460 Mand 1221 Ukendt 194	Kontakt
Kannada_CC_8	Kannada	Kannada (I Pipeline)	kn_IN		Callcenter	60	Kannada (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Kannada_GC	Kannada	Kannada (I Pipeline)	kn_IN		Generel samtale	100	Kannada (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Kannada_MA	Kannada	Kannada (I Pipeline)	kn_IN		Medie lyd	40	Kannada (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Koreansk_CC_8	koreansk	koreansk	ko_KR	8 kHz	Callcenter	107	Koreanske Call-center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1086, Mand 210, Ukendt 4	Kontakt
Koreansk_MA_16	koreansk	koreansk	ko_KR	16 kHz	Medie lyd	204	Koreanske medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 70 Mand 303, Ukendt 25	Kontakt
Koreansk_SM_48	koreansk	koreansk	ko-KR	48 kHz	Manuskriptmonolog	1,955	Koreansk skriftmonolog	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1195 Mand 1134 Ukendt 122	Kontakt
Malay_GC_8	Malay	Malay	ms_MIN	8 kHz	Generel samtale	266	Malayisk generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, malaysisk i Malaysia	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 316, Mand 176, Ukendt 0	Kontakt
Malay_MA_16	Malay	Malay	ms_MIN	16 kHz	Medie lyd	344	Malay Media lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 236, Mand 626, Ukendt 47	Kontakt
Malayalam_CC_8	malayalam	Malayalam (I pipeline)	ml_IN		Callcenter	60	Malayalam (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Malayalam_GC	malayalam	Malayalam (I pipeline)	ml_IN		Generel samtale	100	Malayalam (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Malayalam_MA	malayalam	Malayalam (I pipeline)	ml_IN		Medie lyd	40	Malayalam (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Marathi_CC_8	Marathi	Marathi (I Pipeline)	mr_IN		Callcenter	60	Marathi (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Marathi_GC	Marathi	Marathi (I Pipeline)	mr_IN		Generel samtale	100	Marathi (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Marathi_MA	Marathi	Marathi (I Pipeline)	mr_IN		Medie lyd	40	Marathi (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Mexicansk_SM_48	Spansk (Mexico)	Spansk (Mexico)	es-MX	48 kHz	Manuskriptmonolog	1,492	Mexicansk spansk skriftmonolog	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1016 Mand 1069 Ukendt 95	Kontakt
Holland_SM_48	Hollandsk	Hollandsk	nl-NL	48 kHz	Manuskriptmonolog	1,205	hollandsk skriftmonolog	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1285 Mand 531 Ukendt 3	Kontakt
New York English_CC_8	New York engelsk	New York engelsk	da_DK	8 kHz	Callcenter	103	New York engelsk Call-center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 610, Mand 532, Ukendt 0	Kontakt
New York English_GC_8	New York engelsk	New York engelsk	da_DK	8 kHz	Generel samtale	107	New York engelsk generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 118, Mand 114, Ukendt 0	Kontakt
New York English_MA_16	New York engelsk	New York engelsk	da_DK	16 kHz	Medie lyd	140	New York engelske medier lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 66, Mand 230, Ukendt 11	Kontakt
New Zealand_GC_8	New Zealand engelsk	New Zealand engelsk	da_NZ	8 kHz	Generel samtale	148	New Zealand engelsk generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 167, mand 121, Ukendt 4	Kontakt
New Zealand_MA_16	New Zealand engelsk	New Zealand engelsk	da_NZ	16 kHz	Medie lyd	400	New Zealand engelske medier lyd	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 367, mand 678, Ukendt 26	Kontakt
Oriya_CC_8	oriya	Oriya (I Pipeline)	eller_IN		Callcenter	60	Oriya (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Oriya_GC	oriya	Oriya (I Pipeline)	eller_IN		Generel samtale	100	Oriya (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Oriya_MA	oriya	Oriya (I Pipeline)	eller_IN		Medie lyd	40	Oriya (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Polsk_MA_16	polsk	polsk	pl_PL	16 kHz	Medie lyd	269	Polsk medie lyd	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 173 Mand 354 Ukendt 6	Kontakt
Polsk Polen_SM_48	Polsk (Polen)	Polsk (Polen)	PL-PL	48 kHz	Manuskriptmonolog	1,482	Polsk Polen - Manuskriptmonolog	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1324 Mand 701 Ukendt 24	Kontakt
Punjabi_CC_8	punjabi	Punjabi (I pipeline)	punjabi		Callcenter	60	Punjabi (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Punjabi_GC	punjabi	Punjabi (I pipeline)	punjabi		Generel samtale	100	Punjabi (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Punjabi_MA	punjabi	Punjabi (I pipeline)	punjabi		Medie lyd	40	Punjabi (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Russisk_SM_48	russisk	russisk	ru-RU	48 kHz	Manuskriptmonolog	2,398	Russisk skriftmonolog	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1689 Mand 1937 Ukendt 214	Kontakt
Skotsk_GC_8	Skotsk (engelsk accent)	Skotsk (engelsk accent)	da_AB	8 kHz	Generel samtale	292	Skotske generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 285 , Mand 260, Ukendt 3	Kontakt
Singapore_CC_8	Singapore engelsk	Singapore engelsk	da_SG	8 kHz	Callcenter	218	Singapore Call-Center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 2139 , Mand 884, Ukendt 21	Kontakt
Singapore_MA_16	Singapore engelsk	Singapore engelsk	da_SG	16 kHz	Medie lyd	247	Singapore Media lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 160, Mand 455, Ukendt 37	Kontakt
Sydafrikansk engelsk_CC_8	Sydafrikansk engelsk	Sydafrikansk engelsk	da_ZA	8 kHz	Callcenter	261	South African English Call-Center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1274 , Mand 935 , Ukendt 1	Kontakt
Sydafrikansk engelsk_MA_16	Sydafrikansk engelsk	Sydafrikansk engelsk	da_ZA	16 kHz	Medie lyd	251	Sydafrikanske engelske mediers lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 235, Mand 432, Ukendt 36	Kontakt
Swahili_CC_8	Swahili	Swahili	sw_KE	8 kHz	Callcenter	230	Swahili Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 611, Mand 833, Ukendt 0	Kontakt
Swahili_MA_16	Swahili	Swahili	sw_KE	16 kHz	Medie lyd	265	Swahili Media lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 118, Mand 493, Ukendt 25	Kontakt
Svensk_CC_8	Svensk	Svensk	sv_SE	8 kHz	Callcenter	250	Svenske Call-Center data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1581, Mand 727, Ukendt 2	Kontakt
Svensk_MA_16	Svensk	Svensk	sv_SE	16 kHz	Medie lyd	278	Svenske mediers lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 195, Mand 500, Ukendt 21	Kontakt
Tamil_CC_8	tamil	Tamil (I pipeline)	ta_IN		Callcenter	60	Tamil (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Tamil_GC	tamil	Tamil (I pipeline)	ta_IN		Generel samtale	100	Tamil (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Tamil_MA	tamil	Tamil (I pipeline)	ta_IN		Medie lyd	40	Tamil (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Generel samtale	553	Telugu generelle samtaledata	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 574 , Mand 564, Ukendt 0	Kontakt
Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Medie lyd	648	Telugu Media lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 207, Mand 963, Ukendt 2	Kontakt
Telugu_CC_8	telugu	Telugu (I pipeline)	te_IN		Callcenter	30	Telugu (In Pipeline) Call-Center-data	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Telugu_GC	telugu	Telugu (I pipeline)	te_IN		Generel samtale	50	Telugu (In Pipeline) Generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,		desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Telugu_MA	telugu	Telugu (I pipeline)	te_IN		Medie lyd	20	Telugu (In Pipeline) Medielyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter		Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling		Kontakt
Thai_GC_8	Thai	Thai	th_TH	8 kHz	Generel samtale	183	Thai generel samtale	Uscriptet telefonsamtale mellem to personer. Ca. Lydvarighed (område) - 15-60 minutter, et uformelt register brugt mellem venner	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 338, Mand 96, Ukendt 8	Kontakt
Thai_MA_8	Thai	Thai	th_TH	16 kHz	Medie lyd	173	Thai medie lyd	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 143, Mand 502, Ukendt 26	Kontakt
Tyrkisk Tyrkiet_SM_48	Tyrkisk Tyrkiet	Tyrkisk Tyrkiet	tr-TR	48 kHz	Manuskriptmonolog	2,027	Tyrkisk Tyrkiet	Optagelser med enkelt ytring, som har en tendens til at falde i intervallet 5 til 30 sekunder	Mono	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 1561 Mand 1241 Ukendt 31	Kontakt
Vietnamesisk_GC_8	vietnamesisk	vietnamesisk	vi_VN	8 kHz	Generel samtale	295	Vietnamesiske generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter, nordlige (f.eks. Hanoi), centrale og sydlige (f.eks. Ho Chi Minh City).	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 400, mand 380, Ukendte 2	Kontakt
Vietnamesisk_MA_16	vietnamesisk	vietnamesisk	vi_VN	16 kHz	Medie lyd	257	vietnamesiske medier lyddata	Licenserbar Public domain lyd-/videofiler såsom interviews, podcasts osv. - 1 til 5 personer. Ca. Lydvarighed (område) 15-60 minutter	Mono	Web Sourcing	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 249, mand 200, Ukendte 45	Kontakt
Welsh_GC_8	walisisk (engelsk accent)	walisisk (engelsk accent)	da_WL	8 kHz	Generel samtale	278	walisiske generelle samtaledata	Uscriptet, syntetisk telefonisk samtale mellem "agent" og "kunde", Ca. Lydvarighed (område) 5-15 minutter,	Dual	desktop	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Kvinde 270, Mand 324, Ukendt 0	Kontakt
UK English_WW_16	UK engelsk	UK engelsk	da_dk	16 kHz	Wake Word	200 højttalere	Wake Word engelsk engelsk	nøglesætningsindsamling af data 200 højttalere 4 unikke nøglesætninger pr. højttaler 25-30 gentagne nøglesætningsoptagelser pr. unik nøglesætning 25-30 lydfiler pr. unik nøglesætning 120 samlede optagne ytringer pr. højttaler	1 kanal	Mobile App	5.0	. Wav	.json	ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling	Køn: 50 % mænd, 50 % kvinder, +/- 10 %.	Kontakt

Tjenester tilbydes

Ekspert indsamling af lyddata er ikke alle-hands-on-deck til omfattende AI-opsætninger. Hos Shaip kan du endda overveje følgende tjenester for at gøre modeller langt mere udbredte end normalt:

Anbefalede ressourcer

Tilbyder

Lydkommentar til intelligente AI'er

Lydkommentartjenester har været en af Shaips styrke siden begyndelsen. Udvikle, træne og forbedre konversations-AI, chatbots og talegenkendelsesmotorer med vores avancerede lydannoteringstjenester.

Købervejledning

Købervejledning: Komplet guide til konversations-AI

Den chatbot, du har talt med, kører på et avanceret konversations-AI-system, der er trænet, testet og bygget ved hjælp af tonsvis af talegenkendelsesdatasæt.

Datakatalog

Off-the-Shelf Tale Data Katalog & Licens

Der er en lang række almindelige applikationer til taledata i AI-projekter. Vi tilbyder dig enorme mængder af højkvalitetsdata klar til din stemmegenkendelse.

Vil du bygge dit eget lyddatasæt?

Få kontakt med vores interne taledataindsamlingsekspert for at opsætte et lydlager, der bedst passer til dit behov

Fornavn*
Efternavn*
E-mail*
Telefon*
Om os*
Land*
Land
Kommentarer*
Ved tilmelding er jeg enig med Shaip Privatlivspolitik , Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.
CAPTCHA

Ofte stillede spørgsmål (FAQ)

1. Hvad er taledataindsamling?

Indsamling af taledata for en ML-model refererer til processen med at indsamle lydoptagelser af talt sprog. Denne samling hjælper med at træne og forfine maskinlæringsalgoritmer, især dem, der er centreret om at forstå og behandle menneskelige stemmer.

2. Hvordan indsamler man lyddata til ASR (Automatic Speech Recognition)?

Når du søger at indsamle lyddata til Automatic Speech Recognition (ASR), bør du starte med at definere dit projekts specifikke behov, herunder det ønskede sprog, accent og taletype. Når du har indstillet disse parametre, skal du sikre dig, at du opnår alle nødvendige tilladelser for at respektere brugernes privatliv. Brug derefter passende optageenheder eller software til at fange klare lydeksempler. Hver optagelse bør omhyggeligt annoteres med dens transskription eller andre relevante metadata og opbevares systematisk for nem adgang.

3. Brug af taledatasæt til maskinindlæring

Et taledatasæt i maskinlæring er afgørende for træning, test og validering af modeller, der er skræddersyet til at genkende, transskribere eller fortolke talesprog. Sådanne datasæt baner vejen for et utal af applikationer, fra stemmeassistenter og transskriptionstjenester til stemmebiometri.

4. Hvordan man indsamler nøjagtige data fra flere sprog og accenter

For at indsamle præcise data fra forskellige sprog og accenter er samarbejde med modersmål med den ønskede sproglige baggrund afgørende. Sigt efter et varieret og repræsentativt udvalg, der dækker et bredt spektrum af demografiske nuancer. Anvend standardiseret optageudstyr i ensartede miljøer for at sikre lydkonsistens. Og vigtigst af alt, annotér hvert datastykke med detaljerede transskriptioner og metadata, der angiver det specifikke sprog og accent.

Mest betroede tjenester til indsamling af taledata til din AI

Opdag lyddatapipelines uden flaskehalse

Fremhævede klienter

Professionel lyd-/stemmedataindsamlingstjenester

Ethvert emne. Ethvert scenarie.

100 +

55K +

250 +

60 +

8 / 16 / 44 / 48 kHz

Vores ekspertise

Juster lyddata til smartere NLP-modeller

Monolog Speech Collection

Dialogtale Samling

Gruppe / Muti-party Samtaler

Samling af naturlige sprogudtalelser

Akustiske data Samling

Automatisk talegenkendelse (ASR)

Flersproget tale/lydtræningsdata

Tekst-til-tale (TTS)

Call center Optagelser

Succeshistorier

Grunde til at vælge Shaip som din troværdige taledataindsamlingspartner

Mennesker

Proces

perron

Mennesker

Proces

perron

Off-the-shelf Tale / Audio Datasæt

Tjenester tilbydes

Indsamling af tekstdata Tjenester

Services til indsamling af billeddata

Services til indsamling af videodata

Anbefalede ressourcer

Tilbyder

Lydkommentar til intelligente AI'er

Købervejledning

Købervejledning: Komplet guide til konversations-AI

Datakatalog

Off-the-Shelf Tale Data Katalog & Licens

Vil du bygge dit eget lyddatasæt?

Ofte stillede spørgsmål (FAQ)

AI-datatjenester

Specialiseret

Industri

Produkter

Om os

Ressourcer

Kontakt os

Dialogtale
Samling

Gruppe / Muti-party
Samtaler

Akustiske data
Samling

Tekst-til-tale
(TTS)

Call center
Optagelser

Indsamling af tekstdata
Tjenester