Få nu 50 % RABAT* om Conversational AI Off-the-Shelf Datasæt

Tale- og lyddatasæt til chatbots, stemmeassistenter, taleaktiverede enheder.

*Tilbud i begrænset periode

  • Ved tilmelding er jeg enig med Shaip Privatlivspolitik , Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.

Betroet af industriledere

DetaljerOff-the-shelf sprogdatasætCall Center-samtaler 8khz*Generiske samtaler 8khz*Medier og podcasts 16khz*Ytring/ scripted monolog 16khz*Samlet volumen i timerDialekter dækketLyd FormatTeksttransskriptionsformatUse CaseKildeCTA
TaleAfrikaansAfrikaans lyddatasæt6009001500Afrikaans talt i Afrika. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalearabiskArabisk lyddatasæt80015002300Arabisk fra Golflandene. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalekinesiskKinesisk lyddatasæt20002000kinesere fra Kina. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleDanskeDansk lyddatasæt40060020003000Dansk fra Danmark. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleHollandskhollandsk lyddatasæt20002000hollændere fra Holland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - AAVE AccentEngelsk - AAVE (African American Vernacular English) lyddatasæt5005001000Den folkelige variant (nogle gange kendt som AAVE, typisk talt af det store flertal af arbejder- og middelklasse afroamerikanere) og den mere standardvariant (typisk talt af middelklasse afroamerikanere i formelle og offentlige situationer), men med en stærkere vægt på folkemunde.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - Boston/New York AccentEngelsk - Boston/New York lyddatasæt225225350800Dette er en samling af flere regionale accenter, der tales i og omkring byerne Boston, New York og Philadelphia. Disse accenter lyder måske som ikke-lokale, men adskiller sig fra andre amerikanske accenter. På trods af et lokalt ordforråd, der er forskelligt fra andre dele af den engelsktalende verden, er disse accenter gensidigt forståelige med engelsk, der tales andre steder.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - kinesisk accentEngelsk - kinesisk accent lyddatasæt150300450Talere, der taler kinesisk som deres første sprog, og som flyttede/immigrerede til USA som teenagere/voksne og lærte engelsk som deres andet sprog.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - Deep South AccentEngelsk - Deep South Audio Dataset2752754501000Højttalere fra (i) Texas; (ii) North Carolina, South Carolina, Georgia; (iii) New Orleans; (iv) Florida panhandle; (v) Tennessee, Arkansas, Michigan.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - Hispanic AccentEngelsk - Hispanic Accented Audio Dataset400400800Hispanic English refererer til de varianter af amerikansk engelsk, der tales af latinamerikanske amerikanere med forskellig national arv. Hovedfokus var på mexicanske amerikanere, talere af forskellig national oprindelse (f.eks. Mexico, Puerto Rico, Den Dominikanske Republik, Ecuador, Cuba osv.) og også fra forskellige regioner (f.eks. Californien, New York, Florida). Talere inkluderet var, der taler spansk som førstesprog, såvel som talere af latinamerikansk oprindelse, der taler spansk, har et arvesprog.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - New Zealandsk accentEngelsk - New Zealand lyddatasæt2507501000Højttalere på begge øer, inklusive en blanding af yngre højttalere (<40 år) og ældre højttalere (>40 år) i lige store forhold.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - Singapore AccentEngelsk - Singapore lyddatasæt4006001000Både Standard Singapore English og Colloquial Singapore English. Singaporeanere med forskellig etnisk baggrund (f.eks. kinesisk, malaysisk, indisk osv.) og med forskelligt uddannelsesniveau.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - Sydafrika AccentEngelsk - Sydafrika lyddatasæt4006001000Repræsentanter fra forskellige socioøkonomiske klasser og etnologiske baggrunde (f.eks. sydafrikanere med europæisk, afrikansk, indisk eller blandet baggrund).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - irsk accentEngelsk - irsk lyddatasæt500500engelsk talt i Irland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - skotsk accentEngelsk - skotsk lyddatasæt800800Engelsk talt af skotsk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelsk - walisisk accentEngelsk - walisisk lyddatasæt800800walisisk engelsk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleFransk canadiskFransk canadisk lyddatasæt10001000Canadisk fransk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalehebraiskHebraisk lyddatasæt7507501500hebraisk i Israel. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleindonesiskIndonesisk lyddatasæt100010002000Bahasa indonesisk. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalejapanskJapansk lyddatasæt20002000Japansk fra Japan. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalekoreanskKoreansk lyddatasæt10020015001800Højttalere spredt over hele Sydkorea.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleMalayMalay Audio Datasæt5005001000Malayisk i Malaysia. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleMexicansk spanskMexicansk spansk lyddatasæt12501250Mexicansk fra Mexico. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalepolskPolsk lyddatasæt25020002250polsk fra Polen. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalerussiskRussisk lyddatasæt20002000Russisk fra Rusland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleSwahiliSwahili lyddatasæt3506501000sydafrikansk og kenyansk swahili. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleSvenskSvensk lyddatasæt3506501000svensk i Sverige. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleTaiwan kinesiskTaiwan kinesisk lyddatasæt10001000kinesisk fra Taiwan. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleThaiThai lyddatasæt350450800Et uformelt register, der bruges mellem venner,. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaletyrkiskTyrkisk lyddatasæt20002000Tyrkisk fra Tyrkiet. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalevietnamesiskVietnamesisk lyddatasæt6004001000Nordlige (f.eks. Hanoi), Centrale og Sydlige (f.eks. Ho Chi Minh City).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleHindiHindi lyddatasæt80020002800Hindi i Indien specifikt i nord, øst og vest regioner. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleHinglishIndisk engelsk lyddatasæt300500800Indsamlet fra indiske byer, der er økonomiske knudepunkter i landet på grund af voksende økonomiske muligheder. Sådanne steder kan være Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad osv.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleEngelskEngelsk lyddatasæt700700. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleKannadaKannada lyddatasæt6010040200Kannada fra Karnataka, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalemalayalamMalayalam lyddatasæt6010040200Malayalam fra Kerala, Lakshadweep og Puducherry. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleoriyaOriya lyddatasæt6010040200Oriya fra dele af Odisha, Vestbengalen, Jharkhand og Chhattisgarh. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalepunjabiPunjabi lyddatasæt6010040200Punjabi fra Punjab, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaletamilTamil lyddatasæt60100240400Tamil fra Tamil Nadu, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleteluguTelugu lyddatasæt1009509502000Telugu fra Andhra Pradesh, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalebengalskBengalsk lyddatasæt6010040200Bengali fra Vestbengalen, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TalegujaratiGujarati lyddatasæt6010040200Gujarati fra Gujarat, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleMarathiMarathi lyddatasæt6010040200Marathi fra Maharashtra, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip
TaleAssamesiskAssamisk lyddatasæt6010040200Assamisk fra Asssam, Indien. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingSaip

Dyb ekspertise inden for konversations AI

Conversational AI eller Chatbots eller Virtual / Digital Assistants er kun så smarte som teknologien og dataene bag dem. Hos Shaip tilbyder vi dig et bredt sæt af det diversificerede lyddatasæt til Natural Language Processing (NLP), der efterligner samtaler med rigtige mennesker, som lader dig bringe din AI til live. Med vores dybe forståelse hjælper vi dig med at bygge og lokalisere AI-aktiverede talemodeller med den største præcision med rige og strukturerede datasæt på flere sprog fra hele kloden. Vi tilbyder flersproget lydindsamling, lydtransskription og lydannoteringstjenester baseret på dine krav, mens vi fuldt ud tilpasser ønsket hensigt, ytringer og demografisk distribution.

Indsamling af scriptet tale

Spontan taleindsamling

Transkription af lyddata

Datamærkning og kommentar

Shaip lader dig træne din Conversational AI-platform nøjagtigt, så den kan:

  • Tal, tekst og chat problemfrit på tværs af flere kanaler.
  • Lær af eksisterende interaktioner i form af chat, stemmetransskriptioner, transaktioner osv. og foreslå & samtale baseret på disse erfaringer.
  • Forstå hensigten bag menneskelig tale og fjern tvetydighed i forståelsen af ​​menneskeligt sprog.
  • Interagere med dig på en-til-en basis og kan trænes i at identificere brugere og huske tidligere samtaler.

En verdensleder inden for konversations AI træningsdata

Timer med lyddata på mere end 100 sprog - hentet, transskriberet og kommenteret

Licensdata til taledata

20k + timers taledata på 40+ sprog og dialekter, der dækker en række 55+ emner fra forskellige domæner, dvs. callcenter, debatter, generelle samtaler, taler, podcasts osv.

Indsamling af taledata

Saml lyd- og taledata (monolog, 2-personers samtale, human-bot-chat) på over 100 sprog fra hele verden, tilpasset dit AI-krav.

Transskription af taledata

Omkostningseffektiv lydtranskription eller lydkommentar gennem en stærk arbejdsstyrke på 30,000 samarbejdspartnere med garanteret TAT, nøjagtighed og besparelser

Fremskynd din konversations AI-appudvikling med Audio Collection & Audio Annotation Services

Shaip-fordelen

Skala

Vi kan kilde, skalere og levere lyddata fra hele verden på flere sprog og dialekter baseret på dine krav.

ekspertise

Vi har den rigtige ekspertise med hensyn til nøjagtig og upartisk dataindsamling, transkription og guldstandard-kommentar.

Netværk

Et netværk af mere end 30,000 kvalificerede bidragsydere, som hurtigt kan tildeles dataindsamlingsopgaver til at opbygge AI-træningsmodel og opskaleringstjenester.

Teknologier

Vi har en fuldt AI-baseret platform med proprietære værktøjer og processer til at udnytte arbejdsflowstyringen 24 * 7 døgnet rundt.

Agility

Vi tilpasser os meget hurtigt ændringer i kundernes behov og hjælper med at fremskynde AI-udvikling med taledata af høj kvalitet 5-10 gange hurtigere end konkurrencen.

Sikkerhed

Vi lægger stor vægt på datasikkerhed og privatliv og er også certificeret til at håndtere meget regulerede følsomme data.

Hvad vi gør bedst

Træningsdata

Få mærkede data af højeste kvalitet på en brøkdel af tiden. Den er guldstandard, pålidelig og klar til at træne dine AI- og ML-modeller for at opnå det højeste niveau af ydeevne.

Lær mere

Dataindsamling, mærkning og kommentar

Med Shaip får du mere end 15 års dokumenteret ekspertise i at indsamle, transskribere og kommentere kvalitetsdata. Med vores globale arbejdsstyrke kan vi indsamle data fra hele kloden og derefter levere mærknings- og annoteringstjenester med den perfekte mængde færdighedsniveau og ekspertise, der kræves til dine data.

Lær mere

Datakataloger og licensering

Med vores enorme beholdning af millioner af datasæt kan du indsamle og organisere efter behov. Vi kan derefter licensere disse kvalitetsdata til dine specifikke AI- og ML-brugskrav. Derudover er disse data tilgængelige til en brøkdel af prisen, hvis du selv skulle oprette dem.

Lær mere

Vil du bygge dit eget datasæt?

Kontakt os nu for at lære, hvordan vi kan indsamle et tilpasset datasæt til din unikke AI-løsning.