April 12, 2022

6 gennemprøvede metoder til at tilpasse taledataindsamling

Der er flere forskellige typer klienter – nogle har en klar idé om, hvordan deres taledata skal struktureres, og nogle er mere fleksible med deres tilgang.

Som serviceudbyder skal vi sørge for, at begge kundens krav er opfyldt. Men med en klient, der er fleksibel med deres krav, er det muligt, at de ikke har givet fuldt ud indsamling af taledata en komplet tanke.

Det er her bidraget fra udbyderen af taledatasæt kommer i spil.

Vi har ansvaret for at fremvise de punkter, der skal huskes, før du starter lyden dataindsamling projekt for at give AI-organisationerne mulighed for at identificere en gennemførlig, effektiv og omkostningseffektiv løsning.

Stemmegenkendelsesmarkedet i verden forventes at vokse til $ 27.16 milliarder i 2026 fra $10.7 milliarder i 2020 ved en CAGR på 16.8%.

Lad os se på alle de effektive måder eller punkter, der skal huskes, før du tilpasser indsamling af taledata projekt.

Sprog og demografi
Samlingsstørrelse
Scriptets struktur
Lydkrav og formater
Leverings- og behandlingskrav
Andre vigtige punkter at bemærke

Sprog og demografi

Projektet bør først specificere målsprogene og måldemografien.

Sprog og dialekt
Start med at have projektkravet i tankerne – de sprog, som taledatasættet bliver indsamlet og tilpasset til. Forstå også det specifikke færdighedskrav. Skal deltageren f.eks. være modersmål eller ikke-modersmål?
For eksempel – Engelsk som modersmål
At løbe tæt i hælene på sproget er dialekt. For at sikre, at datasættet ikke lider af skævheder, er det tilrådeligt at introducere dialekter med vilje for at tage højde for diversitet hos deltagerne.
For eksempel – Højttalere med australsk engelsk accent
Lande
Inden der tilpasses, er det vigtigt at vide, om der er et specifikt krav om, at deltagerne skal komme fra bestemte lande. Og om deltagerne i øjeblikket skal bo i et specifikt land.
For eksempel – Punjabi tales forskelligt i Indien og Pakistan.
Demografi
Udover sprog og geografi kan tilpasningen også ske baseret på demografi. Målfordeling af deltagere baseret på deres alder, køn, uddannelsesmæssige kvalifikationer og mere kan også gøres.
For eksempel – Voksne vs børn eller uddannede vs uuddannede

Samlingsstørrelse

Dit datasæt vil påvirke dit dataprojekts ydeevne. Dog vil den indsamlingsdatastørrelse, du har brug for, også afgøre, hvilke deltagere der kræves.

Det samlede antal respondenter
Bestem det samlede antal deltagere, der kræves til projektet. I tilfælde af at projektet kræver sprog indsamling af lyddata, bør du analysere det samlede antal deltagere, der kræves pr. målsprog.
For eksempel – 50 % amerikansk engelsk og 50 % australsk engelsktalende
Det samlede antal ytringer
For at opbygge taledataindsamlingen skal du bestemme det samlede antal ytringer eller gentagelser pr. deltager eller det samlede antal gentagelser, der er nødvendige.
For eksempel – 50 deltagere med 25 ytringer pr. deltager = 1250 gentagelser

Script struktur

Scriptet kan også tilpasses til at imødekomme projektets behov, så det er tilrådeligt at søge hjælp fra taleterapeuter at designe strømmen af tekst. Hvis ML-modellen skal trænes på velstrukturerede data, skal den tage hensyn til scriptet og arbejdsgangen.

Scripted vs Unscripted
Du kan vælge mellem at bruge en scriptet tekst eller en naturlig eller unscripted tekst, der skal læses af deltagerne.
I en scriptet teksttale læser deltagerne, hvad der vises på skærmen. Denne metode bruges for det meste til at optage kommandoer eller instruktioner.
For eksempel – 'Sluk musikken', 'Tryk på 1 for at optage'.
I den uskriptede tale får deltagerne scenarier og bliver bedt om at indramme deres sætninger og tale så naturligt som muligt.
For eksempel – 'Kan du venligst fortælle mig, hvor den næste tankstation er?'
Ytringssamling / Wakeup Words
Hvis der bruges scriptet tekst, skal du bestemme antallet af scripts, der skal bruges, og om hver deltager skal læse et unikt script eller en gruppe scripts. Bestem også, om scriptet indeholder en samling af wake-ord og -kommandoer.
For eksempel -
Kommando 1:
"Alexa, hvad er opskriften på en chokolade cupcake?"
"Ok Google, hvad er opskriften på en chokoladecupcake?"
"Siri, hvad er opskriften på en chokoladecupcake?"
Kommando 2:
"Alexa, hvornår er flyet til New York?"
"Google, hvornår er flyet til New York?"
"Siri, hvornår er flyet til New York?"

Lydkrav og formater

Lydkvalitet spiller en afgørende rolle i talegenkendelsen dataindsamling behandle. Distraherende baggrundsstøj kan have en negativ indvirkning på kvaliteten af de indsamlede stemmenoter. Dette kan også mindske effektiviteten af stemmegenkendelsesalgoritmen.

Lydkvalitet
Kvaliteten af optagelserne og tilstedeværelsen af baggrundsstøj kan påvirke resultatet af projektet. Men nogle taledataindsamlinger accepterer tilstedeværelsen af støj. Det er dog tilrådeligt at have en bedre forståelse af kravene med hensyn til bithastighed, signal-til-støj-forhold, amplitude og meget mere.
dannet
Filformatet, datapunkter, indholdsstruktur, komprimering og efterbehandlingskrav bestemmer også kvaliteten af taleoptagelser.
Grunden til vigtigheden af filformater er, at modellen skal identificere filoutputtet og trænes til at genkende netop den lydkvalitet.
Definer brugerdefineret lydkrav
Tilpassede lydkrav bør nævnes før begyndelsen af indsamlingsprocessen. Klienter kan vælge tilpassede lydfiler, hvor specifikke filer lægges sammen.

Leverings- og behandlingskrav

Når taledataene er indsamlet, kan kunderne vælge at få dem leveret i henhold til deres krav.

Krav til transskription og annotering
Nogle kunder kræver datatransskription og mærkning, før de leverer. Derudover kan de også kræve specifikke former for mærkning og segmentering.
Nogle gange er det bedre at søge tale-sprog-patologer og eksperter til at hjælpe med at transskribere tale på forskellige sprog for at bevare målsprogets autenticitet.
Filnavnekonventioner
formularer til dataindsamling skal angive enhver filnavnekonvention, der skal følges. Hvis navnekonventionen er kompleks eller uden for processens standardomfang, kan den tiltrække ekstra udviklingsomkostninger.
Retningslinjer for levering
Sikkerheds- og leveringsretningslinjer skal følges som specificeret i projektkravene. Desuden skal det angives, om dataene skal leveres i små milepæle eller som en komplet pakke. Kunder foretrækker også rettidigt statusovervågning opdateringer, så de kan holde styr på projektets status.

Andre vigtige punkter at bemærke

Tilpasningerne vil påvirke, hvordan

Dataindsamlingsmetoder anvendte
Rekruttering af deltagere
Tidslinjen for levering
De foreløbige omkostninger ved projektet

Når du vælger den rigtige leverandør, skal du sørge for, at du går sammen med en person, der både har erfaringen til at give tilpasningsvalg og fleksibilitet til at skalere projektet ubesværet. Karakteren af indsamling af taledata er, at den udvikler sig, og kompleksiteten ændrer sig over tid, og den rigtige udbyder bør være i stand til at holde trit.

Når alt hvad du behøver er fleksibilitet og skalerbarhed, er Shaip det rigtige valg. Vi tilbyder tilpassede tjenester baseret på dine specifikke projektkrav. Vi tilbyder skalerbar og fleksibel dataindsamlingsløsninger til flersprogede projekter til konkurrencedygtige priser. Tal med vores eksperter for at vide, hvordan vores taledataindsamling og tilpasningsteknikker fungerer ved udvikling af konversations-AI.

[Læs også: Talegenkendelsestræningsdata – typer, dataindsamling og applikationer]

Social Share

Tal med en ekspert

Fornavn*
Efternavn*
E-mail*
Telefon*
Om os*
Land*
Land
Kommentarer*
Ved tilmelding er jeg enig med Shaip Privatlivspolitik , Servicevilkår og give mit samtykke til at modtage B2B marketingkommunikation fra Shaip.
CAPTCHA

Download gratis bog

Du vil måske også kunne lide

6 gennemprøvede metoder til at tilpasse taledataindsamling

Sprog og demografi

Sprog og dialekt

Lande

Demografi

Samlingsstørrelse

Det samlede antal respondenter

Det samlede antal ytringer

Script struktur

Scripted vs Unscripted

Ytringssamling / Wakeup Words

Lydkrav og formater

Lydkvalitet

dannet

Definer brugerdefineret lydkrav

Leverings- og behandlingskrav

Krav til transskription og annotering

Filnavnekonventioner

Retningslinjer for levering

Andre vigtige punkter at bemærke

Social Share

Tal med en ekspert

4 Effektive samtale-AI-praksis til maksimal ROI

Sådan afbødes almindelige dataudfordringer i Conversational AI

Bag kulisserne: Udforskning af ChatGPT's indre funktioner – del 2

AI-datatjenester

Specialiseret

Industri

Produkter

Om os

Ressourcer

Kontakt os