Casestudie: Moderering af indhold

Mere end 30 dokumenter er skrottet og kommenteret til indholdsmoderering

Moderering af indhold - banner
Der er en stigende efterspørgsel efter AI-drevet indholdsmoderering
der stræber efter at sikre det online rum, hvor vi forbinder og kommunikerer.

Efterhånden som brugen af ​​sociale medier fortsætter med at vokse, bliver
problemet med cybermobning er dukket op som et
betydelig hindring for platforme, der stræber efter
sikre en sikker onlineplads. En svimlende
38% af individerne støder på dette
skadelig adfærd på daglig basis,
understreger den presserende efterspørgsel efter opfindsomhed
tilgange til moderation af indhold.
Organisationer i dag er afhængige af brugen af
kunstig intelligens til at håndtere det varige
problem med cybermobning proaktivt.

Cybersikkerhed:

Facebooks Q4 Community Standards Enforcement Report afslørede – handling på 6.3 mio. stykker af mobning og chikane, med en proaktiv opdagelsesrate på 49.9 %

Uddannelse:

2021 undersøgelse fandt det 36.5 %% af eleverne i USA i alderen fra 12 & 17 år oplevet cybermobning på et eller andet tidspunkt i løbet af deres skolegang.

Ifølge en 2020-rapport blev det globale marked for indholdsmodereringsløsninger vurderet til USD 4.07 milliarder i 2019 og forventedes at nå USD 11.94 milliarder i 2027 med en CAGR på 14.7 %.

Virkelig verdens løsning

Data, der modererer globale samtaler

Klienten var ved at udvikle en robust automatiseret
indholdsmoderering Machine Learning
model for sit Cloud-tilbud, som de
ledte efter domænespecifik leverandør, der
kunne hjælpe dem med præcise træningsdata.

Ved at udnytte vores omfattende viden inden for naturlig sprogbehandling (NLP) hjalp vi klienten med at indsamle, kategorisere og kommentere mere end 30,000 dokumenter på både engelsk og spansk for at opbygge automatiseret indholdsmoderering Machine Learning Model opdelt i giftigt, modent eller seksuelt eksplicit indhold kategorier.

Virkelig verdens løsning

Problem

  • Web-skraber 30,000 dokumenter på både spansk og engelsk fra prioriterede domæner
  • Kategorisering af det indsamlede indhold i korte, mellemstore og lange segmenter
  • Mærkning af de kompilerede data som giftigt, modent eller seksuelt eksplicit indhold
  • Sikring af annoteringer af høj kvalitet med minimum 90 % nøjagtighed.

Løsning

  • Web skrottet 30,000 dokumenter hver for spansk og engelsk fra BFSI, Healthcare, Manufacturing, Detail. Indholdet blev yderligere opdelt i korte, mellemlange og lange dokumenter 
  • Det lykkedes at mærke det klassificerede indhold som giftigt, voksent eller seksuelt eksplicit indhold
  • For at opnå 90 % kvalitet implementerede Shaip en kvalitetskontrolproces i to niveauer:
    » Niveau 1: Kvalitetssikringstjek: 100 % af filerne skal valideres.
    » Niveau 2: Kritisk kvalitetsanalysekontrol: Shaips' CQA-team vurderer 15 %-20 % af de retrospektive prøver.

Resultat

Træningsdataene hjalp med at opbygge en automatiseret ML-model for indholdsmoderering, der kan give adskillige resultater til gavn for at opretholde et sikrere onlinemiljø. Nogle af de vigtigste resultater omfatter:

  • Effektivitet til at behandle store mængder data
  • Konsistens i at sikre ensartet håndhævelse af moderationspolitikker
  • Skalerbarhed til at tilpasse sig voksende brugerbase og indholdsmængder
  • Realtidsmoderering kan identificere og
    fjerne potentielt skadeligt indhold, efterhånden som det genereres
  • Omkostningseffektivitet ved at reducere afhængigheden af ​​menneskelige moderatorer

Eksempler på indholdsmoderering

Eksempler på indholdsmoderering

Fremskynde din samtale AI
applikationsudvikling med 100%

Fortæl os, hvordan vi kan hjælpe med dit næste AI-initiativ.