Studija slučaja: moderiranje sadržaja

30 dokumenata na webu odbačeno i označeno za moderiranje sadržaja
Moderacija sadržaja - banner
Sve je veća potražnja za moderiranjem sadržaja pomoću umjetne inteligencije koje nastoji osigurati online prostor u kojem se povezujemo i komuniciramo.

Kako korištenje društvenih medija nastavlja rasti, problem internetskog zlostavljanja pojavio se kao značajna prepreka za platforme koje nastoje osigurati siguran online prostor. Zapanjujućih 38% pojedinaca svakodnevno se susreće s ovim štetnim ponašanjem, što naglašava hitnu potražnju za inventivnim pristupima moderiranja sadržaja. Današnje se organizacije oslanjaju na upotrebu umjetne inteligencije kako bi proaktivno riješile trajni problem internetskog nasilja.

Kibernetička sigurnost:

Otkriveno Facebookovo izvješće o provedbi standarda zajednice za četvrto tromjesečje – djelovanje na 4 milijuna komada sadržaja zastrašivanja i uznemiravanja, s proaktivnom stopom otkrivanja od 6.3%

Obrazovanje:

2021 studija je utvrdila da 36.5%% učenika u Sjedinjenim Državama u dobi od 12 i 17 godina iskusili internetsko zlostavljanje u jednom trenutku tijekom svog školovanja.

Prema izvješću iz 2020., globalno tržište rješenja za moderiranje sadržaja procijenjeno je na 4.07 milijardi USD u 2019., a očekuje se da će dosegnuti 11.94 milijarde USD do 2027., s CAGR-om od 14.7%.

Rješenje u stvarnom svijetu

Podaci koji moderiraju globalne razgovore

Klijent je razvijao robustan automatizirani model strojnog učenja za moderiranje sadržaja za svoju ponudu u oblaku, za koju su tražili dobavljača za pojedine domene koji bi im mogao pomoći s točnim podacima o obuci.

Koristeći svoje opsežno znanje o obradi prirodnog jezika (NLP), pomogli smo klijentu u prikupljanju, kategorizaciji i označavanju više od 30,000 XNUMX dokumenata na engleskom i španjolskom jeziku kako bismo izgradili automatizirani model strojnog učenja za moderiranje sadržaja račvan na otrovne, odrasle ili seksualno eksplicitne sadržaje kategorije.

Rješenje u stvarnom svijetu

Problem

  • Web skrapiranje 30,000 dokumenata na španjolskom i engleskom s prioritetnih domena
  • Kategoriziranje prikupljenog sadržaja u kratke, srednje i duge segmente
  • Označavanje prikupljenih podataka kao otrovnog, sadržaja za odrasle ili seksualno eksplicitnog sadržaja
  • Osiguravanje visokokvalitetnih komentara s najmanje 90% točnosti.

Riješenje

  • Web je ukinuo 30,000 XNUMX dokumenata svaki za španjolski i engleski iz BFSI-a, zdravstva, proizvodnje, maloprodaje. Sadržaj je dalje račvan na kratke, srednje i dugačke dokumente 
  • Uspješno označavanje klasificiralo je sadržaj kao otrovan, sadržaj za odrasle ili seksualno eksplicitan
  • Kako bi postigao 90% kvalitete, Shaip je implementirao dvoslojni proces kontrole kvalitete:
    » Razina 1: Provjera osiguranja kvalitete: 100% datoteka koje treba potvrditi.
    » Razina 2: Provjera kritične analize kvalitete: Shaipsov CQA tim procjenjuje 15%-20% retrospektivnih uzoraka.

Proizlaziti

Podaci o obuci pomogli su u izgradnji ML modela automatizirane moderacije sadržaja koji može dati nekoliko ishoda korisnih za održavanje sigurnijeg mrežnog okruženja. Neki od ključnih rezultata uključuju:

  • Učinkovitost obrade ogromne količine podataka
  • Dosljednost u osiguravanju jedinstvene provedbe politika moderiranja
  • Skalabilnost za prilagodbu sve većoj korisničkoj bazi i količini sadržaja
  • Moderacija u stvarnom vremenu može identificirati &
    uklonite potencijalno štetan sadržaj čim se stvori
  • Isplativost smanjenjem oslanjanja na ljudske moderatore

Ubrzajte razvoj svoje aplikacije za razgovornu umjetnu inteligenciju za 100%

Recite nam kako vam možemo pomoći s vašom sljedećom inicijativom umjetne inteligencije.