La AI de Facebook povas analizi memojn, sed ĉu ĝi povas kompreni ilin? La teknologio Rosetta de Facebook analizas miliardojn da bildoj, kiuj enhavas tekston, sed memoj estas tro kompleksaj por artefarita inteligenteco. Miliardoj da tekstoj, fotoj kaj filmetoj estas alŝutitaj al sociaj amaskomunikiloj ĉiutage. Ĉi tio estas amaso da informoj, kiujn homaj moderigaĵoj kaj iliaj fakkontrolistoj ne povas amplekse kribri, kontroli kaj kontroli. Firmaoj kiel Facebook kaj Jutubo longe dependas de artefarita inteligenteco por konservi spamon, perforton, kritikan enhavon kaj pornografion ekster siaj platformoj!
Io kiel sistemkritika memo sen teksto povas esti malfacila por ĝiaj superkomputiloj kaj iliaj algoritmoj analizi kaj prilabori, ĉar ĉi tiu tasko postulas kalkuli plurajn malsamajn vidajn elementojn samtempe. Aŭtomatigitaj sistemoj, tiel nomataj bot-sistemoj, devas rekoni kaj "legi" la vortojn super la foto kaj ankaŭ analizi kaj atribui la bildon mem. Memeoj ankaŭ povas esti priskribitaj kiel komplikaj kulturaj artefaktoj, kiuj estas malfacile kompreneblaj ekster kunteksto. Malgraŭ la defioj, kiujn ili prezentas, ĉiuj ĉefaj sociaj platformoj jam uzas AI por kontroli memojn, inkluzive de Facebook, kiu uzas ilon nomatan Rosetta por analizi fotojn kaj filmetojn, kiuj enhavas tekston kaj subtitolojn.
Laŭ Facebook, Rosetta jam estas uzata por aŭtomate detekti enhavon, kiu malobservas gvidliniojn pri malama parolo. Kun la helpo de Rosetta, Facebook strebas kontroli uzantenhavon inkluzive de fotoj kaj filmetoj kaj ne nur tekst-bazitaj afiŝoj. Rosetta subtenas la procezon, en kiu oni aŭtomate kontrolas ĉu bildoj kaj filmetoj, kiuj enhavas tekston, antaŭe estis markitaj kiel "kritikaj". Rosetta kombinas teknologion OCR (optika karaktero rekono) kun aliaj maŝinlernadoteknikoj por vidi, prilabori, klasifiki kaj atribui tekston en kaj sur fotoj kaj filmetoj kaj poste konservi ĝin. Unue, OCR estas uzata por determini kie la teksto estas en memo aŭ video. Ĉi tio permesas al ili rapide transformi datumojn kaj uzi siajn "elektilojn" por taksi la enhavon.
Post kiam Rosetta scias kie estas la vortoj, Fejsbuko uzas neŭralan reton, kiu povas kompreni la tekston, ĝian transskribon kaj ĝian signifon. Ĉi tiu teksto povas tiam esti trapasita tra aliaj sistemoj, kiel sistemo kiu kontrolas ĉu la memo estas virusmesaĝo kiu jam estis malkonfirmita laŭ iliaj gvidlinioj. La programistoj kaj esploristoj de Rosetta asertas, ke la ilo nun povas ĉerpi tekston de iu ajn bildo publike alŝutita al Fejsbuko en reala tempo kaj rekoni la tekston, kaj ankaŭ "legi" ĝian lingvan identigilon, inkluzive de la angla, hispana, germana kaj araba.
Rosetta ankaŭ povas analizi bildojn, kiuj enhavas tekston en multaj malsamaj formoj, kiel fotoj de protestaj signoj, restoraciomenuoj, butikfenestroj kaj pli. Viswanath Sivakumar, programaro-inĝeniero ĉe Facebook, kiu laboras pri Rosetta, diris en retpoŝto, ke la ilo funkcias bone por identigi tekston en pejzaĝo kiel stratsigno kaj por memoj - sed ĉi-lasta estas pli malfacila. "En la kunteksto de iniciateme detektado de malama parolado kaj alia enhavo kiu malobservas politikojn, mem-stilaj bildoj prezentas la pli kompleksan AI-defion," li skribis.
Male al homoj, AI ankaŭ kutime bezonas vidi dekojn da miloj da ekzemploj antaŭ ol ĝi povas lerni plenumi komplikan taskon, diras Sivakumar. Sed memoj ne estas senfine kontroleblaj, eĉ por Fejsbuko, kaj kolekti kaj konservi sufiĉe da ekzemploj en malsamaj lingvoj kaj emocioj ankaŭ povas montriĝi malfacila. Trovi altkvalitajn mesaĝojn estas daŭra defio por esploro pri artefarita inteligenteco pli vaste. Datumoj ofte devas esti zorge permane etikeditaj kaj arkivitaj. Multaj datumbazoj ankaŭ estas protektitaj per kopirajto.
Por nutri Rosetta per la necesaj datumoj kaj trejni ĝian utilecon, teksto, kune kun ĝiaj bildotekstoj kaj la lokoj de kiuj ili estis publikigitaj, estas kombinitaj en komputilan procezon. En simplaj vortoj, vi kreis programon por krei ĝuste tiujn ekzemplojn, kies enhavo ŝajnas dubinda. Tio signifas, ke la tuta procezo estas iagrade aŭtomatigita: unu programo aŭtomate kraĉas la memojn kaj alia provas analizi ilin. AI alfrontos tre grandajn defiojn. Ekzemple, Rosetta alfrontas lingvojn kiel la araba, kiu estas legata de dekstre al maldekstre, kontraste al aliaj lingvoj kiel la angla aŭ la germana. Rosetta "legas" la araban malantaŭen, tiam Fejsbuko inversigas la signojn post prilaborado. Ĉi tiu lertaĵo funkcias surprize bone kaj ebligas unuigitan modelon, kiu funkcias por kaj maldekstre al dekstre kaj dekstre al maldekstre lingvoj.
Aŭtomatigitaj sistemoj povas esti ekstreme utilaj por enhavmoderado kaj kontrolado de faktoj, sed ili ne ĉiam estas facilaj. Ekzemple, WeChat uzas du malsamajn algoritmojn por filtri bildojn. La unua, OCR-bazita programo, filtras fotojn kiuj enhavas tekston pri malpermesitaj temoj, dum la aliaj cenzuras bildojn similajn al tiuj en nigra listo verŝajne kreitaj de la ĉina registaro. Per la filtriloj de WeChat, vi povas facile forigi la karakterizaĵojn de bildo, same kiel la kolorigon aŭ ŝanĝitan orientiĝon. Rossetta de Facebook estas kompleksa, sed verŝajne ne perfekta. La sistemon povas esti evitita per malfacile legebla teksto aŭ distorditaj tiparoj. Ĉiuj algoritmoj de rekono de bildoj ankaŭ estas ankoraŭ eble vundeblaj al konfliktantaj ekzemploj, iomete ŝanĝitaj bildoj, kiuj aspektas same al homoj sed igas AI konfuziĝi.
Facebook kaj aliaj platformoj kiel Twitter, Jutubo kaj Reddit estas sub enorma premo por kontroli certajn specojn de enhavo en pluraj landoj. En 2018, la Eŭropa Unio proponis novajn leĝojn, kiuj postulus kompaniojn pri sociaj amaskomunikiloj forigi teroristajn afiŝojn ene de unu horo post sciigo aŭ alfronti monpunojn. Rosetta kaj aliaj simile aŭtomatigitaj iloj jam helpas al Facebook kaj aliaj platformoj plenumi similajn leĝojn en landoj kiel Germanio. Kaj ili pliboniĝas pri siaj laboroj: Antaŭ du jaroj, ĉefoficisto Mark Zuckerberg diris, ke la AI-sistemoj de Facebook nur proaktive kaptas ĉirkaŭ duonon de la enhavo, kiun la firmao forigis. Homoj devas unue marki la reston. Laŭ Facebook, ĝiaj AI-iloj detektas preskaŭ 100 procentojn de la spamo, kiun ili kondamnas, same kiel 99,5 procentojn de terorista enhavo kaj 86 procentojn de grafika perforto. Aliaj platformoj kiel ekzemple YouTube atingis similan sukceson kun aŭtomatigitaj enhavrekonsistemoj.
Tamen, ĉi tio ne signifas, ke AI-sistemoj kiel Rosetta estas perfekta solvo, precipe se temas pri pli nuancaj formoj de esprimo. Male al restoracio-menuo, povas esti malfacile analizi la signifon de memeo sen scii la kuntekston en kiu ĝi estis afiŝita. Tial estas tutaj retejoj klarigantaj ilin. Memeoj ofte aperas en ŝercoj aŭ estas tre specifaj por certa interreta subkulturo kaj ĝia morala kaj etika fono. Kaj artefarita inteligenteco ankoraŭ ne kapablas kompreni memeon aŭ videon kiel homo farus. Nuntempe, Fejsbuko ankoraŭ devos fidi al homaj moderigaĵoj kaj iliaj faktokontroliloj por fari decidojn ĉu forigi memeon.
Traduka artikolo el la revuo Wired la 14.09.2018-an de septembro XNUMX
(tra Vale Rion)