Mesterséges intelligencia menti meg a Wikipediát

wikipedia
A Wikipedia Alapítvány globális konferenciája 2014 március 14-én
Vágólapra másolva!
A  Wikipedia, a legnagyobb online enciklopédia ma már világszerte az egyik legfontosabb internetes ismeretterjesztő adatbázisnak számít. A minőség javítását, és a szócikkekbe történő szakszerűtlen beavatkozás megakadályozását egy új rendszer bevezetése segíti.
Vágólapra másolva!

Visszazuhant a szerkesztők száma

A Wikipedia a világ 7. leglátogatottabb oldala, az elmúlt nyolc évben mégis 40%-kal esett vissza a szerkesztőinek száma, körülbelül harmincezerre.

Jimmy Wales, a világ legnagyobb online enciklopédiájának alapítója Forrás: Wikimedia Commons

Mindeközben egyre égetőbb és egyre nehezebben megoldható problémává vált a szócikkekbe belerondító vandálok elleni küzdelem,

ami ráadásul nem volt mindig gyorsan és hatékonyan megkülönböztethető azoktól az esetektől, amikor egy kezdő szerkesztő véletlenül szúrt el valamit, még félig-automatizált korrigáló eszközökkel sem.

Az angol nyelvű Wikipedia szócikkeinek növekedését ábrázoló grafikon, az enciklopédia alapításának évétől, 2001-től 2015-ig. A függőleges oszlop jelzi a szócikkek számát Forrás: Wikimedia Commons

Úgy tűnik, egy mesterséges intelligenciát, azon belül is gépi tanulást alkalmazó megoldással több problémát is kiküszöbölnek egyszerre egy néhány nappal ezelőtt bevezetett megoldással.

Nem voltak kifinomult módszerek a hibák kiszűrésére

A 40%-os esés ugyan az angol nyelvű Wikipediára vonatkozik, viszont egyrészt a Wikipedián angol szócikkből van a legtöbb, másrészt a probléma alapvetően nem csak az angol Wikipediát érintette. A szerkesztők számának csökkenése mögötti ok többek szerint az, hogy

a kezdő szerkesztőket többször kemény kritikával illették a rutinosabbak,

ráadásul a hibázás valószínűségét növelte a felhasználóbarát szerkesztőfelületekhez képest szokatlan Wikitext szerkesztő.

A Wikipedia Alapítvány globális konferenciája 2014 március 14-én Forrás: Wikimedia Commons

Ezen kívül az újonnan belépő szerkesztők szerkesztéseit automatizált eszközökkel azonnal visszavonták nem túl barátságos módon. Mindemellett nyilván előfordult, hogy néhány durva hiba sokáig javítatlan maradt. Nem voltak eléggé kifinomult módszerek rá, hogy a vandálok által elkövetett átírásokat elég gyorsan megkülönböztessék a kezdők által véletlenül vétett hibáktól, amiket például egy-egy szócikk pontosításakor ejtettek.

Új rendszer szűri a módosításokat

A Wikimedia Alapítvány egyik kutatója, Aaron Halfaker miután azonosította a jelenséget, kifejlesztettek egy kifinomultabb, AI-alapú rendszert, az ORES-t (Objective Revision Evaluation Service), ami a különböző szerkesztő felhasználók különböző típusú módosításaihoz eltérő értékeket, súlyokat rendel, ilyen módon, gépi tanuláson keresztül okosabban ismeri fel a módosításokat és jelzi a rutinos wikiszerkesztők felé.

Az alapító Jimmy Wales-t a Maastrichti Egyetem díszdoktorává fogadják Forrás: Wikimedia Commons

A hibák javítása tehát nem csak gyorsabbá,

hanem hatékonyabbá is vált az olvasók és a szócikkek minőségéért felelős szerkesztők örömére.

Teljesen érthető, hogy a Wikipedia adatmennyisége idővel akkorára növekedett, hogy annak karbantartása még fél-automatizált eszközökkel sem lett volna tovább megoldható, a korábbi, például címkék használatán alapuló eszközökkel sem.

Az online enciklopédia ma már az egyik legfontosabb tájékozódási forrás Forrás: Wikimedia Commons

Az újonnan bevezetett módszer az angol nyelvűn kívül, a portugál, török és farszi nyelvű Wikipediában is érezhető változást eredményezett. Érdemes megjegyezni, hogy ez az első olyan eset, amikor egy széles körben használt, közösségi tudásmegosztáson alapuló rendszert kombináltak gépi tanuláson alapuló módszerrel a hibajavítás érdekében, ráadásul ilyen heterogén tartalom esetén.

(MIT Tech Review nyomán)