Az emberi agy gyorsabb képfelismerő, mint a számítógép

Vágólapra másolva!
Az emberek simán lekörözik a számítógépeket, ha különféle méretű, színű, elhelyezkedésű, megvilágítású arcok vagy tárgyak felismeréséről van szó. Arról azonban még keveset tudunk, hogyan valósítja meg agyunk a látottak vizuális földolgozását. Amerikai kutatók munkája nyomán most egy lépéssel közelebb kerültünk a folyamat megértéséhez.
Vágólapra másolva!

A Bostoni Gyerekkórház kutatói olyan betegeken végeztek agytérképezéseket, akik epilepszia miatti műtétre vártak. Első ízben sikerült kimutatniuk, hogy az agy a feldolgozás egészen korai szakaszában villámgyorsan képes fölismerni a különböző körülmények között ábrázolt tárgyakat. A részletes eredményeket a Neuron című folyóirat legújabb száma közli.

A szem retinájából érkező látási információ az agy egy sor hierarchikus szerveződésű látóterületén - többek közt a nyakszirtlebenyben lévő elsődleges látókérgen - áramlik keresztül, míg végül eléri a halántéklebenyt. A látási tárgyfelismerő kapacitásunkért és a színérzékelésünkért végső soron felelős halántéklebeny visszajelzéseket is küld a korai feldolgozó területekre. Ez a kétirányú információáramlás megerősíti a látási érzékelést.

Eddig nem volt világos, hogy mennyiben járulnak hozzá a látáshoz ezek az "előreáramló" és "visszacsatoló" jelek, mondja Gabriel Kreiman, a Bostoni Gyerekkórház szemészeti osztályának munkatársa. Egyesek úgy vélték, ha nincs visszacsatolás, akkor nincs látás sem, de Kreiman és csoportja kimutatta, hogy létezik egy kezdeti aktivitáshullám, amely gyors elsődleges benyomást ad, és már ez is nagyon erőteljes.

Noha a magasabb agyterületekről később előfordulhat visszacsatolás, ami gyakran fontos lehet, a rendkívül gyors látási feldolgozásnak kétségtelenül evolúciós előnye lehetett a kritikus helyzetekben, például egy ragadozóval szembe találkozva.

Az embereken végzett korábbi tanulmányok nem invazív agymegfigyelésekre épültek, azaz a vizsgálatok során nem végeztek műtéteket, hanem vagy elektródákat tettek a fej felületére, vagy képalkotó eljárásokat használtak. Másodperces időközökkel rögzítették az agyi aktivitást, ami jelentősen elmarad az agy tényleges feldolgozási sebességétől. Ráadásul ezek az eljárások meglehetősen kiterjedt agyterületekről gyűjtenek információt.

Kreiman és munkatársai közvetlenül az agyba helyezték az elektródákat, így rendkívül nagy időbeli felbontással tudtak adatokhoz jutni (a látási inger megjelenítése után 100 milliszekundummal, azaz 0,1 másodperccel rögzítették a jeleket), és erősen körülhatárolt, jól meghatározott helyek aktivitását tudták nyomon követni.

A "durvább" eljárást az tette lehetővé, hogy a kísérletekben olyan epilepsziás önkénteseket vizsgáltak, akik betegségük miatt műtétre vártak. Az ilyen műtétek előtt fel kell térképezni az agyat, hogy a sérült agyszövetek eltávolításakor ne károsítsanak semmilyen létfontosságú agyfunkciót. A csoport 11 epilepsziás serdülő és fiatal felnőtt agyába ültetett elektródákat (betegenként 48-126 elektródát) azokra a területekre, ahonnan az epilepsziás rohamok feltételezhetően származtak. Miközben az elektródák továbbították az agyi aktivitást a rögzítő műszerekhez, a betegeknek egy sor különböző méretű és elforgatottságú képet mutattak öt kategóriából (állatok, székek, emberi arcok, gyümölcsök és járművek).

Gabriel Kreiman, PhD, Children's Hospital Boston

Ezek az egyetlen elektródából származó jelek mutatják a különböző látási ingerekre adott válaszreakciók erősségét és sebességét (piros: állatok, zöld: székek, kék: emberi arcok, fekete: gyümölcsök, sárga: járművek). A kis agyképen az elektróda helye látható (a bal halántéklebenyben). Ez az agyterület gyors, erőteljes és szelektív választ ad az emberi arcokra (Gabriel Kreiman, PhD, Children's Hospital Boston szívességéből)

A regisztrált adatok azt mutatták, hogy az agy látókérgének bizonyos területei szelektíven ismernek fel bizonyos tárgykategóriákat. Az egyes agyterületek olyan erősen és következetesen válaszoltak, hogy a kutatók egy idő után csupán a kísérleti alanyok idegválaszainak mintázatát vizsgálva, matematikai algoritmussal meghatározhatták, mit néznek a betegek. Ezen kívül a válaszok a tárgy méretétől és az elfordítás mértékétől függetlenül állandóak voltak. A felismerés 100 milliszekundumon belül egyértelmű volt, ami túl kevés idő ahhoz, hogy az információ megjárhatta volna a nyakszirtlebenyben lévő elsődleges látókéreg és a halántéklebeny közötti oda-vissza utat.

A kutatók a vizuális algoritmusok számos gyakorlati alkalmazását tartják elképzelhetőnek. Segítségükkel például "megtaníthatják" a számítógépeket, hogy olyan jól lássanak, mint az emberek. Ily módon a számítógépek segíthetnének valós élethelyzetekben, például megpillanthatnák a terroristákat a repülőtereken, autóba szerelve megakadályozhatnák a rosszul látható gyalogosok elütését, vagy sok száz mikroszkópos metszetet vizsgálhatnának meg, hogy kiszűrjék a rosszindulatú sejtburjánzásokat. Ennél is futuristább alkalmazási terület lehetne olyan agy-számítógép interfészek tervezése, amelyek lehetővé tennék vak emberek számára legalább a részleges látási érzékelést.