Mese habbal az adatgyűjtés anonimitása

Anonim aszexuálisok: Gyönyör nélkül is lehet szép az élet?
intim
Vágólapra másolva!
Könnyen kideríthető lehet az egyének személyazonossága.
Vágólapra másolva!

Az elmúlt évtized legnagyobb trendje az anonimizáltnak mondott adatgyűjtés lett, a mobilos és számítógépes alkalmazások, a legkülönfélébb szolgáltatások nyújtói (legyenek azok közösségi webhelyek vagy biztosítócégek) sokszor abszurd mennyiségű információval rendelkeznek, egyesek pedig brókereknek értékesítik is azokat némi plusz bevételért. A cégek szerint az adatokból nem lehet kideríteni az egyének személyazonosságát, hiszen az eladásuk előtt anonimizálják az információkat, azonban a biztonsági kutatók már évek óta kongatják a vészharangot, hogy ez gyakorlatilag mese habbal. Még akkor is, ha tényleg megvan a szándék az anonimizálásra.

Forrás: Thinkstock

Az Imperial College London és Leuveni Katolikus Egyetem kutatói kidolgoztak egy új módszert, állításuk szerint a gépi tanulást is használó algoritmusuk tizenöt ismertetőjegy alapján képes bármely anonimizált adathalmazban 99,98 százalékos pontossággal azonosítani bármely amerikai állampolgárt.

A szoftverük tanítása során ötféle forrásból szereztek információkat, a 210 különböző adathalmazban összesen 11 millió egyén adatai voltak benne.

Ezek az adathalmazok vagy nyilvánosak, vagy információbrókerektől származnak, azaz szabadon megvásárolhatóak. A kutatásukban csak a klasszikus, szűrésen alapuló azonosítási módszerrel foglalkoztak, azaz a nemhez, a születési dátumhoz, az irányítószámhoz, vagy éppen a családi állapothoz hasonló attribútumokkal dolgozik a megoldásuk.

Mindez viszont csak a jéghegy csúcsát jelenti, például mobilappokon, vagy éppen az internet böngészése során begyűjtött adatokból is nagyon sok következtetést lehet levonni, részben mivel mindenki specifikus rutinok szerint él,

a körülményei és a szokásai pedig teljesen egyedivé teszik.

Adott esetben akár komoly mintaelemzés nélkül is kideríthető valakinek a személyazonossága. Erre klasszikus példa, hogy mondjuk egy böngészőbeépülő elküldi a felhasználó által meglátogatott weblapok URL-jeit, az egyik linkben pedig benne lehet az illető felhasználói neve. Ennek ismeretében elképzelhető, hogy már csak egyetlen Google-keresésre van szükség az illető azonosításához.

A kutatók készítettek egy magyarázó weblapot is a kutatásukhoz, az angol nyelvű oldalon megadott információkat nem gyűjtik be.

Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!