Emberi agy segítségével fejlesztették a gépi tanulást

2022. március 09. 2 perc

Az ELTE kutatói az emberi agy kapcsolatainak leírását használták innovatív gépi tanulási módszerek teszteléséhez. Az új módszer a Newton-elmosás nevet kapta, a kapcsolódó tanulmány a Scientific Reports című lapban jelent meg.

A mesterséges intelligencia felhasználásaiban és a gépi tanulásban szükség van olyan óriási oktató adathalmazokra, amelyekkel hatékonyan meg lehet tanítani a programokat arra, hogy az adatok bizonyos sajátságait felismerjék. Sokszor azonban nem állnak rendelkezésre milliós adathalmazok: ezekben az esetekben adatsokszorozást, ún. augmentálást végeznek az adatokon.

Kifejező példa lehet, hogy az önvezető autó vezérlésének beállításakor a közlekedési szituációkat leíró képek egy-egy – többnyire nem lényeges részét – elhomályosítják, elmossák, és így egyetlen eredetiből sok képet tudnak származtatni. A módszer a népszerű képszerkesztő programokban is megtalálható Gauss-homályosítás vagy -elmosás (Gaussian blurring).

Az eljárás azonban a biológiai, kémiai szerkezetek és képletek esetében nem működik: erre a problémára kerestek megoldást a magyar kutatók. Az ELTE Matematikai Intézete PIT Bioinformatikai Csoportjának kutatói – Keresztes László, Szögi Evelin, és Varga Bálint Grolmusz Vince professzor vezetésével – kidolgozták a Newton-elmosás módszerét, amellyel nem csak képi adatokat lehet megsokszorozni.

A Newton-elmosás az adatok javítási mechanizmusát variálja: a nagyobb megbízhatóság kedvéért többször mérünk vagy számolunk ki valamilyen mennyiséget, és ezeket átlagolva használjuk. Ha valamit például tízszer mérünk meg, és a 10 mérésből minden lehetséges módon kiválasztunk hetet. Majd ezeket külön-külön átlagoljuk, akkor az adatokat megsokszorozhatjuk annyiszor, ahányszor 10 adatból 7-et ki lehet választani. A példában ez éppen 120.

Az ELTE-s kutatók módszere nem visz be mesterséges „homályosítást”, mint a Gauss-elmosás, hanem az adatjavításba avatkozik bele: a megsokszorozott adatok minősége jobb, mint az egyedi adatoké, hiszen – a példánkban – hét mérés eredményeit átlagoltuk.

A szakemberek a Newton-elmosást először az emberi agy kapcsolatait leíró 1053 alanytól származó agygráfokra alkalmazták, és így az adathalmaz méretét százhúszszorosára növelték, azaz 126.360 agygráfot készítettek az adathalmazból. Mindegyiket öt különböző felbontásban számoltak ki, így 5 x 126.360, azaz 631.800 agygráfot tehettek közzé. A megnövelt adathalmazon igazolták a módszer használhatóságát a gépi tanulásban.

Az új eljárás nemcsak agygráfokra, de sok más, köztük kémiai és biológiai adathalmazra is használható. Az új agygráfok kiszámítása mintegy három hetet vett igénybe a kutatócsoport 36 számítógépén.