Újabb lépés a fehérjekutatásban
A világon sok helyen tekintélyes erőforrásokat rendelnek a mesterséges intelligencia eszközeinek kutatására. A legnagyobb figyelem a mély neurális hálózatok felé fordul, mivel olyan problémákat sikerült megoldani a segítségükkel, mint az önvezető autók vezérlése, komplex képfelismerési feladatok megoldása vagy a legjobb humán gojátékos legyőzése.
A földi élet legfontosabb molekulái a fehérjék: az embernek mintegy 100.000 fehérjéje van, a bennünk élő baktériumoknak pedig összességében több millió. Az eddig ismert fehérjék összetételét, így az elsődleges szerkezetüket leíró aminosav-szekvenciákat is különböző nagy adatbázisok tárolják. A fehérjeszekvenciákat, azaz az őket alkotó aminosavak sorrendjét ma már nem nehéz meghatározni, de funkciójuk kiderítése még ma sem könnyű feladat.
Sok betegség esetében bizonyos fehérjék szintje megnő, illetve lecsökken, így feltételezik, hogy ezek a fehérjék szoros kapcsolatban lehetnek az adott betegséggel. Szekvenciájuk után a funkciójuk leírása fontos lépés lehet a betegség megértése, illetve gyógyítása felé.
A kutatók sok éve próbálkoznak mély neurális hálókat alkalmazni a fehérjék funkciójának leírására, több-kevesebb sikerrel. Az ELTE PIT Bioinformatikai Csoport kutatói, Szalkai Balázs doktorjelölt és Grolmusz Vince professzor most publikációban mutatta be a SECLAF webszervert, amely – mindenki számára elérhetően – határozza meg a fehérjék funkcióját aminosav-sorrendjükből.
Az eredmény azért jelentős, mert igen nagy pontosságú eszközről van szó: a SECLAF több mint 99.99%-os találati aránnyal osztályozza a fehérjeszekvenciákat az UniProt adatbázis 698 fehérjecsaládjába.
A webszerver nyilvánosan elérhető a https://pitgroup.org/seclaf/ oldalon.
A közlemény ingyenes változata