Koneoppiminen mahdollisti ennennäkemättömän laajan ja nopean lääkeaineiden virtuaaliseulonnan

Report this content

Itä-Suomen yliopisto, Orion ja Tieteen tietotekniikan keskus CSC ovat toteuttaneet yhden maailman suurimmista lääkeaineiden virtuaaliseulontakokeista. Seulonnassa käsiteltiin kaikkiaan 1,56 miljardia yhdistettä. Koneoppimisen avulla virtuaaliseulonta voitiin toteuttaa yli 90 prosenttia lyhyemmässä ajassa. Tulokset julkaistiin Journal of Chemical Information and Modeling -lehdessä.

Uusien lääkemolekyylien löytämiseksi tutkijat käyttävät usein tietokoneavusteista seulontaa. Sen avulla haetaan erilaisista tietokannoista yhdisteitä, jotka pystyvät sitoutumaan lääkevaikutusten kohteena olevaan proteiiniin. Tällainen lääkekohde voi olla esimerkiksi entsyymi, joka auttaa bakteeria sietämään antibiootteja tai virusta aiheuttamaan tartunnan. Viime vuosina tietokannat ovat kasvaneet niin nopeasti, ettei tietokoneiden seulontanopeus ole pysynyt perässä. Etsittäessä vaikka vain yhteen lääkekohteeseen sopivia molekyylejä miljardeja yhdisteitä sisältävistä tietokannoista seulonta voi kestää useita kuukausia tai jopa vuosia – myös maailman huippuluokan supertietokoneilla. Siksi nopeampia lähestymistapoja tarvitaan kiireellisesti.

Nyt julkaistussa tutkimuksessa tutkijatohtori Ina Pöhnerin tutkimusryhmä Itä-Suomen yliopiston farmasian laitokselta selvitti CSC:n ja Orionin asiantuntijoiden kanssa koneoppimisen mahdollisuuksia erittäin laajojen virtuaalisten seulontojen nopeuttamisessa.

Tutkimuksen lähtökohtana oli havainto, että perinteisellä seulonnalla 1.56 miljardin yhdisteen -käsittelyyn kului aikaa noin puoli vuotta, kun käytettiin CSC:n Mahti- ja Puhti-supertietokoneita. Tässä perinteisessä seulonnassa molekyylejä ”telakoitiin” kohdeproteiinin sitoutumisalueelle ja kustakin telakoinnista laskettiin pisteytys, joka kuvasi kyseisen yhdisteen sopivuutta sitoutumisalueeseen. Tutkimuksen ensimmäisen vaiheen tuloksena oli siis kaikille 1,56 miljardille molekyylille laskettu telakointi ja sitä vastaava pisteytysarvo.

Perinteisen seulonnan tuloksia verrattiin koneoppimisella tehostettuun seulontaan, jossa hyödynnettiin dosentti Tuomo Kalliokosken kehittämää HASTEN-työkalua. – Koneoppimista hyödyntävä työkalu opettelee molekyylien ominaisuuksia ja niiden vaikutuksia yhdisteiden pisteytykseen. Kun sille esitetään tarpeeksi esimerkkejä perinteisestä telakoinnista, se voi ennustaa telakointeja muille tietokannan yhdisteille paljon nopeammin kuin perinteinen menetelmä, kertoo Kalliokoski , joka toimii Orionilla vanhempana tutkijana.

Koneoppimisen aineistona käytettiin yhtä prosenttia koko tietokannan yhdisteistä, minkä jälkeen työkalu pystyi tunnistamaan oikein yli 90 prosenttia lupaavimmista yhdisteistä. Erona alkuperäiseen menetelmään oli se, että koneoppimisen avulla ennusteet oli mahdollista saada alle kymmenessä päivässä puolen vuoden sijaan.

Tutkimuksessa tehtiin ensimmäistä kertaa tarkka vertailu koneoppimisella tehostetun telakoinnin ja perinteisen telakoinnin välillä erittäin laajassa aineistossa. – Tulosten perusteella koneoppimisella pystytään luotettavasti ja toistettavasti löytämään lähes kaikki perinteisellä telakoinnilla tunnistettavista yhdisteistä mutta merkittävästi nopeammassa ajassa, Pöhner kertoo.

– Tämä projekti on erinomainen esimerkki yhteistyöstä tiedemaailman ja teollisuuden välillä ja osoittaa osaltaan, että CSC:n laskentaresurssit ovat maailman kärkeä. Näinkin kunnianhimoinen tavoite voitiin saavuttaa yhdistämällä eri osapuolten ideat, resurssit ja teknologia, lisää professori Antti Poso, joka johtaa lääkeainekehityksen tutkimusryhmää osana Itä-Suomen yliopiston DrugTech-tutkimusyhteisöä.

Muita vastaavia, yhtä suuren mittakaavan tutkimuksia ei toistaiseksi ole julkaistu. Siksi tutkijat ovat tuoneet julkiseen käyttöön tutkimuksen tietoaineistot: valmiin seulontakirjaston telakoinnin nopeuttamiseksi muille kohteille ja koko 1,56 miljardin yhdisteen telakoinnin tulokset kahdelle kohteelle. Tavoitteena on rohkaista muitakin tutkijoita kehittämään uusia menetelmiä lääkeainesuunnitteluun.

Lisätietoja:

Professori Antti Poso, Itä-Suomen yliopisto, farmasian laitos, antti.poso(a)uef.fi

Dr. Ina Pöhner, Itä-Suomen yliopisto, farmasian laitos, ina.pohner(a) uef.fi

Vanhempi tutkija, dosentti Tuomo Kalliokoski, Orion Oyj, tuomo.kalliokoski(a)orionpharma.com

Tutkimusartikkeli:

Toni Sivula, Laxman Yetukuri, Tuomo Kalliokoski, Heikki Käsnänen, Antti Poso & Ina Pöhner (2023) Machine 

Learning-Boosted Docking Enables the Efficient Structure-Based Virtual Screening of Giga-Scale Enumerated 

Chemical Libraries. J. Chem. Inf. Model. DOI: 10.1021/acs.jcim.3c01239. Available at: https://pubs.acs.org/doi/full/10.1021/acs.jcim.3c01239  

Tilaa