Hakukone tunnistaa aineenvaihduntatuotteet aiempaa nopeammin ja tarkemmin

Koneoppimiseen perustuvalle menetelmälle voi löytyä sovelluksia muun muassa anti-dopingtyössä, tullin huumevalvonnassa ja rikospaikkatutkinnassa.

Prosenttiosuus hauista, joissa oikea tunnistus on ensimmäisten osumien (top10) joukossa. Aalto-yliopiston ja Jenan yliopiston menetelmä on kilpailevia menetelmiä selvästi tarkempi.
 

Aalto-yliopiston ja saksalaisen Jenan yliopiston tutkijat ovat kehittäneet CSI:FingerID-hakukoneen, joka tunnistaa aineenvaihduntatuotteet tandemmassaspektrometrimittauksista yli 150 prosenttia parasta kilpailijaansa tarkemmin ja voi näin helpottaa muun muassa bio- ja lääketieteen tutkijoiden työtä. Tutkimus julkaistiin äskettäin arvostetussa PNAS-lehdessä.  

Aineenvaihduntatuotteet ovat pieniä molekyylejä, kuten sokereita, rasvahappoja ja aminohappoja, jotka toimivat soluissa muun muassa energianlähteinä ja soluseinien rakennusaineina. Tutkijoille ne ovat ikään kuin jälkiä solujen toiminnasta ja tilasta.

Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia.

– Aineenvaihduntatuotteita on paljon, sadoistatuhansista miljooniin, ja ne kaikki näyttävät vähän samankaltaisilta. Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia, Aalto-yliopiston professori Juho Rousu selittää.

Molekyylin sormenjäljet

Tutkimuksessa käytetty tandemmassaspektrometri on laite, joka pilkkoo molekyylit palasiksi ja mittaa palasten massat ja suhteelliset osuudet eli massaspektrin. Aallon ja Jenan tutkijoiden menetelmässä kustakin opetusaineiston spektristä lasketaan ensin fragmentaatiopuu, joka kuvaa, mistä palasista pilkkoutumalla kukin molekyyliosanen on syntynyt. Tämän jälkeen tutkijat opettavat koneoppimismallia suurella määrällä fragmentaatiopuita ja kutakin puuta vastaavan molekyylin ominaisuuksia eli sormenjälkiä.  Kun mallille sitten annetaan uuden molekyylin spektri, se ennustaa sille todennäköiset sormenjäljet, joiden perusteella haetaan molekyylitietokannasta joukko parhaiten vastaavia molekyylejä.

Tällä hetkellä molekyylien tyypistä riippuen jopa 95 prosenttia hauista tuottaa oikean hakutuloksen 10 ensimmäisen osuman joukkoon. Tunnistamisen täsmällisyys paranee aineistoa kasvatettaessa. Tällä hetkellä mallin muodostamiseen on käytetty noin 6000 massaspektriä. Täydellisessä tilanteessa koneoppimiseen perustuva hakukone ehdottaisi aina ensimmäisenä osumana oikeaa molekyyliä, mutta se vaatii aineiston huomattavaa kasvattamista ja menetelmien kehittämistä.

Tutkimuksesta voi olla hyötyä erityisesti bio- ja lääketieteen tutkijoille. Tulevaisuuden mahdollisia sovellusalueita on esimerkiksi anti-dopingtyössä, tullin huumevalvonnassa ja rikospaikkatutkinnassa.

Tutkimus on tehty yhteistyössä Jenan yliopiston professori Sebastian Böckerin tutkimusryhmän kanssa, ja se on hyvä esimerkki Aalto-yliopiston tietotekniikkaan ja digitaalista terveyttä yhdistävästä tutkimuksesta.

Lisätietoja:

Professori Juho Rousu
Puh. 050 415 1702
[email protected]

Linkki artikkeliin http://www.pnas.org/content/early/2015/09/16/1509788112.abstract

 

  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu

Lisää tästä aiheesta

Professori Mika Järvinen
Tutkimus ja taide Julkaistu:

Mika Järvinen jalostaa kuonasta ja hiilidioksidista kannattavaa liiketoimintaa

Energiatekniikan professorin mielestä tieteen tulee tuottaa ratkaisuja suuriin ympäristöongelmiin.
Infografiikka tietotekniikan sijoituksesta 56:nneksi maailmassa.
Tutkimus ja taide, Yliopisto Julkaistu:

Tietotekniikan ala loikkasi sijalle 56 Times Higher Educationin rankingissa

Insinööritieteiden ja teknologian ala oli sijalla 101–125 maailmassa.
The picture shows Professor Ray Ball giving a keynote speech at the seminar organized at the School of Business.
Yhteistyö, Tutkimus ja taide Julkaistu:

Kaikki hyötyvät yritysten tilinpäätösraportoinnista

Tekoäly, tasapainoilu globaalien ja paikallisten kysymysten välillä sekä sosiaalisten ja ympäristökysymysten entistä vahvempi painottaminen asettavat haasteita tulevaisuuden tilintarkastajille.
Photo: Mikko Raskinen.
Yhteistyö, Tutkimus ja taide Julkaistu:

Kvanttiteknologian kansainvälinen kärki kokoontuu perjantaina 18. lokakuuta Otaniemeen

Kvanttiteknologian paneelissa kohtaavat muun muassa molekyylejä hyödyntävän tietokoneen kehittäjä Kenji Ohmori ja Valkoisen talon kvantti-informaatiotieteen apulaisjohtaja Jake Taylor.