Uutiset

Hakukone tunnistaa aineenvaihduntatuotteet aiempaa nopeammin ja tarkemmin

Koneoppimiseen perustuvalle menetelmälle voi löytyä sovelluksia muun muassa anti-dopingtyössä, tullin huumevalvonnassa ja rikospaikkatutkinnassa.

Prosenttiosuus hauista, joissa oikea tunnistus on ensimmäisten osumien (top10) joukossa. Aalto-yliopiston ja Jenan yliopiston menetelmä on kilpailevia menetelmiä selvästi tarkempi.
 

Aalto-yliopiston ja saksalaisen Jenan yliopiston tutkijat ovat kehittäneet CSI:FingerID-hakukoneen, joka tunnistaa aineenvaihduntatuotteet tandemmassaspektrometrimittauksista yli 150 prosenttia parasta kilpailijaansa tarkemmin ja voi näin helpottaa muun muassa bio- ja lääketieteen tutkijoiden työtä. Tutkimus julkaistiin äskettäin arvostetussa PNAS-lehdessä.  

Aineenvaihduntatuotteet ovat pieniä molekyylejä, kuten sokereita, rasvahappoja ja aminohappoja, jotka toimivat soluissa muun muassa energianlähteinä ja soluseinien rakennusaineina. Tutkijoille ne ovat ikään kuin jälkiä solujen toiminnasta ja tilasta.

Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia.

– Aineenvaihduntatuotteita on paljon, sadoistatuhansista miljooniin, ja ne kaikki näyttävät vähän samankaltaisilta. Rakensimme tutkimuksessa koneoppimismetodeita hyödyntävän mallin, jonka ennustamia molekyylirakenteita voidaan käydä läpi samaan tapaan kuin Googlen hakukoneen hakutuloksia, Aalto-yliopiston professori Juho Rousu selittää.

Molekyylin sormenjäljet

Tutkimuksessa käytetty tandemmassaspektrometri on laite, joka pilkkoo molekyylit palasiksi ja mittaa palasten massat ja suhteelliset osuudet eli massaspektrin. Aallon ja Jenan tutkijoiden menetelmässä kustakin opetusaineiston spektristä lasketaan ensin fragmentaatiopuu, joka kuvaa, mistä palasista pilkkoutumalla kukin molekyyliosanen on syntynyt. Tämän jälkeen tutkijat opettavat koneoppimismallia suurella määrällä fragmentaatiopuita ja kutakin puuta vastaavan molekyylin ominaisuuksia eli sormenjälkiä.  Kun mallille sitten annetaan uuden molekyylin spektri, se ennustaa sille todennäköiset sormenjäljet, joiden perusteella haetaan molekyylitietokannasta joukko parhaiten vastaavia molekyylejä.

Tällä hetkellä molekyylien tyypistä riippuen jopa 95 prosenttia hauista tuottaa oikean hakutuloksen 10 ensimmäisen osuman joukkoon. Tunnistamisen täsmällisyys paranee aineistoa kasvatettaessa. Tällä hetkellä mallin muodostamiseen on käytetty noin 6000 massaspektriä. Täydellisessä tilanteessa koneoppimiseen perustuva hakukone ehdottaisi aina ensimmäisenä osumana oikeaa molekyyliä, mutta se vaatii aineiston huomattavaa kasvattamista ja menetelmien kehittämistä.

Tutkimuksesta voi olla hyötyä erityisesti bio- ja lääketieteen tutkijoille. Tulevaisuuden mahdollisia sovellusalueita on esimerkiksi anti-dopingtyössä, tullin huumevalvonnassa ja rikospaikkatutkinnassa.

Tutkimus on tehty yhteistyössä Jenan yliopiston professori Sebastian Böckerin tutkimusryhmän kanssa, ja se on hyvä esimerkki Aalto-yliopiston tietotekniikkaan ja digitaalista terveyttä yhdistävästä tutkimuksesta.

Lisätietoja:

Professori Juho Rousu
Puh. 050 415 1702
[email protected]

Linkki artikkeliin http://www.pnas.org/content/early/2015/09/16/1509788112.abstract

 

  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu

Lue lisää uutisia

Book shelves in the library full of books
Yhteistyö, Tutkimus ja taide Julkaistu:

Kurssikirjojen kirjoittaja ja tiedekirjailija – tiesitkö, että olet oikeutettu lainauskorvaukseen?

Kaikki tekijät, jotka ovat kirjoittaneet tekstiä teokseen, jota lainataan kirjastoista, ovat oikeutettuja lainauskorvaukseen.
Learning Centre graphics
Tutkimus ja taide Julkaistu:

Aalto-sähköpostiosoite käyttöön Aalto-Primossa

Aalto-yliopiston opiskelijat ja henkilökunta voivat jatkossa käyttää Aalto-Primossa vain Aalto-sähköpostiosoitettaan.
Tilannekuvia siitä, miten hiukkaset muuttavat muotoaan prosessin eri vaiheissa niitten alkuperäisestä jakautumisesta lopputulokseen. Kuva: Aalto-yliopisto
Mediatiedotteet, Tutkimus ja taide Julkaistu:

Tutkijat keksivät, miten jäljitellä veden ja tuulen tapaa siirtää materiaaleja

Hiukkaset siirtyvät tärinälevyllä haluttuun muotoon energiakentän ja älykkään algoritmin avulla. Tulevaisuudessa menetelmää voisi hyödyntää esimerkiksi solujen lajittelussa sekä uusissa valmistusteknologioissa.
Frank Martela
Tutkimus ja taide Julkaistu:

Talousmittarit eivät riitä – Suomi tarvitsee koetun hyvinvoinnin kunnianhimoista mittaamista

Bruttokansantuotteen kaltaisten talousmittarien ja hiilidioksidipäästöjen kaltaisten ympäristömittarien rinnalle tarvitaan hyvinvoinnin suorempaa mittaamista, kirjoittaa Frank Martela.