Uutiset

Koneoppimisesta apua kemisteille: algoritmien avulla minimienergiapolut ja satulapisteet löytyvät tehokkaammin

Koneoppiminen avaa uusia mahdollisuuksia monille aloille – myös kemian tutkimukseen, minkä osoittaa Suomen tekoälykeskuksessa tehty tuore väitöstutkimus.
Machine learning in theoretical chemistry
Lähde: J. Chem. Phys. 147, 152720 (2017). Julkaistu AIP Publishingin luvalla.

 

Aalto-yliopiston tohtorikoulutettava Olli-Pekka Koistinen kehitti väitöskirjassaan gaussisiin prosesseihin perustuvia koneoppimisalgoritmeja, jotka tehostavat minimienergiapolkujen ja satulapisteiden etsintää, sekä testasi niiden toimivuutta.

Teoreettisessa kemiassa minimienergiapolkujen ja satulapisteiden määrittäminen on yksi eniten aikaa ja laskentaresursseja kuluttavista tehtävistä. Laskenta-aikaa kuluu etenkin atomikonfiguraation tarkan energian ja gradienttivektorin määrittämiseen. Se joudutaan tekemään erikseen jopa sadoissa konfiguraatioavaruuden pisteissä.

Koneoppimista hyödyntävät menetelmät voivat vähentää tarvittavien havaintopisteiden ja raskaiden energialaskujen määrää murto-osaan siitä, mitä perinteiset menetelmät vaativat, ja siten nopeuttaa ja keventää laskentaa.

Minimienergiapolut kulkevat potentiaalienergiapinnalla, joka kuvaa järjestelmän – esimerkiksi molekyylin – energiaa tiettyjen parametrien suhteen. Yleensä nämä parametrit kertovat atomien sijainnin. Energiapinnan paikalliset minimikohdat vastaavat systeemin vakaita tiloja. Minimienergiapolut yhdistävät näitä vakaita tiloja toisiinsa ja kuvaavat mahdollisia reaktiomekanismeja.

”Suunnistajana ajattelen energiapintaa karttana. Pysyvät atomikonfiguraatiot näkyvät kartassa kuoppina. Minimienergiapolku on reitti kahden tällaisen tilan välillä. Se pysyy koko ajan mahdollisimman matalana. Polun korkein kohta on satulapisteessä, jolloin se pääsee pujahtamaan kuopasta toiseen mahdollisimman matalalta”, Koistinen selittää.

Perinteisesti minimienergiapolkuja ja satulapisteitä on etsitty iteratiivisilla menetelmillä, jotka etenevät energiapinnalla pienin askelin. Koneoppimisen ja tilastollisten mallien avulla aikaisemmat havainnot voidaan käyttää hyväksi energiapinnan mallintamiseksi, jolloin tavoitteeseen voidaan päästä huomattavasti vähemmillä iteraatioilla.

Koneoppiminen tarjoaa siis tehtävään tehokkaamman ja kevyemmän sekä sitä kautta myös aiempaa halvemman ja ympäristöystävällisemmän keinon. Se voi myös avata mahdollisuuksia sellaisten ongelmien tutkimiseen, joihin käytännön resurssit eivät ole aikaisemmin riittäneet. ”Tämä on yksi esimerkki lisää siitä, mihin koneoppimismenetelmiä voi käyttää”, Koistinen sanoo.

Diplomi-insinööri Olli-Pekka Koistinen väittelee torstaina 9. tammikuuta 2020 Aalto-yliopiston perustieteiden korkeakoulussa Kandidaattikeskuksen salissa E (Y124). Väitöskirjan nimi on "Algorithms for Finding Saddle Points and Minimum Energy Paths Using Gaussian Process Regression".

Linkki väitöskirjaan: https://aaltodoc.aalto.fi/handle/123456789/41794

  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu

Lisää tästä aiheesta

Samples of dyer’s woad (värimorsinko) non-toxic blue dye textiles. Photo: Valeria Azovskaya
Tutkimus ja taide Julkaistu:

Pikamuodin hinta: 92 miljoonaa tonnia jätettä ja 79 triljoonaa litraa vettä vuodessa sekä 10 % maailmanlaajuisista päästöistä

Ympäristövaikutusten vähentäminen vaatii koko järjestelmän muutosta, sanoo Kirsi Niinimäen työryhmä.
reppukeilain
Tutkimus ja taide Julkaistu:

Lisättyä todellisuutta, startupeja ja täsmämetsänhoitoa

Laserkeilauksen huippuyksikkö on edistänyt tieteen ja taiteen kohtaamisia ja luonut yhteiskuntaa ja taloutta kehittävää teknologiaa.
BIZ public artworks (photo: Mikko Raskinen)
Tutkimus ja taide Julkaistu:

Helsinki GSE perustaa talouden tilannehuoneen – tavoitteena tukea nopeaa päätöksentekoa koronaviruskriisissä

Tilannehuone tekee myös yhteistyötä Vesa Vihriälän vetämän, pidemmän aikavälin talousvaikutuksiin keskittyvän ryhmän kanssa.
Kuvakaappaus Biografiasammosta
Tutkimus ja taide Julkaistu:

Eero Hyvönen tuo datamassat humanistien – ja kaikkien muidenkin – ulottuville

Hyvösen ja hänen kollegoidensa kehittämien ”sampojen” data on kaikille avointa. Sammot helpottavat esimerkiksi historioitsijoiden työtä, sillä he voivat hyödyntää ja analysoida niissä olevaa dataa ilman ohjelmointitaitoja.