Uutiset

Kohti parempaa hoitoa ja ennusteita – tekoäly tuottaa dataa synteettisesti

Mahdollisuus tuottaa suuria määriä tutkimusaineistoa keinotekoisesti helpottaa merkittävästi esimerkiksi covid19-taudin tutkintaa.
Violetti- ja beigesävyinen kuvituskuva, jossa näkyy ihmisiä ja numeroita
Mahdollisuus tuottaa tutkimusdataa keinotekoisesti ratkaisee monia ongelmia ja mahdollistaa esimerkiksi paremman hoidon kehittämisen. Kuvituskuva: Matti Ahlgren / Aalto-yliopisto

Suomen tekoälykeskus FCAI:n tutkijat ovat kehittäneet uuden, koneoppimiseen perustuvan menetelmän, joka pystyy tuottamaan tutkimusaineistoa keinotekoisesti. Menetelmä voi ainutlaatuisella tavalla auttaa esimerkiksi kehittämään parempia hoitomenetelmiä covid19-tautiin ja ymmärtämään sitä.

Tutkijat julkistivat juuri menetelmään perustuvan sovelluksen, jonka avulla alkuperäinen datajoukko voidaan muuntaa synteettiseksi aineistoksi vaarantamatta alkuperäiseen tutkimukseen osallistuneiden henkilöiden yksityisyyttä. Sovelluksen ansiosta tutkijat ja yritykset voivat jakaa dataa keskenään turvallisesti.

Datapohjaiset teknologiat mullistavat useimpia aloja, muistuttaa FCAI:n johtaja, akatemiaprofessori Samuel Kaski. Esimerkiksi terveydenhuoltoon ja lääkekehitykseen liittyvässä tutkimuksessa tutkimusaineistoa on kuitenkin tietojen arkaluonteisuuden ja tiukan yksilönsuojan vuoksi saatavilla liian vähän. Kun dataa on käytettävissä niukasti, tutkijoiden tekemät johtopäätökset ja ennusteet jäävät epävarmoiksi.

”Kun ihminen sairastuu, hän haluaa tietenkin saada mahdollisimman hyvää hoitoa. Silloin olisi tärkeää, että käytettävissä olisi parhaat mahdolliset yksilöllisen terveydenhuollon menetelmät”, Kaski sanoo.

Yksilöllisen hoidon kehittäminen vaatii kuitenkin paljon dataa. Sitä puolestaan ei ole nykyisellään saatavilla, koska kansalaisia ei voi velvoittaa antamaan itsestään tietoja mihin tahansa käyttöön. “En itsekään haluaisi antaa esimerkiksi vakuutusyhtiöille omia arkaluonteisia tietojani, jollen voi erittäin tarkkaan päättää, mitä yhtiö niillä tekee”, Kaski huomauttaa.

Monella alalla omaa dataa halutaan suojella viimeiseen saakka, etteivät yrityssalaisuudet ja keksinnöt paljastu kilpailijoille. Näin on etenkin lääkekehityksessä, joka on erittäin kallista. Jos lääkeyhtiöt voisivat jakaa dataansa muille yrityksille ja tutkijoille paljastamatta omia keksintöjään, kaikki hyötyisivät.

Mahdollisuus valmistaa dataa synteettisesti ratkaisee nämä ongelmat. FCAI:n tutkijat havaitsivat aiemmassa, juuri vertaisarvioitavana olevassa tutkimuksessaan, että synteettisen datan pohjalta voi tehdä yhtä luotettavia tilastollisia johtopäätöksiä kuin alkuperäisellä datalla. Sen avulla analyyseja voi tehdä loputtomasti ja samalla alkuperäiseen tutkimukseen osallistuneiden henkilöiden yksityisyys pysyy turvassa.

Kesäkuun lopussa julkaistu sovellus toimii seuraavasti: Tutkija syöttää sovellukseen alkuperäisen datajoukon, jonka perusteella sovellus rakentaa synteettistä dataa. Sen jälkeen dataa voi jakaa eteenpäin muille tutkijoille. Sovellus julkaistiin mahdollisimman nopealla aikataululla, jotta koronavirusta tutkivat saisivat sen käyttöönsä mahdollisimman varhain. Tutkijat kehittävät sovellusta edelleen esimerkiksi helppokäyttöisemmäksi.

”Uudesta koronaviruksesta ei vielä tiedetä läheskään kaikkea: emme esimerkiksi tiedä tarpeeksi hyvin, mitä virus elimistössä aiheuttaa ja mitkä ovat sen varsinaiset riskitekijät. Kun tutkijoiden käytössä on synteettistä dataa, alamme ymmärtää näitä asioita paremmin”, Kaski sanoo.

FCAI:n tutkijat pyrkivät nyt itse rakentamaan synteettisen datan avulla mallin, joka ennustaa tiettyjen biomarkkereiden perusteella, onko testattavan henkilön koronavirustesti positiivinen vai negatiivinen. Biomarkkerit ovat esimerkiksi tietynlaisia molekyylejä, soluja tai hormoneja, jotka viittaavat sairauteen.

”Alkuperäinen datajoukko, jolla tätä teemme, on ollut julkisesti saatavilla. Nyt yritämme toistaa alkuperäisen tutkimuksen tulokset synteettisen datan avulla ja rakentaa synteettisestä datasta yhtä ennustavan mallin kuin mikä saatiin aikaan alkuperäisessä tutkimuksessa”, kertoo Aalto-yliopiston tohtorikoulutettava Joonas Jälkö.

FCAI:n tekemää tutkimusta rahoittaa Suomen Akatemia.

Lisätietoja

Samuel Kaski
Johtaja, Suomen tekoälykeskus FCAI
Akatemiaprofessori
Puh. 050-3058694
[email protected]

Joonas Jälkö
Tohtorikoulutettava, Aalto-yliopisto
Puh. 040-5830937
[email protected]

Tutkimusartikkelin preprint-versio

Linkki sovellukseen

  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu

Lisää tästä aiheesta

valoanturi
Tiedotteet, Tutkimus ja taide Julkaistu:

Aallossa kehitetty musta valoanturi ylitti ensimmäisenä maailmassa 100 prosentin hyötysuhteen

Hyötysuhde oli niin hyvä, että tutkijat eivät ensin olleet itsekään uskoa sitä. Siksi ennätystulos vahvistettiin myös Euroopan tarkimmista mittauksista vastaavassa Saksan kansallisessa metrologian instituutissa PTB:ssä. Aallosta ponnistanut ElFys Oy toimittaa jo ennätysantureita prosessiteollisuuden tarpeisiin.
Saara Saarela at the set of the movie Guardian of Water. Photo: Gabriela Urm © Bufo 2020
Tiedotteet Julkaistu:

Saara Saarela ohjaa Veden vartija -suurtuotannon

Emmi Itärannan kansainvälisesti menestyneeseen romaaniin perustuvan Veden vartija -elokuvan ohjaa Saara Saarela, joka toimii tällä hetkellä myös Aalto-yliopiston elokuvaohjauksen professorina.
Heikko kirkastuma, kuva: Metsähovin radiotutkimusasema
Tiedotteet Julkaistu:

Uusi tutkimus: Rauhallinen Aurinko on paljon aktiivisempi kuin luulimme

Rauhallista Aurinkoa on tutkittu huomattavasti vähemmän kuin aktiivista Aurinkoa.
Pohjoisen ikirouta-alueen vehreää kasvillisuutta. Kuva: Ive van Krunkelsven
Tiedotteet, Tutkimus ja taide Julkaistu:

Ikiroudan sulaminen voi lisätä kasvihuonepäästöjä luultua enemmän – syynä kasvien juurten vauhdittama lisähajotusilmiö

Lisähajotusilmiö voi yksinään johtaa jopa 40 miljardin hiilitonnin vapautumiseen ikiroudasta vuoteen 2100 mennessä.