Uutiset

Kohti parempaa hoitoa ja ennusteita – tekoäly tuottaa dataa synteettisesti

Mahdollisuus tuottaa suuria määriä tutkimusaineistoa keinotekoisesti helpottaa merkittävästi esimerkiksi covid19-taudin tutkintaa.
Violetti- ja beigesävyinen kuvituskuva, jossa näkyy ihmisiä ja numeroita
Mahdollisuus tuottaa tutkimusdataa keinotekoisesti ratkaisee monia ongelmia ja mahdollistaa esimerkiksi paremman hoidon kehittämisen. Kuvituskuva: Matti Ahlgren / Aalto-yliopisto

Suomen tekoälykeskus FCAI:n tutkijat ovat kehittäneet uuden, koneoppimiseen perustuvan menetelmän, joka pystyy tuottamaan tutkimusaineistoa keinotekoisesti. Menetelmä voi ainutlaatuisella tavalla auttaa esimerkiksi kehittämään parempia hoitomenetelmiä covid19-tautiin ja ymmärtämään sitä.

Tutkijat julkistivat juuri menetelmään perustuvan sovelluksen, jonka avulla alkuperäinen datajoukko voidaan muuntaa synteettiseksi aineistoksi vaarantamatta alkuperäiseen tutkimukseen osallistuneiden henkilöiden yksityisyyttä. Sovelluksen ansiosta tutkijat ja yritykset voivat jakaa dataa keskenään turvallisesti.

Datapohjaiset teknologiat mullistavat useimpia aloja, muistuttaa FCAI:n johtaja, akatemiaprofessori Samuel Kaski. Esimerkiksi terveydenhuoltoon ja lääkekehitykseen liittyvässä tutkimuksessa tutkimusaineistoa on kuitenkin tietojen arkaluonteisuuden ja tiukan yksilönsuojan vuoksi saatavilla liian vähän. Kun dataa on käytettävissä niukasti, tutkijoiden tekemät johtopäätökset ja ennusteet jäävät epävarmoiksi.

”Kun ihminen sairastuu, hän haluaa tietenkin saada mahdollisimman hyvää hoitoa. Silloin olisi tärkeää, että käytettävissä olisi parhaat mahdolliset yksilöllisen terveydenhuollon menetelmät”, Kaski sanoo.

Yksilöllisen hoidon kehittäminen vaatii kuitenkin paljon dataa. Sitä puolestaan ei ole nykyisellään saatavilla, koska kansalaisia ei voi velvoittaa antamaan itsestään tietoja mihin tahansa käyttöön. “En itsekään haluaisi antaa esimerkiksi vakuutusyhtiöille omia arkaluonteisia tietojani, jollen voi erittäin tarkkaan päättää, mitä yhtiö niillä tekee”, Kaski huomauttaa.

Monella alalla omaa dataa halutaan suojella viimeiseen saakka, etteivät yrityssalaisuudet ja keksinnöt paljastu kilpailijoille. Näin on etenkin lääkekehityksessä, joka on erittäin kallista. Jos lääkeyhtiöt voisivat jakaa dataansa muille yrityksille ja tutkijoille paljastamatta omia keksintöjään, kaikki hyötyisivät.

Mahdollisuus valmistaa dataa synteettisesti ratkaisee nämä ongelmat. FCAI:n tutkijat havaitsivat aiemmassa, juuri vertaisarvioitavana olevassa tutkimuksessaan, että synteettisen datan pohjalta voi tehdä yhtä luotettavia tilastollisia johtopäätöksiä kuin alkuperäisellä datalla. Sen avulla analyyseja voi tehdä loputtomasti ja samalla alkuperäiseen tutkimukseen osallistuneiden henkilöiden yksityisyys pysyy turvassa.

Kesäkuun lopussa julkaistu sovellus toimii seuraavasti: Tutkija syöttää sovellukseen alkuperäisen datajoukon, jonka perusteella sovellus rakentaa synteettistä dataa. Sen jälkeen dataa voi jakaa eteenpäin muille tutkijoille. Sovellus julkaistiin mahdollisimman nopealla aikataululla, jotta koronavirusta tutkivat saisivat sen käyttöönsä mahdollisimman varhain. Tutkijat kehittävät sovellusta edelleen esimerkiksi helppokäyttöisemmäksi.

”Uudesta koronaviruksesta ei vielä tiedetä läheskään kaikkea: emme esimerkiksi tiedä tarpeeksi hyvin, mitä virus elimistössä aiheuttaa ja mitkä ovat sen varsinaiset riskitekijät. Kun tutkijoiden käytössä on synteettistä dataa, alamme ymmärtää näitä asioita paremmin”, Kaski sanoo.

FCAI:n tutkijat pyrkivät nyt itse rakentamaan synteettisen datan avulla mallin, joka ennustaa tiettyjen biomarkkereiden perusteella, onko testattavan henkilön koronavirustesti positiivinen vai negatiivinen. Biomarkkerit ovat esimerkiksi tietynlaisia molekyylejä, soluja tai hormoneja, jotka viittaavat sairauteen.

”Alkuperäinen datajoukko, jolla tätä teemme, on ollut julkisesti saatavilla. Nyt yritämme toistaa alkuperäisen tutkimuksen tulokset synteettisen datan avulla ja rakentaa synteettisestä datasta yhtä ennustavan mallin kuin mikä saatiin aikaan alkuperäisessä tutkimuksessa”, kertoo Aalto-yliopiston tohtorikoulutettava Joonas Jälkö.

FCAI:n tekemää tutkimusta rahoittaa Suomen Akatemia.

Lisätietoja

Samuel Kaski
Johtaja, Suomen tekoälykeskus FCAI
Akatemiaprofessori
Puh. 050-3058694
samuel.kaski@aalto.fi

Joonas Jälkö
Tohtorikoulutettava, Aalto-yliopisto
Puh. 040-5830937
joonas.jalko@aalto.fi

Tutkimusartikkelin preprint-versio

Linkki sovellukseen

Suomen tekoälykeskus FCAI:n verkkosivut

  • Päivitetty:
  • Julkaistu:
Jaa
URL kopioitu

Lue lisää uutisia

Iris Seitz
Palkinnot ja tunnustukset Julkaistu:

Iris Seitz palkittiin uran alkuvaiheen poikkeuksellisista saavutuksista

Professori Mauri Kostiaisen entinen tohtoriopiskelija, tohtori Iris Seitz, on palkittu vuoden 2026 Robert Dirks Molecular Programming Prize -palkinnolla työstään, joka koskee ohjelmoitavia proteiinirakenteita nukleiinihappo-origamin avulla.
Sami Lauronen, Axel Hedman, Eero Virmavirta, Olli Latvakoski, Elina Heikkila.jpg
Palkinnot ja tunnustukset Julkaistu:

Perustieteiden korkeakoulu palkitsi vuoden 2025 parhaat väitöskirjat ja diplomityöt

Perustieteiden korkeakoulussa valmistui 2025 kaiken kaikkiaan 71 tohtoritutkintoa ja 607 maisteritutkintoa. Korkeakoulu palkitsi seitsemän väitöskirjaa ja kuusi diplomityötä.
Two women smiling talking to each other at one of Aalto Startup Center's event
Kampus, Mediatiedotteet Julkaistu:

Startupit menestyvät vastatuulessakin – Aalto Startup Centerin nopean kasvun yritysten liikevaihto kasvoi 355 prosenttia kolmessa vuodessa

Aalto Startup Centeristä ponnistaneet kasvuyritykset jatkavat vahvaa kasvua haastavasta taloustilanteesta huolimatta. Nopeimmin kasvaneiden yritysten yhteenlaskettu liikevaihto nousi 56,95 miljoonaan euroon vuonna 2024.
Kuormittavinta on kännykän jatkuva vilkuilu ja toistuva viestittely pitkin päivää. Kuva: Matti Ahlgren, Aalto-yliopisto.
Mediatiedotteet Julkaistu:

Unohda ruutuaika, kuormitus syntyy puhelimen toistuvasta räpläämisestä

Aalto-yliopiston tutkijat selvittivät pitkittäistutkimuksessaan, mikä kuormittaa digilaitteiden käyttäjiä eniten. Yllättäen kuormittavinta ei ole laitteiden käyttöaika, vaan toistuva käyttö lyhyissä pätkissä – se kuormittaa enemmän kuin pitkä ruutuaika.