Kohti parempaa hoitoa ja ennusteita – tekoäly tuottaa dataa synteettisesti
Suomen tekoälykeskus FCAI:n tutkijat ovat kehittäneet uuden, koneoppimiseen perustuvan menetelmän, joka pystyy tuottamaan tutkimusaineistoa keinotekoisesti. Menetelmä voi ainutlaatuisella tavalla auttaa esimerkiksi kehittämään parempia hoitomenetelmiä covid19-tautiin ja ymmärtämään sitä.
Tutkijat julkistivat juuri menetelmään perustuvan sovelluksen, jonka avulla alkuperäinen datajoukko voidaan muuntaa synteettiseksi aineistoksi vaarantamatta alkuperäiseen tutkimukseen osallistuneiden henkilöiden yksityisyyttä. Sovelluksen ansiosta tutkijat ja yritykset voivat jakaa dataa keskenään turvallisesti.
Datapohjaiset teknologiat mullistavat useimpia aloja, muistuttaa FCAI:n johtaja, akatemiaprofessori Samuel Kaski. Esimerkiksi terveydenhuoltoon ja lääkekehitykseen liittyvässä tutkimuksessa tutkimusaineistoa on kuitenkin tietojen arkaluonteisuuden ja tiukan yksilönsuojan vuoksi saatavilla liian vähän. Kun dataa on käytettävissä niukasti, tutkijoiden tekemät johtopäätökset ja ennusteet jäävät epävarmoiksi.
”Kun ihminen sairastuu, hän haluaa tietenkin saada mahdollisimman hyvää hoitoa. Silloin olisi tärkeää, että käytettävissä olisi parhaat mahdolliset yksilöllisen terveydenhuollon menetelmät”, Kaski sanoo.
Yksilöllisen hoidon kehittäminen vaatii kuitenkin paljon dataa. Sitä puolestaan ei ole nykyisellään saatavilla, koska kansalaisia ei voi velvoittaa antamaan itsestään tietoja mihin tahansa käyttöön. “En itsekään haluaisi antaa esimerkiksi vakuutusyhtiöille omia arkaluonteisia tietojani, jollen voi erittäin tarkkaan päättää, mitä yhtiö niillä tekee”, Kaski huomauttaa.
Monella alalla omaa dataa halutaan suojella viimeiseen saakka, etteivät yrityssalaisuudet ja keksinnöt paljastu kilpailijoille. Näin on etenkin lääkekehityksessä, joka on erittäin kallista. Jos lääkeyhtiöt voisivat jakaa dataansa muille yrityksille ja tutkijoille paljastamatta omia keksintöjään, kaikki hyötyisivät.
Mahdollisuus valmistaa dataa synteettisesti ratkaisee nämä ongelmat. FCAI:n tutkijat havaitsivat aiemmassa, juuri vertaisarvioitavana olevassa tutkimuksessaan, että synteettisen datan pohjalta voi tehdä yhtä luotettavia tilastollisia johtopäätöksiä kuin alkuperäisellä datalla. Sen avulla analyyseja voi tehdä loputtomasti ja samalla alkuperäiseen tutkimukseen osallistuneiden henkilöiden yksityisyys pysyy turvassa.
Kesäkuun lopussa julkaistu sovellus toimii seuraavasti: Tutkija syöttää sovellukseen alkuperäisen datajoukon, jonka perusteella sovellus rakentaa synteettistä dataa. Sen jälkeen dataa voi jakaa eteenpäin muille tutkijoille. Sovellus julkaistiin mahdollisimman nopealla aikataululla, jotta koronavirusta tutkivat saisivat sen käyttöönsä mahdollisimman varhain. Tutkijat kehittävät sovellusta edelleen esimerkiksi helppokäyttöisemmäksi.
”Uudesta koronaviruksesta ei vielä tiedetä läheskään kaikkea: emme esimerkiksi tiedä tarpeeksi hyvin, mitä virus elimistössä aiheuttaa ja mitkä ovat sen varsinaiset riskitekijät. Kun tutkijoiden käytössä on synteettistä dataa, alamme ymmärtää näitä asioita paremmin”, Kaski sanoo.
FCAI:n tutkijat pyrkivät nyt itse rakentamaan synteettisen datan avulla mallin, joka ennustaa tiettyjen biomarkkereiden perusteella, onko testattavan henkilön koronavirustesti positiivinen vai negatiivinen. Biomarkkerit ovat esimerkiksi tietynlaisia molekyylejä, soluja tai hormoneja, jotka viittaavat sairauteen.
”Alkuperäinen datajoukko, jolla tätä teemme, on ollut julkisesti saatavilla. Nyt yritämme toistaa alkuperäisen tutkimuksen tulokset synteettisen datan avulla ja rakentaa synteettisestä datasta yhtä ennustavan mallin kuin mikä saatiin aikaan alkuperäisessä tutkimuksessa”, kertoo Aalto-yliopiston tohtorikoulutettava Joonas Jälkö.
FCAI:n tekemää tutkimusta rahoittaa Suomen Akatemia.
Lisätietoja
Samuel Kaski
Johtaja, Suomen tekoälykeskus FCAI
Akatemiaprofessori
Puh. 050-3058694
samuel.kaski@aalto.fi
Joonas Jälkö
Tohtorikoulutettava, Aalto-yliopisto
Puh. 040-5830937
joonas.jalko@aalto.fi
Lue lisää uutisia
Iris Seitz palkittiin uran alkuvaiheen poikkeuksellisista saavutuksista
Professori Mauri Kostiaisen entinen tohtoriopiskelija, tohtori Iris Seitz, on palkittu vuoden 2026 Robert Dirks Molecular Programming Prize -palkinnolla työstään, joka koskee ohjelmoitavia proteiinirakenteita nukleiinihappo-origamin avulla.
Perustieteiden korkeakoulu palkitsi vuoden 2025 parhaat väitöskirjat ja diplomityöt
Perustieteiden korkeakoulussa valmistui 2025 kaiken kaikkiaan 71 tohtoritutkintoa ja 607 maisteritutkintoa. Korkeakoulu palkitsi seitsemän väitöskirjaa ja kuusi diplomityötä.
Startupit menestyvät vastatuulessakin – Aalto Startup Centerin nopean kasvun yritysten liikevaihto kasvoi 355 prosenttia kolmessa vuodessa
Aalto Startup Centeristä ponnistaneet kasvuyritykset jatkavat vahvaa kasvua haastavasta taloustilanteesta huolimatta. Nopeimmin kasvaneiden yritysten yhteenlaskettu liikevaihto nousi 56,95 miljoonaan euroon vuonna 2024.