Väitös tietotekniikan alalta, DI Andreas Henelius

2017-05-05 12:00:00 2017-05-05 23:59:59 Europe/Helsinki Väitös tietotekniikan alalta, DI Andreas Henelius Väitöskirjan nimi on: "Exploring classifier attribute interactions and time series using constrained randomisations" http://www.aalto.fi/fi/midcom-permalink-1e70e12c7bb08840e1211e7abee8727c6cdbc56bc56 Maarintie 8, 02150, Espoo

Väitöskirjan nimi on: "Exploring classifier attribute interactions and time series using constrained randomisations"

05.05.2017 / 12:00
salissa AS2, TUAS-talo, Maarintie 8, 02150, Espoo, FI

Diplomi-insinööri Andreas Henelius väittelee perjantaina 5.5.2017 klo 12 Aalto-yliopiston perustieteiden korkeakoulussa, salissa AS2, Maarintie 8 (ent. Otaniementie 17), Espoo. Väitöskirjassa "Exploring classifier attribute interactions and time series using constrained randomisations" tutkittiin luokittimien muuttujien vuorovaikutuksia sekä aikasarjojen rakennetta rajoitettujen satunnaistusmenetelmien avulla.

Ohjattu oppiminen on koneoppimisen osa-alue, jossa algoritmit opetetaan luokittelemaan näytteitä esittämällä esimerkkejä.Nykyaikaiset luokittimet, kuten satunnaiset päätöspuut tai tukivektorikoneet, ovat menetelminä erittäin tehokkaita. Niitä sovelletaankin laajasti eri aloilla, esimerkiksi lääketieteessä tautien luokituksessa tai oikeustieteessä ennustamaan rikoksen uusimisen todennäköisyyttä. Vaikka algoritimien toiminta on hyvin tunnettu, on vaikeata ymmärtää miten ne käytännössä hyödyntävät datassa olevia riippuvuuksia tehdessään luokituksia. Algoritmin tulkittavuus on erittäin tärkeää, jotta käyttäjä voi ymmärtää miten algoritmi toimii ja samalla oppia ymmärtämään datan rakennetta paremmin.

Tässä väitöskirjatyössä on kehitetty uusia menetelmiä, jotka mahdollistavat luokittimien toimintaperiaatteiden paremman ymmärtämisen paljastamalla mitä datan muuttujien sisäisiä riippuuvuuksia, kuten esimerkiksi yhteyksiä iän ja sukupuolen välillä, algoritmit hyödyntävät. Väitöskirjassa kehitetyt menetelmät pohjautuvat satunnaistusmenetelmiin ja ovat yleisesti sovellettavissa. Datassa olevia muuttujia sekoitetaan satunnaisesti. Jos sekoittamisen tuloksena luokittimen tarkkuus heikkenee, voidaan päätellä, että jokin algoritmin hyödyntämä rakenne datassa rikottiin.

Väitöskirjassa kehitettyjä menetelmiä on hyödynnetty muun muuassa tunnistamaan lääkkeiden yhteiskäytön haittavaikutuksia. Väitöskirjassa sovellettiin myös satunnaistusmenetelmiä aikasarjojen rakenteen tutkimiseen ja lisäksi tutkittiin miten sydämen sykevälivaihtelu ennustaa muutoksia univajeesta kärsivän henkilön tarkkaavaisuudessa.

Väitöstiedote (pdf)

Vastaväittäjä: professori Matthijs van Leeuwen, Leiden University, Alankomaat

Kustos: professori Aristides Gionis, Aalto-yliopiston perustieteiden korkeakoulu, tietotekniikan laitos

Elektroninen väitöskirja: http://urn.fi/URN:ISBN:978-952-60-7360-6