Tapahtumat

Väitös tietotekniikan alalta, Diego Parente Paiva Mesquita

Väitöskirjan nimi on "Advances in distributed Bayesian inference and graph neural networks"
a hat of a newly minted doctor

Bayesiläinen tilastotiede ja graafiset neuroverkot ovat tehokkaita välineitä epävarmuuden ja verkkotietojen käsittelyyn. Bayesiläisellä tilastotieteellä on vankka teoreettinen perusta, mutta se on riippuvainen otantamenetelmistä, jotka skaalautuvat huonosti. Graafiset neuroverkot ajautuvat ongelmiin ison tietomassojen sovelluksissa (esim. bioinformatiikassa ja luonnollisenkielen käsittelyssä), ja ne perustuvat pitkälti empiirisiin intuitioihin. Lyhyesti sanottuna tämä työ i) laajentaa Bayesiläisen tilastotieteen sovellusten soveltamisalaa, ja ii) syventää ymmärrystä graafisten neuroverkkojen keskeisistä suunnitteluperiaatteista.

Bayesiläisen lähestymistavan osalta tässä tutkielmassa kehitetään kaksi otantamenetelmää hajautettuihin laskentaympäristöihin (distributed computing), joissa kommunikointi on erittäin tärkeää, kuten federoidussa koneoppimisessa (federated learning). Kehitetyt otantamenetelmät ovat erityisen hyödyllisiä silloin, kun tiedot syntyvät luonnostaan hajautetusti (esim. käyttäjien älypuhelimista) ja yksityisyysrajoitukset estävät meitä paljastamasta niitä palvelimelle. Esimerkiksi, tämä on keskeistä mobiilidatan hyödyntämisessä kriittisissä sovelluksissa, kuten yksilöllistetyssä lääketieteessä.

Kehitimme myös ensimmäisen periaatteellisen menetelmän eri tutkimuksista saatujen Bayesiläisten posteriorien yhdistämiseksi meta-analyyseissä. Aiemmista menetelmistä poiketen emme vaadi meta-analyytikolta, että hänen tulee tiivistää tietoa yhteenvedoiksi (summary statistics). Lähestymistapamme on agnostinen tutkimuskohtaisille erikoisuuksille, jotka kaikki on sisälletetty niiden posteriojakaumiin. Odotamme, että tämä työkalu helpottaa meta-analyysien tekemistä ja että se kannustaa tutkijoita jakamaan posteriorijakaumansa.

Syväoppimisen puolella tässä tutkielmassa tarkastellaan uudelleen graafisten neuroverkkojen suosittuja suunnitteluvalintoja ja valotetaan niitä uudella tavalla. Osoitamme, että on mahdollista saavuttaa huippuluokan suorituskyky lisäämällä minimaalisia ominaisuuksia polynomispektristen graafisten neuroverkkojen perusmuotoiluun. Lisäksi kyseenalaistamme ns. “pooling-kerrosten” roolin graafisissa neuroverkkoissa ja osoitamme, että ne ovat yleensä tarpeettomia. Uskomme, että meidän tutkimus auttaa tutkijoita ja käytännön toimijoita valitsemaan paremmin, mihin he käyttävät aikaansa ja resurssejaan tarkempien graafisten neuroverkkojen rakentamisessa.

Vastaväittäjä: tohtori Antonio Vergari, University of Edinburgh, Skotlanti

Kustos: professori Samuel Kaski, Aalto-yliopiston perustieteiden korkeakoulu, Tietotekniikan laitos

Väittelijän yhteystiedot: [email protected], +55 85 996286017

Väitöstilaisuus järjestetään etäyhteyden kautta sekä kampuksella. Linkki tilaisuuteen

Väitöskirja on julkisesti nähtävillä 10 päivää ennen väitöstä Aalto-yliopiston julkaisuarkiston verkkoriiputussivulla.

Elektroninen väitöskirja

  • Julkaistu:
  • Päivitetty: