Väitös automaation ja säätötekniikan alalta, M.Sc. Adrien Corenflos
Milloin
Missä
Tapahtuman kieli
Väitöskirjan nimi: Computationally efficient statistical inference in Markovian models
Väittelijä: Adrien Corenflos
Vastaväittäjä: Prof. Omiros Papaspiliopoulos, Bocconi University, Italia
Kustos: Prof. Simo Särkkä, Aalto-yliopiston sähkötekniikan korkeakoulu, sähkötekniikan ja automaation laitos
Tila-avaruusmallit, tai Feynman-Kac -mallit, ovat kaikkialla nykypäivän maailmassa, jossa niitä käytetään kuvaamaan erilaisia fyysisiä/teknisiä ilmiöitä, kuten paikannusta ja sääennusteita, sekä keinotekoisia rakenteita, kuten suurten kieli- tai häiriönpoistomalleja koneoppimisessa ja tekoälyssä. Ne yhdistävät tuntemattomat latentit dynamiikat järjestelmän tilan havaittuihin meluisiin ja osittaisiin signaaleihin. Näitä malleja on tutkittu 1900-luvun puolivälistä lähtien, ja kaksi pääasiallista päättelymenetelmien perhettä on syntynyt: Kalmanin likimääräiset ja sekventiaaliset Monte Carlo (SMC) -ratkaisut.
Vaikka nämä tarjoavat kultastandardeja, ne esittävät monia ongelmia:
- Molemmat menetelmät ovat luonteeltaan sekventiaalisia, jolloin havaitut datapisteet käsitellään yksi kerrallaan.
- Kalmanin likimääräyksiä ei ole helppo hallita virheiden osalta, ja ne voivat epäonnistua dramaattisesti, kun malli on kaukana lineaarisesta.
- SMC-menetelmät kärsivät erilaistumisen ongelmista, mikä rajoittaa gradienttipohjaisten parametrien arviointimenetelmien käyttöä.
- SMC-menetelmät kärsivät ulottuvuuksien kirouksesta, mikä rajoittaa niiden käyttöä.
Väitöskirja tarjoaa uusia laskennallisia työkaluja, jotka ratkaisevat nämä ongelmat joko itsenäisesti tai yhdessä, erityisesti rinnakkaislaitteiston läsnä ollessa, joka perinteisesti jätetään kirjallisuudessa jälkiajatukseksi. Pyrimme korostamaan tilastollis-laskennallisia kompromisseja, joita voi syntyä käytettäessä tilastollisesti epäoptimaalisia mutta laskennallisesti parempia menetelmiä.
Ensimmäinen artikkeli käsittelee ei-erilaistuvuuden ongelman ratkaisemista partikkelisuodatuksessa, tukeutuen optimaalisiin kuljetuskarttoihin, jotka ovat käytännöllisiä vain GPU. Toinen artikkeli rinnakkaistaa laajennetut ja sigma-piste Kalmanin likimääräykset, tukeutuen tunnettuun Gauss-Newton -menetelmään. Kolmas soveltaa samanlaisia tekniikoita kuin edellinen artikkeli suorittaakseen Gaussin prosessiregressiota logaritmisessa ajassa. Neljäs käsittelee SMC-menetelmien rinnakkaistustekniikoita. Viides koskee gradienttipohjaisten MCMC-näytteiden toteuttamista yhdessä artikkeleiden 2 ja 4 kanssa ulottuvuuksien kirouksen ratkaisemiseksi säilyttäen rinnakkaiset laskelmat. Kuudes käsittelee uutta muotoa Kalmanin kaltaisista likimääräyksistä, perustuen Wassersteinin geodeeseihin. Viimeinen artikkeli laajentaa viidettä, tarjoten yhtenäisen kehyksen SMC ja Langevin MCMC välillä.
Linkki väitöskirjan sähköiseen esittelykappaleeseen (esillä 10 päivää ennen väitöstä): https://aaltodoc.aalto.fi/doc_public/eonly/riiputus/
Yhteystiedot:
[email protected] |
Sähkötekniikan korkeakoulun väitöskirjat: https://aaltodoc.aalto.fi/handle/123456789/53
- Julkaistu:
- Päivitetty: