Väitös tietotekniikan alalta, DI Rinu Boney
Milloin
Missä
Tapahtuman kieli
Vahvistusoppiminen (RL) on yleinen kehys älykkään käyttäytymisen oppimiselle ja se soveltuu ongelmien ratkaisemiseen monilla aloilla. Vahvistusoppimisen tutkimuksessa on viime vuosina tapahtunut huomattavaa edistystä, jonka taustalla on niin kutsuttu syvä vahvistusoppiminen, joka käyttää syviä neuroverkkoja funktioiden approksimaatioon vahvistusoppimista varten. Väitöskirjassa esitetään menetelmiä syvien vahvistusoppimisalgoritmien otostehokkuuden parantamiseksi ja analysoidaan niiden toimintaa tosielämän ongelmissa.
Vastaväittäjä: tohtori Yuval Tassa, Google/DeepMind Technologies, Englanti
Kustos: professori Juho Kannala, Aalto-yliopiston perustieteiden korkeakoulu, Tietotekniikan laitos
Väittelijän yhteystiedot: [email protected]
Väitöstilaisuus järjestetään kampuksella (Maarintie 8, sali AS1).
Väitöskirja on julkisesti nähtävillä 10 päivää ennen väitöstä Aalto-yliopiston julkaisuarkiston verkkoriiputussivulla.
- Julkaistu:
- Päivitetty: