Tapahtumat

Väitös tietotekniikan alalta, DI Rinu Boney

Väitöskirjan nimi on "Sample-Efficient Methods for Real-World Deep Reinforcement Learning"
Doctor's hat

Vahvistusoppiminen (RL) on yleinen kehys älykkään käyttäytymisen oppimiselle ja se soveltuu ongelmien ratkaisemiseen monilla aloilla. Vahvistusoppimisen tutkimuksessa on viime vuosina tapahtunut huomattavaa edistystä, jonka taustalla on niin kutsuttu syvä vahvistusoppiminen, joka käyttää syviä neuroverkkoja funktioiden approksimaatioon vahvistusoppimista varten. Väitöskirjassa esitetään menetelmiä syvien vahvistusoppimisalgoritmien otostehokkuuden parantamiseksi ja analysoidaan niiden toimintaa tosielämän ongelmissa.

Vastaväittäjä: tohtori Yuval Tassa, Google/DeepMind Technologies, Englanti

Kustos: professori Juho Kannala, Aalto-yliopiston perustieteiden korkeakoulu, Tietotekniikan laitos

Väittelijän yhteystiedot: [email protected]

Väitöstilaisuus järjestetään kampuksella (Maarintie 8, sali AS1).

Väitöskirja on julkisesti nähtävillä 10 päivää ennen väitöstä Aalto-yliopiston julkaisuarkiston verkkoriiputussivulla.

Elektroninen väitöskirja

  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu