Väitös tietojenkäsittelytieteen alalta, TkL Antti Keurulainen
Väitös Aalto-yliopiston perustieteiden korkeakoulusta, tietotekniikan laitokselta
Milloin
Missä
Tapahtuman kieli
Väitöskirjan nimi: Real-time and sample-efficient learning of computationally rational user models
Tohtoriopiskelija: Antti Keurulainen
Vastaväittäjä: Toht. John Williamson, University of Glasgow, Iso-Britannia
Kustos: Prof. Samuel Kaski, Aalto-yliopiston perustieteiden korkeakoulu, tietotekniikan laitos
Tehdäkseen tehokasta yhteistyötä ihmisten kanssa, tekoälyjärjestelmien on ymmärrettävä ihmisen käyttäytymistä ja sen taustalla vaikuttavia tekijöitä, kuten tavoitteita, mieltymyksiä ja kykyjä. Koneiden ja ihmisten väliset vuorovaikutukset tuottavat tyypillisesti vain rajoitetun määrän näytteitä, joten monissa käytännön tilanteissa tekoälyn on kyettävä ymmärtämään ihmisen tavoitteita ja käyttäytymistä vain muutaman interaktion perusteella. Lisäksi tekoälyn on kyettävä tekemään päättelyä ihmisen käyttäytymisestä reaaliaikaisesti ilman viiveitä, jotka saattaisivat häiritä koneen ja ihmisen välistä vuorovaikutusta. Tässä väitöskirjassa tutkitaan, kuinka tekoälyjärjestelmä voi oppia havainnoimaan ja päättelemään toisen osapuolen käyttäytymisestä reaaliaikaisesti ja näytetehokkaasti hyödyntäen vahvistusoppimiseen perustuvia menetelmiä. Väitöskirjan ensimmäinen tulos on menetelmä, jossa neuroverkkojen avulla opitaan luomaan representaatioita toisen osapuolen käyttäytymisestä epätäydellisistä havainnoista. Näitä representaatioita voidaan edelleen käyttää parantamaan suorituskykyä yhteistyötä vaativissa päätöksentekotehtävissä. Toinen tulos on menetelmä, jossa luodaan automatisoidusti tehtäväjakauma sekä annotoituja näytteitä metaoppijan harjoittamista varten. Metaoppijan avulla tekoäly kykenee esimerkiksi nopeasti arvioimaan toisen osapuolen taitotasoa ja mukauttamaan omaa käyttäytymistään yhteistyön parantamiseksi. Kolmas tulos on uusi menetelmä, jossa tekoäly kykenee tuottamaan spesifikaation informatiiviselle kokeelle simulointipohjaisen käyttäjämallin parametrien estimoimiseen. Esitetyssä menetelmässä tuotetaan samanaikaisesti käyttäjämallin parametrien estimaatti sekä informatiivisen kokeen spesifikaatio neuroverkkojen avulla. Tutkimuksen tulokset tarjoavat uusia mahdollisuuksia parantaa koneiden ja ihmisten välistä yhteistyötä, sekä edistävät tekoälyn oppimista ihmismäisestä käyttäytymisestä rajoitetun datan avulla vuorovaikutteisessa ympäristössä.
Avainsanat: Vahvistuoppiminen, syvät neuroverkot, käyttäjämallit.
Linkki väitöskirjan sähköiseen esittelykappaleeseen (esillä 10 päivää ennen väitöstä): https://aaltodoc.aalto.fi/doc_public/eonly/riiputus/
Yhteystiedot:
Sähköposti | [email protected] |
Puhelinnumero | 0405800802 |
Perustieteiden korkeakoulun väitöskirjat: https://aaltodoc.aalto.fi/handle/123456789/52
- Julkaistu:
- Päivitetty: