Tapahtumat

Väitös tietoverkkotekniikan alalta, M.Sc. Petr Byvshev

Liikkeen ja ulkonäön erottaminen videoissa ja syvissä neuroverkoissa.
Robot making sushi
Robot making sushi, by Stable Diffusion 2

M.Sc. Petr Byvshev väittelee 19.4.2023 klo 12 Aalto-yliopiston sähkötekniikan korkeakoulussa, informaatio- ja tietoliikennetekniikan laitoksella, salissa T1, Konemiehentie 2, Espoo. Väitöskirjan nimi on "Motion and Appearance Representation Learning of Human Activities from Videos and Wearable Sensors".

Vastaväittäjä: Prof. Shaogang Gong, Queen Mary University of London, UK
Kustos: Prof. Yu Xiao, Aalto-yliopiston sähkötekniikan korkeakoulu, informaatio- ja tietoliikennetekniikan laitos

Linkki väitöskirjan sähköiseen esittelykappaleeseen (esillä 10 päivää ennen väitöstä): https://aaltodoc.aalto.fi/doc_public/eonly/riiputus/
Sähkötekniikan korkeakoulun väitöskirjat: https://aaltodoc.aalto.fi/handle/123456789/53

Väitöstiedote:

Oletko huomannut, että videoista on tullut merkittävä osa elämäämme? Tällä hetkellä ne ovat myös keskeinen osa syväopittujen neuroverkkojen koulutusdataa. Tästä syystä olemme ylpeitä voidessamme julkistaa uuden väitöstyön, jossa tutkitaan, kuinka syvän neuroverkon avulla opittuja videorepresentaatioita voidaan parantaa.

Tutkimuksen tavoitteena on selvittää, miten mallit oppivat ajallisia riippuvaisuuksia, erityisesti 3D video-ominaisuuksista. Kun verkostot koulutetaan yleisiin videotietosarjoihin, ne keskittyvät ulkonäkötietoihin liikkeen sijaan. Näytämme, kuinka neuroverkot voi sopeuttaa vaihteleviin temporaalisuuden tasoihin ja näin ollen ylittää vinouman ulkonäkötietoihin. Lisäksi tutkimuksessa esitellään uusia menetelmiä ajallisen tiedon poimimiseksi videoista optimaalisella tavalla, sekä yhdistämiseksi muihin aistinvaraisiin modaliteeteihin, kuten älykäsineisiin. Esittelemme simulaatiopohjaisen alustan älykäsineille ihmisen toiminnan tunnistusjärjestelmien luomiseen, käyttämällä suuria videodatan joukkoja synteettisten anturitietojen luomiseen.

Väitöskirja on erittäin relevantti videorepresentaatioiden ja syvien neuroverkkojen alan tutkimukseen. Tutkimuksen päätulos on uusien menetelmien kehittäminen ajallisen tiedon poimimiseksi videoista optimaalisesti ja yhdistämiseksi muihin aistimodaliteeteihin.

Tämä väitöskirja tuo uutta tietoa ja näkemyksiä avoimen videodatan vaikutuksesta opittuihin videoesitykseen ja edistää syvien neuroverkkojen arkkitehtuurisuunnittelua. Tässä väitöskirjassa esitettyjä tietoja voidaan soveltaa videoiden representaatioiden parantamiseen ja videosisällön vaihtelevuuden ymmärtämiseen. Tässä tutkimuksessa kehitettyjä menetelmiä voidaan soveltaa esimerkiksi tarkempien ja kestävämpien videotoiminnan tunnistusjärjestelmien luomiseen.

Tämä opinnäytetyö voi olla mielenkiintoinen niille, jotka haluavat oppia huippuluokan syvävideomalleista ja suuren mittakaavan tietojoukoista, joilla ne on koulutettu. Kaikki ovat tervetulleita mukaan.

Väittelijän yhteystiedot:

Email [email protected]
Mobile +31621321586
  • Julkaistu:
  • Päivitetty: