Tapahtumat

Väitös tietotekniikan alalta, FM Tommi Gröndahl

Väitöskirjan nimi on "Natural Language Processing in Adversarial Settings and Beyond: Benefits and Risks of Text Classification, Transformation, and Representation"
CS_defence_2 photo by Matti Ahlgren

Kieliteknologia on yksi yleisimmistä tekoälyn muodoista. Yksi sen monista käyttötarkoituksista
on pyrkimys tunnistaa haitallista materiaalia, kuten valheita tai vihapuhetta.
Toisaalta tekstien luokittelu lisää mahdollisuuksia sensuurille ja yksityisyydenloukkauksille.
Tässä väitöskirjassa vertailen johtavia kieliteknologiamenetelmiä
erityisesti tietoturvan ja yksityisyydensuojan näkökulmasta. Keskityn kielen luokitteluun,
automaattiseen tuottamiseen sekä erilaisiin tapoihin käsitellä merkityssisältöä.
Esitän myös teknisiä parannuksia aiempiin menetelmiin.

Tulokset osoittavat, että tekstin luokittelu perustuu tyypillisesti melko yksinkertaisiin
piirteisiin, kuten tiettyjen sanojen läsnäoloon. Monimutkaiset koneoppimismallit jäävät
kiinni tällaisiin piirteisiin yhtä lailla kuin yksinkertaisemmat mallit. Tämä asettaa ne alttiiksi
hyökkäyksille, joissa pyritään sekoittamaan luokittelija ilman, että tekstin sisältöä
muutetaan merkittävästi. Tällaisella luokittelun väistämisellä voi toisaalta esimerkiksi
puolustautua kirjoittajan tunnistamista vastaan, millä saattaa olla merkittäviä seurauksia
kirjoittajan yksityisyydelle ja turvallisuudelle.

Teknisestä näkökulmasta vertailen syväoppivia neuroverkkoja perinteisempiin sääntöpohjaisiin
menetelmiin. Näiden väliltä löytyy suuria eroja, joiden hyödyt ja haitat
ovat usein vastakkaisia. Vaikka neuroverkot kykenevät käsittelemään kielidataa
paljon laajemmin kuin käsin ohjelmoidut säännöt, niillä on vaikeuksia säilyttää merkityssisältöä
yksityiskohtaisesti. Siksi neuroverkot yksin eivät ole aina optimaalinen
ratkaisu, ja oleellista on yhdistää eri menetelmien parhaat puolet.

Vastaväittäjä: professori Jörg Tiedemann, Helsingin yliopisto, Suomi

Kustos: Professori N. Asokan, University of Waterloo / Aalto-yliopiston perustieteiden korkeakoulu, Tietotekniikan laitos

Tohtoriopiskelijan yhteystiedot: [email protected]

Väitöstilaisuus järjestetään etäyhteyden (Zoom) kautta. Linkki tilaisuuteen

Zoom pikaopas

Väitöskirja on julkisesti nähtävillä 10 päivää ennen väitöstä Aalto-yliopiston julkaisuarkiston verkkoriiputussivulla.

Elektroninen väitöskirja. (aaltodoc.aalto.fi)

  • Julkaistu:
  • Päivitetty: