Tapahtumat

Käytännön tietojen anonymisointi 2023 / Hands-on Data Anonymisation 2023

Tässä 2 x 3 tunnin työpajassa käsittelemme anonymisoinnin ja pseudonymisoinnin käsitteitä ja sovellamme niitä käytännössä erilaisiin kvantitatiivisiin ja kvalitatiivisiin tutkimusaineistoihin. Tule ja opi tekemällä!
Hands-on Data Anonymisation

Kuvaus

Käytännön henkilötietojen anonymisointi ja pseudonymisointi.

Tämän 2-päivän työpajan tavoitteet ovat käytännönläheisiä: saada ihmiset todella minimoimaan, pseudonymisoimaan ja anonymisoimaan henkilötietoja monissa niiden muodoissa ja käyttämään myös moderneja tekniikoita henkilökohtaisten / arkaluonteisten tietojen käsittelyyn. Ensimmäisenä päivänä on käsitteellinen johdatus aiheeseen, muina päivinä käsitellään työkaluja henkilötietojen (pseudo)anonymisointiin.

Kuka voi osallistua? 

Kaikki, jotka työskentelevät henkilötietojen kanssa kaikissa niiden muodoissa (taustamuuttujat kyselylomakkeista, lääketieteelliset kuvat, terveystiedot, paikkatiedot, puhe, videot, kuvat jne...).

Oppimistulokset 

  • Anonymisoinnin ja pseudonymisoinnin peruskäsitteiden ja rajoitusten ymmärtäminen 
  • Taulukkomuotoisten tietojen anonymisoinnin automatisointi Amnesia-työkalulla 
  • Monimutkaisten aineistojen anonymisointi: Kasvot kuvissa ja videoissa, puhe, paikkatiedot, lääketieteelliset tiedot. 
  • Anonymisointi laadullisessa tutkimuksessa (haastattelut, teksti). 
  • Edistyneet tekniikat arkaluonteisten tietojen käsittelyyn, kun anonymisointia ei voida saavuttaa (datasynteesi, hajautettu oppiminen ja differentiaalinen yksityisyys) 

Muoto 

Kaksipäiväinen kolmetuntinen verkkoseminaari. 1 opintopisteen laajuinen opintosuoritus on saatavilla niille opiskelijoille, jotka ovat halukkaita tekemään lisätehtäviä.

Aikataulu ja sijainti 

Koulutus järjestetään verkossa Zoomin kautta 18. huhtikuuta ja 20. huhtikuuta klo 12.00–15.00 Itä-Euroopan aikaa (EET).

Alla oleva työpajan rakenne on luonnos. Tavoitteena on mukautua enemmistön osallistujien todellisiin tarpeisiin. Kolmas valinnainen päivä saatetaan lisätä, mikäli tiettyjä datatyyppejä ei voida käsitellä kahdessa päivässä.

Päivä 1 
12:00 - 12:10: Esittely 
12:10 - 12:25: Käytännön harjoitus #1: taulukkomuotoiset tiedot ja taulukkolaskentaohjelmat 
12:25 - 12:50: Tietojen anonymisoinnin perusteet, osa 1 
13:00 - 13:30: K-anonymiteetin oppiminen Amnesia-työkalulla (demo ja harjoitus #2) 
13:30 - 14:00: Tietojen anonymisoinnin perusteet, osa 2 
14:10 - 14:30: Käytännön harjoitus #3: toimiessaan datan vertaisarvioijana 
14:30 - 15:00: Kysymykset ja yhteenveto

Päivä 2 
12:00 - 12:10: Esittely + kertaus päivästä 1 
12:10 - 12:50: Ääni-/visuaali-/tekstimateriaalin käsittely 
13:00 - 13:30: Käytännön harjoitus #4: haastattelun transkription anonymisointi 
13:30 - 13:50: Tarkempien tietotyyppien yleiskatsaus (yleisön kiinnostuksen mukaan): lääketieteelliset kuvat, paikkatiedot 
14:00 - 14:30: Kun anonymisointi ei ole mahdollista ja tiedot ovat arkaluonteisia: turvalliset tietoanalyysityönkulut, datasynteesi (tätä voidaan pidentää yleisön kiinnostuksen mukaan) 
14:30 - 15:00: Kysymykset, tulevat suunnat ja erilaiset ratkaisemattomat kysymykset tietosuojan, avoimen tieteen ja tutkimuseettisyyden välillä.

Ei käsitellä, ellei kiinnostusta ole: henkilötietojen visualisointi, henkilötietojen jakaminen, henkilötietojen tekeminen FAIRiksi tietojen minimoinnin ja tietosuojan kautta, hajautetut lähestymistavat.

Toivottu: tekoälyn turvallinen käyttö henkilötietojen minimointiin (ja käsittelyyn); esimerkki paikallisista "GPT" suurista kielimalleista.

Ohjaaja

Dr. Enrico Glerean, Data Agent, Staff Scientist, School of Science, Aalto University

This page was automatically translated from English. If something got lost in translation please switch to the English version at https://www.aalto.fi/en/events/hands-on-data-anonymisation-2023

Aalto RDM & Open Science Training | YouTube | Privacy Notice

  • Julkaistu:
  • Päivitetty: