Käytännön tietojen anonymisointi 2023 / Hands-on Data Anonymisation 2023
Kuvaus
Käytännön henkilötietojen anonymisointi ja pseudonymisointi.
Tämän 2-päivän työpajan tavoitteet ovat käytännönläheisiä: saada ihmiset todella minimoimaan, pseudonymisoimaan ja anonymisoimaan henkilötietoja monissa niiden muodoissa ja käyttämään myös moderneja tekniikoita henkilökohtaisten / arkaluonteisten tietojen käsittelyyn. Ensimmäisenä päivänä on käsitteellinen johdatus aiheeseen, muina päivinä käsitellään työkaluja henkilötietojen (pseudo)anonymisointiin.
Kuka voi osallistua?
Kaikki, jotka työskentelevät henkilötietojen kanssa kaikissa niiden muodoissa (taustamuuttujat kyselylomakkeista, lääketieteelliset kuvat, terveystiedot, paikkatiedot, puhe, videot, kuvat jne...).
Oppimistulokset
- Anonymisoinnin ja pseudonymisoinnin peruskäsitteiden ja rajoitusten ymmärtäminen
- Taulukkomuotoisten tietojen anonymisoinnin automatisointi Amnesia-työkalulla
- Monimutkaisten aineistojen anonymisointi: Kasvot kuvissa ja videoissa, puhe, paikkatiedot, lääketieteelliset tiedot.
- Anonymisointi laadullisessa tutkimuksessa (haastattelut, teksti).
- Edistyneet tekniikat arkaluonteisten tietojen käsittelyyn, kun anonymisointia ei voida saavuttaa (datasynteesi, hajautettu oppiminen ja differentiaalinen yksityisyys)
Muoto
Kaksipäiväinen kolmetuntinen verkkoseminaari. 1 opintopisteen laajuinen opintosuoritus on saatavilla niille opiskelijoille, jotka ovat halukkaita tekemään lisätehtäviä.
Aikataulu ja sijainti
Koulutus järjestetään verkossa Zoomin kautta 18. huhtikuuta ja 20. huhtikuuta klo 12.00–15.00 Itä-Euroopan aikaa (EET).
Alla oleva työpajan rakenne on luonnos. Tavoitteena on mukautua enemmistön osallistujien todellisiin tarpeisiin. Kolmas valinnainen päivä saatetaan lisätä, mikäli tiettyjä datatyyppejä ei voida käsitellä kahdessa päivässä.
Päivä 1
12:00 - 12:10: Esittely
12:10 - 12:25: Käytännön harjoitus #1: taulukkomuotoiset tiedot ja taulukkolaskentaohjelmat
12:25 - 12:50: Tietojen anonymisoinnin perusteet, osa 1
13:00 - 13:30: K-anonymiteetin oppiminen Amnesia-työkalulla (demo ja harjoitus #2)
13:30 - 14:00: Tietojen anonymisoinnin perusteet, osa 2
14:10 - 14:30: Käytännön harjoitus #3: toimiessaan datan vertaisarvioijana
14:30 - 15:00: Kysymykset ja yhteenveto
Päivä 2
12:00 - 12:10: Esittely + kertaus päivästä 1
12:10 - 12:50: Ääni-/visuaali-/tekstimateriaalin käsittely
13:00 - 13:30: Käytännön harjoitus #4: haastattelun transkription anonymisointi
13:30 - 13:50: Tarkempien tietotyyppien yleiskatsaus (yleisön kiinnostuksen mukaan): lääketieteelliset kuvat, paikkatiedot
14:00 - 14:30: Kun anonymisointi ei ole mahdollista ja tiedot ovat arkaluonteisia: turvalliset tietoanalyysityönkulut, datasynteesi (tätä voidaan pidentää yleisön kiinnostuksen mukaan)
14:30 - 15:00: Kysymykset, tulevat suunnat ja erilaiset ratkaisemattomat kysymykset tietosuojan, avoimen tieteen ja tutkimuseettisyyden välillä.
Ei käsitellä, ellei kiinnostusta ole: henkilötietojen visualisointi, henkilötietojen jakaminen, henkilötietojen tekeminen FAIRiksi tietojen minimoinnin ja tietosuojan kautta, hajautetut lähestymistavat.
Toivottu: tekoälyn turvallinen käyttö henkilötietojen minimointiin (ja käsittelyyn); esimerkki paikallisista "GPT" suurista kielimalleista.
Ohjaaja
Dr. Enrico Glerean, Data Agent, Staff Scientist, School of Science, Aalto University
This page was automatically translated from English. If something got lost in translation please switch to the English version at https://www.aalto.fi/en/events/hands-on-data-anonymisation-2023
Aalto RDM & Open Science Training | YouTube | Privacy Notice
- Julkaistu:
- Päivitetty: