Tutkimus ja taide

Parhaita käytäntöjä tekoälytyökalujen hyödyntämiseen tutkimuksessa

Kokoelma parhaita käytäntöjä tekoälytyökalujen hyödyntämiseen tutkimuksessa.
A banner that says "AI and Research Work"

Tekoäly (AI) ja tutkimustyö

Tekoälytyökaluja, esimerkiksi generatiiviseen tekoälyyn (genAI) perustuvia, käytetään tutkimuksen kaikissa vaiheissa: kirjallisuushausta ohjelmistojen koodaukseen ja käsikirjoitusten editointiin. Tutustu ohjeeseen Generatiivisen tekoälyn vastuullinen käyttö tutkimusprosessissa, jos et ole vielä tehnyt niin. Tämä sivu auttaa tunnistamaan, missä generatiivinen tekoäly voi auttaa, ja samalla tiedostamaan sen riskit liittyen tutkimusetiikkaan ja hyvän tieteelliseen käytännön periaatteisiin.

1. Tekoäly tutkimuksessa: mitä tekoäly on?

Tutkimuksen kontekstissa tekoäly voi toimia kolmessa roolissa:

  • Tekoäly tutkimuskohteena: tekoälyn itsensä tutkiminen ja kehittäminen (esim. ihmisen ja chatbotin vuorovaikutus, uudet koneoppimisalgoritmit (Machine Learning, ML)). Digitalisaatio ja tekoäly on yksi Aalto-yliopiston seitsemästä avaintutkimusalueesta. 
  • Tekoäly menetelmänä: ML:n tai muiden tekoälymenetelmien käyttäminen tutkimuksesi analyysimenetelmänä (esim. luokittelu, ennustaminen).
  • Tekoäly työkaluna: tekoälysovellusten (usein generatiivinen tekoäly) hyödyntäminen tehtävissä, jotka eivät sinänsä koske tekoälyä (esim. oikoluku, koodin debuggaus).

Useimmille tutkijoille - myös niille, jotka eivät tutki tekoälyä aiheena tai käytä sitä menetelmänä - tekoäly on työkalu, jonka he kohtaavat päivittäin. Tämä sivu keskittyy (generatiiviseen) tekoälyyn työkaluna.

2. Generatiivisen tekoälyn työkalut tutkimuksen eri vaiheissa

Generatiivisen tekoälyn työkalut voivat auttaa tutkimusprosessin jokaisessa vaiheessa:

Vaihe Esimerkkejä tekoälyavusta
Suunnittelu Kirjallisuushaku, rahoitushakemusten luonnostelu, tutkimuskysymysten ideointi
Aineiston keruu Kyselyiden suunnittelu, aineiston kokoaminen, simulaatiot
Esikäsittely Datan muokkaaminen, laadunvarmistus, aineiston siivoaminen
Analyysi Analyysikoodin tuottaminen, laadulliset lisämerkinnät eli annotaatiot
Säilyttäminen Dokumentointi, README-tiedostojen luonti, metadata
Jakaminen Käsikirjoituksen luonnostelu, lehdistötiedotteet, sosiaalisen median julkaisut
Uudelleenkäyttö Koodin dokumentointi, aineistokuvaukset

Jokaiseen käyttötilanteeseen liittyy riskejä. Mikään tehtävä ei ole tekoälylle aina sopiva tai epäsopiva, vaan se riippuu kontekstista ja tekoälytyökalun käyttäjästä. Vastuullisena tutkijana tehtäväsi on arvioida riskit ennen kuin päätät jatkaa tekoälyn hyödyntämistä. Jos olet epävarma, voit keskustella asiasta kollegoiden kanssa (esim. data-asiantuntijoiden kanssa osoitteessa researchdata@aalto.fi) tai yksinkertaisesti välttää tekoälyn käyttöä kyseisessä tehtävässä. 

3. Älä sorru tutkimusvilppiin

Ellei generatiivista tekoälyä käytetä huolellisesti, se voi erittäin helposti syyllistyä mihin tahansa näistä tieteellisen vilpin muodosta:

  • Sepittäminen: generatiivinen AI "hallusinoi" eli tuottaa järkevän näköistä tekstiä, viittauksia, tilastoja tai dataa, jota ei ole olemassa.
  • Vääristely: Tekoäly ei päättele asioita samalla tavalla kuin ihminen, vaan se vain tuottaa syötteeseen ja opetusaineistoon perustuen sopivimman vastauksen. Tekoäly voi siis päätyä vääriin johtopäätöksiin. Tutkijan on validoitava tulokset sellaisella tavalla, jonka hän tuntee itse hyvin.
  • Plagiointi: Tekoäly voi antaa vastauksen, joka perustuu toisen tutkijan tuloksiin. Jos esität tekoälyn antamia tuloksia omissa nimissäsi, ilman että viittaat muiden aiempaan työhön, voit syyllistyä plagiointiin.

Riskejä kuvataan tarkemmin täällä sekä ohjeistuksessa Tekoälyn vastuullinen käyttö tutkimusprosessin aikana.

4. Riskin arviointi: asiantuntijuus × tuotoksen riskitaso -matriisi

Eri tilanteissa on erilaiset riskit. Jos olet epävarma, voit pohtia kahta tekijää arvioidaksesi, kuinka varovainen sinun tulisi olla:

  1. Oma asiantuntijuutesi tehtävässä, jonka delegoit tekoälylle
  2. Tuotoksen tärkeys: lähetetäänkö se vertaisarvioitavaksi vai onko kyse vähemmän tärkeästä sisällöstä (esim. työpajan verkkosivu)?
  Vähän asiantuntemusta Paljon asiantuntemusta
Korkea riski (tieteellinen julkaisu: teksti, koodi, kuvat, viitteet) Käytä tekoälyä vain ideoiden pallotteluun: kysy, mitä lähteitä kannattaisi lukea, pyydä avainsanaehdotuksia ja käy sitten itse lukemassa varsinaiset lähteet.

Esimerkki: etsi sopivia avainsanoja tai kysy, mitkä tilastolliset menetelmät voisivat sopia aineistoosi, ja käy sen jälkeen lukemassa niistä itse.
Käytä tekoälyä yksinkertaisiin tehtävänantoihin, jotka pystyt tarkistamaan kokonaan. Tarkista tulos yhtä huolellisesti kuin jos olisit kirjoittanut sen itse alusta asti. Yliluottamus on tässä kohtaa erityisen vaarallista.

Esimerkkejä: lyhyiden koodinpätkien generoiminen funktio kerrallaan. Tekstin muokkaus: pyydä tekoälyä merkitsemään ehdottamansa muutokset lihavoinnilla, jotta voit itse päättää, mitkä muutokset otat mukaan lopulliseen tekstiin.
Matala riski (tapahtuman verkkosivu, some-päivitys, esitykset) Käytä tekoälyä, mutta hyväksy se, että virheitä voi lipsahtaa läpi.

 Esimerkki: CSS-työkalun käyttö työpajan verkkosivulla tai pienen demon vibe-koodaus.
Delegoi suurin osa työstä tekoälylle. Varmista, että tuotos on järkevä.

Esimerkki: laatimasi ohjelmakoodin dokumentointi tai esityksen luonnosversion tekeminen omien äänitystesi litteroinnista.

(lähde: Glerean, 2026, ”AI and research work”, valmisteilla)

Huomio 1: Aineistosi arkaluonteisuus nostaa riskitasoa. Luottamuksellisten aineistojen tai henkilötietojen kanssa sinun täytyy kiinnittää huomiota paitsi siihen, miten käytät työkaluja, myös siihen, mitä työkaluja käytät.

Huomio 2: Erityistapaus, joka ulottuu eri riskitasojen yli, liittyy generoituun ohjelmakoodiin silloin, kun haluttu toiminnallisuus voidaan muotoilla automatisoitujen yksikkötestien avulla, testit on määritelty hyvin ja ne kattavat koodin kannalta oleellisen käyttäytymisen. Tämä voi pienentää riskitasoa, mutta siirtää laatuvaatimuksia itse testeihin.

Huomio 3: Kaikki tapaukset eivät istu tähän 2×2-matriisiin. Sinä olet viime kädessä vastuussa ja arvioit, onko tekoälyn käyttö tilanteessa tarkoituksenmukaista.

5. Tekoälytyökalun valinta: tietojen luokittelu

Käyttämäsi tekoälytyökalu tulisi valita sen mukaan, miten arkaluonteista tai julkista tieto on, jota käytät. 
Ohjeemme (kappale 3 datan arkaluontoisuudesta) edellyttävät Aalto AI Assistantin käyttöä kaikissa käyttötapauksissa, joissa data ei ole täysin julkista. Alla oleva taulukko yhdistää Aallon neljä tiedon suojaustasoa sopiviin tekoälytyökaluihin.

Taso Esimerkkejä datasta Tekoälytyökalu
Julkinen Wikipedia-sisältö, CC-lisensoidut julkaistut artikkelit, julkinen data Mikä tahansa tekoälytyökalu käy
Sisäinen Muistiot kokouksista, kuluraportit, yliopiston sisäiset sivut Suosi organisaation omia työkaluja kuten Aalto AI Assistant
Luottamuksellinen Tutkimukseen osallistujien data, julkaisemattomat tutkimustulokset Käytä vain työkaluja, joilla on sopimukseen perustuva tietosuojatakuu (kuten Aalto AI Assistant), tai aja tekoälymalleja paikallisesti (esim. Triton-klusterilla)
Salainen Data, jonka vuoto aiheuttaisi vakavaa vahinkoa (esim. potilastiedot) Ei pilvipohjaisia tekoälytyökaluja. Käytä vain paikallisia työkaluja luotetussa tutkimusympäristössä (Trusted Research Environment) kuten SECDATA

Jos käytät hyväksymättömiä työkaluja, muista että kaikkea, mitä syötät tekoälyjärjestelmään, saatetaan käyttää mallin koulutukseen tai se voi päätyä muiden saataville. Hyvänä käytännön nyrkkisääntönä kohtele vuorovaikutusta Meta AI:n, Grokin (xAI) ja DeepSeekin kanssa täysin julkisena riippumatta siitä, mihin suojausluokkaan jakamasi sisältö kuuluu, ja riippumatta niiden lupaamista yksityisyydensuojakäytännöistä. Näillä työkaluilla on joko sallivat tietosuojakäytännöt, jotka mahdollistavat syötteidesi käytön mallien kouluttamiseen, tai niitä tarjoavat organisaatiot, joiden tietosuojakäytännöt eivät ole riippumattomasti todennettavissa.

Vaikka tutkimusdatasi olisi julkista, julkaisemattomien tutkimusideoiden jakaminen tekoälypalveluille sisältää aina riskin idean päätymisestä muiden käyttöön tai julkiseen internetiin.

6. Tekoälyn käytön ilmoittaminen

Aalto-yliopiston ohjeet tekoälyn vastuulliseen käyttöön tutkimuksessa pohjautuvat ALLEAn Eurooppalainen hyvä tieteellinen käytäntö -ohjeiston neljään periaatteeseen: luotettavuuteen, rehellisyyteen, kunnioitukseen ja vastuullisuuteen. Tieteellisen käsikirjoituksen valmistelussa tekoälyn käytöstä on siksi usein tehtävä ilmoitus.

Mitä pitää ilmoittaa? 

Esimerkkinä tässä ovat Elsevierin suositukset (tarkista oman kustantajasi suositukset ennen käsikirjoituksen lähettämistä):

  • Ilmoitusta ei tarvita: vain kirjoitusvirheiden ja kieliopin korjaaminen
  • Ilmoitus vaaditaan: kaikenlainen tekstin yhteenveto, koodin generointi, kuvien luonti, analyysimenetelmien ehdottaminen tai minkä tahansa osion luonnostelu
  • Tekoälyllä tuotetut kuvat: sallittuja vain työnkulun tai menetelmän havainnollistamiseen; ei koskaan tutkimuksen tuloksen kuvina tai numeerisina kuvaajina

Ilmoitusmalli

Kun ilmoitat tekoälyn käytöstä, sisällytä esimerkiksi seuraavanlainen lausuma (Elsevierin esimerkki):

  • Osion otsikko: Ilmoitus generatiivisen tekoälyn ja tekoälyavusteisten teknologioiden käytöstä käsikirjoituksen valmistelussa
  • Lausuma: Tämän työn valmistelun aikana kirjoittaja(t) käytti(vät) [TYÖKALUN / PALVELUN NIMI] [MILLÄ TAVALLA]. Työkalun/palvelun käytön jälkeen kirjoittaja(t) tarkasti(vat) ja muokkasi(vat) sisältöä tarvittaessa ja ottaa(ottavat) täyden vastuun julkaistun artikkelin sisällöstä.

7. Käytännön neuvoja

Tässä on joukko käytännön vinkkejä ja tekoälytyökalujen käyttötapauksia tutkimuksessa, satunnaisessa järjestyksessä.

8. Kysymyksiä ja vastauksia

Tässä joitakin kysymyksiä, joita on usein noussut esiin tutkimusetiikan kurssilla tai “Tekoäly tutkimustyössä” -työpajoissamme.

9. Video­luentoja tekoälystä ja tutkimuksesta

Tämä osio näkyy vain, jos olet kirjautunut sisään. Osiossa on videoita tohtoriopiskelijoiden tutkimusetiikan kurssilta, jonka opettajina ovat Arno Solin (Etiikka tekoälytutkimuksessa), Enrico Glerean (Generatiivinen tekoäly ja tutkimuksen integriteetti) ja Maria Rehbinder (AI-asetus). Valmistelemme MOOC-verkkokurssia, johon sisältyy näiden videoiden lisäksi paljon muutakin. Otathan yhteyttä, jos haluat osallistua MOOCin tekemiseen.

Johtopäätökset

Tekoäly laajenee väistämättä kaikkiin elämämme osa-alueisiin, joten vastuullisia tutkijoita eivät ole ne, jotka välttelevät tekoälyä kokonaan, eivätkä ne, jotka delegoivat sille kaiken. Vastuulliset tutkijat ymmärtävät, miten nämä järjestelmät toimivat ja mitä niille delegoidaan. He osaavat tarkistaa tulokset, pohtia dataan ja lainsäädäntöön liittyviä riskejä, kertoa tekoälyn käytöstä rehellisesti ja säilyttää tutkimuksessa tarvittavat keskeiset inhimilliset taidot: lukemisen, päättelyn, dokumentoinnin, viestinnän ja vastuun kantamisen. 

Tämän sivun sisältö perustuu lukuisiin keskusteluihin yli tuhannen tutkijan kanssa vuosina 2024-2026 kursseilla ”AI and Research Work” (Glerean, Silva) [zenodo][youtube], ”Research Ethics for Doctoral Students” (tekoälyaiheet: Glerean, Solin, Rehbinder) sekä CodeRefinery-työpajassa ”Responsible Use of Generative AI in Assisted Coding” (Glerean, CodeRefinery) [materials][youtube]. Haluatko täydentää näitä käytännön ohjeita? Ota yhteyttä Enrico Glereaniin ja Aalto Data Agents -verkostoon (researchdata@aalto.fi). Valmistelemme avointa MOOC-verkkokurssia, joka on saatavilla syyskuusta 2026 alkaen. 

Aalto-yliopiston logo, jonka yläpuolella isoilla kirjaimilla 'A!'. Nimen alla kolmella kielellä.

Tekoälyn vastuullinen käyttö tutkimusprosessin aikana

Tutkimuksen toistettavuus, vastuunkanto tutkimustulosten oikeellisuudesta, toisten tutkijoiden tekemän työn tunnustaminen ja kunnioittaminen, ja tiedon suojaus.

Palvelut
Suloinen valkoinen AI-robotti kaaviossa, jossa datasyötöt, käsittelykuvakkeet ja vihreät tulossymbolit

Koodausassistentit Aallossa

Koodiavustajat ovat AI-työkaluja, jotka auttavat kirjoittamaan ohjelmakoodia, arvioimaan sitä ja nopeuttamaan siten kehitysprosesseja.

Palvelut
Local AI llm gateway banner

Tutkimukselle ja opetukselle oma rajapinta suurelle kielimallille

Aallon tutkijoille, opettajille ja opiskelijoille tarjolla turvallinen tapa rakentaa suuria kielimalleja hyödyntäviä työkaluja

Uutiset
Light bulb

Vinkkejä opettajalle tekoälyn käytöstä opetuksessa

Opettajalle vinkkejä miten tekoälyn käyttöä opetuksessa voi huomioida

Palvelut
Mustia ympyröitä ja neliöitä, jotka on yhdistetty katkoviivoilla sinisellä taustalla.

Tekoälyjärjestelmät ja tekijänoikeus

Tekoälyjärjestelmät ja niihin liittyvät tekijänoikeuskysymykset.

Palvelut
  • Päivitetty:
  • Julkaistu:
Jaa
URL kopioitu