Tutkimus ja taide

Parhaita käytäntöjä tekoälytyökalujen hyödyntämiseen tutkimuksessa

Kokoelma parhaita käytäntöjä tekoälytyökalujen hyödyntämiseen tutkimuksessa.

A banner that says "AI and Research Work"

Tekoäly (AI) ja tutkimustyö

Tekoälytyökaluja, esimerkiksi generatiiviseen tekoälyyn (genAI) perustuvia, käytetään tutkimuksen kaikissa vaiheissa: kirjallisuushausta ohjelmistojen koodaukseen ja käsikirjoitusten editointiin. Tutustu ohjeeseen Generatiivisen tekoälyn vastuullinen käyttö tutkimusprosessissa, jos et ole vielä tehnyt niin. Tämä sivu auttaa tunnistamaan, missä generatiivinen tekoäly voi auttaa, ja samalla tiedostamaan sen riskit liittyen tutkimusetiikkaan ja hyvän tieteelliseen käytännön periaatteisiin.

1. Tekoäly tutkimuksessa: mitä tekoäly on?

Tutkimuksen kontekstissa tekoäly voi toimia kolmessa roolissa:

Tekoäly tutkimuskohteena: tekoälyn itsensä tutkiminen ja kehittäminen (esim. ihmisen ja chatbotin vuorovaikutus, uudet koneoppimisalgoritmit (Machine Learning, ML)). Digitalisaatio ja tekoäly on yksi Aalto-yliopiston seitsemästä avaintutkimusalueesta.
Tekoäly menetelmänä: ML:n tai muiden tekoälymenetelmien käyttäminen tutkimuksesi analyysimenetelmänä (esim. luokittelu, ennustaminen).
Tekoäly työkaluna: tekoälysovellusten (usein generatiivinen tekoäly) hyödyntäminen tehtävissä, jotka eivät sinänsä koske tekoälyä (esim. oikoluku, koodin debuggaus).

Useimmille tutkijoille - myös niille, jotka eivät tutki tekoälyä aiheena tai käytä sitä menetelmänä - tekoäly on työkalu, jonka he kohtaavat päivittäin. Tämä sivu keskittyy (generatiiviseen) tekoälyyn työkaluna.

2. Generatiivisen tekoälyn työkalut tutkimuksen eri vaiheissa

Generatiivisen tekoälyn työkalut voivat auttaa tutkimusprosessin jokaisessa vaiheessa:

Vaihe	Esimerkkejä tekoälyavusta
Suunnittelu	Kirjallisuushaku, rahoitushakemusten luonnostelu, tutkimuskysymysten ideointi
Aineiston keruu	Kyselyiden suunnittelu, aineiston kokoaminen, simulaatiot
Esikäsittely	Datan muokkaaminen, laadunvarmistus, aineiston siivoaminen
Analyysi	Analyysikoodin tuottaminen, laadulliset lisämerkinnät eli annotaatiot
Säilyttäminen	Dokumentointi, README-tiedostojen luonti, metadata
Jakaminen	Käsikirjoituksen luonnostelu, lehdistötiedotteet, sosiaalisen median julkaisut
Uudelleenkäyttö	Koodin dokumentointi, aineistokuvaukset

Jokaiseen käyttötilanteeseen liittyy riskejä. Mikään tehtävä ei ole tekoälylle aina sopiva tai epäsopiva, vaan se riippuu kontekstista ja tekoälytyökalun käyttäjästä. Vastuullisena tutkijana tehtäväsi on arvioida riskit ennen kuin päätät jatkaa tekoälyn hyödyntämistä. Jos olet epävarma, voit keskustella asiasta kollegoiden kanssa (esim. data-asiantuntijoiden kanssa osoitteessa researchdata@aalto.fi) tai yksinkertaisesti välttää tekoälyn käyttöä kyseisessä tehtävässä.

3. Älä sorru tutkimusvilppiin

Ellei generatiivista tekoälyä käytetä huolellisesti, se voi erittäin helposti syyllistyä mihin tahansa näistä tieteellisen vilpin muodosta:

Sepittäminen: generatiivinen AI "hallusinoi" eli tuottaa järkevän näköistä tekstiä, viittauksia, tilastoja tai dataa, jota ei ole olemassa.
Vääristely: Tekoäly ei päättele asioita samalla tavalla kuin ihminen, vaan se vain tuottaa syötteeseen ja opetusaineistoon perustuen sopivimman vastauksen. Tekoäly voi siis päätyä vääriin johtopäätöksiin. Tutkijan on validoitava tulokset sellaisella tavalla, jonka hän tuntee itse hyvin.
Plagiointi: Tekoäly voi antaa vastauksen, joka perustuu toisen tutkijan tuloksiin. Jos esität tekoälyn antamia tuloksia omissa nimissäsi, ilman että viittaat muiden aiempaan työhön, voit syyllistyä plagiointiin.

Riskejä kuvataan tarkemmin täällä sekä ohjeistuksessa Tekoälyn vastuullinen käyttö tutkimusprosessin aikana.

4. Riskin arviointi: asiantuntijuus × tuotoksen riskitaso -matriisi

Eri tilanteissa on erilaiset riskit. Jos olet epävarma, voit pohtia kahta tekijää arvioidaksesi, kuinka varovainen sinun tulisi olla:

Oma asiantuntijuutesi tehtävässä, jonka delegoit tekoälylle
Tuotoksen tärkeys: lähetetäänkö se vertaisarvioitavaksi vai onko kyse vähemmän tärkeästä sisällöstä (esim. työpajan verkkosivu)?

	Vähän asiantuntemusta	Paljon asiantuntemusta
Korkea riski (tieteellinen julkaisu: teksti, koodi, kuvat, viitteet)	Käytä tekoälyä vain ideoiden pallotteluun: kysy, mitä lähteitä kannattaisi lukea, pyydä avainsanaehdotuksia ja käy sitten itse lukemassa varsinaiset lähteet. Esimerkki: etsi sopivia avainsanoja tai kysy, mitkä tilastolliset menetelmät voisivat sopia aineistoosi, ja käy sen jälkeen lukemassa niistä itse.	Käytä tekoälyä yksinkertaisiin tehtävänantoihin, jotka pystyt tarkistamaan kokonaan. Tarkista tulos yhtä huolellisesti kuin jos olisit kirjoittanut sen itse alusta asti. Yliluottamus on tässä kohtaa erityisen vaarallista. Esimerkkejä: lyhyiden koodinpätkien generoiminen funktio kerrallaan. Tekstin muokkaus: pyydä tekoälyä merkitsemään ehdottamansa muutokset lihavoinnilla, jotta voit itse päättää, mitkä muutokset otat mukaan lopulliseen tekstiin.
Matala riski (tapahtuman verkkosivu, some-päivitys, esitykset)	Käytä tekoälyä, mutta hyväksy se, että virheitä voi lipsahtaa läpi. Esimerkki: CSS-työkalun käyttö työpajan verkkosivulla tai pienen demon vibe-koodaus.	Delegoi suurin osa työstä tekoälylle. Varmista, että tuotos on järkevä. Esimerkki: laatimasi ohjelmakoodin dokumentointi tai esityksen luonnosversion tekeminen omien äänitystesi litteroinnista.

(lähde: Glerean, 2026, ”AI and research work”, valmisteilla)

Huomio 1: Aineistosi arkaluonteisuus nostaa riskitasoa. Luottamuksellisten aineistojen tai henkilötietojen kanssa sinun täytyy kiinnittää huomiota paitsi siihen, miten käytät työkaluja, myös siihen, mitä työkaluja käytät.

Huomio 2: Erityistapaus, joka ulottuu eri riskitasojen yli, liittyy generoituun ohjelmakoodiin silloin, kun haluttu toiminnallisuus voidaan muotoilla automatisoitujen yksikkötestien avulla, testit on määritelty hyvin ja ne kattavat koodin kannalta oleellisen käyttäytymisen. Tämä voi pienentää riskitasoa, mutta siirtää laatuvaatimuksia itse testeihin.

Huomio 3: Kaikki tapaukset eivät istu tähän 2×2-matriisiin. Sinä olet viime kädessä vastuussa ja arvioit, onko tekoälyn käyttö tilanteessa tarkoituksenmukaista.

5. Tekoälytyökalun valinta: tietojen luokittelu

Käyttämäsi tekoälytyökalu tulisi valita sen mukaan, miten arkaluonteista tai julkista tieto on, jota käytät.
Ohjeemme (kappale 3 datan arkaluontoisuudesta) edellyttävät Aalto AI Assistantin käyttöä kaikissa käyttötapauksissa, joissa data ei ole täysin julkista. Alla oleva taulukko yhdistää Aallon neljä tiedon suojaustasoa sopiviin tekoälytyökaluihin.

Taso	Esimerkkejä datasta	Tekoälytyökalu
Julkinen	Wikipedia-sisältö, CC-lisensoidut julkaistut artikkelit, julkinen data	Mikä tahansa tekoälytyökalu käy
Sisäinen	Muistiot kokouksista, kuluraportit, yliopiston sisäiset sivut	Suosi organisaation omia työkaluja kuten Aalto AI Assistant
Luottamuksellinen	Tutkimukseen osallistujien data, julkaisemattomat tutkimustulokset	Käytä vain työkaluja, joilla on sopimukseen perustuva tietosuojatakuu (kuten Aalto AI Assistant), tai aja tekoälymalleja paikallisesti (esim. Triton-klusterilla)
Salainen	Data, jonka vuoto aiheuttaisi vakavaa vahinkoa (esim. potilastiedot)	Ei pilvipohjaisia tekoälytyökaluja. Käytä vain paikallisia työkaluja luotetussa tutkimusympäristössä (Trusted Research Environment) kuten SECDATA

Jos käytät hyväksymättömiä työkaluja, muista että kaikkea, mitä syötät tekoälyjärjestelmään, saatetaan käyttää mallin koulutukseen tai se voi päätyä muiden saataville. Hyvänä käytännön nyrkkisääntönä kohtele vuorovaikutusta Meta AI:n, Grokin (xAI) ja DeepSeekin kanssa täysin julkisena riippumatta siitä, mihin suojausluokkaan jakamasi sisältö kuuluu, ja riippumatta niiden lupaamista yksityisyydensuojakäytännöistä. Näillä työkaluilla on joko sallivat tietosuojakäytännöt, jotka mahdollistavat syötteidesi käytön mallien kouluttamiseen, tai niitä tarjoavat organisaatiot, joiden tietosuojakäytännöt eivät ole riippumattomasti todennettavissa.

Vaikka tutkimusdatasi olisi julkista, julkaisemattomien tutkimusideoiden jakaminen tekoälypalveluille sisältää aina riskin idean päätymisestä muiden käyttöön tai julkiseen internetiin.

6. Tekoälyn käytön ilmoittaminen

Aalto-yliopiston ohjeet tekoälyn vastuulliseen käyttöön tutkimuksessa pohjautuvat ALLEAn Eurooppalainen hyvä tieteellinen käytäntö -ohjeiston neljään periaatteeseen: luotettavuuteen, rehellisyyteen, kunnioitukseen ja vastuullisuuteen. Tieteellisen käsikirjoituksen valmistelussa tekoälyn käytöstä on siksi usein tehtävä ilmoitus.

Mitä pitää ilmoittaa?

Esimerkkinä tässä ovat Elsevierin suositukset (tarkista oman kustantajasi suositukset ennen käsikirjoituksen lähettämistä):

Ilmoitusta ei tarvita: vain kirjoitusvirheiden ja kieliopin korjaaminen
Ilmoitus vaaditaan: kaikenlainen tekstin yhteenveto, koodin generointi, kuvien luonti, analyysimenetelmien ehdottaminen tai minkä tahansa osion luonnostelu
Tekoälyllä tuotetut kuvat: sallittuja vain työnkulun tai menetelmän havainnollistamiseen; ei koskaan tutkimuksen tuloksen kuvina tai numeerisina kuvaajina

Ilmoitusmalli

Kun ilmoitat tekoälyn käytöstä, sisällytä esimerkiksi seuraavanlainen lausuma (Elsevierin esimerkki):

Osion otsikko: Ilmoitus generatiivisen tekoälyn ja tekoälyavusteisten teknologioiden käytöstä käsikirjoituksen valmistelussa
Lausuma: Tämän työn valmistelun aikana kirjoittaja(t) käytti(vät) [TYÖKALUN / PALVELUN NIMI] [MILLÄ TAVALLA]. Työkalun/palvelun käytön jälkeen kirjoittaja(t) tarkasti(vat) ja muokkasi(vat) sisältöä tarvittaessa ja ottaa(ottavat) täyden vastuun julkaistun artikkelin sisällöstä.

7. Käytännön neuvoja

Tässä on joukko käytännön vinkkejä ja tekoälytyökalujen käyttötapauksia tutkimuksessa, satunnaisessa järjestyksessä.

Kehotteiden suunnittelu ei kannata, koska GenAI-mallit ovat ihmistä parempia kirjoittamaan kehotteita. Sen sijaan, että opettelisit kehotteiden suunnittelua tai tallentaisit kirjanmerkkeihin kehotteita, jotka eivät ehkä enää toimi uusien mallien kanssa, voit pyytää tekoälyä kirjoittamaan kehote puolestasi ja huolehtia siitä, että ohjeistat sitä myös esittämään täsmentäviä kysymyksiä ennen kehotteen tuottamista.

Esimerkki 1: Tässä esimerkissä on luottamuksellista tietoa käynnissä olevasta tutkimusprojektista, joten tätä voisi käyttää Aalto AI Assistantissa, ai.aalto.fi:ssä.

Yritän valita, mitä analyysimenetelmää käyttäisin aineistoni kanssa (litteroidut haastattelut suomalaisista yritysten omistajista, haastatteluissa on selvitetty heidän näkemyksiään tekoälyn aiheuttamasta työn vaativuuden alenemisesta). Laadi minulle kehote käytettäväksi [mallin] kanssa. Ennen kuin tuotat kehotteen, esitä minulle muutama kysymys sen tarkentamiseksi.

Esimerkki 2: Aalto AI Assistantilla ei ole pääsyä internetiin, joten se ei voi tehdä hakuja tai tarkistaa kirjallisuutta. Tässä on kehote, joka käyttää Google Geminin "Deep Research" -ominaisuutta, jotta se voi hakea tietoa internetistä. (OpenAI:n ChatGPT:llä ja Anthropicin Claudella on vastaavia ominaisuuksia.) Tämä kehote ei sisällä mitään luottamuksellisia yksityiskohtia:

Olen aivokuvantamistutkija, mutta en tunne genomiikkaa ja aivokuvantamiskirjallisuutta kovin hyvin. Kirjoita minulle kehote käytettäväksi Google Geminin Deep Research -toiminnon kanssa, jotta se kartoittaa viimeisen viiden vuoden olennaista kirjallisuutta ja tunnistaa tärkeät vertaisarvioidut artikkelit, joissa yhdistyvät genetiikka ja aivokuvantaminen. Myös katsausartikkelit tulisi sisällyttää. Ennen kuin tuotat kehotteen, esitä minulle muutama kysymys sen tarkentamiseksi.

Huomio: vaikka Deep Research vaikuttaa ensi käyttökerralla hämmästyttävältä, monet Aallon tutkijat ovat kertoneet, että sillä on tapana sepittää asioita ja raportoida yksityiskohtia, joita ei ole lainkaan mainituissa viitteissä. Suhtaudu Deep Researchiin välineenä, jonka avulla voi löytää osan kirjallisuudesta, mutta lue sen jälkeen varsinaiset artikkelit ja tee tavanomaiset haut artikkelitietokannoista.

Generatiivinen tekoäly on erittäin hyvä kääntämään yhdestä kielestä toiseen, ja yksi hyödyllisimmistä käyttötapauksista on luonnollisen englannin kääntäminen Pythoniksi (tai miksi tahansa ohjelmointikieleksi, jota käytät). CodeRefineryn oppitunnissa “Responsible Use of Generative AI in Assisted Coding” esitellään kolme tapaa työskennellä tekoälyn tuottaman koodin kanssa:

Täysi hallinta — kopioi ja liitä koodi manuaalisesti funktio funktiolta, tarkista jokainen osa ja aja se itse. Pienin riski.
IDE (kehitysympäristö) tekoälylaajennuksella — tekoäly ehdottaa koodia suoraan editorissa: hyväksyt rivin tai lohkon kerrallaan, sinä ajat koodin. Kohtalainen riski.
Täysi agenttitila — sinä vain seuraat vieressä, agentti kirjoittaa ja ajaa koodia itsenäisesti. Suurin riski.

Aloita skenaariosta 1. Siirry skenaarioon 2 vasta, kun olet varma, että osaat arvioida tuotettua koodia. Skenaariosta 3 kerrotaan seuraavassa osiossa.

Tekoälyagentit (erityisesti koodausagentit) aiheuttavat suurempia riskejä, koska ne voivat toimia itsenäisesti. Riskejä ovat erityisesti:

Luotat liikaa: mitä enemmän käytät agenttia, sitä useammin hyväksyt sen ehdotukset ilman, että tarkistat niitä. Käytännöllinen ratkaisu on katselmoida säännöllisesti: tarkista agentin tekemiset omin käsin ennen kuin jatkat seuraavaan vaiheeseen.
Kehoteinjektio: haitallinen ohje, joka on upotettu ulkoiseen tiedostoon (esimerkiksi README-tiedostoon tai aineiston kuvaustiedostoon), voi kaapata agentin toiminnan.

Ennen kuin käytät agentteja yhteisellä laskentainfrastruktuurilla, lue aiheeseen liittyvät ohjeet ja tutustu siellä olevaan riskitaulukkoon. Suurin osa suurteholaskentainfrastruktuureja koskevista riskeistä pätee yhtä lailla henkilökohtaiseen tietokoneeseen.

Ohjeita ja lisätietoja:

Ohjeet Aalto-koodiavustajien käytön aloittamiseen | Aalto-yliopisto

CodeRefineryn coding-with-AI -oppitunti (englanniksi)

Yleinen suositus on käyttää vain Aallon hyväksymiä tekoälytyökaluja, kuten ohjeen Responsible use of Generative Artificial Intelligence in the research process kappaleessa 3 on kerrottu. Tutkijoiden täytyy kuitenkin usein vertailla erilaisia työkaluja tai käyttää uusia ominaisuuksia, joita Aallon hyväksymissä työkaluissa ei vielä ole. Jos sinun täytyy testata ei-hyväksyttyä työkalua, noudata näitä yleisiä suosituksia:

Syötä työkaluun vain täysin julkisia tietoja (mieluiten sellaisia julkisia tietoja, jotka eivät sisällä henkilötietoja).
Varaudu siihen, että työkalun käyttösi on kenen tahansa nähtävissä.
Älä syötä työkaluun julkaisemattomia hypoteeseja, menetelmiä tai tutkimustuloksia.

Joissakin tapauksissa tehtäväsi on hyvin rajattu eikä vaadi generatiivista tekoälyä. Esimerkiksi puheesta tekstiksi -transkriptio voidaan tehdä kokonaan paikallisesti Aallon laskentaympäristössä.

Käännöksiä kielestä toiseen voidaan myös suorittaa paikallisesti. IT-palvelut ja tieteellisen laskennan asiantuntijat kehittävät näitä työkaluja, ja sillä välin voit käyttää Aalto AI Assistantia ja pyytää sitä kääntämään tekstin puolestasi.

Tekoälyä voidaan käyttää kuvien tuottamiseen, mutta koska tutkijalla ei yleisesti ole tekijänoikeuksia puhtaasti tekoälyn tuottamiin kuviin, niitä ei hyväksytä moniin tieteellisiin tarkoituksiin, kuten tieteellisiin julkaisuihin. Tästä huolimatta tällainen työkalu voi olla hyödyllinen tutkijoille visuaalisen aineiston luomisessa. Joitakin hyväksyttäviä tapoja integroida generatiivista tekoälyä tieteelliseen työskentelyyn ovat:

Käsitteellinen kartoitus ja estetiikan tutkiminen

Kun jokin käsite on liian abstrakti tai kun monimutkaisten käsitteiden kääntäminen konkreettisiksi esityksiksi on hankalaa, tutkijat voivat käyttää tekoälyä visualisoidakseen käsitettä. Voit luoda visuaalisia metaforia datalle sekä kokeilla erilaisia väripaletteja, tekstuureja ja esitystyylejä rakentaaksesi yhtenäisen visuaalisen ilmeen tutkimusprojektille tai rahoitushakemukselle.
Useiden variaatioiden luominen yhdestä konseptista

Edellinen kohta käsitteli abstraktien ideoiden tutkimista, kun taas tässä on kyse siitä, miten toteuttaa visuaalisesti jo määritelty konsepti. Tekoäly pystyy tuottamaan täsmälleen saman konseptin lukuisissa eri taidetyyleissä. Voit pyytää sitä luonnostelemaan kuvan, joka on lähellä haluttua estetiikkaa, ja siten testata nopeasti erilaisia sommitteluja, kuvakulmia ja rajauksia. Kun löydät sopivan visuaalisen lähestymistavan, tämä tekoälyn tuottama kuva voi toimia rakenteellisena pohjana tai viiteluonnoksena, jonka voit jäljentää käsin ja luoda oman alkuperäisen vektorigrafiikkasi (esim. Inkscapella tai Illustratorilla).
Nopea kuvageneraattori esityksiä varten

Joskus tiedät tarkalleen, millaisen kuvan haluat, mutta sinulla ei ole riittävästi aikaa sen tekemiseen. Visuaalinen materiaali voi usein ratkaista sen, saatko yleisön huomion, olipa kyseessä ryhmäkokous tai seminaariesitys. Koska tällaiset tuotokset ovat yleensä sisäiseen käyttöön tai tilapäisiin esityksiin, tekijänoikeuden omistaminen ei ole välttämätöntä. Tekoäly soveltuu mainiosti taustagrafiikan, käsitteellisten ikonien tai koriste-elementtien luomiseen esityskalvoja varten.
Skriptaus 3D-mallinnuksen ja renderöinnin automatisointiin

Kuvamallien lisäksi tekoäly soveltuu erinomaisesti skriptien laatimiseen. Voit pyytää laajaa kielimallia, LLM:ää, kirjoittamaan Python-skriptejä Blenderiin (ja vastaaviin), jotta voit ohjelmallisesti luoda tarkkoja geometrioita, asettaa kamerakulmia tai animoida molekyylirakenteita.
Tekstistä diagrammisyntaksiksi

Dokumentaation, koejärjestelyjen ja projektiaikataulujen ylläpito edellyttää selkeitä ja helposti muokattavia kaavioita. LLM-mallit ovat erittäin taitavia muuntamaan tekstikuvauksia diagrammikoodeiksi (esim. Mermaid.js, Graphviz, PlantUML). Tällä lähestymistavalla voit luoda vuokaavioita, diagrammeja ja tiekarttoja koodilla, jota voidaan muokata, versioida Gitin avulla ja renderöidä suoraan markdown-dokumentteihin tai laboratorion muistiinpanoihin.

Laadullinen tutkimus on perinteisesti toteutunut ensisijaisesti tutkijan, aineiston ja tutkimusryhmän kollegoiden välillä. Tällaisessa tutkimuksessa keskeistä ovat tutkijan tulkinnat sekä vastuu pohtia omaa vaikutustaan aineiston tulkintaan. Menetelmällisessä kirjallisuudessa tätä kutsutaan refleksiivisyydeksi, ja sitä on pitkään pidetty laadullisen tutkimuksen ytimessä. Monissa laadullisen tutkimuksen traditioissa analyysilla ei tavoitella yhtä ainoaa absoluuttista totuutta, vaan se koostuu aineiston subjektiivisesta tulkinnasta ja sen käsittelemisestä yhtenä todellisuuden muotona. Tämä subjektiivisuus on olennainen osa analyyttista prosessia ja toimii tutkijalle resurssina (Braun & Clarke, 2019). Se, mitä voidaan pitää perusteltuna tulkintana, riippuu tutkijan omaksumasta tietoteoreettisesta kannasta ja niistä perusteista, joihin tulkinnalliset valinnat pohjautuvat.

Suurten kielimallien (Large Language Models, LLM) pohjalle rakentuva tekoälyjärjestelmä tuo analyyttiseen vuorovaikutukseen mukaan uuden osallistujan, joka tuottaa sanoja ja generoi valtaosan chat-käyttöliittymän kautta syntyvästä tekstistä. Tekoäly ei kuitenkaan toimi yksinkertaisesti täysin itsenäisenä kolmantena osallistujana, koska se ei ole yhtenäinen tai pysyvä toimija, vaan mallit toimivat erilaisten mahdollisten persoonien superpositiona. Jokainen kehote tuottaa vastauksia, joita muovaavat useat kerrostumat, kuten laajaan tekstiaineistoon perustuva esikoulutus, esimerkkikeskusteluihin perustuva hienosäätö sekä ihmispalautteeseen perustuvat säädöt (kuten RLHF), jotka kaikki yhdessä rakentavat tyypillistä avustajapersoonaa. Lisäksi tuotokseen vaikuttavat myös itse kehotus, istunnon konteksti ja muisti.

Koska tutkijat keskustelevat näiden järjestelmien kanssa arkikielellä chatin kautta, he voivat käydä edestakaista vuoropuhelua, joka ajan myötä vaikuttaa heidän ajatteluunsa ja päätöksiinsä. Laadullisesta tulkinnasta tulee helpommin puolustettavissa oleva, kun tutkija pystyy selittämään, miten se on muotoutunut, mutta merkitysten muuttuessa pitkäkestoisen dialogin myötä yhteisrakenteisiksi refleksiivisyyden ylläpitäminen voi olla haastavaa. Mikään tämä ei tee tekoälystä käyttökelvotonta laadullisessa työssä; refleksiivisesti käytettynä se voi auttaa jäsentämään omia ajatuksia, järjestämään aineistoa uudelleen tai testaamaan tulkintaa eri vaihtoehtoihin verrattuna, kunhan tutkija tietoisesti säilyttää toimijuuden tulkintaprosessin ohjauksessa. Seuraavassa on joitakin hyödyllisiä vinkkejä, jotka on hyvä pitää mielessä tehtäessä laadullista analyysia tekoälyjärjestelmän kanssa:

Tee ensin oma tulkintasi. Lue keräämäsi aineisto ja muodosta oma analyyttinen tulkintasi ennen kuin otat tekoälyn mukaan, jotta tulkinta saa alkunsa sinusta.
Kiinnitä huomiota siihen, mitä syötät järjestelmään. Aallon ohjeistus on selkeä siinä, että henkilötietoja sisältävää tutkimusaineistoa ei tule syöttää ulkoisiin tekoälyjärjestelmiin. Suosi Aallon hyväksymiä järjestelmiä ja käsittele myös järjestelmän tuottamaa aineistoa mahdollisesti arkaluonteisena.
Tarkista tekoälyn tuotos aineistoasi vasten ja pidä oma analyysisi erillään. Testaa sen ehdotuksia omaa aineistoasi vasten äläkä pidä niitä neutraalina luentana. Koska järjestelmä tuottaa suurimman osan tekstistä, voit helposti lipsahtaa tilanteeseen, jossa analysoit oman aineistosi sijaan tekoälyn tuotoksia. Tällöin lopputulos ei ole enää sinun omaa tulkintaasi.
Määritä konteksti, josta malli työskentelee. Et voi muuttaa mallin koulutusaineistoa, mutta voit määritellä ohjeistukset, keskusteluhistorian ja sen, mitä järjestelmä muistaa. Käytä näitä tarkoituksenmukaisesti, esimerkiksi saadaksesi mallin haastamaan omaa tulkintaasi aineistosta. Nämä asetukset muokkaavat tuotosta, mutta eivät kontrolloi sitä täysin, joten hyödynnä niitä ajattelun tukena ja ideoiden jäsentämisessä, älä tulkinnallisten päätösten tekemisessä puolestasi.
Säilytä refleksiivisyys molempiin suuntiin pitämällä refleksiivistä muistiota. Kirjaa ylös omat muuttuvat oletuksesi ja positiosi rinnakkain tekoälyn roolin kanssa analyysissa. Kirjoita ylös antamasi kehotteet, tekoälyn antamat ehdotukset sekä se, mitä otit käyttöön tai jätit sivuun ja miksi, jotta jokainen tulkinnallinen valinta voidaan jäljittää omaan päättelyysi.
Säilytä chat-keskustelulokit dokumenttina itse prosessista. Analyyttinen tuotoksesi – olipa se tekstiä, artefakti tai asiakirja – syntyi sinun ja tekoälyn vuorovaikutuksen kautta, riippumatta siitä vastasiko järjestelmä vain chatissa vai toimiko se myös sellaisten työkalujen, tiedostojen ja muiden agenttien kautta, joita et voinut täysin nähdä. Lue keskusteluja uudelleen analyysin edetessä ja kiinnitä huomiota siihen, miten dialogi muovasi ajatteluasi.

Suositeltavaa luettavaa

Braun, V., & Clarke, V. (2019). Reflecting on reflexive thematic analysis. Qualitative Research in Sport, Exercise and Health, 11(4), 589–597. https://doi.org/10.1080/2159676X.2019.1628806

Finlay, L. (2002). Negotiating the swamp: The opportunity and challenge of reflexivity in research practice. Qualitative Research, 2(2), 209–230. https://doi.org/10.1177/146879410200200205

Gulay, E., Picco, E., Glerean, E., & Coupette, C. (2026). Relational dissonance in human-AI interactions: The case of knowledge work. Teoksessa Proceedings of the 2026 CHI Conference on Human Factors in Computing Systems (CHI ’26). ACM. https://doi.org/10.1145/3772318.3791180

Madill, A., Jordan, A., & Shirley, C. (2000). Objectivity and reliability in qualitative analysis: Realist, contextualist and radical constructionist epistemologies. British Journal of Psychology, 91(1), 1–20. https://doi.org/10.1348/000712600161646

8. Kysymyksiä ja vastauksia

Tässä joitakin kysymyksiä, joita on usein noussut esiin tutkimusetiikan kurssilla tai “Tekoäly tutkimustyössä” -työpajoissamme.

V1: Manuaalinen tarkistus on käytännössä ainoa luotettava menetelmä. Työnkulku, jota kuvataan The Lancet -lehdessä (2026):

Jos DOI tai PubMed ID on annettu, tarkista, että se viittaa viitattuun artikkeliin
Jos löydät ristiriidan, merkitse viite tarkistettavaksi
Varmista, ettei kyse ole vain kirjoitusvirheestä tai lyhenteen erilaisesta käytöstä
Hae otsikkoa neljästä tietokannasta: PubMed, Crossref, OpenAlex, Google Scholar

Tekoälypohjaiset tunnistustyökalut eivät ole luotettavia tähän tarkoitukseen.

V2: Horizon Europe on kieltänyt tekoälyn käytön apurahahakemusten arvioinnissa. ICML teki kontrolloidun kokeen LLM-mallien käytöstä vertaisarvioinnissa, jossa saatiin opettavaisia havaintoja sääntörikkomuksista.

V3: Kyllä, kaikkein sinnikkäimpiä tutkijoita ovat ne, jotka osaavat edelleen ajatella huolellisesti silloinkin, kun tekoälyä ei ole saatavilla tai se on väärässä, ja jotka pystyvät aina palaamaan alkuperäisiin lähteisiin (lukevat artikkelit kokonaan, osaavat tarkistaa ohjelmistokirjastojen dokumentaation). Kuten jokainen 7-vuotias sanoisi: kertotaulut kannattaa yhä opetella, vaikka laskimia on olemassa.

A4: Kirjallisuudessa esitetyt havainnot ovat ristiriitaisia. Ohjelmoinnissa, joka on se alue, jolla tekoäly suoriutuu parhaiten, tuottavuuden kasvua voidaan mitata, mutta hinnaksi koituu suurempi määrä vaikeasti ylläpidettävää koodia sekä nopeasti nousevat työkalukustannukset. Laajemmin tutkimuksessa tekoäly voi poistaa joitakin pullonkauloja yksittäisten tutkijoiden työstä, mutta siirtää pullonkaulan vertaisarviointiin, joka muodostaa edelleen ylärajan sille, millä vauhdilla tutkimusta voidaan validoida ja julkaista. Tuottavuuden lisäys, joka tapahtuu arvioinnin laadun kustannuksella, ei ole todellista edistystä tieteen kannalta.

V5: Joidenkin tutkimusten mukaan vaikutukset ympäristöön ovat selviä (yksi esimerkki täällä), mutta toisaalta datakeskukset kertovat käyttävänsä vihreää energiaa ja tavoittelevansa jätteettömyyttä vuoteen 2030 mennessä (katso Microsoft Azure).

Yleisesti ottaen suurten tekoälyjärjestelmien energiakustannukset ovat korkeammat kuin yksinkertaisen, ilman tekoälyä toimivan hakukonehaun suorittaminen. Siis jos kysymykseesi löytyy vastaus tavallisella hakukoneella, kannattaa harkita sen käyttämistä tekoälykeskustelubotin sijaan. Esimerkkejä hyvistä hakukoneista, joissa tekoälytulokset voi kytkeä pois päältä ja jotka ovat myös yksityisyyttä kunnioittavia: https://duckduckgo.com/ , https://www.ecosia.org/

V6: Tieteellinen vapaus on yksi tutkimuksen perusperiaatteista. Sinun ei tulisi koskaan tuntea velvollisuutta käyttää tekoälyä työssäsi, varsinkaan silloin, kun tiedät sen aiheuttavan enemmän haittaa kuin hyötyä. On kuitenkin tärkeää oppia, miten nämä työkalut on rakennettu ja miten ne voivat (tai eivät voi) toimia tutkimuksesi kannalta. Generatiivisen tekoälyn käyttäminen, kun järjestelmä on rakennettu aineistoilla, jotka on kerätty ilman tekijöiden tai oikeudenhaltijoiden nimenomaista suostumusta tai merkittävästi ympäristöä kuormittaen, ei ehkä ole linjassa omien eettisten periaatteidesi kanssa. Harkitse tekoälytyökalujen käyttämistä, kun ne on rakennettu vastuullisesti. Valitettavasti tämä on helpommin sanottu kuin tehty – tehdään töitä tämän eteen yhdessä!

Tutkimusvilppi tarkoittaa Suomessa (ja laajemmin akateemisessa maailmassa) sepittämistä, vääristelyä ja plagiointia. Ellei generatiivista tekoälyä käytetä huolellisesti, siitä voi käytännössä tulla “täydellinen vilppikone”, koska se voi erittäin helposti syyllistyä mihin tahansa näistä kolmesta väärinkäytöksen muodosta. Tutustu riskeihin, jotka on käsitelty ohjeistuksessa.

Sepittäminen

Generatiiviset tekoälyjärjestelmät sepittävät asioita koko ajan, ja näitä sepitteitä kutsutaan usein harhoiksi tai hallusinaatioksi: ne voivat olla uskottavan näköistä tekstiä, viitteitä, tilastoja tai dataa, joita ei todellisuudessa ole olemassa. Vuoden 2026 tutkimus (Topaz et al.) havaitsi, että yli 2800 vertaisarvioitua artikkelia, jotka on julkaistu kahden viime vuoden aikana, sisältää sepitettyjä viittauksia. ArXiv-preprintpalvelu on nyt ottanut käyttöön yhden vuoden julkaisukiellon käsikirjoituksille, jotka sisältävät tekoälyn sepittämiä viitteitä tai muuta kiistatonta tekoälykuraa. Kustantajat ovat ottamassa käyttöön samankaltaisen linjauksen.

Tekoälyn käyttäminen viitteiden muotoilun apuna tai viite-ehdotusten tekemiseen ilman, että jokaista viitettä tarkistetaan käsin, on merkittävä riski. Tämä koskee jopa näennäisen ”turvallisia” muotoilutehtäviä: viitelistaa järjestävä tekoäly voi muuttaa kirjoittajien järjestystä, julkaisuvuotta tai keksiä uuden otsikon tai lehden nimen (tämä on todennäköisempää, jos lista on pitkä). Generatiivinen tekoäly on myös melko huono artikkeleiden tiivistämisessä: se liioittelee tai lisää, poistaa tai muuttaa tuloksia aina sepittämiseen asti (Peters & Chin-Yee 2025).

Vääristely

Tekoälytyökalut eivät päättelyltään toimi kuten ihmiset, vaan ne ennustavat koulutusdatansa perusteella tilastollisesti todennäköisintä seuraavaa merkkiä (tokenia). Tekoälyn käyttäminen tutkimustulosten tuottamiseen tai tulkintaan luo korkean riskin virheellisille johtopäätöksille. Määrällinen ja laadullinen analyysi on tehtävä menetelmillä, jotka tutkija voi luotettavasti validoida ja toistaa. Kun pyydät tekoälyä ehdottamaan sopivaa analyysitapaa, suorita aina keskeiset vaiheet itsenäisesti uudelleen tai varmista ne tunnetulla menetelmällä ennen kuin luotat tulokseen.

Plagiointi

Generatiivinen tekoäly pohjautuu suuriin kielimalleihin (LLM). Ne on koulutettu käytännössä kaikella internetissä saatavilla olevalla ihmistekstillä, äänillä ja kuvilla. Ne tuottavat uutta tekstiä ilmoittamatta lähteitä. Tuoreen tutkimuksen (Ahmed et al 2026) mukaan suuresta kielimallista oli mahdollista löytää lähes sanatarkasti jopa 95 % yhdestä Harry Potter -kirjasta. Vaikka et kopioisi omaan tekstiisi suoraan tekoälyn tuottamaa tekstiä, mutta käytät tekoälyä ideoiden ”sparraajana” ja tämän jälkeen esität idean omanasi, ilman että tarkistat, esiintyykö sama idea jo kirjallisuudessa, saatat syyllistyä plagiointiin.

9. Videoluentoja tekoälystä ja tutkimuksesta

Tämä osio näkyy vain, jos olet kirjautunut sisään. Osiossa on videoita tohtoriopiskelijoiden tutkimusetiikan kurssilta, jonka opettajina ovat Arno Solin (Etiikka tekoälytutkimuksessa), Enrico Glerean (Generatiivinen tekoäly ja tutkimuksen integriteetti) ja Maria Rehbinder (AI-asetus). Valmistelemme MOOC-verkkokurssia, johon sisältyy näiden videoiden lisäksi paljon muutakin. Otathan yhteyttä, jos haluat osallistua MOOCin tekemiseen.

Johtopäätökset

Tekoäly laajenee väistämättä kaikkiin elämämme osa-alueisiin, joten vastuullisia tutkijoita eivät ole ne, jotka välttelevät tekoälyä kokonaan, eivätkä ne, jotka delegoivat sille kaiken. Vastuulliset tutkijat ymmärtävät, miten nämä järjestelmät toimivat ja mitä niille delegoidaan. He osaavat tarkistaa tulokset, pohtia dataan ja lainsäädäntöön liittyviä riskejä, kertoa tekoälyn käytöstä rehellisesti ja säilyttää tutkimuksessa tarvittavat keskeiset inhimilliset taidot: lukemisen, päättelyn, dokumentoinnin, viestinnän ja vastuun kantamisen.

Tämän sivun sisältö perustuu lukuisiin keskusteluihin yli tuhannen tutkijan kanssa vuosina 2024-2026 kursseilla ”AI and Research Work” (Glerean, Silva) [zenodo][youtube], ”Research Ethics for Doctoral Students” (tekoälyaiheet: Glerean, Solin, Rehbinder) sekä CodeRefinery-työpajassa ”Responsible Use of Generative AI in Assisted Coding” (Glerean, CodeRefinery) [materials][youtube]. Haluatko täydentää näitä käytännön ohjeita? Ota yhteyttä Enrico Glereaniin ja Aalto Data Agents -verkostoon (researchdata@aalto.fi). Valmistelemme avointa MOOC-verkkokurssia, joka on saatavilla syyskuusta 2026 alkaen.

Yhteystietoja

Tutkimuksen toistettavuus, vastuunkanto tutkimustulosten oikeellisuudesta, toisten tutkijoiden tekemän työn tunnustaminen ja kunnioittaminen, ja tiedon suojaus.

Palvelut

Suloinen valkoinen AI-robotti kaaviossa, jossa datasyötöt, käsittelykuvakkeet ja vihreät tulossymbolit

Koodiavustajat ovat AI-työkaluja, jotka auttavat kirjoittamaan ohjelmakoodia, arvioimaan sitä ja nopeuttamaan siten kehitysprosesseja.

Palvelut

Aallon tutkijoille, opettajille ja opiskelijoille tarjolla turvallinen tapa rakentaa suuria kielimalleja hyödyntäviä työkaluja

4.6.2026 Uutiset

Opettajalle vinkkejä miten tekoälyn käyttöä opetuksessa voi huomioida

Palvelut

Mustia ympyröitä ja neliöitä, jotka on yhdistetty katkoviivoilla sinisellä taustalla.

Tekoälyjärjestelmät ja niihin liittyvät tekijänoikeuskysymykset.

Palvelut

Päivitetty: 29.6.2026
Julkaistu: 26.6.2026

Tutkimus ja taide

Parhaita käytäntöjä tekoälytyökalujen hyödyntämiseen tutkimuksessa

Tekoäly (AI) ja tutkimustyö

1. Tekoäly tutkimuksessa: mitä tekoäly on?

2. Generatiivisen tekoälyn työkalut tutkimuksen eri vaiheissa

3. Älä sorru tutkimusvilppiin

4. Riskin arviointi: asiantuntijuus × tuotoksen riskitaso -matriisi

5. Tekoälytyökalun valinta: tietojen luokittelu