Tekoälyn vastuullinen käyttö tutkimusprosessin aikana
Tutkimuksen toistettavuus, vastuunkanto tutkimustulosten oikeellisuudesta, toisten tutkijoiden tekemän työn tunnustaminen ja kunnioittaminen, ja tiedon suojaus.
Tekoälytyökaluja, esimerkiksi generatiiviseen tekoälyyn (genAI) perustuvia, käytetään tutkimuksen kaikissa vaiheissa: kirjallisuushausta ohjelmistojen koodaukseen ja käsikirjoitusten editointiin. Tutustu ohjeeseen Generatiivisen tekoälyn vastuullinen käyttö tutkimusprosessissa, jos et ole vielä tehnyt niin. Tämä sivu auttaa tunnistamaan, missä generatiivinen tekoäly voi auttaa, ja samalla tiedostamaan sen riskit liittyen tutkimusetiikkaan ja hyvän tieteelliseen käytännön periaatteisiin.
Tutkimuksen kontekstissa tekoäly voi toimia kolmessa roolissa:
Useimmille tutkijoille - myös niille, jotka eivät tutki tekoälyä aiheena tai käytä sitä menetelmänä - tekoäly on työkalu, jonka he kohtaavat päivittäin. Tämä sivu keskittyy (generatiiviseen) tekoälyyn työkaluna.
Generatiivisen tekoälyn työkalut voivat auttaa tutkimusprosessin jokaisessa vaiheessa:
| Vaihe | Esimerkkejä tekoälyavusta |
|---|---|
| Suunnittelu | Kirjallisuushaku, rahoitushakemusten luonnostelu, tutkimuskysymysten ideointi |
| Aineiston keruu | Kyselyiden suunnittelu, aineiston kokoaminen, simulaatiot |
| Esikäsittely | Datan muokkaaminen, laadunvarmistus, aineiston siivoaminen |
| Analyysi | Analyysikoodin tuottaminen, laadulliset lisämerkinnät eli annotaatiot |
| Säilyttäminen | Dokumentointi, README-tiedostojen luonti, metadata |
| Jakaminen | Käsikirjoituksen luonnostelu, lehdistötiedotteet, sosiaalisen median julkaisut |
| Uudelleenkäyttö | Koodin dokumentointi, aineistokuvaukset |
Jokaiseen käyttötilanteeseen liittyy riskejä. Mikään tehtävä ei ole tekoälylle aina sopiva tai epäsopiva, vaan se riippuu kontekstista ja tekoälytyökalun käyttäjästä. Vastuullisena tutkijana tehtäväsi on arvioida riskit ennen kuin päätät jatkaa tekoälyn hyödyntämistä. Jos olet epävarma, voit keskustella asiasta kollegoiden kanssa (esim. data-asiantuntijoiden kanssa osoitteessa researchdata@aalto.fi) tai yksinkertaisesti välttää tekoälyn käyttöä kyseisessä tehtävässä.
Ellei generatiivista tekoälyä käytetä huolellisesti, se voi erittäin helposti syyllistyä mihin tahansa näistä tieteellisen vilpin muodosta:
Riskejä kuvataan tarkemmin täällä sekä ohjeistuksessa Tekoälyn vastuullinen käyttö tutkimusprosessin aikana.
Eri tilanteissa on erilaiset riskit. Jos olet epävarma, voit pohtia kahta tekijää arvioidaksesi, kuinka varovainen sinun tulisi olla:
| Vähän asiantuntemusta | Paljon asiantuntemusta | |
|---|---|---|
| Korkea riski (tieteellinen julkaisu: teksti, koodi, kuvat, viitteet) | Käytä tekoälyä vain ideoiden pallotteluun: kysy, mitä lähteitä kannattaisi lukea, pyydä avainsanaehdotuksia ja käy sitten itse lukemassa varsinaiset lähteet. Esimerkki: etsi sopivia avainsanoja tai kysy, mitkä tilastolliset menetelmät voisivat sopia aineistoosi, ja käy sen jälkeen lukemassa niistä itse. |
Käytä tekoälyä yksinkertaisiin tehtävänantoihin, jotka pystyt tarkistamaan kokonaan. Tarkista tulos yhtä huolellisesti kuin jos olisit kirjoittanut sen itse alusta asti. Yliluottamus on tässä kohtaa erityisen vaarallista. Esimerkkejä: lyhyiden koodinpätkien generoiminen funktio kerrallaan. Tekstin muokkaus: pyydä tekoälyä merkitsemään ehdottamansa muutokset lihavoinnilla, jotta voit itse päättää, mitkä muutokset otat mukaan lopulliseen tekstiin. |
| Matala riski (tapahtuman verkkosivu, some-päivitys, esitykset) | Käytä tekoälyä, mutta hyväksy se, että virheitä voi lipsahtaa läpi. Esimerkki: CSS-työkalun käyttö työpajan verkkosivulla tai pienen demon vibe-koodaus. |
Delegoi suurin osa työstä tekoälylle. Varmista, että tuotos on järkevä. Esimerkki: laatimasi ohjelmakoodin dokumentointi tai esityksen luonnosversion tekeminen omien äänitystesi litteroinnista. |
(lähde: Glerean, 2026, ”AI and research work”, valmisteilla)
Huomio 1: Aineistosi arkaluonteisuus nostaa riskitasoa. Luottamuksellisten aineistojen tai henkilötietojen kanssa sinun täytyy kiinnittää huomiota paitsi siihen, miten käytät työkaluja, myös siihen, mitä työkaluja käytät.
Huomio 2: Erityistapaus, joka ulottuu eri riskitasojen yli, liittyy generoituun ohjelmakoodiin silloin, kun haluttu toiminnallisuus voidaan muotoilla automatisoitujen yksikkötestien avulla, testit on määritelty hyvin ja ne kattavat koodin kannalta oleellisen käyttäytymisen. Tämä voi pienentää riskitasoa, mutta siirtää laatuvaatimuksia itse testeihin.
Huomio 3: Kaikki tapaukset eivät istu tähän 2×2-matriisiin. Sinä olet viime kädessä vastuussa ja arvioit, onko tekoälyn käyttö tilanteessa tarkoituksenmukaista.
Käyttämäsi tekoälytyökalu tulisi valita sen mukaan, miten arkaluonteista tai julkista tieto on, jota käytät.
Ohjeemme (kappale 3 datan arkaluontoisuudesta) edellyttävät Aalto AI Assistantin käyttöä kaikissa käyttötapauksissa, joissa data ei ole täysin julkista. Alla oleva taulukko yhdistää Aallon neljä tiedon suojaustasoa sopiviin tekoälytyökaluihin.
| Taso | Esimerkkejä datasta | Tekoälytyökalu |
|---|---|---|
| Julkinen | Wikipedia-sisältö, CC-lisensoidut julkaistut artikkelit, julkinen data | Mikä tahansa tekoälytyökalu käy |
| Sisäinen | Muistiot kokouksista, kuluraportit, yliopiston sisäiset sivut | Suosi organisaation omia työkaluja kuten Aalto AI Assistant |
| Luottamuksellinen | Tutkimukseen osallistujien data, julkaisemattomat tutkimustulokset | Käytä vain työkaluja, joilla on sopimukseen perustuva tietosuojatakuu (kuten Aalto AI Assistant), tai aja tekoälymalleja paikallisesti (esim. Triton-klusterilla) |
| Salainen | Data, jonka vuoto aiheuttaisi vakavaa vahinkoa (esim. potilastiedot) | Ei pilvipohjaisia tekoälytyökaluja. Käytä vain paikallisia työkaluja luotetussa tutkimusympäristössä (Trusted Research Environment) kuten SECDATA |
Jos käytät hyväksymättömiä työkaluja, muista että kaikkea, mitä syötät tekoälyjärjestelmään, saatetaan käyttää mallin koulutukseen tai se voi päätyä muiden saataville. Hyvänä käytännön nyrkkisääntönä kohtele vuorovaikutusta Meta AI:n, Grokin (xAI) ja DeepSeekin kanssa täysin julkisena riippumatta siitä, mihin suojausluokkaan jakamasi sisältö kuuluu, ja riippumatta niiden lupaamista yksityisyydensuojakäytännöistä. Näillä työkaluilla on joko sallivat tietosuojakäytännöt, jotka mahdollistavat syötteidesi käytön mallien kouluttamiseen, tai niitä tarjoavat organisaatiot, joiden tietosuojakäytännöt eivät ole riippumattomasti todennettavissa.
Vaikka tutkimusdatasi olisi julkista, julkaisemattomien tutkimusideoiden jakaminen tekoälypalveluille sisältää aina riskin idean päätymisestä muiden käyttöön tai julkiseen internetiin.
Aalto-yliopiston ohjeet tekoälyn vastuulliseen käyttöön tutkimuksessa pohjautuvat ALLEAn Eurooppalainen hyvä tieteellinen käytäntö -ohjeiston neljään periaatteeseen: luotettavuuteen, rehellisyyteen, kunnioitukseen ja vastuullisuuteen. Tieteellisen käsikirjoituksen valmistelussa tekoälyn käytöstä on siksi usein tehtävä ilmoitus.
Esimerkkinä tässä ovat Elsevierin suositukset (tarkista oman kustantajasi suositukset ennen käsikirjoituksen lähettämistä):
Kun ilmoitat tekoälyn käytöstä, sisällytä esimerkiksi seuraavanlainen lausuma (Elsevierin esimerkki):
Tässä on joukko käytännön vinkkejä ja tekoälytyökalujen käyttötapauksia tutkimuksessa, satunnaisessa järjestyksessä.
Kehotteiden suunnittelu ei kannata, koska GenAI-mallit ovat ihmistä parempia kirjoittamaan kehotteita. Sen sijaan, että opettelisit kehotteiden suunnittelua tai tallentaisit kirjanmerkkeihin kehotteita, jotka eivät ehkä enää toimi uusien mallien kanssa, voit pyytää tekoälyä kirjoittamaan kehote puolestasi ja huolehtia siitä, että ohjeistat sitä myös esittämään täsmentäviä kysymyksiä ennen kehotteen tuottamista.
Esimerkki 1: Tässä esimerkissä on luottamuksellista tietoa käynnissä olevasta tutkimusprojektista, joten tätä voisi käyttää Aalto AI Assistantissa, ai.aalto.fi:ssä.
Yritän valita, mitä analyysimenetelmää käyttäisin aineistoni kanssa (litteroidut haastattelut suomalaisista yritysten omistajista, haastatteluissa on selvitetty heidän näkemyksiään tekoälyn aiheuttamasta työn vaativuuden alenemisesta). Laadi minulle kehote käytettäväksi [mallin] kanssa. Ennen kuin tuotat kehotteen, esitä minulle muutama kysymys sen tarkentamiseksi.
Esimerkki 2: Aalto AI Assistantilla ei ole pääsyä internetiin, joten se ei voi tehdä hakuja tai tarkistaa kirjallisuutta. Tässä on kehote, joka käyttää Google Geminin "Deep Research" -ominaisuutta, jotta se voi hakea tietoa internetistä. (OpenAI:n ChatGPT:llä ja Anthropicin Claudella on vastaavia ominaisuuksia.) Tämä kehote ei sisällä mitään luottamuksellisia yksityiskohtia:
Olen aivokuvantamistutkija, mutta en tunne genomiikkaa ja aivokuvantamiskirjallisuutta kovin hyvin. Kirjoita minulle kehote käytettäväksi Google Geminin Deep Research -toiminnon kanssa, jotta se kartoittaa viimeisen viiden vuoden olennaista kirjallisuutta ja tunnistaa tärkeät vertaisarvioidut artikkelit, joissa yhdistyvät genetiikka ja aivokuvantaminen. Myös katsausartikkelit tulisi sisällyttää. Ennen kuin tuotat kehotteen, esitä minulle muutama kysymys sen tarkentamiseksi.
Huomio: vaikka Deep Research vaikuttaa ensi käyttökerralla hämmästyttävältä, monet Aallon tutkijat ovat kertoneet, että sillä on tapana sepittää asioita ja raportoida yksityiskohtia, joita ei ole lainkaan mainituissa viitteissä. Suhtaudu Deep Researchiin välineenä, jonka avulla voi löytää osan kirjallisuudesta, mutta lue sen jälkeen varsinaiset artikkelit ja tee tavanomaiset haut artikkelitietokannoista.
Generatiivinen tekoäly on erittäin hyvä kääntämään yhdestä kielestä toiseen, ja yksi hyödyllisimmistä käyttötapauksista on luonnollisen englannin kääntäminen Pythoniksi (tai miksi tahansa ohjelmointikieleksi, jota käytät). CodeRefineryn oppitunnissa “Responsible Use of Generative AI in Assisted Coding” esitellään kolme tapaa työskennellä tekoälyn tuottaman koodin kanssa:
Aloita skenaariosta 1. Siirry skenaarioon 2 vasta, kun olet varma, että osaat arvioida tuotettua koodia. Skenaariosta 3 kerrotaan seuraavassa osiossa.
Tekoälyagentit (erityisesti koodausagentit) aiheuttavat suurempia riskejä, koska ne voivat toimia itsenäisesti. Riskejä ovat erityisesti:
Ennen kuin käytät agentteja yhteisellä laskentainfrastruktuurilla, lue aiheeseen liittyvät ohjeet ja tutustu siellä olevaan riskitaulukkoon. Suurin osa suurteholaskentainfrastruktuureja koskevista riskeistä pätee yhtä lailla henkilökohtaiseen tietokoneeseen.
Ohjeet Aalto-koodiavustajien käytön aloittamiseen | Aalto-yliopisto
Yleinen suositus on käyttää vain Aallon hyväksymiä tekoälytyökaluja, kuten ohjeen Responsible use of Generative Artificial Intelligence in the research process kappaleessa 3 on kerrottu. Tutkijoiden täytyy kuitenkin usein vertailla erilaisia työkaluja tai käyttää uusia ominaisuuksia, joita Aallon hyväksymissä työkaluissa ei vielä ole. Jos sinun täytyy testata ei-hyväksyttyä työkalua, noudata näitä yleisiä suosituksia:
Joissakin tapauksissa tehtäväsi on hyvin rajattu eikä vaadi generatiivista tekoälyä. Esimerkiksi puheesta tekstiksi -transkriptio voidaan tehdä kokonaan paikallisesti Aallon laskentaympäristössä.
Käännöksiä kielestä toiseen voidaan myös suorittaa paikallisesti. IT-palvelut ja tieteellisen laskennan asiantuntijat kehittävät näitä työkaluja, ja sillä välin voit käyttää Aalto AI Assistantia ja pyytää sitä kääntämään tekstin puolestasi.
Tekoälyä voidaan käyttää kuvien tuottamiseen, mutta koska tutkijalla ei yleisesti ole tekijänoikeuksia puhtaasti tekoälyn tuottamiin kuviin, niitä ei hyväksytä moniin tieteellisiin tarkoituksiin, kuten tieteellisiin julkaisuihin. Tästä huolimatta tällainen työkalu voi olla hyödyllinen tutkijoille visuaalisen aineiston luomisessa. Joitakin hyväksyttäviä tapoja integroida generatiivista tekoälyä tieteelliseen työskentelyyn ovat:
Käsitteellinen kartoitus ja estetiikan tutkiminen
Kun jokin käsite on liian abstrakti tai kun monimutkaisten käsitteiden kääntäminen konkreettisiksi esityksiksi on hankalaa, tutkijat voivat käyttää tekoälyä visualisoidakseen käsitettä. Voit luoda visuaalisia metaforia datalle sekä kokeilla erilaisia väripaletteja, tekstuureja ja esitystyylejä rakentaaksesi yhtenäisen visuaalisen ilmeen tutkimusprojektille tai rahoitushakemukselle.
Useiden variaatioiden luominen yhdestä konseptista
Edellinen kohta käsitteli abstraktien ideoiden tutkimista, kun taas tässä on kyse siitä, miten toteuttaa visuaalisesti jo määritelty konsepti. Tekoäly pystyy tuottamaan täsmälleen saman konseptin lukuisissa eri taidetyyleissä. Voit pyytää sitä luonnostelemaan kuvan, joka on lähellä haluttua estetiikkaa, ja siten testata nopeasti erilaisia sommitteluja, kuvakulmia ja rajauksia. Kun löydät sopivan visuaalisen lähestymistavan, tämä tekoälyn tuottama kuva voi toimia rakenteellisena pohjana tai viiteluonnoksena, jonka voit jäljentää käsin ja luoda oman alkuperäisen vektorigrafiikkasi (esim. Inkscapella tai Illustratorilla).
Nopea kuvageneraattori esityksiä varten
Joskus tiedät tarkalleen, millaisen kuvan haluat, mutta sinulla ei ole riittävästi aikaa sen tekemiseen. Visuaalinen materiaali voi usein ratkaista sen, saatko yleisön huomion, olipa kyseessä ryhmäkokous tai seminaariesitys. Koska tällaiset tuotokset ovat yleensä sisäiseen käyttöön tai tilapäisiin esityksiin, tekijänoikeuden omistaminen ei ole välttämätöntä. Tekoäly soveltuu mainiosti taustagrafiikan, käsitteellisten ikonien tai koriste-elementtien luomiseen esityskalvoja varten.
Skriptaus 3D-mallinnuksen ja renderöinnin automatisointiin
Kuvamallien lisäksi tekoäly soveltuu erinomaisesti skriptien laatimiseen. Voit pyytää laajaa kielimallia, LLM:ää, kirjoittamaan Python-skriptejä Blenderiin (ja vastaaviin), jotta voit ohjelmallisesti luoda tarkkoja geometrioita, asettaa kamerakulmia tai animoida molekyylirakenteita.
Tekstistä diagrammisyntaksiksi
Dokumentaation, koejärjestelyjen ja projektiaikataulujen ylläpito edellyttää selkeitä ja helposti muokattavia kaavioita. LLM-mallit ovat erittäin taitavia muuntamaan tekstikuvauksia diagrammikoodeiksi (esim. Mermaid.js, Graphviz, PlantUML). Tällä lähestymistavalla voit luoda vuokaavioita, diagrammeja ja tiekarttoja koodilla, jota voidaan muokata, versioida Gitin avulla ja renderöidä suoraan markdown-dokumentteihin tai laboratorion muistiinpanoihin.
Laadullinen tutkimus on perinteisesti toteutunut ensisijaisesti tutkijan, aineiston ja tutkimusryhmän kollegoiden välillä. Tällaisessa tutkimuksessa keskeistä ovat tutkijan tulkinnat sekä vastuu pohtia omaa vaikutustaan aineiston tulkintaan. Menetelmällisessä kirjallisuudessa tätä kutsutaan refleksiivisyydeksi, ja sitä on pitkään pidetty laadullisen tutkimuksen ytimessä. Monissa laadullisen tutkimuksen traditioissa analyysilla ei tavoitella yhtä ainoaa absoluuttista totuutta, vaan se koostuu aineiston subjektiivisesta tulkinnasta ja sen käsittelemisestä yhtenä todellisuuden muotona. Tämä subjektiivisuus on olennainen osa analyyttista prosessia ja toimii tutkijalle resurssina (Braun & Clarke, 2019). Se, mitä voidaan pitää perusteltuna tulkintana, riippuu tutkijan omaksumasta tietoteoreettisesta kannasta ja niistä perusteista, joihin tulkinnalliset valinnat pohjautuvat.
Suurten kielimallien (Large Language Models, LLM) pohjalle rakentuva tekoälyjärjestelmä tuo analyyttiseen vuorovaikutukseen mukaan uuden osallistujan, joka tuottaa sanoja ja generoi valtaosan chat-käyttöliittymän kautta syntyvästä tekstistä. Tekoäly ei kuitenkaan toimi yksinkertaisesti täysin itsenäisenä kolmantena osallistujana, koska se ei ole yhtenäinen tai pysyvä toimija, vaan mallit toimivat erilaisten mahdollisten persoonien superpositiona. Jokainen kehote tuottaa vastauksia, joita muovaavat useat kerrostumat, kuten laajaan tekstiaineistoon perustuva esikoulutus, esimerkkikeskusteluihin perustuva hienosäätö sekä ihmispalautteeseen perustuvat säädöt (kuten RLHF), jotka kaikki yhdessä rakentavat tyypillistä avustajapersoonaa. Lisäksi tuotokseen vaikuttavat myös itse kehotus, istunnon konteksti ja muisti.
Koska tutkijat keskustelevat näiden järjestelmien kanssa arkikielellä chatin kautta, he voivat käydä edestakaista vuoropuhelua, joka ajan myötä vaikuttaa heidän ajatteluunsa ja päätöksiinsä. Laadullisesta tulkinnasta tulee helpommin puolustettavissa oleva, kun tutkija pystyy selittämään, miten se on muotoutunut, mutta merkitysten muuttuessa pitkäkestoisen dialogin myötä yhteisrakenteisiksi refleksiivisyyden ylläpitäminen voi olla haastavaa. Mikään tämä ei tee tekoälystä käyttökelvotonta laadullisessa työssä; refleksiivisesti käytettynä se voi auttaa jäsentämään omia ajatuksia, järjestämään aineistoa uudelleen tai testaamaan tulkintaa eri vaihtoehtoihin verrattuna, kunhan tutkija tietoisesti säilyttää toimijuuden tulkintaprosessin ohjauksessa. Seuraavassa on joitakin hyödyllisiä vinkkejä, jotka on hyvä pitää mielessä tehtäessä laadullista analyysia tekoälyjärjestelmän kanssa:
Braun, V., & Clarke, V. (2019). Reflecting on reflexive thematic analysis. Qualitative Research in Sport, Exercise and Health, 11(4), 589–597. https://doi.org/10.1080/2159676X.2019.1628806
Finlay, L. (2002). Negotiating the swamp: The opportunity and challenge of reflexivity in research practice. Qualitative Research, 2(2), 209–230. https://doi.org/10.1177/146879410200200205
Gulay, E., Picco, E., Glerean, E., & Coupette, C. (2026). Relational dissonance in human-AI interactions: The case of knowledge work. Teoksessa Proceedings of the 2026 CHI Conference on Human Factors in Computing Systems (CHI ’26). ACM. https://doi.org/10.1145/3772318.3791180
Madill, A., Jordan, A., & Shirley, C. (2000). Objectivity and reliability in qualitative analysis: Realist, contextualist and radical constructionist epistemologies. British Journal of Psychology, 91(1), 1–20. https://doi.org/10.1348/000712600161646
Tässä joitakin kysymyksiä, joita on usein noussut esiin tutkimusetiikan kurssilla tai “Tekoäly tutkimustyössä” -työpajoissamme.
V1: Manuaalinen tarkistus on käytännössä ainoa luotettava menetelmä. Työnkulku, jota kuvataan The Lancet -lehdessä (2026):
Tekoälypohjaiset tunnistustyökalut eivät ole luotettavia tähän tarkoitukseen.
V2: Horizon Europe on kieltänyt tekoälyn käytön apurahahakemusten arvioinnissa. ICML teki kontrolloidun kokeen LLM-mallien käytöstä vertaisarvioinnissa, jossa saatiin opettavaisia havaintoja sääntörikkomuksista.
V3: Kyllä, kaikkein sinnikkäimpiä tutkijoita ovat ne, jotka osaavat edelleen ajatella huolellisesti silloinkin, kun tekoälyä ei ole saatavilla tai se on väärässä, ja jotka pystyvät aina palaamaan alkuperäisiin lähteisiin (lukevat artikkelit kokonaan, osaavat tarkistaa ohjelmistokirjastojen dokumentaation). Kuten jokainen 7-vuotias sanoisi: kertotaulut kannattaa yhä opetella, vaikka laskimia on olemassa.
A4: Kirjallisuudessa esitetyt havainnot ovat ristiriitaisia. Ohjelmoinnissa, joka on se alue, jolla tekoäly suoriutuu parhaiten, tuottavuuden kasvua voidaan mitata, mutta hinnaksi koituu suurempi määrä vaikeasti ylläpidettävää koodia sekä nopeasti nousevat työkalukustannukset. Laajemmin tutkimuksessa tekoäly voi poistaa joitakin pullonkauloja yksittäisten tutkijoiden työstä, mutta siirtää pullonkaulan vertaisarviointiin, joka muodostaa edelleen ylärajan sille, millä vauhdilla tutkimusta voidaan validoida ja julkaista. Tuottavuuden lisäys, joka tapahtuu arvioinnin laadun kustannuksella, ei ole todellista edistystä tieteen kannalta.
V5: Joidenkin tutkimusten mukaan vaikutukset ympäristöön ovat selviä (yksi esimerkki täällä), mutta toisaalta datakeskukset kertovat käyttävänsä vihreää energiaa ja tavoittelevansa jätteettömyyttä vuoteen 2030 mennessä (katso Microsoft Azure).
Yleisesti ottaen suurten tekoälyjärjestelmien energiakustannukset ovat korkeammat kuin yksinkertaisen, ilman tekoälyä toimivan hakukonehaun suorittaminen. Siis jos kysymykseesi löytyy vastaus tavallisella hakukoneella, kannattaa harkita sen käyttämistä tekoälykeskustelubotin sijaan. Esimerkkejä hyvistä hakukoneista, joissa tekoälytulokset voi kytkeä pois päältä ja jotka ovat myös yksityisyyttä kunnioittavia: https://duckduckgo.com/ , https://www.ecosia.org/
V6: Tieteellinen vapaus on yksi tutkimuksen perusperiaatteista. Sinun ei tulisi koskaan tuntea velvollisuutta käyttää tekoälyä työssäsi, varsinkaan silloin, kun tiedät sen aiheuttavan enemmän haittaa kuin hyötyä. On kuitenkin tärkeää oppia, miten nämä työkalut on rakennettu ja miten ne voivat (tai eivät voi) toimia tutkimuksesi kannalta. Generatiivisen tekoälyn käyttäminen, kun järjestelmä on rakennettu aineistoilla, jotka on kerätty ilman tekijöiden tai oikeudenhaltijoiden nimenomaista suostumusta tai merkittävästi ympäristöä kuormittaen, ei ehkä ole linjassa omien eettisten periaatteidesi kanssa. Harkitse tekoälytyökalujen käyttämistä, kun ne on rakennettu vastuullisesti. Valitettavasti tämä on helpommin sanottu kuin tehty – tehdään töitä tämän eteen yhdessä!
Tutkimusvilppi tarkoittaa Suomessa (ja laajemmin akateemisessa maailmassa) sepittämistä, vääristelyä ja plagiointia. Ellei generatiivista tekoälyä käytetä huolellisesti, siitä voi käytännössä tulla “täydellinen vilppikone”, koska se voi erittäin helposti syyllistyä mihin tahansa näistä kolmesta väärinkäytöksen muodosta. Tutustu riskeihin, jotka on käsitelty ohjeistuksessa.
Generatiiviset tekoälyjärjestelmät sepittävät asioita koko ajan, ja näitä sepitteitä kutsutaan usein harhoiksi tai hallusinaatioksi: ne voivat olla uskottavan näköistä tekstiä, viitteitä, tilastoja tai dataa, joita ei todellisuudessa ole olemassa. Vuoden 2026 tutkimus (Topaz et al.) havaitsi, että yli 2800 vertaisarvioitua artikkelia, jotka on julkaistu kahden viime vuoden aikana, sisältää sepitettyjä viittauksia. ArXiv-preprintpalvelu on nyt ottanut käyttöön yhden vuoden julkaisukiellon käsikirjoituksille, jotka sisältävät tekoälyn sepittämiä viitteitä tai muuta kiistatonta tekoälykuraa. Kustantajat ovat ottamassa käyttöön samankaltaisen linjauksen.
Tekoälyn käyttäminen viitteiden muotoilun apuna tai viite-ehdotusten tekemiseen ilman, että jokaista viitettä tarkistetaan käsin, on merkittävä riski. Tämä koskee jopa näennäisen ”turvallisia” muotoilutehtäviä: viitelistaa järjestävä tekoäly voi muuttaa kirjoittajien järjestystä, julkaisuvuotta tai keksiä uuden otsikon tai lehden nimen (tämä on todennäköisempää, jos lista on pitkä). Generatiivinen tekoäly on myös melko huono artikkeleiden tiivistämisessä: se liioittelee tai lisää, poistaa tai muuttaa tuloksia aina sepittämiseen asti (Peters & Chin-Yee 2025).
Tekoälytyökalut eivät päättelyltään toimi kuten ihmiset, vaan ne ennustavat koulutusdatansa perusteella tilastollisesti todennäköisintä seuraavaa merkkiä (tokenia). Tekoälyn käyttäminen tutkimustulosten tuottamiseen tai tulkintaan luo korkean riskin virheellisille johtopäätöksille. Määrällinen ja laadullinen analyysi on tehtävä menetelmillä, jotka tutkija voi luotettavasti validoida ja toistaa. Kun pyydät tekoälyä ehdottamaan sopivaa analyysitapaa, suorita aina keskeiset vaiheet itsenäisesti uudelleen tai varmista ne tunnetulla menetelmällä ennen kuin luotat tulokseen.
Generatiivinen tekoäly pohjautuu suuriin kielimalleihin (LLM). Ne on koulutettu käytännössä kaikella internetissä saatavilla olevalla ihmistekstillä, äänillä ja kuvilla. Ne tuottavat uutta tekstiä ilmoittamatta lähteitä. Tuoreen tutkimuksen (Ahmed et al 2026) mukaan suuresta kielimallista oli mahdollista löytää lähes sanatarkasti jopa 95 % yhdestä Harry Potter -kirjasta. Vaikka et kopioisi omaan tekstiisi suoraan tekoälyn tuottamaa tekstiä, mutta käytät tekoälyä ideoiden ”sparraajana” ja tämän jälkeen esität idean omanasi, ilman että tarkistat, esiintyykö sama idea jo kirjallisuudessa, saatat syyllistyä plagiointiin.
Tämä osio näkyy vain, jos olet kirjautunut sisään. Osiossa on videoita tohtoriopiskelijoiden tutkimusetiikan kurssilta, jonka opettajina ovat Arno Solin (Etiikka tekoälytutkimuksessa), Enrico Glerean (Generatiivinen tekoäly ja tutkimuksen integriteetti) ja Maria Rehbinder (AI-asetus). Valmistelemme MOOC-verkkokurssia, johon sisältyy näiden videoiden lisäksi paljon muutakin. Otathan yhteyttä, jos haluat osallistua MOOCin tekemiseen.
Tekoäly laajenee väistämättä kaikkiin elämämme osa-alueisiin, joten vastuullisia tutkijoita eivät ole ne, jotka välttelevät tekoälyä kokonaan, eivätkä ne, jotka delegoivat sille kaiken. Vastuulliset tutkijat ymmärtävät, miten nämä järjestelmät toimivat ja mitä niille delegoidaan. He osaavat tarkistaa tulokset, pohtia dataan ja lainsäädäntöön liittyviä riskejä, kertoa tekoälyn käytöstä rehellisesti ja säilyttää tutkimuksessa tarvittavat keskeiset inhimilliset taidot: lukemisen, päättelyn, dokumentoinnin, viestinnän ja vastuun kantamisen.
Tämän sivun sisältö perustuu lukuisiin keskusteluihin yli tuhannen tutkijan kanssa vuosina 2024-2026 kursseilla ”AI and Research Work” (Glerean, Silva) [zenodo][youtube], ”Research Ethics for Doctoral Students” (tekoälyaiheet: Glerean, Solin, Rehbinder) sekä CodeRefinery-työpajassa ”Responsible Use of Generative AI in Assisted Coding” (Glerean, CodeRefinery) [materials][youtube]. Haluatko täydentää näitä käytännön ohjeita? Ota yhteyttä Enrico Glereaniin ja Aalto Data Agents -verkostoon (researchdata@aalto.fi). Valmistelemme avointa MOOC-verkkokurssia, joka on saatavilla syyskuusta 2026 alkaen.
Tutkimuksen toistettavuus, vastuunkanto tutkimustulosten oikeellisuudesta, toisten tutkijoiden tekemän työn tunnustaminen ja kunnioittaminen, ja tiedon suojaus.
Koodiavustajat ovat AI-työkaluja, jotka auttavat kirjoittamaan ohjelmakoodia, arvioimaan sitä ja nopeuttamaan siten kehitysprosesseja.
Aallon tutkijoille, opettajille ja opiskelijoille tarjolla turvallinen tapa rakentaa suuria kielimalleja hyödyntäviä työkaluja
Opettajalle vinkkejä miten tekoälyn käyttöä opetuksessa voi huomioida
Tekoälyjärjestelmät ja niihin liittyvät tekijänoikeuskysymykset.