Computing education research and educational technology
Psychology and education.
Suuriin kielimalleihin pohjautuva generatiivinen tekoäly löi itsensä kuluttajien mielikuvituksiin viimeistään vuoden 2022 aikana. Suurimman jäljen jätti DALL-E 2, jonka avulla tuotetut kuvat hehkuivat ihmismäistä luovuutta.
Samalla kun koneiden luoma taide ruokkii ihmisten mielikuvitusta, taustalla kytee myös toisenlainen muutos. Kesäkuussa 2022 maailman suurin lähdekoodien hallintajärjestelmä GitHub julkaisi Copilot-nimisen tekoälyavusteisen ohjelmointityökalun, joka on suunniteltu automatisoimaan toistuvat ja tylsät koodaustehtävät. Copilot on opetettu 45 terabitillä koodausdataa suoraan GitHubin koodivarastoista ja se pohjautuu OpenAI:n Codex-mallille. GitHubin mukaan työkalun avulla voi automatisoida jopa 40 prosenttia ohjelmointitehtävistä.
”Työkalussa on valtava potentiaali, mutta siihen sisältyy myös liiallisen luottamuksen riski, jos ohjelman tuottamia koodeja ei tarkasteta asianmukaisesti”, kertoo Juho Leinonen, tutkijatohtori Aalto-yliopiston tietotekniikan laitokselta, joka tutkii koulutusteknologiaa ja koneoppimista koulutuksessa. ”Riski on erityisen korkea opiskelijoiden keskuudessa.”
Copilot maksaa käyttäjille kymmenen euroa kuussa, mutta opiskelijoille se on ilmainen. Hintapolitiikka on herättänyt huolta huijaamisen yleistymisestä ohjelmointikursseilla.
”Keskeinen kysymys on, että miten tietotekniikan opetusta muutetaan näiden työkalujen yleistymisen myötä”, Leinonen pohtii. ”Tämä on vasta alkua.”
Leinonen ja hänen kollegansa tarttuivat haasteeseen ja lähestyivät kysymystä opettajan näkökulmasta tutkimusartikkelissaan, joka käsitteli Codexia.
”Selvitimme miten opettajat voivat käyttää Codexia tuottaakseen uusia ohjelmointitehtäviä sekä luonnollisen kielen selityksiä koodille”, kertoo Arto Hellas, vanhempi yliopistonlehtori Aalto-yliopiston tietotekniikan laitokselta. ”Pienistä stipluista huolimatta tutkimuksemme osoitti, että Codexilla on huikeat mahdollisuudet tuottaa uusia harjoituksia ja luonnollisen kielen selityksiä tehtäville. Onnistuimme myös generoimaan harjoituksia jostain nimetystä teemasta, kuten koripallosta.”
Aloittelijoiden ja opiskelijoiden keskuudessa ohjelmointiharjoitusten tarve on valtava. Harjoitusten ja tehtävien selitysten automatisoinnista olisi valtava apu opettajille. Tutkimusartikkelille myönnettiin parhaan artikkelin palkinto ICER 2022 -konferenssissa, joka on eräs tietoteknisen opetuksen keskeisistä akateemisista konferensseista.
”Vaikka ihmisen pitää vielä tarkastaa Codexin tuottamat harjoitukset ja selitykset, niin sen suorituskyky ylitti silti tutkijayhteisön odotukset”, kertoo Leinonen. ”Alamme tutkijat ja opettajat tuntuvat olevan innoissaan näiden uusien työkalujen tarjoamista mahdollisuuksista, mutta myös huolestuneita niiden tuottamien haasteiden vuoksi.”
Tutkimus ei mennyt myöskään GitHubilta ohi. Se päätti tehdä Copilotista ilmaisen myös opettajille muutama viikko ICER-konferenssin jälkeen, viitaten Leinosen, Hellaksen ja heidän kollegojensa tutkimukseen yhtenä perusteluna.
Suurien kielimallien vaikutuksesta tietotekniikan opetukseen on tehty vasta vähän tutkimusta. Konferenssin jälkeiset yhteistyöpyynnöt ovatkin pitäneet Leinosen, Hellaksen ja heidän kollegansa Sami Sarsan kiireisinä syksyn ajan. Samalla tutkijatrio on selvittänyt muita teemaan liittyviä mahdollisuuksia, kuten ohjelmistojen virheilmoitusten selventämistä sekä joukkoistamisen ja koneoppimisen yhdistämistä.
”Alan nopean kehityksen vuoksi on mahdotonta ennustaa miten suuret kielimallit tulevat muuttamaan tietotekniikan opetusta”, sanoo Leinonen. ”Kaksi asiaa ovat kuitenkin varmoja – tekoälyavusteinen ohjelmointi on tullut jäädäkseen ja me aiomme selvittää sen vaikutukset.”
Psychology and education.
cs.aalto.fi