Äänikirjoja voidaan nykyään luoda tekoälyn avulla
Tuotantotaloudenlaitos (TUTA) on julkaissut ensimmäisen tekoälyäänikirjan (neljä kirjan lukua), joka on toteutettu autoetnografisena tutkimusprojektina kesällä 2023 Timo Seppälän, Tomasz Muchan ja Juri Mattilan toimittamasta kirjasta 'The Fifth Wave - BRIE-ETLA Collection of Articles´. Autoetnografia on omaelämäkerrallinen tutkimuksen tekemisen tapa, jossa tutkijan omat kokemukset ja niistä kirjoitetut tai muuten tuotetut kenttämuistiinpanot muodostavat tutkimuksen keskeisen aineiston.
Tekoälyyn perustuvan äänikirjaprojektin motivaatio oli varsin suoraviivainen. Vanhemman lehtorin Timo Seppälän työkaveri koneteollisuudesta mainitsi kerran, ettei hänellä ole aikaa lukea Timon kirjaa, mutta hän voisi kuunnella sitä työmatkalla tai kotiin palatessaan.
Miten tekoälypohjainen äänikirja tehtiin?
"Minä luin tekoälytyökalulle 20 ja kollegani Tomasz 50 lausetta. Huomasimme, että 50 lauseen ääninäyte tuottaa paljon paremman äänenlaadun, joten minä menin takaisin studioon ja luin vielä 60 lausetta. Näiden perusteella tekoälytyökalu kloonasi äänemme ja käytti niitä kirjan kertojana", Timo kuvailee äänikirjan tekoprosessia.
Kirjan tuottaja Laura Loikas opiskelee Aallossa tuotantotaloutta. Hänet palkattiin kesällä kuukaudeksi työskentelemään projektin parissa. Laura vertaili ja valitsi käytettävän teknologian, teki äänien kloonauksen ja muokkasi kirjan artikkelit niin, että tekoäly voi lukea niitä. Sitten hän tuotti mp3-tiedostot ja muokkasi kohdat, joissa tekoäly teki virheitä. Kaikkiaan tuotantokustannukset olivat noin 200 euroa ilman palkkakustannuksia.
"Opetusmateriaalit tuotetaan yleensä kirjallisessa muodossa, mutta tulevaisuudessa mitä tahansa kirjallista opetusmateriaalia voidaan tuottaa helposti audiona tekoälytyökalujen ja -sovellusten avulla. Tämä antaa myös opiskelijalle uusia työkaluja oppia asioita paikasta riippumatta. Tämän hankkeen tuloksena voimme nyt muuntaa kirjallista materiaalia äänitteeksi kohtuullisella laadulla, pienemmillä kustannuksilla ja suuremmalla tehokkuudella. Seuraavalla kerralla annamme ohjeet tähän prosessiin", sanoo Timo.
Lue lisää uutisia
Äänesi paljastaa enemmän kuin uskot – tutkijat kehittävät keinoja suojata puheeseen kätkeytyvää tietoa
Puheteknologiat yleistyvät vauhdilla, ja samalla kasvaa riski siitä, että ääni paljastaa arkaluonteista tietoa terveydestä, taustoista tai mielipiteistä. Aalto-yliopiston tutkijat kehittävät keinoja mitata ja rajoittaa sitä, mitä kaikkea puheesta voidaan päätellä.
Aallon vuosi 2025: Kvanttihyppyjä, luovia loikkia ja ratkaisuja parempaan elämään
Kasvua, teknologiaa ja teollisuuden uudistumista, ihmislähtöisiä ratkaisuja, terveys ja arjen hyvinvointi sekä hauskaa arkea ja toimivia yhteisöjä.
Merkittävä EU-rahoitus kahdelle Unite! Seed Fund -hankkeelle, joissa Aalto on mukana
Kaksi arvostettua EU-rahoitusta on myönnetty hankkeille, joita on alun perin tuettu Unite! Seed Fund -rahoituksella. Aalto-yliopisto on mukana molemmissa hankkeissa.