Uutiset

Äänesi paljastaa enemmän kuin uskot – tutkijat kehittävät keinoja suojata puheeseen kätkeytyvää tietoa

Julkaistu: 29.12.2025

Puheteknologiat yleistyvät vauhdilla, ja samalla kasvaa riski siitä, että ääni paljastaa arkaluonteista tietoa terveydestä, taustoista tai mielipiteistä. Aalto-yliopiston tutkijat kehittävät keinoja mitata ja rajoittaa sitä, mitä kaikkea puheesta voidaan päätellä.

Henkilö puhuu älykelloon, jossa on hopeinen verkkoranneke ja näytöllä aaltomuoto. — Puheeseen sisältyy tietoa esimerkiksi terveydestä, kulttuuritaustasta ja koulutustasosta. Se välittyy puheen mukana, vaikka ihminen itse ei sitä tiedostaisi, kertoo professori Tom Bäckström. Kuva: Adobe Stock.

Ihmisen äänensävystä voi usein päätellä, onko hän esimerkiksi iloinen, väsynyt tai stressaantunut. Myös tietokoneet pystyvät jo nyt samaan – ja tulevaisuudessa ne pystyvät tunnistamaan puheesta vielä huomattavasti enemmän. Puhe- ja kieliteknologian professori Tom Bäckström varoittaa, että ääneen koodautunut tieto voi helposti paljastaa paljon enemmän kuin puhuja itse aikookaan.

”Puheeseen sisältyy tietoa esimerkiksi terveydestä, kulttuuritaustasta ja koulutustasosta. Se välittyy puheen mukana, vaikka ihminen itse ei sitä tiedostaisi”, Bäckström sanoo.

Mitä kaikkea tietoa puhe sisältää?

Hienovaraiset erot intonaatiossa, puhenopeudessa tai sanavalinnoissa voivat kertoa vaikkapa poliittisesta suuntauksesta, tunnetiloista tai sosiaalisesta taustasta. Hengitykseen, äänenlaatuun tai puheen rytmiin liittyvät piirteet taas voivat paljastaa tietoa esimerkiksi sairauksista tai muutoksista terveydentilassa.

Henkilö vaaleansinisessä paidassa ja harmaassa bleiserissä seisoo käsi lantiolla. Taustalla näkyy moderni taideteos. — Professori Tom Bäckström. Kuva: Aalto-yliopisto / Mikko Raskinen.

Yksi merkittävä riski onkin, että äänitallenteista päätelty terveystieto vaikuttaa jatkossa esimerkiksi vakuutusten saantiin ja hinnoitteluun tai ohjaa lääkkeiden ja hoitojen markkinointia ilman, että ihminen itse on tietoinen tällaisista puheeseen perustuvista päätöksistä.

Työnantajat taas saattavat esimerkiksi poimia äänitallenteista henkilökohtaista tietoa, jota käytetään rekrytoinneissa, työntekijöiden arvioinnissa tai jopa heitä vastaan. Myös entiset kumppanit tai muut ulkopuoliset voisivat hyödyntää puheeseen liittyviä analyysityökaluja vainoamiseen tai häirintään. Bäckström korostaa näiden lisäksi kuitenkin myös epäsuoran haitan mahdollisuutta.

”Jo se, että ihminen kokee olevansa koko ajan kuunneltavana, tai pelko jatkuvasta tarkkailusta – on itsessään psykologisesti vahingollista”, hän sanookin.

Miten puheeseen kätkeytyvää tietoa voidaan rajoittaa?

Bäckströmin mukaan teknologia, jolla kaikkea tätä puheeseen ja ääneen koodautunutta tietoa voitaisiin kattavasti ja luotettavasti hyödyntää, ei ole ”ihan vielä valmista”. Tutkijat pyrkivät kuitenkin kehittämään suojakeinoja jo nyt – ennen kuin ongelma kasvaa liian suureksi ja käytännöt ehtivät vakiintua. Yksi keskeinen haaste on ollut, ettei puheen sisältämän informaation määrää ole aiemmin osattu mitata kunnolla.

”On vaikea suojella jotain, jos ei tiedä, mitä on suojelemassa. Mittaaminen onkin ensimmäinen askel kohti toimivaa yksityisyyden suojaa”, Bäckström sanoo.

Tähän tarpeeseen hänen tutkimusryhmänsä on nyt kehittänyt mittarin, joka arvioi, kuinka tarkasti puhujan identiteetti voidaan rajata äänitallenteen perusteella. Aiemmat menetelmät ovat keskittyneet yksittäisiin tunnistamisriskeihin – esimerkiksi siihen, voidaanko puheesta päätellä jokin tietty sairaus – mutta niitä on ollut vaikea yleistää. Uusi lähestymistapa kuvaa puhetallenteen sisältämän informaation kokonaismäärää.

Mittareiden avulla voidaan myös kehittää konkreettisia suojakeinoja. Väärinkäytösten ehkäiseminen edellyttää, että välitetään vain palvelun kannalta välttämätön tieto ja että se toimitetaan turvallisesti oikealle vastaanottajalle. Yksityinen tieto voidaan erottaa muusta puheesta, puhetta voidaan käsitellä paikallisesti laitteessa pilvipalvelujen sijaan, ja akustisilla ratkaisuilla voidaan rajata, missä ääntä tallennetaan tai kuuluu. Haasteet ovat suhteellisen uusia ja seurausta nopeasta teknologisesta kehityksestä sekä suurten aineistojen yleistymisestä.

Vuonna 2019 Bäckström kollegoineen perusti kansainvälisen tutkimusverkoston, joka keskittyy puheteknologioiden yksityisyyteen ja tietoturvaan. Verkosto on nyt julkaissut uuden työkalunsa, joka vastaa alan peruskysymykseen: kuinka paljon tietoa puhetallenne sisältää.

Parempaa tiedettä, parempia työkaluja

Bäckström näkee vastikään Proceedings of the IEEE -lehdessä julkaistun tutkimuksen askeleena kohti sitä, että ihmisille voidaan kertoa ymmärrettävällä tavalla eri puheteknologioiden yksityisyysvaikutuksista.

”Haaveilen siitä, että voisimme sanoa esimerkiksi näin: jos annat tallenteen jollekin palvelulle, se pystyy kymmenen euron kustannuksella rajaamaan henkilöllisyytesi vaikkapa tuhannen ihmisen joukkoon. Se on asia, jonka ihmiset ymmärtävät – ja se voitaisiin tuoda suoraan käyttöliittymään”, Bäckström sanoo.

Hyvät mittarit ovat tärkeitä myös yksityisyyttä suojaavien työkalujen suunnittelussa ja arvioinnissa. Artikkelissaan tutkimusryhmä tarjoaa ensimmäisen kattavan yleiskatsauksen puheteknologioihin liittyvistä uhkista ja suojakeinoista sekä nostaa esiin myös riskit ihmisille, jotka eivät itse käytä puhepalveluja – esimerkiksi tilanteissa, joissa ääni tallentuu taustahälynä.

Tutkimus korostaa, että yksityisyyden suoja ei ole vain tekninen kysymys, vaan liittyy myös käyttäjien psykologiaan, kokemuksiin ja käyttöliittymäsuunnitteluun.

”Käyttöliittymän pitäisi kertoa, kuinka yksityinen vuorovaikutustilanne on ja kuinka varma järjestelmä on toiminnastaan. Kun nämä asiat tehdään näkyviksi, syntyy pitkäaikaista luottamusta”, Bäckström sanoo.

Yksityisyyden huomioiminen ei hänen mukaansa välttämättä lisää kuormaa, vaan voi jopa parantaa palvelua. Kun puheesta poistetaan tarpeeton yksityinen tieto, siirrettävän datan määrä pienenee, verkkoliikenne kevenee ja kustannukset laskevat.

”Yksityisyyttä ja hyötyä pidetään usein vastakkaisina voimina, mutta monilla yksityisyysteknologioilla on myös selkeitä käytännön hyötyjä”, hän toteaa.

Näitä periaatteita sovelletaan parhaillaan käytännössä TrustM-hankkeessa, jossa kehitetään Espoon kaupungin maahanmuuttajille suunnattuja digitaalisia palveluja. Backström muistuttaa, että palvelujen käyttäjien on voitava luottaa siihen, että heidän henkilötietonsa ovat turvassa ja että esimerkiksi tekoälyn tuottamat keskusteluyhteenvedot ovat luotettavia.

Lisätietoja

Linkki julkaisuun: Privacy in Speech Technology

Päivitetty: 29.12.2025
Julkaistu: 29.12.2025

Mediatiedotteet, Tutkimus ja taide Julkaistu: 14.5.2026

Laaja selvitys OmaKannasta kertoo: Potilastiedot voivat loukata – etenkin mielenterveyteen hoitoa saaneet herkkiä sanavalinnoille

Virheet, epäkunnioittava kieli ja tarpeettomaksi koettu tieto voivat loukata sähköisissä potilastiedoissa.

Abstrakti lähikuva värikkäästä lasista, jossa on pyörteisiä kuvioita oranssin, sinisen ja violetin sävyissä.

Tutkimus ja taide, Opinnot Julkaistu: 13.5.2026

Äänesi paljastaa enemmän kuin uskot – tutkijat kehittävät keinoja suojata puheeseen kätkeytyvää tietoa

Mitä kaikkea tietoa puhe sisältää?

Miten puheeseen kätkeytyvää tietoa voidaan rajoittaa?

Parempaa tiedettä, parempia työkaluja

Tom Bäckström

Lue lisää uutisia

Laaja selvitys OmaKannasta kertoo: Potilastiedot voivat loukata – etenkin mielenterveyteen hoitoa saaneet herkkiä sanavalinnoille

Tohtoriopintojen uusi THOPS-työkalu julkaistaan 18.5.

Kauppakorkeakoulun juhlava promootio näkyy Töölön katukuvassa toukokuussa

Tutkijat mittasivat tseptojoulen, eli energiamäärän, jolla punasolu liikkuu nanometrin