Uutiset

Äänesi paljastaa enemmän kuin uskot – tutkijat kehittävät keinoja suojata puheeseen kätkeytyvää tietoa

Puheteknologiat yleistyvät vauhdilla, ja samalla kasvaa riski siitä, että ääni paljastaa arkaluonteista tietoa terveydestä, taustoista tai mielipiteistä. Aalto-yliopiston tutkijat kehittävät keinoja mitata ja rajoittaa sitä, mitä kaikkea puheesta voidaan päätellä.
Henkilö puhuu älykelloon, jossa on hopeinen verkkoranneke ja näytöllä aaltomuoto.
Puheeseen sisältyy tietoa esimerkiksi terveydestä, kulttuuritaustasta ja koulutustasosta. Se välittyy puheen mukana, vaikka ihminen itse ei sitä tiedostaisi, kertoo professori Tom Bäckström. Kuva: Adobe Stock.

Ihmisen äänensävystä voi usein päätellä, onko hän esimerkiksi iloinen, väsynyt tai stressaantunut. Myös tietokoneet pystyvät jo nyt samaan – ja tulevaisuudessa ne pystyvät tunnistamaan puheesta vielä huomattavasti enemmän. Puhe- ja kieliteknologian professori Tom Bäckström varoittaa, että ääneen koodautunut tieto voi helposti paljastaa paljon enemmän kuin puhuja itse aikookaan.

”Puheeseen sisältyy tietoa esimerkiksi terveydestä, kulttuuritaustasta ja koulutustasosta. Se välittyy puheen mukana, vaikka ihminen itse ei sitä tiedostaisi”, Bäckström sanoo.

Mitä kaikkea tietoa puhe sisältää?

Hienovaraiset erot intonaatiossa, puhenopeudessa tai sanavalinnoissa voivat kertoa vaikkapa poliittisesta suuntauksesta, tunnetiloista tai sosiaalisesta taustasta. Hengitykseen, äänenlaatuun tai puheen rytmiin liittyvät piirteet taas voivat paljastaa tietoa esimerkiksi sairauksista tai muutoksista terveydentilassa.

Henkilö vaaleansinisessä paidassa ja harmaassa bleiserissä seisoo käsi lantiolla. Taustalla näkyy moderni taideteos.
Professori Tom Bäckström. Kuva: Aalto-yliopisto / Mikko Raskinen.

Yksi merkittävä riski onkin, että äänitallenteista päätelty terveystieto vaikuttaa jatkossa esimerkiksi vakuutusten saantiin ja hinnoitteluun tai ohjaa lääkkeiden ja hoitojen markkinointia ilman, että ihminen itse on tietoinen tällaisista puheeseen perustuvista päätöksistä.

Työnantajat taas saattavat esimerkiksi poimia äänitallenteista henkilökohtaista tietoa, jota käytetään rekrytoinneissa, työntekijöiden arvioinnissa tai jopa heitä vastaan. Myös entiset kumppanit tai muut ulkopuoliset voisivat hyödyntää puheeseen liittyviä analyysityökaluja vainoamiseen tai häirintään. Bäckström korostaa näiden lisäksi kuitenkin myös epäsuoran haitan mahdollisuutta.

”Jo se, että ihminen kokee olevansa koko ajan kuunneltavana, tai pelko jatkuvasta tarkkailusta – on itsessään psykologisesti vahingollista”, hän sanookin.

Miten puheeseen kätkeytyvää tietoa voidaan rajoittaa?

Bäckströmin mukaan teknologia, jolla kaikkea tätä puheeseen ja ääneen koodautunutta tietoa voitaisiin kattavasti ja luotettavasti hyödyntää, ei ole ”ihan vielä valmista”. Tutkijat pyrkivät kuitenkin kehittämään suojakeinoja jo nyt – ennen kuin ongelma kasvaa liian suureksi ja käytännöt ehtivät vakiintua. Yksi keskeinen haaste on ollut, ettei puheen sisältämän informaation määrää ole aiemmin osattu mitata kunnolla.

”On vaikea suojella jotain, jos ei tiedä, mitä on suojelemassa. Mittaaminen onkin ensimmäinen askel kohti toimivaa yksityisyyden suojaa”, Bäckström sanoo.

Tähän tarpeeseen hänen tutkimusryhmänsä on nyt kehittänyt mittarin, joka arvioi, kuinka tarkasti puhujan identiteetti voidaan rajata äänitallenteen perusteella. Aiemmat menetelmät ovat keskittyneet yksittäisiin tunnistamisriskeihin – esimerkiksi siihen, voidaanko puheesta päätellä jokin tietty sairaus – mutta niitä on ollut vaikea yleistää. Uusi lähestymistapa kuvaa puhetallenteen sisältämän informaation kokonaismäärää.

Mittareiden avulla voidaan myös kehittää konkreettisia suojakeinoja. Väärinkäytösten ehkäiseminen edellyttää, että välitetään vain palvelun kannalta välttämätön tieto ja että se toimitetaan turvallisesti oikealle vastaanottajalle. Yksityinen tieto voidaan erottaa muusta puheesta, puhetta voidaan käsitellä paikallisesti laitteessa pilvipalvelujen sijaan, ja akustisilla ratkaisuilla voidaan rajata, missä ääntä tallennetaan tai kuuluu. Haasteet ovat suhteellisen uusia ja seurausta nopeasta teknologisesta kehityksestä sekä suurten aineistojen yleistymisestä.

Vuonna 2019 Bäckström kollegoineen perusti kansainvälisen tutkimusverkoston, joka keskittyy puheteknologioiden yksityisyyteen ja tietoturvaan. Verkosto on nyt julkaissut uuden työkalunsa, joka vastaa alan peruskysymykseen: kuinka paljon tietoa puhetallenne sisältää.

Parempaa tiedettä, parempia työkaluja

Bäckström näkee vastikään Proceedings of the IEEE -lehdessä julkaistun tutkimuksen askeleena kohti sitä, että ihmisille voidaan kertoa ymmärrettävällä tavalla eri puheteknologioiden yksityisyysvaikutuksista.

”Haaveilen siitä, että voisimme sanoa esimerkiksi näin: jos annat tallenteen jollekin palvelulle, se pystyy kymmenen euron kustannuksella rajaamaan henkilöllisyytesi vaikkapa tuhannen ihmisen joukkoon. Se on asia, jonka ihmiset ymmärtävät – ja se voitaisiin tuoda suoraan käyttöliittymään”, Bäckström sanoo.

Hyvät mittarit ovat tärkeitä myös yksityisyyttä suojaavien työkalujen suunnittelussa ja arvioinnissa. Artikkelissaan tutkimusryhmä tarjoaa ensimmäisen kattavan yleiskatsauksen puheteknologioihin liittyvistä uhkista ja suojakeinoista sekä nostaa esiin myös riskit ihmisille, jotka eivät itse käytä puhepalveluja – esimerkiksi tilanteissa, joissa ääni tallentuu taustahälynä.

Tutkimus korostaa, että yksityisyyden suoja ei ole vain tekninen kysymys, vaan liittyy myös käyttäjien psykologiaan, kokemuksiin ja käyttöliittymäsuunnitteluun. 

”Käyttöliittymän pitäisi kertoa, kuinka yksityinen vuorovaikutustilanne on ja kuinka varma järjestelmä on toiminnastaan. Kun nämä asiat tehdään näkyviksi, syntyy pitkäaikaista luottamusta”, Bäckström sanoo.

Yksityisyyden huomioiminen ei hänen mukaansa välttämättä lisää kuormaa, vaan voi jopa parantaa palvelua. Kun puheesta poistetaan tarpeeton yksityinen tieto, siirrettävän datan määrä pienenee, verkkoliikenne kevenee ja kustannukset laskevat.

”Yksityisyyttä ja hyötyä pidetään usein vastakkaisina voimina, mutta monilla yksityisyysteknologioilla on myös selkeitä käytännön hyötyjä”, hän toteaa.

Näitä periaatteita sovelletaan parhaillaan käytännössä TrustM-hankkeessa, jossa kehitetään Espoon kaupungin maahanmuuttajille suunnattuja digitaalisia palveluja. Backström muistuttaa, että palvelujen käyttäjien on voitava luottaa siihen, että heidän henkilötietonsa ovat turvassa ja että esimerkiksi tekoälyn tuottamat keskusteluyhteenvedot ovat luotettavia. 

Lisätietoja

Linkki julkaisuun: Privacy in Speech Technology

  • Päivitetty:
  • Julkaistu:
Jaa
URL kopioitu

Lue lisää uutisia

Useita pieniä, suorakulmaisia hiukkasia, joissa on pyöristetyt reunat, harmaana tummalla taustalla.
Tutkimus ja taide Julkaistu:

Katalyysi uudessa valossa: mikrotason vuorovaikutukset voivat tehostaa puhtaan energian teknologioita

Uusi tutkimus avaa tarkemman näkymän siihen, miten katalyytit toimivat kemiallisten reaktioiden aikana. Löydös voi auttaa kehittämään tehokkaampia materiaaleja esimerkiksi vihreän vedyn tuotantoon ja kestävämpään kemianteollisuuteen.
Puhuja esiintyy suurelle yleisölle pimeässä auditorioissa. Suuren näytön takana on eläväinen kuva tekstillä 'Welcome'.
Palkinnot ja tunnustukset, Tutkimus ja taide Julkaistu:

Vuosikatselmus loi katsauksen menneeseen vuoteen

Taiteiden ja suunnittelun korkeakoulun vuosikatselmuksessa tehtiin kattava katsaus kuluneeseen vuoteen ja palkittiin ansioituneita yhteisön jäseniä.
Tummaan takkiin pukeutunut henkilö seisoo ulkona monikerroksisen rakennuksen edessä, jossa on paljon ikkunoita.
Palkinnot ja tunnustukset, Tutkimus ja taide Julkaistu:

Vuoden alumni Anna Brotkin: ”Tarvitsemme moderneja tarinoita tästä ajasta”

Taiteiden ja suunnittelun korkeakoulun Vuoden alumniksi 2026 valittu käsikirjoittaja Anna Brotkin uskoo paikallisuuden voimaan ja toivon merkitykseen kriisiaikoina.
Valkoinen sylinterimäinen kone, jossa 'Aalto University' logo teollisuusympäristössä.
Mediatiedotteet Julkaistu:

Aalto-yliopisto sai oman kvanttitietokoneen – AaltoQ20 kouluttaa tulevaisuuden kvanttiosaajat

AaltoQ20 on maailmallakin harvinainen ja Suomessa täysin ainutlaatuinen huipputason kvanttitietokone, jolla paitsi koulutetaan tulevaisuuden osaajia, myös tutkitaan kvantti-ilmiöitä ja kehitetään uutta teknologiaa.