Uutiset

Big Datan tietomäärää ei vielä osata hyödyntää

Professori Esa Ollila kehittää signaalinkäsittelyn ja koneoppimisen välineitä ja menetelmiä Big Datan käyttöön.
esa_ollila_aaltowww_fi.jpg

TkT Esa Ollila nimitettiin signaalinkäsittelyn ja akustiikan laitokselle Associate Professor -tehtävään 1.6.2015. Professuurin ala on tilastollinen signaalinkäsittely, joka koostuu sovelletun matematiikan, sähkötekniikan ja koneoppimisen malleista ja menetelmistä.

Ollilan mukaan signaalinkäsittely on laajentanut omaa kenttäänsä.

– Data-analyysin merkitys kasvaa sen myötä, kun tietomäärä kasvaa. Vaikka älykkäät laitteet jokapäiväisessä elämässämme ovat tarjonneet erilaisia keinoja kerätä, käsitellä ja tallentaa suuria tietomääriä helposti, tietomäärän hyödyntäminen ei ole kasvanut samaa tahtia.

Ollila mainitsee, että tekniikoista puuttuu skaalautuvuus, joka vaikeuttaa piirteiden, korrelaatioiden tai klustereiden löytämistä laajoista tietojoukoista. Lisäksi usein se, mitä halutaan tietää, on epävarmuus johdetuissa estimaateissa ja analyyseissä.

– Tällä hetkellä meiltä puuttuu Big Datan työkalupakista menetelmiä, jotka mahdollistavat virhemarginaalin antamisen estimoiduille parametreille. Tämä on yksi tämän hetkisistä tutkimuskohteistani Big Datan tiimoilta.

Laajemmin hänen tavoitteensa on kehittää laskennallisia menetelmiä, työkaluja ja algoritmeja suurten moniulotteisten datajoukkojen käsittelyyn ja visualisointiin. Tarkoitus on, että Big Datan eli valtavien tietomäärien hyödynnettävyys paranee.

– Tällaisilla menetelmillä voi olla myös laajaa taloudellista ja yhteiskunnallista merkitystä, Ollila sanoo. 

Datan mallinnuksen ja analysoinnin sovelluskenttä on laaja

Mitä sitten nykyään tarkoitetaan signaalinkäsittelyllä?

– Signaali on oikeastaan vain dataa eli numeroarvoisia havaintoja erityyppisistä antureista tai mittausjärjestelmistä. Siksi sana signaali on terminä vanhentunut. Tyypillisiä esimerkkejä Big Datasta tai signaaleista ovat signaali- ja tietoliikennejärjestelmien, älypuhelimien, monisensorijärjestelmien, tietoverkkojen, tai älykkäiden sähköverkkojen tuottamat datat.

Datasta tai isosta tietojoukosta voidaan laskea useita erilaisia estimaattoreita eli tunnuslukuja, jotka jollain tavalla kuvaavat tutkittua populaatiota tai auttavat ymmärtämään tutkittavaa ilmiötä, jota kerätty data ilmentää. Datan määrän kasvaessa myös virheellisten mittausten tai poikkeavien havaintojen määrä kasvaa samaa vauhtia, mikä tuottaa virheen myös estimaattoreissa ja saaduissa johtopäätöksissä ja analyyseissä.

– Siksi esimerkiksi robustit signaalinkäsittelyn ja data-analyysin menetelmät, eli menetelmät jotka eivät ole herkkiä mittausvirheille tai poikkeaville havainnoille, ovat erittäin tärkeässä roolissa Big Data -analyysissä. Minulla on vankka kokemus robusteista menetelmistä ja tilastollisesta mallinnuksesta, jota voin nyt hyödyntää omassa Big Data -tutkimuksessani.

Signaalinkäsittelyssä Ollila tutkii satunnaisuutta mittauksissa, erityisesti erilaisia kohinamalleja, joita voidaan hyödyntää esimerkiksi antenniryhmien ja tutkasignaalien analyyseissä ja optimaalisten estimaattoreiden johtamisessa. Hän on myös kehittänyt tekniikoita antenniryhmän vastaanottamien signaalien tulosuunnan ja lähettimen sijainnin estimoimiseen.

Datan mallinnuksen ja analysoinnin sovelluskenttä on laaja. Yhtenä esimerkkinä Ollila mainitsee lääketieteellisen kuvantamisen.

– Esimerkiksi tensorihajotelmat ovat erittäin hyödyllisiä ja käyttökelpoisia datan käsittelymenetelmiä moniulotteisille datajoukoille ja niitä voidaan soveltaa vaikkapa lääketieteellisen datan analyyseissä.

Entä miten professori viettää vapaa-aikaansa?

– Vapaa-aika kuluu perheen ja harrastusten parissa erityisesti talvisin laskettelemassa ja kesäisin tenniskentällä. Kokkaan myös mielelläni, joka on osoittautunut hyväksi vastapainoksi työlle.

Kuva: Lasse Lecklin

  • Päivitetty:
  • Julkaistu:
Jaa
URL kopioitu

Lue lisää uutisia

Useita sauvanmuotoisia bakteereja mikroskooppisessa näkymässä, tummanpunaisella taustalla.
Mediatiedotteet, Tutkimus ja taide Julkaistu:

Tutkijat kehittivät uuden tavan mitata tartuttavuutta: verenmyrkytystä aiheuttava E. coli -suolistobakteeri voi levitä kuin influenssavirus

Antibiooteille vastustuskykyiset ja virulenteimmat kannat eivät kuitenkaan ole kaikkein herkimmin leviäviä.
Learning Centre graphics
Tutkimus ja taide Julkaistu:

Oppimiskeskuksen aukioloajat joulun aikaan ja vuodenvaihteessa 2025-2026

Kiitokset kuluneesta vuodesta ja ihanaa joulun aikaa!
Kolme valkoista, pyöreää pitsikuviota mustalla taustalla, jokaisella ainutlaatuinen geometrinen muotoilu.
Tutkimus ja taide Julkaistu:

Älykkäät tekstiilit uudistavat käsityksemme materiaaleista – ja lajienvälisestä viestinnästä

Euroopan tutkimusneuvosto ERC:n rahoituksen saanut PAST-A-BOT-tutkimushanke kehittää pehmeitä, älykkäitä tekstiilejä, jotka voivat tulevaisuudessa toimia pelastusrobotteina, ääntä aistivina maataloustekstiileinä tai avustavina vaatteina – ja samalla uudistavat tavan, jolla ajattelemme materiaalitutkimusta.
Neljä miestä muodollisissa vaatteissa eri ympäristöissä. Yhdellä poolopaita, muilla puvut ja solmiot.
Tutkimus ja taide Julkaistu:

Tulevaisuuden tekijät tutkivat akkuja, tietojen salausta ja muovin kierrätystä

Teknologiateollisuuden 100-vuotissäätiö myönsi 3,5 miljoonaa euroa tutkimusrahaa kahdeksalle hankkeelle, joista viisi tuli Aalto-yliopistosta.