Tapahtumat

Väitös puhe- ja kieliteknologian alalta, M.Sc. Sneha Das

Väitöskirjan nimi on: Robust and Efficient Methods for Distributed Speech Processing – Perspectives on Coding, Enhancement and Privacy

M.Sc. Sneha Das väittelee 26.11.2021 klo 12 Aalto-yliopiston sähkötekniikan korkeakoulussa, signaalinkäsittelyn ja akustiikan laitoksella. Väitöskirjan nimi on "Robust and Efficient Methods for Distributed Speech Processing – Perspectives on Coding, Enhancement and Privacy".

Vastaväittäjä: Prof. Mads Græsbøll Christensen, Aalborg University, Tanska
Kustos: Prof. Tom Bäckström, Aalto-yliopiston sähkötekniikan korkeakoulu, signaalinkäsittelyn ja akustiikan laitos

Väitöstilaisuus järjestetään etäyhteydellä Zoomissa, jonne voi liittyä vapaasti: https://aalto.zoom.us/j/61255513284
Zoom pikaopas: https://www.aalto.fi/fi/palvelut/zoom-pikaopas

Linkki väitöskirjan sähköiseen esittelykappaleeseen: https://aaltodoc.aalto.fi/doc_public/eonly/riiputus/

Sähkötekniikan korkeakoulun väitöskirjat: https://aaltodoc.aalto.fi/handle/123456789/53

Väitöstiedote:

Tietokoneet ja teknologia ovat nykyään vahvasti läsnä elämässämme, ja ihmiset käyttävät huomattavan osan päivästään kommunikointiin teknologian avulla. Tavanomaiset ihmisen ja teknologian vuorovaikutustavat ovat olleet pääasiassa laitekeskeisiä, minkä vuoksi käyttäjien on oltava laitteen läheisyydessä. Tästä voi tulla hankalaa, kun yksilön omistamien henkilökohtaisten laitteiden määrä kasvaa. Puhekäyttöliittymän käyttö ihmisen ja tietokoneen välisessä vuorovaikutuksessa voi tehostaa teknologian käyttöä. Jotta puheteknologiaa voitaisiin soveltaa menestyksekkäästi usean laitteen skenaarioissa, on kuitenkin ratkaistava puheen parantamiseen, koodaukseen ja käyttäjän yksityisyyteen liittyvät haasteet kyseisessä ympäristössä. Tämän väitöskirjan tavoitteina on kehittää menetelmiä, joiden avulla voidaan kehittää perinteistä puheenkoodausta useita mikrofoneja varten, ja ymmärtää yksityisyyden suojauksen tilaa puhe-käyttäjärajapinnoissa.

Yksinkertaisten ja vankkojen puheenkoodausjärjestelmien saamiseksi olemme kehittäneet jälkisuodattimia puheen laadun parantamiseksi puheenkoodekin vastaanottopäässä. Olemme kehittäneet menetelmiä, joissa käytetään puheen malleja verhospektrille ja perustaajuudelle, ja osoitamme mallien tehokkuuden sekä yhden mikrofonin että usean mikrofonin oletuksissa. Lisäksi käsittelemme yksityisyyden suojaa puhekäyttöliittymissä tutkimalla, miten älykkäisiin puhekäyttöliittymiin voidaan lisätä intuitiivinen ymmärrys käyttäjän yksityisyysasetuksista. Tutkimus paljastaa, että yksilöillä on intuitiivinen käsitys yksityisyyden suojasta puheviestinnässä, joka on riippuvainen muun muassa akustisista skenaarioista, ja tätä näkemystä voidaan hyödyntää ehdollistamalla yksityisyysmieltymykset havaitun akustisen ympäristön perusteella puherajapinnassa.

Väittelijän yhteystiedot:

Email [email protected]
Mobile +4591440864
  • Julkaistu:
  • Päivitetty: