Tapahtumat

Väitös kieliteknologian alalta, DI Reima Karhila

Väitöksen nimi on “Building personalised speech technology systems with sparse, bad quality or out-of-domain data”

Puheteknologiset järjestelmät, jotka tunnistavat tai tuottavat puhetta koneellisesti, ovat yleistyneet viime vuosina. Nykyaikaiset järjestelmät viritetään toimimaan käyttäen opetusaineistoa, joka koostuu järjestelmän tehtävään nähden soveliaasta puheesta. Esimerkiksi suomenkielisen puhesyntetisaattorin rakentamiseen tarvitaan suomenkielistä puhetta, tai lasten puhetta tunnistavan järjestelmän opettamiseen tarvitaan lasten puhetta. Jos sopivia puheaineistoja ei ole saatavilla, on järjestelmän kehittäjän yleensä pakko kerätä sopiva aineisto itse. Tässä väitöskirjassa tarkastellaan, miten puheteknologisia järjestelmiä voidaan opettaa kaksivaiheisesti, ensin käyttäen saatavilla olevia muita aineistoja, ja sen jälkeen virittämällä järjestelmä varsinaista tehtävää varten pienellä määrällä kohdetehtävän puheaineistoa.

Tuloksina ovat mm:
•    Lasten puhetta tuottavan järjestelmän esiopettaminen aikuisten puheella ja virittäminen pienellä määrällä lasten puhetta,
•    kaksikielistä puhetta tuottavan järjestelmän rakentaminen kahdesta yksikielisestä järjestelmästä,
•    puheentunnistuksen ja puhesynteesin parantaminen yhdellä kielellä virittämällä systeemi puhujan toisella kielellä puhumien lauseiden avulla sekä
•    vieraan kielen lausumisvirheiden havaitseminen käyttäen järjestelmän opetukseen vain virheetöntä puheaineistoa.

Vastaväittäjä toimii Dr Kate Knill, Cambridge University, UK

Valvojana on professori Mikko Kurimo, Aalto-yliopiston sähkötekniikan korkeakoulu, signaalinkäsittelyn ja akustiikan laitos.

Väitöksen verkkosivu

Väittelijän yhteystiedot: Reima Karhila, [email protected], tel. +358 50 430 3384

  • Julkaistu:
  • Päivitetty: