Informaatio- ja tietoliikennetekniikan laitos

Puheentunnistus

Tavoitteemme on parantaa automaattisen puheentunnistuksen menetelmiä Aalto-yliopistossa kehitettävien uusien algoritmien avulla.

Puheentunnistus tarjoaa haastavia benchmark-tehtäviä tehokkaille algoritmeille, jotka prosessoivat suuria datamassoja ja oppivat mallintamaan niistä olennaiset piirteet. Akustisten foneemimallien parantamisen lisäksi tähtäämme uusien oppivien ja tilastollisten kielimallien kehittämiseen vaativiin tunnistustehtäviin, joissa käsitellään rajoittamattoman sanaston jatkuvaa puhetta. Ryhmällemme relevantteihin pilotointisovelluksiin kuuluvat eri kielten sanelun lisäksi audioindeksointi, adaptiivinen puhesynteesi ja puheesta puheeseen käännös.

Lue lisää tutkimuksesta

Ryhmän jäsenet

Software & Demonstrations

Software produced as part of our research is available on our GitHub

Demonstration videos of our research work can be watched on our YouTube Channel

Self-Supervised App-Based Speech Training for Children With Speech Sound Disorder—A Single-Case Experimental Design Study

Sofia Strömbergsson, Ella Edlund, Magdalena Pettersson, Nhan Phan, Mikko Kurimo 2026 International Journal of Language & Communication Disorders

Tutkimusportaali

Päivitetty: 19.4.2024
Julkaistu: 29.8.2018

Puheentunnistus

Ryhmän jäsenet

Mikko Kurimo

Mittul Singh

Anssi Ilmari Moisio

Yaroslav Getman

Nhan Phan

Mehedi Hasan Bijoy

Zirui Li

Kristiina Iida Inkeri Ojala

Ilona Lähteenmäki

Software & Demonstrations

Viimeisimmät julkaisut

Self-Supervised App-Based Speech Training for Children With Speech Sound Disorder—A Single-Case Experimental Design Study

A transformer-based spelling error correction framework for Bangla and resource scarce Indic languages

Multi-Teacher Language-Aware Knowledge Distillation for Multilingual Speech Emotion Recognition

Is your model big enough? Training and interpreting large-scale monolingual speech foundation models

Non-Native Children's Automatic Speech Assessment Challenge (NOCASA)

Towards large-scale speech foundation models for a low-resource minority language

Developing a digital tool for L2 speaking assessment in low-resourced languages

Proceedings of the Workshop on Automatic Assessment of Atypical Speech

Pronunciation Editing for Finnish Speech using Phonetic Posteriorgrams

Mispronunciation Detection Without L2 Pronunciation Dataset in Low-Resource Setting: A Case Study in Finland Swedish