Signaalinkäsittelyn ja akustiikan laitos

Puheentunnistus

Tavoitteemme on parantaa automaattisen puheentunnistuksen menetelmiä Aalto-yliopistossa kehitettävien uusien algoritmien avulla. Puheentunnistus tarjoaa haastavia benchmark-tehtäviä tehokkaille algoritmeille, jotka prosessoivat suuria datamassoja ja oppivat mallintamaan niistä olennaiset piirteet. Akustisten foneemimallien parantamisen lisäksi tähtäämme uusien oppivien ja tilastollisten kielimallien kehittämiseen vaativiin tunnistustehtäviin, joissa käsitellään rajoittamattoman sanaston jatkuvaa puhetta. Ryhmällemme relevantteihin pilotointisovelluksiin kuuluvat eri kielten sanelun lisäksi audioindeksointi, adaptiivinen puhesynteesi ja puheesta puheeseen käännös.
Speech_Recognition_Aalto_University

Software & Demonstrations

Software produced as part of our research is available on our GitHub

Demonstration videos of our research work can be watched on our YouTube Channel

Viimeisimmät julkaisut

Spectral modification for recognition of children’s speech under mismatched conditions

Hemant Kathania, Sudarsana Kadiri, Paavo Alku, Mikko Kurimo 2021 Proc. 23rd Nordic Conference on Computational Linguistics (NoDaLiDa)

Advances in subword-based HMM-DNN speech recognition across languages

Peter Smit, Sami Virpioja, Mikko Kurimo 2021 Computer Speech and Language

Morphologically motivated word classes for very large vocabulary speech recognition of Finnish and Estonian

Matti Varjokallio, Sami Virpioja, Mikko Kurimo 2021 Computer Speech and Language

Graph-based Syntactic Word Embeddings

Ragheb Al-Ghezi, Mikko Kurimo 2020 Proceedings of the Graph-based Methods for Natural Language Processing (TextGraphs)

Applying dnn adaptation to reduce the session dependency of ultrasound tongue imaging-based silent speech interfaces

Gábor Gosztolya, Tamás Grósz, László Tóth, Alexandra Markó, Tamás Gábor Csapó 2020 ACTA POLYTECHNICA HUNGARICA

Visual Interpretation of DNN-based Acoustic Models using Deep Autoencoders

Tamás Grósz, Mikko Kurimo 2020 Machine Learning Methods in Visualisation for Big Data

Morfessor EM+Prune: Improved subword segmentation with expectation maximization and pruning

Stig Arne Grönroos, Sami Virpioja, Mikko Kurimo 2020 Proceedings of The 12th Language Resources and Evaluation Conference
More information on our research in the Research database.
Research database
  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu