Signaalinkäsittelyn ja akustiikan laitos

Puheentunnistus

Tavoitteemme on parantaa automaattisen puheentunnistuksen menetelmiä Aalto-yliopistossa kehitettävien uusien algoritmien avulla. Puheentunnistus tarjoaa haastavia benchmark-tehtäviä tehokkaille algoritmeille, jotka prosessoivat suuria datamassoja ja oppivat mallintamaan niistä olennaiset piirteet. Akustisten foneemimallien parantamisen lisäksi tähtäämme uusien oppivien ja tilastollisten kielimallien kehittämiseen vaativiin tunnistustehtäviin, joissa käsitellään rajoittamattoman sanaston jatkuvaa puhetta. Ryhmällemme relevantteihin pilotointisovelluksiin kuuluvat eri kielten sanelun lisäksi audioindeksointi, adaptiivinen puhesynteesi ja puheesta puheeseen käännös.
Speech_Recognition_Aalto_University

Software & Demonstrations

Software produced as part of our research is available on our GitHub

Demonstration videos of our research work can be watched on our YouTube Channel

Viimeisimmät julkaisut

Transfer learning and subword sampling for asymmetric-resource one-to-many neural translation

Stig-Arne Grönroos, Sami Virpioja, Mikko Kurimo 2021 MACHINE TRANSLATION

Advances in subword-based HMM-DNN speech recognition across languages

Peter Smit, Sami Virpioja, Mikko Kurimo 2021 Computer Speech and Language

Morphologically motivated word classes for very large vocabulary speech recognition of Finnish and Estonian

Matti Varjokallio, Sami Virpioja, Mikko Kurimo 2021 Computer Speech and Language

Graph-based Syntactic Word Embeddings

Ragheb Al-Ghezi, Mikko Kurimo 2020 Proceedings of the Graph-based Methods for Natural Language Processing (TextGraphs)

Applying dnn adaptation to reduce the session dependency of ultrasound tongue imaging-based silent speech interfaces

Gábor Gosztolya, Tamás Grósz, László Tóth, Alexandra Markó, Tamás Gábor Csapó 2020 ACTA POLYTECHNICA HUNGARICA

Visual Interpretation of DNN-based Acoustic Models using Deep Autoencoders

Tamás Grósz, Mikko Kurimo 2020 Machine Learning Methods in Visualisation for Big Data

Using Fan-Made Content, Subtitles and Face Recognition for Character-Centric Video Summarization

Ismail Harrando, Alison Reboud, Pasquale Lisena, Raphaël Troncy, Jorma Laaksonen, Anja Virkkunen, Mikko Kurimo 2020 Proceedings of the TRECVID 2020 Workshop

Finnish ASR with deep transformer models

Abhilash Jain, Aku Rouhe, Stig Arne Grönroos, Mikko Kurimo 2020 Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH
More information on our research in the Research database.
Research database
  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu