Signaalinkäsittelyn ja akustiikan laitos

Puheentunnistus

Tavoitteemme on parantaa automaattisen puheentunnistuksen menetelmiä Aalto-yliopistossa kehitettävien uusien algoritmien avulla. Puheentunnistus tarjoaa haastavia benchmark-tehtäviä tehokkaille algoritmeille, jotka prosessoivat suuria datamassoja ja oppivat mallintamaan niistä olennaiset piirteet. Akustisten foneemimallien parantamisen lisäksi tähtäämme uusien oppivien ja tilastollisten kielimallien kehittämiseen vaativiin tunnistustehtäviin, joissa käsitellään rajoittamattoman sanaston jatkuvaa puhetta. Ryhmällemme relevantteihin pilotointisovelluksiin kuuluvat eri kielten sanelun lisäksi audioindeksointi, adaptiivinen puhesynteesi ja puheesta puheeseen käännös.
Speech_Recognition_Aalto_University

Software & Demonstrations

Software produced as part of our research is available on our GitHub

Demonstration videos of our research work can be watched on our YouTube Channel

Viimeisimmät julkaisut

Advances in subword-based HMM-DNN speech recognition across languages

Peter Smit, Sami Virpioja, Mikko Kurimo 2021 Computer Speech and Language

Applying dnn adaptation to reduce the session dependency of ultrasound tongue imaging-based silent speech interfaces

Gábor Gosztolya, Tamás Grósz, László Tóth, Alexandra Markó, Tamás Gábor Csapó 2020 ACTA POLYTECHNICA HUNGARICA

Visual Interpretation of DNN-based Acoustic Models using Deep Autoencoders

Tamás Grósz, Mikko Kurimo 2020 Machine Learning Methods in Visualisation for Big Data

Data augmentation using prosody and false starts to recognize non-native children's speech

Hemant Kathania, Mittul Singh, Tamás Grósz, Mikko Kurimo 2020 Proceedings of Interspeech

Study of Formant Modification for Children ASR

Hemant Kathania, Sudarsana Kadiri, Paavo Alku, Mikko Kurimo 2020 Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing

Brain activity reflects the predictability of word sequences in listened continuous speech

Miika Koskinen, Mikko Kurimo, Joachim Gross, Aapo Hyvärinen, Riitta Hari 2020 NeuroImage

FinChat: Corpus and evaluation setup for Finnish chat conversations on everyday topics

Katri Leino, Juho Leinonen, Mittul Singh, Sami Virpioja, Mikko Kurimo 2020 Proceedings of Interspeech

Named Entity Recognition for Spoken Finnish

Dejan Porjazovski, Juho Leinonen, Mikko Kurimo 2020 AI4TV 2020 - Proceedings of the 2nd International Workshop on AI for Smart TV Content Production, Access and Delivery

Speaker-Aware Training of Attention-Based End-to-End Speech Recognition Using Neural Speaker Embeddings

Aku Rouhe, Tuomas Kaseva, Mikko Kurimo 2020 2020 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2020 - Proceedings

Creating speaker independent ASR system through prosody modification based data augmentation

S. Shahnawazuddin, Nagaraj Adiga, Hemant Kumar Kathania, B. Tarun Sai 2020 Pattern Recognition Letters
More information on our research in the Research database.
Research database
  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu