Signaalinkäsittelyn ja akustiikan laitos

Puheentunnistus

Tavoitteemme on parantaa automaattisen puheentunnistuksen menetelmiä Aalto-yliopistossa kehitettävien uusien algoritmien avulla.
Speech_Recognition_Aalto_University

Puheentunnistus tarjoaa haastavia benchmark-tehtäviä tehokkaille algoritmeille, jotka prosessoivat suuria datamassoja ja oppivat mallintamaan niistä olennaiset piirteet.  Akustisten foneemimallien parantamisen lisäksi tähtäämme uusien oppivien ja tilastollisten kielimallien kehittämiseen vaativiin tunnistustehtäviin, joissa käsitellään rajoittamattoman sanaston jatkuvaa puhetta.  Ryhmällemme relevantteihin pilotointisovelluksiin kuuluvat eri kielten sanelun lisäksi audioindeksointi, adaptiivinen puhesynteesi ja puheesta puheeseen käännös.

Lue lisää tutkimuksesta

Ryhmän jäsenet

Software & Demonstrations

Software produced as part of our research is available on our GitHub

Demonstration videos of our research work can be watched on our YouTube Channel

Viimeisimmät julkaisut

wav2vec2-based Speech Rating System for Children with Speech Sound Disorder

Yaroslav Getman, Ragheb Al-Ghezi, Ekaterina Voskoboinik, Tamás Grósz, Mikko Kurimo, Giampiero Salvi, Torbjørn Svendsen, Sofia Strömbergsson 2022 Proceedings of Interspeech'22

Tracing Signs of Urbanity in the Finnish Fiction Film of the 1950s: Toward a Multimodal Analysis of Audiovisual Data

Tamás Grósz, Noora Kallioniemi, Harri Kiiskinen, Kimmo Laine, Anssi Moisio, Tommi Römpötti, Anja Virkkunen, Hannu Salmi, Mikko Kurimo, Jorma Laaksonen 2022 Proceedings of the 6th Digital Humanities in the Nordic and Baltic Countries Conference (DHNB 2022), Long Papers

Gaming enhances learning-induced plastic changes in the brain

Katja Junttila, Anna Riikka Smolander, Reima Karhila, Anastasia Giannakopoulou, Maria Uther, Mikko Kurimo, Sari Ylinen 2022 Brain and Language

Comparison and Analysis of New Curriculum Criteria for End-to-End ASR

Georgios Karakasidis, Tamás Grósz, Mikko Kurimo 2022 Proceedings of Interspeech'22

A Formant Modification Method for Improved ASR of Children’s Speech

Hemant Kathania, Sudarsana Kadiri, Paavo Alku, Mikko Kurimo 2022 Speech Communication

Data Augmentation Using Spectral Warping for Low Resource Children ASR

Hemant Kumar Kathania, Viredner Kadyan, Sudarsana Reddy Kadiri, Mikko Kurimo 2022 Journal of Signal Processing Systems

Lahjoita puhetta: a large-scale corpus of spoken Finnish with some benchmarks

Anssi Moisio, Dejan Porjazovski, Aku Rouhe, Yaroslav Getman, Anja Virkkunen, Ragheb AlGhezi, Mietta Lennes, Tamás Grósz, Krister Lindén, Mikko Kurimo 2022 LANGUAGE RESOURCES AND EVALUATION

Low Resource Comparison of Attention-based and Hybrid ASR Exploiting wav2vec 2.0

Aku Rouhe, Anja Virkkunen, Juho Leinonen, Mikko Kurimo 2022 Proceedings of Interspeech'22

Self-supervised end-to-end ASR for low resource L2 Swedish

Ragheb Al-Ghezi, Yaroslav Getman, Aku Rouhe, Raili Hildén, Mikko Kurimo 2021 22nd Annual Conference of the International Speech Communication Association, INTERSPEECH 2021

LSTM-XL: Attention Enhanced Long-Term Memory for LSTM Cells

Tamás Grósz, Mikko Kurimo 2021 Text, Speech, and Dialogue - 24th International Conference, TSD 2021, Proceedings
More information on our research in the Research database.
Research database
  • Julkaistu:
  • Päivitetty:
Jaa
URL kopioitu