SoundRise is an interactive application designed for educational and therapeutic purposes, particularly in vocal therapy and speech modulation. Since its creation, the project has evolved through various stages, improving its portability, user interface, and functionality. The latest version, now a web-based platform developed with React JS, enhances accessibility, especially for children practicing speech therapy, while maintaining its core feature as an engaging educational game for vocal exploration. Despite these advancements, challenges persist, particularly in the area of timbre (vowel) recognition. The current timbre recognition method relies on a deterministic approach based on formant analysis for classification, but it faces limitations that affect its classification accuracy. This thesis aims to address these limitations by exploring machine learning techniques to improve the performance of the timbre recognition system. The work provides a comprehensive analysis of the underlying theory, implementation process, and results, with the goal of refining the application’s overall functionality.
SoundRise è un'applicazione interattiva progettata per scopi educativi e terapeutici, in particolare nella terapia vocale e nella modulazione della voce. Dalla sua creazione, il progetto si è evoluto attraverso varie fasi, migliorando la sua portabilità, l'interfaccia utente e le funzionalità. L'ultima versione, ora una piattaforma web sviluppata con React JS, migliora l'accessibilità, soprattutto per i bambini che praticano la logopedia, mantenendo al contempo la sua caratteristica principale come un gioco educativo coinvolgente per l'esplorazione vocale. Nonostante questi progressi, persistono delle sfide, in particolare nell'area del riconoscimento del timbro (vocali). L'attuale metodo di riconoscimento del timbro si basa su un approccio deterministico basato sull'analisi dei formanti per la classificazione, ma presenta delle limitazioni che influenzano l'accuratezza della classificazione. Questa tesi si propone di affrontare tali limitazioni esplorando tecniche di machine learning per migliorare le prestazioni del sistema di riconoscimento del timbro. Il lavoro fornisce un'analisi completa della teoria di base, del processo di implementazione e dei risultati, con l'obiettivo di affinare la funzionalità complessiva dell'applicazione.
Vowel Recognition in SoundRise: A Machine Learning Approach to Improve Accuracy and Reliability
FRIGATO, FRANCESCO
2024/2025
Abstract
SoundRise is an interactive application designed for educational and therapeutic purposes, particularly in vocal therapy and speech modulation. Since its creation, the project has evolved through various stages, improving its portability, user interface, and functionality. The latest version, now a web-based platform developed with React JS, enhances accessibility, especially for children practicing speech therapy, while maintaining its core feature as an engaging educational game for vocal exploration. Despite these advancements, challenges persist, particularly in the area of timbre (vowel) recognition. The current timbre recognition method relies on a deterministic approach based on formant analysis for classification, but it faces limitations that affect its classification accuracy. This thesis aims to address these limitations by exploring machine learning techniques to improve the performance of the timbre recognition system. The work provides a comprehensive analysis of the underlying theory, implementation process, and results, with the goal of refining the application’s overall functionality.File | Dimensione | Formato | |
---|---|---|---|
Frigato_Francesco.pdf
accesso aperto
Dimensione
911.86 kB
Formato
Adobe PDF
|
911.86 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/83031