Vowel Recognition in SoundRise: A Machine Learning Approach to Improve Accuracy and Reliability

SoundRise is an interactive application designed for educational and therapeutic purposes, particularly in vocal therapy and speech modulation. Since its creation, the project has evolved through various stages, improving its portability, user interface, and functionality. The latest version, now a web-based platform developed with React JS, enhances accessibility, especially for children practicing speech therapy, while maintaining its core feature as an engaging educational game for vocal exploration. Despite these advancements, challenges persist, particularly in the area of timbre (vowel) recognition. The current timbre recognition method relies on a deterministic approach based on formant analysis for classification, but it faces limitations that affect its classification accuracy. This thesis aims to address these limitations by exploring machine learning techniques to improve the performance of the timbre recognition system. The work provides a comprehensive analysis of the underlying theory, implementation process, and results, with the goal of refining the application’s overall functionality.

SoundRise è un'applicazione interattiva progettata per scopi educativi e terapeutici, in particolare nella terapia vocale e nella modulazione della voce. Dalla sua creazione, il progetto si è evoluto attraverso varie fasi, migliorando la sua portabilità, l'interfaccia utente e le funzionalità. L'ultima versione, ora una piattaforma web sviluppata con React JS, migliora l'accessibilità, soprattutto per i bambini che praticano la logopedia, mantenendo al contempo la sua caratteristica principale come un gioco educativo coinvolgente per l'esplorazione vocale. Nonostante questi progressi, persistono delle sfide, in particolare nell'area del riconoscimento del timbro (vocali). L'attuale metodo di riconoscimento del timbro si basa su un approccio deterministico basato sull'analisi dei formanti per la classificazione, ma presenta delle limitazioni che influenzano l'accuratezza della classificazione. Questa tesi si propone di affrontare tali limitazioni esplorando tecniche di machine learning per migliorare le prestazioni del sistema di riconoscimento del timbro. Il lavoro fornisce un'analisi completa della teoria di base, del processo di implementazione e dei risultati, con l'obiettivo di affinare la funzionalità complessiva dell'applicazione.

Vowel Recognition in SoundRise: A Machine Learning Approach to Improve Accuracy and Reliability

FRIGATO, FRANCESCO

2024/2025

Abstract

SoundRise is an interactive application designed for educational and therapeutic purposes, particularly in vocal therapy and speech modulation. Since its creation, the project has evolved through various stages, improving its portability, user interface, and functionality. The latest version, now a web-based platform developed with React JS, enhances accessibility, especially for children practicing speech therapy, while maintaining its core feature as an engaging educational game for vocal exploration. Despite these advancements, challenges persist, particularly in the area of timbre (vowel) recognition. The current timbre recognition method relies on a deterministic approach based on formant analysis for classification, but it faces limitations that affect its classification accuracy. This thesis aims to address these limitations by exploring machine learning techniques to improve the performance of the timbre recognition system. The work provides a comprehensive analysis of the underlying theory, implementation process, and results, with the goal of refining the application’s overall functionality.

Scheda

Scheda DC

	Facoltà/Dipartimento
	
				Dipartimento di Ingegneria dell'Informazione - DEI
			
	Corso di studio
	
				COMPUTER ENGINEERING Laurea Magistrale (D.M. 270/2004)
			
	Anno Accademico
	
				2024
			
	Titolo inglese
	
				Vowel Recognition in SoundRise: A Machine Learning Approach to Improve Accuracy and Reliability
			
	Abstract in italiano
	
				SoundRise è un'applicazione interattiva progettata per scopi educativi e terapeutici, in particolare nella terapia vocale e nella modulazione della voce. Dalla sua creazione, il progetto si è evoluto attraverso varie fasi, migliorando la sua portabilità, l'interfaccia utente e le funzionalità.
L'ultima versione, ora una piattaforma web sviluppata con React JS, migliora l'accessibilità, soprattutto per i bambini che praticano la logopedia, mantenendo al contempo la sua caratteristica principale come un gioco educativo coinvolgente per l'esplorazione vocale. Nonostante questi progressi, persistono delle sfide, in particolare nell'area del riconoscimento del timbro (vocali). L'attuale metodo di riconoscimento del timbro si basa su un approccio deterministico basato sull'analisi dei formanti per la classificazione, ma presenta delle limitazioni che influenzano l'accuratezza della classificazione.
Questa tesi si propone di affrontare tali limitazioni esplorando tecniche di machine learning per migliorare le prestazioni del sistema di riconoscimento del timbro. Il lavoro fornisce un'analisi completa della teoria di base, del processo di implementazione e dei risultati, con l'obiettivo di affinare la funzionalità complessiva dell'applicazione.
			
	Parola chiave
	
				Vowel Recognition
SoundRise
Machine Learning
			
	Relatore
	
				CANAZZA TARGON, SERGIO
			
	Appare nelle tipologie:
	
				Lauree magistrali

File in questo prodotto:

File	Dimensione	Formato
Frigato_Francesco.pdf accesso aperto Dimensione 911.86 kB Formato Adobe PDF Visualizza/Apri	911.86 kB	Adobe PDF	Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/83031