In questo lavoro è stato realizzato un sistema di riconoscimento del parlatore indipendente dal testo. Sono state adottate tecniche di machine learning, in particolare ci si è affidati a modelli a misture Gaussiane per le fasi di training e test, mentre sono stati utilizzati come feature i Mel Frequency Cepstral Coefficients (MFCC). I test sono stati effettuati utilizzando audio di scarsa qualità, in modo da testare il sistema in condizioni non ideali

Analisi vocale per il riconoscimento dell'identità del parlatore

Bressan, Matteo
2015/2016

Abstract

In questo lavoro è stato realizzato un sistema di riconoscimento del parlatore indipendente dal testo. Sono state adottate tecniche di machine learning, in particolare ci si è affidati a modelli a misture Gaussiane per le fasi di training e test, mentre sono stati utilizzati come feature i Mel Frequency Cepstral Coefficients (MFCC). I test sono stati effettuati utilizzando audio di scarsa qualità, in modo da testare il sistema in condizioni non ideali
2015-04-21
riconoscimento vocale, speaker recognition, misture gaussiane, mfcc
File in questo prodotto:
File Dimensione Formato  
tesiBressan.pdf

accesso aperto

Dimensione 1.06 MB
Formato Adobe PDF
1.06 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/19590