In questo lavoro è stato realizzato un sistema di riconoscimento del parlatore indipendente dal testo. Sono state adottate tecniche di machine learning, in particolare ci si è affidati a modelli a misture Gaussiane per le fasi di training e test, mentre sono stati utilizzati come feature i Mel Frequency Cepstral Coefficients (MFCC). I test sono stati effettuati utilizzando audio di scarsa qualità, in modo da testare il sistema in condizioni non ideali
Analisi vocale per il riconoscimento dell'identità del parlatore
Bressan, Matteo
2015/2016
Abstract
In questo lavoro è stato realizzato un sistema di riconoscimento del parlatore indipendente dal testo. Sono state adottate tecniche di machine learning, in particolare ci si è affidati a modelli a misture Gaussiane per le fasi di training e test, mentre sono stati utilizzati come feature i Mel Frequency Cepstral Coefficients (MFCC). I test sono stati effettuati utilizzando audio di scarsa qualità, in modo da testare il sistema in condizioni non idealiFile in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
tesiBressan.pdf
accesso aperto
Dimensione
1.06 MB
Formato
Adobe PDF
|
1.06 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
Utilizza questo identificativo per citare o creare un link a questo documento:
https://hdl.handle.net/20.500.12608/19590