In questo lavoro di tesi, si tratterà il tema del Voice Activity Detection (VAD), cioè il compito di discriminare le regioni audio in parlato e non parlato. Si farà uso dell'analisi Wavelet e dell'operatore Teager Energy Operator, un operatore non lineare in grado di sopprimere le componenti rumorose in maniera efficiente. Verrà analizzato a tal proposito l'algoritmo G.729B, standard di mercato per il VAD, e verranno descritti e confrontati con quest'ultimo tre algoritmi di VAD basati sulle Wavelets. Verranno poi forniti e analizzati alcuni risultati relativi ai test effettuati su macchina.
Voice activity detection su segnali audio rumorosi mediante analisi wavelet
Cracco, Andrea
2010/2011
Abstract
In questo lavoro di tesi, si tratterà il tema del Voice Activity Detection (VAD), cioè il compito di discriminare le regioni audio in parlato e non parlato. Si farà uso dell'analisi Wavelet e dell'operatore Teager Energy Operator, un operatore non lineare in grado di sopprimere le componenti rumorose in maniera efficiente. Verrà analizzato a tal proposito l'algoritmo G.729B, standard di mercato per il VAD, e verranno descritti e confrontati con quest'ultimo tre algoritmi di VAD basati sulle Wavelets. Verranno poi forniti e analizzati alcuni risultati relativi ai test effettuati su macchina.File | Dimensione | Formato | |
---|---|---|---|
Tesi_Cracco_Andrea.pdf
accesso aperto
Dimensione
1.02 MB
Formato
Adobe PDF
|
1.02 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/13439