In questo lavoro di tesi, si tratterà il tema del Voice Activity Detection (VAD), cioè il compito di discriminare le regioni audio in parlato e non parlato. Si farà uso dell'analisi Wavelet e dell'operatore Teager Energy Operator, un operatore non lineare in grado di sopprimere le componenti rumorose in maniera efficiente. Verrà analizzato a tal proposito l'algoritmo G.729B, standard di mercato per il VAD, e verranno descritti e confrontati con quest'ultimo tre algoritmi di VAD basati sulle Wavelets. Verranno poi forniti e analizzati alcuni risultati relativi ai test effettuati su macchina.

Voice activity detection su segnali audio rumorosi mediante analisi wavelet

Cracco, Andrea
2010/2011

Abstract

In questo lavoro di tesi, si tratterà il tema del Voice Activity Detection (VAD), cioè il compito di discriminare le regioni audio in parlato e non parlato. Si farà uso dell'analisi Wavelet e dell'operatore Teager Energy Operator, un operatore non lineare in grado di sopprimere le componenti rumorose in maniera efficiente. Verrà analizzato a tal proposito l'algoritmo G.729B, standard di mercato per il VAD, e verranno descritti e confrontati con quest'ultimo tre algoritmi di VAD basati sulle Wavelets. Verranno poi forniti e analizzati alcuni risultati relativi ai test effettuati su macchina.
2010-04-27
116
Voice Activity Detection, wavelet
File in questo prodotto:
File Dimensione Formato  
Tesi_Cracco_Andrea.pdf

accesso aperto

Dimensione 1.02 MB
Formato Adobe PDF
1.02 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/13439