Questa tesi espone una implementazione di localizzazione della sorgente sonora tramite l'utilizzo di un array microfonico, precisamente il Kinect v1. Inoltre viene descritta la feature extraction degli attributi desiderati da alcuni file audio scelti come campione, e l'utilizzo di modelli di Machine Learning per il riconoscimento di scream e shotgun. Dai risultati viene proposto come modello il Random Forest, che presenta una correttezza di predizione del 95%.
Localizzazione e riconoscimento di eventi sonori tramite array microfonico
Pagin, Davide
2016/2017
Abstract
Questa tesi espone una implementazione di localizzazione della sorgente sonora tramite l'utilizzo di un array microfonico, precisamente il Kinect v1. Inoltre viene descritta la feature extraction degli attributi desiderati da alcuni file audio scelti come campione, e l'utilizzo di modelli di Machine Learning per il riconoscimento di scream e shotgun. Dai risultati viene proposto come modello il Random Forest, che presenta una correttezza di predizione del 95%.File in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
Tesi_Davide_Pagin.pdf
accesso aperto
Dimensione
1.31 MB
Formato
Adobe PDF
|
1.31 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
Utilizza questo identificativo per citare o creare un link a questo documento:
https://hdl.handle.net/20.500.12608/27144