Questa tesi espone una implementazione di localizzazione della sorgente sonora tramite l'utilizzo di un array microfonico, precisamente il Kinect v1. Inoltre viene descritta la feature extraction degli attributi desiderati da alcuni file audio scelti come campione, e l'utilizzo di modelli di Machine Learning per il riconoscimento di scream e shotgun. Dai risultati viene proposto come modello il Random Forest, che presenta una correttezza di predizione del 95%.

Localizzazione e riconoscimento di eventi sonori tramite array microfonico

Pagin, Davide
2016/2017

Abstract

Questa tesi espone una implementazione di localizzazione della sorgente sonora tramite l'utilizzo di un array microfonico, precisamente il Kinect v1. Inoltre viene descritta la feature extraction degli attributi desiderati da alcuni file audio scelti come campione, e l'utilizzo di modelli di Machine Learning per il riconoscimento di scream e shotgun. Dai risultati viene proposto come modello il Random Forest, che presenta una correttezza di predizione del 95%.
2016-09-12
sonoro, localizzazione, riconoscimento
File in questo prodotto:
File Dimensione Formato  
Tesi_Davide_Pagin.pdf

accesso aperto

Dimensione 1.31 MB
Formato Adobe PDF
1.31 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/27144