La classificazione di suoni ambientali è una componente fondamentale in numerose situazioni quotidiane; grazie ai recenti sviluppi delle tecnologie di deep learning è stato possibile sviluppare sistemi di classificazione sempre più robusti ed efficienti. L'obiettivo che questa tesi si propone è quello di progettare ed implementare un sistema di classificazione di suoni ambientali basato sulle reti neurali convoluzionali, riconosciute come uno dei metodi più affidabili in ambito di sistemi di classificazione. L'utilizzo di questa tipologia di reti, infatti, permette l'estrazione e l'analisi di caratteristiche gerarchiche dai segnali audio particolarmente efficienti per il riconoscimento di suoni. Il metodo di sviluppo include l'utilizzo di un dataset di suoni ambientali e l'implementazione di una rete neurale convoluzionale realizzata per catturare al meglio le caratteristiche estratte dai vari segnali audio. Il modello realizzato è quindi allenato e ottimizzato attraverso un processo di sperimentazione, ponendo particolare attenzione alla regolazione degli iperparametri della rete. Il modello è successivamente valutato attraverso una fase di test della rete, mostrando le potenzialità delle reti convoluzionali applicate in ambiti di classificazione di suoni. Infine, dopo un'analisi dei risultati ottenuti, viene effettuato un resoconto del lavoro svolto evidenziando le limitazioni del progetto e le possibili direzioni dello sviluppo futuro.

Reti Neurali Convoluzionali per la Classificazione di Suoni Ambientali

GUIDOLIN, FEDERICO
2023/2024

Abstract

La classificazione di suoni ambientali è una componente fondamentale in numerose situazioni quotidiane; grazie ai recenti sviluppi delle tecnologie di deep learning è stato possibile sviluppare sistemi di classificazione sempre più robusti ed efficienti. L'obiettivo che questa tesi si propone è quello di progettare ed implementare un sistema di classificazione di suoni ambientali basato sulle reti neurali convoluzionali, riconosciute come uno dei metodi più affidabili in ambito di sistemi di classificazione. L'utilizzo di questa tipologia di reti, infatti, permette l'estrazione e l'analisi di caratteristiche gerarchiche dai segnali audio particolarmente efficienti per il riconoscimento di suoni. Il metodo di sviluppo include l'utilizzo di un dataset di suoni ambientali e l'implementazione di una rete neurale convoluzionale realizzata per catturare al meglio le caratteristiche estratte dai vari segnali audio. Il modello realizzato è quindi allenato e ottimizzato attraverso un processo di sperimentazione, ponendo particolare attenzione alla regolazione degli iperparametri della rete. Il modello è successivamente valutato attraverso una fase di test della rete, mostrando le potenzialità delle reti convoluzionali applicate in ambiti di classificazione di suoni. Infine, dopo un'analisi dei risultati ottenuti, viene effettuato un resoconto del lavoro svolto evidenziando le limitazioni del progetto e le possibili direzioni dello sviluppo futuro.
2023
Convolutional Neural Networks for Environmental Sound Classification
Reti Neurali
Suoni ambientali
Classificazione
Deep Learning
File in questo prodotto:
File Dimensione Formato  
Guidolin_Federico.pdf

accesso aperto

Dimensione 1.07 MB
Formato Adobe PDF
1.07 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/62797