Nell’ambito dell’Intelligenza Artificiale, le Reti Neurali Convoluzionali ricoprono un ruolo importante, se non principale, nel riconoscimento di immagini e video, di suoni, del linguaggio naturale, e di molti altri aspetti. La loro versatilità è resa possibile dalla tecnica del Transfer Learning, ovvero dalla capacità di alterare il tipo di oggetto da riconoscere (pattern) usando la conoscenza già assimilata: al posto di addestrare tutta la rete a riconoscere nuovi pattern, si addestrano solo gli ultimi strati connessi della rete in questione. Si può così, ad esempio, utilizzare una rete già addestrata al riconoscimento di immagini, cambiare i suoi ultimi livelli, e adattarla al riconoscimento di suoni. In questo lavoro studiamo tramite la piattaforma Matlab le performance di tre reti neurali, create per il riconoscimento di immagini, nell’identificazione dei leoni dal loro ruggito. Abbiamo a disposizione un dataset di 164 ruggiti, e 26 tecniche di rappresentazione dei pattern audio. Il risultato conferma che con questi strumenti è possibile ottenere un alto livello di accuratezza nel problema di identificazione: con una singola rete si arriva fino a quasi il 94% di accuratezza nell’identificazione, ed ancora di più se si usa un ensemble di due o tre reti convoluzionali.

Reti Neurali Convoluzionali per l'identificazione di Leoni Africani da pattern audio

SPINATO, MATTEO
2021/2022

Abstract

Nell’ambito dell’Intelligenza Artificiale, le Reti Neurali Convoluzionali ricoprono un ruolo importante, se non principale, nel riconoscimento di immagini e video, di suoni, del linguaggio naturale, e di molti altri aspetti. La loro versatilità è resa possibile dalla tecnica del Transfer Learning, ovvero dalla capacità di alterare il tipo di oggetto da riconoscere (pattern) usando la conoscenza già assimilata: al posto di addestrare tutta la rete a riconoscere nuovi pattern, si addestrano solo gli ultimi strati connessi della rete in questione. Si può così, ad esempio, utilizzare una rete già addestrata al riconoscimento di immagini, cambiare i suoi ultimi livelli, e adattarla al riconoscimento di suoni. In questo lavoro studiamo tramite la piattaforma Matlab le performance di tre reti neurali, create per il riconoscimento di immagini, nell’identificazione dei leoni dal loro ruggito. Abbiamo a disposizione un dataset di 164 ruggiti, e 26 tecniche di rappresentazione dei pattern audio. Il risultato conferma che con questi strumenti è possibile ottenere un alto livello di accuratezza nel problema di identificazione: con una singola rete si arriva fino a quasi il 94% di accuratezza nell’identificazione, ed ancora di più se si usa un ensemble di due o tre reti convoluzionali.
2021
Convolutional Neural Networks for identification of African Lions from audio patterns
CNN
Identificazione
Pattern audio
Leoni Africani
File in questo prodotto:
File Dimensione Formato  
Spinato_Matteo.pdf

accesso aperto

Dimensione 509.4 kB
Formato Adobe PDF
509.4 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/32240