Lo scopo di questa tesi è quello di analizzare una metodologia di sviluppo per la creazioni di applicazioni legate all’object classification per mezzo dell’utilizzo di modelli per il deep learning supervisionati. Per prima cosa si sono analizzati le varie declinazioni che caratterizzano la computer vision, di cui l’object classification ne rappresenta una task e si sono analizzate le ragioni per cui l’analisi delle immagini viene gestita efficacemente dai modelli per il deep learning. Si è suddiviso di conseguenza il processo di creazione di un’applicazione di computer vision attraverso tre fasi principali: la creazione del dataset supervisionato, lo sviluppo di un modello adeguato di deep learning e infine la definizione di tecniche per la messa in produzione del modello. La prima parte dell’elaborato verte perciò sullo studio delle immagini e ne definisce una metodologia (per mezzo di script python) che permette di costruire dataset supervisionati: la finalizzazione di questa componente è rappresentata dalla costruzione di un dataset toy che verrà utilizzato come base per lo sviluppo e confronto dei modelli. In seguito, si sono studiate le reti feed forward e le reti convoluzionali, che rappresentano i modelli adatti a gestire tale task, ponendo particolare enfasi sullo studio del funzionamento algebrico che caratterizzano queste tipologie di reti, in modo che tramite la lettura dell’elaborato si possa ottenere una conoscenza completa e profonda del funzionamento di tale tipologia di modelli. La fase di studio e analisi dei modelli, è inoltre corredata da simulazioni atte a fornire una rappresentazione degli effetti che i concetti teorici, introdotti sulle strutture delle reti, hanno nei confronti delle performance ottenute dai modelli analizzati. Infine la fase di messa in produzione è presentata per mezzo di due tipologie di deployment, che permettono l’implementazione delle reti addestrate come componenti di servizi web, o come componenti facenti parte del processo di gestione di un caso di studio determinato dall’utilizzo di immagini tratte da un processo produttivo industriale. Tutte le componenti prodotte per la gestione delle tre fasi sono sviluppate in python e sfruttano componenti contenute nei framework: opencv e tensorflow.

Computer vision: implementazione, modelli di deep learning e applicazioni

SALVALAGGIO, MARCO
2021/2022

Abstract

Lo scopo di questa tesi è quello di analizzare una metodologia di sviluppo per la creazioni di applicazioni legate all’object classification per mezzo dell’utilizzo di modelli per il deep learning supervisionati. Per prima cosa si sono analizzati le varie declinazioni che caratterizzano la computer vision, di cui l’object classification ne rappresenta una task e si sono analizzate le ragioni per cui l’analisi delle immagini viene gestita efficacemente dai modelli per il deep learning. Si è suddiviso di conseguenza il processo di creazione di un’applicazione di computer vision attraverso tre fasi principali: la creazione del dataset supervisionato, lo sviluppo di un modello adeguato di deep learning e infine la definizione di tecniche per la messa in produzione del modello. La prima parte dell’elaborato verte perciò sullo studio delle immagini e ne definisce una metodologia (per mezzo di script python) che permette di costruire dataset supervisionati: la finalizzazione di questa componente è rappresentata dalla costruzione di un dataset toy che verrà utilizzato come base per lo sviluppo e confronto dei modelli. In seguito, si sono studiate le reti feed forward e le reti convoluzionali, che rappresentano i modelli adatti a gestire tale task, ponendo particolare enfasi sullo studio del funzionamento algebrico che caratterizzano queste tipologie di reti, in modo che tramite la lettura dell’elaborato si possa ottenere una conoscenza completa e profonda del funzionamento di tale tipologia di modelli. La fase di studio e analisi dei modelli, è inoltre corredata da simulazioni atte a fornire una rappresentazione degli effetti che i concetti teorici, introdotti sulle strutture delle reti, hanno nei confronti delle performance ottenute dai modelli analizzati. Infine la fase di messa in produzione è presentata per mezzo di due tipologie di deployment, che permettono l’implementazione delle reti addestrate come componenti di servizi web, o come componenti facenti parte del processo di gestione di un caso di studio determinato dall’utilizzo di immagini tratte da un processo produttivo industriale. Tutte le componenti prodotte per la gestione delle tre fasi sono sviluppate in python e sfruttano componenti contenute nei framework: opencv e tensorflow.
2021
Computer vision: implementation, deep learning models and applications
deep learning
computer vision
tensorflow
opencv
data engineering
File in questo prodotto:
File Dimensione Formato  
Salvalaggio_Marco.pdf

accesso riservato

Dimensione 7.76 MB
Formato Adobe PDF
7.76 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/11377