Lo scopo di questa tesi è quello di analizzare una metodologia di sviluppo per la creazioni di applicazioni legate all’object classification per mezzo dell’utilizzo di modelli per il deep learning supervisionati. Per prima cosa si sono analizzati le varie declinazioni che caratterizzano la computer vision, di cui l’object classification ne rappresenta una task e si sono analizzate le ragioni per cui l’analisi delle immagini viene gestita efficacemente dai modelli per il deep learning. Si è suddiviso di conseguenza il processo di creazione di un’applicazione di computer vision attraverso tre fasi principali: la creazione del dataset supervisionato, lo sviluppo di un modello adeguato di deep learning e infine la definizione di tecniche per la messa in produzione del modello. La prima parte dell’elaborato verte perciò sullo studio delle immagini e ne definisce una metodologia (per mezzo di script python) che permette di costruire dataset supervisionati: la finalizzazione di questa componente è rappresentata dalla costruzione di un dataset toy che verrà utilizzato come base per lo sviluppo e confronto dei modelli. In seguito, si sono studiate le reti feed forward e le reti convoluzionali, che rappresentano i modelli adatti a gestire tale task, ponendo particolare enfasi sullo studio del funzionamento algebrico che caratterizzano queste tipologie di reti, in modo che tramite la lettura dell’elaborato si possa ottenere una conoscenza completa e profonda del funzionamento di tale tipologia di modelli. La fase di studio e analisi dei modelli, è inoltre corredata da simulazioni atte a fornire una rappresentazione degli effetti che i concetti teorici, introdotti sulle strutture delle reti, hanno nei confronti delle performance ottenute dai modelli analizzati. Infine la fase di messa in produzione è presentata per mezzo di due tipologie di deployment, che permettono l’implementazione delle reti addestrate come componenti di servizi web, o come componenti facenti parte del processo di gestione di un caso di studio determinato dall’utilizzo di immagini tratte da un processo produttivo industriale. Tutte le componenti prodotte per la gestione delle tre fasi sono sviluppate in python e sfruttano componenti contenute nei framework: opencv e tensorflow.
Computer vision: implementazione, modelli di deep learning e applicazioni
SALVALAGGIO, MARCO
2021/2022
Abstract
Lo scopo di questa tesi è quello di analizzare una metodologia di sviluppo per la creazioni di applicazioni legate all’object classification per mezzo dell’utilizzo di modelli per il deep learning supervisionati. Per prima cosa si sono analizzati le varie declinazioni che caratterizzano la computer vision, di cui l’object classification ne rappresenta una task e si sono analizzate le ragioni per cui l’analisi delle immagini viene gestita efficacemente dai modelli per il deep learning. Si è suddiviso di conseguenza il processo di creazione di un’applicazione di computer vision attraverso tre fasi principali: la creazione del dataset supervisionato, lo sviluppo di un modello adeguato di deep learning e infine la definizione di tecniche per la messa in produzione del modello. La prima parte dell’elaborato verte perciò sullo studio delle immagini e ne definisce una metodologia (per mezzo di script python) che permette di costruire dataset supervisionati: la finalizzazione di questa componente è rappresentata dalla costruzione di un dataset toy che verrà utilizzato come base per lo sviluppo e confronto dei modelli. In seguito, si sono studiate le reti feed forward e le reti convoluzionali, che rappresentano i modelli adatti a gestire tale task, ponendo particolare enfasi sullo studio del funzionamento algebrico che caratterizzano queste tipologie di reti, in modo che tramite la lettura dell’elaborato si possa ottenere una conoscenza completa e profonda del funzionamento di tale tipologia di modelli. La fase di studio e analisi dei modelli, è inoltre corredata da simulazioni atte a fornire una rappresentazione degli effetti che i concetti teorici, introdotti sulle strutture delle reti, hanno nei confronti delle performance ottenute dai modelli analizzati. Infine la fase di messa in produzione è presentata per mezzo di due tipologie di deployment, che permettono l’implementazione delle reti addestrate come componenti di servizi web, o come componenti facenti parte del processo di gestione di un caso di studio determinato dall’utilizzo di immagini tratte da un processo produttivo industriale. Tutte le componenti prodotte per la gestione delle tre fasi sono sviluppate in python e sfruttano componenti contenute nei framework: opencv e tensorflow.File | Dimensione | Formato | |
---|---|---|---|
Salvalaggio_Marco.pdf
accesso riservato
Dimensione
7.76 MB
Formato
Adobe PDF
|
7.76 MB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/11377