La rapida evoluzione dell’intelligenza artificiale negli ultimi anni, come per molti altri settori ha portato innovazione nel campo della Visione Artificiale: ne sono d’esempio i ViT (Vision Transformers) e le CNN (Convolutional Neural Networks). Dal punto di vista ingegneristico, tuttavia, è fondamentale essere consapevoli e valutare attentamente le diverse strategie implementative disponibili prima di cimentarsi nello sviluppo di un progetto. Questa tesi si propone di analizzare la pipeline classica di computer vision prendendola come caso di studio e, per ciascuno dei suoi blocchi funzionali, esamina le principali alternative implementative, discutendone vantaggi e limitazioni. Inoltre verranno analizzati due modelli di deep learning utili all’elaborazione del contesto dell’immagine da parte dei calcolatori: il primo basato su architettura Yolo, il secondo su MobileNet. Le conoscenze acquisite vengono infine applicate a un problema reale: la digitalizzazione automatica di scacchiere 2D partendo da foto scattate da dispositivo mobile Android per permettere l’analisi delle posizioni sulla scacchiera. Verranno documentate e descritte le scelte progettuali adottate, illustrati i dettagli implementativi ed effettuati alcuni test volti a comparare e valutare i risultati delle varie decisioni implementative.
Digitalizzazione di scacchiere bidimensionali: studio delle tecniche di computer vision per la progettazione e realizzazione di un'applicazione Android
LAVARINI, ANGELO
2025/2026
Abstract
La rapida evoluzione dell’intelligenza artificiale negli ultimi anni, come per molti altri settori ha portato innovazione nel campo della Visione Artificiale: ne sono d’esempio i ViT (Vision Transformers) e le CNN (Convolutional Neural Networks). Dal punto di vista ingegneristico, tuttavia, è fondamentale essere consapevoli e valutare attentamente le diverse strategie implementative disponibili prima di cimentarsi nello sviluppo di un progetto. Questa tesi si propone di analizzare la pipeline classica di computer vision prendendola come caso di studio e, per ciascuno dei suoi blocchi funzionali, esamina le principali alternative implementative, discutendone vantaggi e limitazioni. Inoltre verranno analizzati due modelli di deep learning utili all’elaborazione del contesto dell’immagine da parte dei calcolatori: il primo basato su architettura Yolo, il secondo su MobileNet. Le conoscenze acquisite vengono infine applicate a un problema reale: la digitalizzazione automatica di scacchiere 2D partendo da foto scattate da dispositivo mobile Android per permettere l’analisi delle posizioni sulla scacchiera. Verranno documentate e descritte le scelte progettuali adottate, illustrati i dettagli implementativi ed effettuati alcuni test volti a comparare e valutare i risultati delle varie decisioni implementative.| File | Dimensione | Formato | |
|---|---|---|---|
|
Lavarini_Angelo.pdf
accesso aperto
Dimensione
4.5 MB
Formato
Adobe PDF
|
4.5 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/104330