La classificazione e la semantic segmentation rappresentano due task fondamentali nell’ambito della Computer Vision, con l’obiettivo di identificare oggetti e regioni di interesse all’interno di un’immagine. Tradizionalmente questi task richiedono una grande quantit`a di dati di addestramento annotati, il che pu`o essere impraticabile o molto costoso in situazioni reali. Negli ultimi anni sono state sviluppate diverse tecniche per affrontare questa sfida e il paradigma del Few-shot Learning emerge come un’area di ricerca promettente. Il Few-shot Learning si concentra sull’apprendimento di nuove classi utilizzando un numero molto limitato di esempi di addestramento, che pu`o variare da pochi esempi (k-shot learning) a uno solo (one-shot learning). La tesi presenta un’analisi delle sfide e delle soluzioni proposte nel campo del Few-Shot Learning applicato alla classificazione e alla semantic segmentation. Vengono esaminati diversi approcci e tecniche che sfruttano il meta-learning e il transfer learning per affrontare entrambi i task. Inoltre, viene condotto un confronto approfondito tra le loro caratteristiche fondamentali e vengono esaminati i benchmark utilizzati per valutare le performance dei modelli. Infine, la tesi prospetta le direzioni future per i due task, basandosi sull’analisi dello stato dell’arte attuale.

Few-shot classification e few-shot semantic segmentation: analisi e prospettive future

CAVINATO, ENRICO
2022/2023

Abstract

La classificazione e la semantic segmentation rappresentano due task fondamentali nell’ambito della Computer Vision, con l’obiettivo di identificare oggetti e regioni di interesse all’interno di un’immagine. Tradizionalmente questi task richiedono una grande quantit`a di dati di addestramento annotati, il che pu`o essere impraticabile o molto costoso in situazioni reali. Negli ultimi anni sono state sviluppate diverse tecniche per affrontare questa sfida e il paradigma del Few-shot Learning emerge come un’area di ricerca promettente. Il Few-shot Learning si concentra sull’apprendimento di nuove classi utilizzando un numero molto limitato di esempi di addestramento, che pu`o variare da pochi esempi (k-shot learning) a uno solo (one-shot learning). La tesi presenta un’analisi delle sfide e delle soluzioni proposte nel campo del Few-Shot Learning applicato alla classificazione e alla semantic segmentation. Vengono esaminati diversi approcci e tecniche che sfruttano il meta-learning e il transfer learning per affrontare entrambi i task. Inoltre, viene condotto un confronto approfondito tra le loro caratteristiche fondamentali e vengono esaminati i benchmark utilizzati per valutare le performance dei modelli. Infine, la tesi prospetta le direzioni future per i due task, basandosi sull’analisi dello stato dell’arte attuale.
2022
Few-shot classification and few-shot semantic segmentation: analysis and future perspectives
Deep Learning
Computer Vision
Few-shot learning
File in questo prodotto:
File Dimensione Formato  
Cavinato_Enrico.pdf

embargo fino al 26/03/2025

Dimensione 4.1 MB
Formato Adobe PDF
4.1 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/52364