La classificazione e la semantic segmentation rappresentano due task fondamentali nell’ambito della Computer Vision, con l’obiettivo di identificare oggetti e regioni di interesse all’interno di un’immagine. Tradizionalmente questi task richiedono una grande quantit`a di dati di addestramento annotati, il che pu`o essere impraticabile o molto costoso in situazioni reali. Negli ultimi anni sono state sviluppate diverse tecniche per affrontare questa sfida e il paradigma del Few-shot Learning emerge come un’area di ricerca promettente. Il Few-shot Learning si concentra sull’apprendimento di nuove classi utilizzando un numero molto limitato di esempi di addestramento, che pu`o variare da pochi esempi (k-shot learning) a uno solo (one-shot learning). La tesi presenta un’analisi delle sfide e delle soluzioni proposte nel campo del Few-Shot Learning applicato alla classificazione e alla semantic segmentation. Vengono esaminati diversi approcci e tecniche che sfruttano il meta-learning e il transfer learning per affrontare entrambi i task. Inoltre, viene condotto un confronto approfondito tra le loro caratteristiche fondamentali e vengono esaminati i benchmark utilizzati per valutare le performance dei modelli. Infine, la tesi prospetta le direzioni future per i due task, basandosi sull’analisi dello stato dell’arte attuale.
Few-shot classification e few-shot semantic segmentation: analisi e prospettive future
CAVINATO, ENRICO
2022/2023
Abstract
La classificazione e la semantic segmentation rappresentano due task fondamentali nell’ambito della Computer Vision, con l’obiettivo di identificare oggetti e regioni di interesse all’interno di un’immagine. Tradizionalmente questi task richiedono una grande quantit`a di dati di addestramento annotati, il che pu`o essere impraticabile o molto costoso in situazioni reali. Negli ultimi anni sono state sviluppate diverse tecniche per affrontare questa sfida e il paradigma del Few-shot Learning emerge come un’area di ricerca promettente. Il Few-shot Learning si concentra sull’apprendimento di nuove classi utilizzando un numero molto limitato di esempi di addestramento, che pu`o variare da pochi esempi (k-shot learning) a uno solo (one-shot learning). La tesi presenta un’analisi delle sfide e delle soluzioni proposte nel campo del Few-Shot Learning applicato alla classificazione e alla semantic segmentation. Vengono esaminati diversi approcci e tecniche che sfruttano il meta-learning e il transfer learning per affrontare entrambi i task. Inoltre, viene condotto un confronto approfondito tra le loro caratteristiche fondamentali e vengono esaminati i benchmark utilizzati per valutare le performance dei modelli. Infine, la tesi prospetta le direzioni future per i due task, basandosi sull’analisi dello stato dell’arte attuale.File | Dimensione | Formato | |
---|---|---|---|
Cavinato_Enrico.pdf
Open Access dal 27/03/2025
Dimensione
4.1 MB
Formato
Adobe PDF
|
4.1 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/52364