Rilevamento di oggetti 3D da immagini 2D: metodi e applicazioni

La rilevazione di oggetti 3D da immagini 2D rappresenta una sfida cruciale nell’abito della visione artificiale e nella robotica, che si pone come obbiettivo quello di individuare la rotazione 3D e la traslazione 3D di oggetti, stimandone così la posa 6D. Questo campo di ricerca mira a determinare con precisione la posizione e l'orientamento degli oggetti in un ambiente tridimensionale. Metteremo in luce l'importanza della stima della posa 6D, un campo in rapida evoluzione, che va dai metodi tradizionali all'apprendimento avanzato, aprendo nuove prospettive di applicazione e offrendo soluzioni innovative negli ambiti industriali, robotici e della realtà aumentata. Questa tesi esplora diverse categorie di metodi utilizzati per affrontare questa sfida, suddividendoli in tre approcci principali: i metodi Template-Based, i metodi Feature-Based e i metodi Learning-Based. Discuteremo le problematiche principali di questo compito difficile, come la presenza di occlusioni, la simmetria degli oggetti e le variazioni di illuminazione. Allo stato dell'arte molti approcci riescono ad affrontare questa sfida con ottimi risultati, riuscendo a calcolare la stima della posa 6D in tempi relativamente brevi (≈ 100ms) e con una precisione notevole, permettendo di stimare la posa anche in real-time. La velocità e l'efficacia della stima della posa 6D è aumentata negli ultimi anni grazie all'utilizzo di metodi di deep-learning e di CNN, che hanno portato questa sfida a un livello successivo. Rimangono comunque ancora tante questioni da migliorare e da risolvere: le CNN devono essere allenate e ciò richiede molto tempo e molte risorse, le occlusioni, gli oggetti senza texture e gli oggetti simmetrici rimangono ancora problemi chiave da affrontare. Esploreremo diversi approcci presenti in letteratura, analizzandone le relative sfide e opportunità, discutendone i metodi utilizzati e individuando possibili direzioni di ricerca future.

Rilevamento di oggetti 3D da immagini 2D: metodi e applicazioni

KOVACHEV, ZLATKO

2022/2023

Abstract

La rilevazione di oggetti 3D da immagini 2D rappresenta una sfida cruciale nell’abito della visione artificiale e nella robotica, che si pone come obbiettivo quello di individuare la rotazione 3D e la traslazione 3D di oggetti, stimandone così la posa 6D. Questo campo di ricerca mira a determinare con precisione la posizione e l'orientamento degli oggetti in un ambiente tridimensionale. Metteremo in luce l'importanza della stima della posa 6D, un campo in rapida evoluzione, che va dai metodi tradizionali all'apprendimento avanzato, aprendo nuove prospettive di applicazione e offrendo soluzioni innovative negli ambiti industriali, robotici e della realtà aumentata. Questa tesi esplora diverse categorie di metodi utilizzati per affrontare questa sfida, suddividendoli in tre approcci principali: i metodi Template-Based, i metodi Feature-Based e i metodi Learning-Based. Discuteremo le problematiche principali di questo compito difficile, come la presenza di occlusioni, la simmetria degli oggetti e le variazioni di illuminazione. Allo stato dell'arte molti approcci riescono ad affrontare questa sfida con ottimi risultati, riuscendo a calcolare la stima della posa 6D in tempi relativamente brevi (≈ 100ms) e con una precisione notevole, permettendo di stimare la posa anche in real-time. La velocità e l'efficacia della stima della posa 6D è aumentata negli ultimi anni grazie all'utilizzo di metodi di deep-learning e di CNN, che hanno portato questa sfida a un livello successivo. Rimangono comunque ancora tante questioni da migliorare e da risolvere: le CNN devono essere allenate e ciò richiede molto tempo e molte risorse, le occlusioni, gli oggetti senza texture e gli oggetti simmetrici rimangono ancora problemi chiave da affrontare. Esploreremo diversi approcci presenti in letteratura, analizzandone le relative sfide e opportunità, discutendone i metodi utilizzati e individuando possibili direzioni di ricerca future.

Scheda

Scheda DC

	Facoltà/Dipartimento
	
				Dipartimento di Ingegneria dell'Informazione - DEI
			
	Corso di studio
	
				INGEGNERIA INFORMATICA Laurea di Primo Livello (D.M. 270/2004)
			
	Anno Accademico
	
				2022
			
	Titolo inglese
	
				3D object detection from 2D images: methods and applications
			
	Parola chiave
	
				Oggetti 3D
Rilevamento
Immagini 2D
			
	Relatore
	
				GHIDONI, STEFANO
			
	Correlatore
	
				TERRERAN, MATTEO
			
	Appare nelle tipologie:
	
				Lauree triennali

File in questo prodotto:

File	Dimensione	Formato
Kovachev_Zlatko.pdf accesso aperto Dimensione 11.52 MB Formato Adobe PDF Visualizza/Apri	11.52 MB	Adobe PDF	Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/57086