La rilevazione di oggetti 3D da immagini 2D rappresenta una sfida cruciale nell’abito della visione artificiale e nella robotica, che si pone come obbiettivo quello di individuare la rotazione 3D e la traslazione 3D di oggetti, stimandone così la posa 6D. Questo campo di ricerca mira a determinare con precisione la posizione e l'orientamento degli oggetti in un ambiente tridimensionale. Metteremo in luce l'importanza della stima della posa 6D, un campo in rapida evoluzione, che va dai metodi tradizionali all'apprendimento avanzato, aprendo nuove prospettive di applicazione e offrendo soluzioni innovative negli ambiti industriali, robotici e della realtà aumentata. Questa tesi esplora diverse categorie di metodi utilizzati per affrontare questa sfida, suddividendoli in tre approcci principali: i metodi Template-Based, i metodi Feature-Based e i metodi Learning-Based. Discuteremo le problematiche principali di questo compito difficile, come la presenza di occlusioni, la simmetria degli oggetti e le variazioni di illuminazione. Allo stato dell'arte molti approcci riescono ad affrontare questa sfida con ottimi risultati, riuscendo a calcolare la stima della posa 6D in tempi relativamente brevi (≈ 100ms) e con una precisione notevole, permettendo di stimare la posa anche in real-time. La velocità e l'efficacia della stima della posa 6D è aumentata negli ultimi anni grazie all'utilizzo di metodi di deep-learning e di CNN, che hanno portato questa sfida a un livello successivo. Rimangono comunque ancora tante questioni da migliorare e da risolvere: le CNN devono essere allenate e ciò richiede molto tempo e molte risorse, le occlusioni, gli oggetti senza texture e gli oggetti simmetrici rimangono ancora problemi chiave da affrontare. Esploreremo diversi approcci presenti in letteratura, analizzandone le relative sfide e opportunità, discutendone i metodi utilizzati e individuando possibili direzioni di ricerca future.

Rilevamento di oggetti 3D da immagini 2D: metodi e applicazioni

KOVACHEV, ZLATKO
2022/2023

Abstract

La rilevazione di oggetti 3D da immagini 2D rappresenta una sfida cruciale nell’abito della visione artificiale e nella robotica, che si pone come obbiettivo quello di individuare la rotazione 3D e la traslazione 3D di oggetti, stimandone così la posa 6D. Questo campo di ricerca mira a determinare con precisione la posizione e l'orientamento degli oggetti in un ambiente tridimensionale. Metteremo in luce l'importanza della stima della posa 6D, un campo in rapida evoluzione, che va dai metodi tradizionali all'apprendimento avanzato, aprendo nuove prospettive di applicazione e offrendo soluzioni innovative negli ambiti industriali, robotici e della realtà aumentata. Questa tesi esplora diverse categorie di metodi utilizzati per affrontare questa sfida, suddividendoli in tre approcci principali: i metodi Template-Based, i metodi Feature-Based e i metodi Learning-Based. Discuteremo le problematiche principali di questo compito difficile, come la presenza di occlusioni, la simmetria degli oggetti e le variazioni di illuminazione. Allo stato dell'arte molti approcci riescono ad affrontare questa sfida con ottimi risultati, riuscendo a calcolare la stima della posa 6D in tempi relativamente brevi (≈ 100ms) e con una precisione notevole, permettendo di stimare la posa anche in real-time. La velocità e l'efficacia della stima della posa 6D è aumentata negli ultimi anni grazie all'utilizzo di metodi di deep-learning e di CNN, che hanno portato questa sfida a un livello successivo. Rimangono comunque ancora tante questioni da migliorare e da risolvere: le CNN devono essere allenate e ciò richiede molto tempo e molte risorse, le occlusioni, gli oggetti senza texture e gli oggetti simmetrici rimangono ancora problemi chiave da affrontare. Esploreremo diversi approcci presenti in letteratura, analizzandone le relative sfide e opportunità, discutendone i metodi utilizzati e individuando possibili direzioni di ricerca future.
2022
3D object detection from 2D images: methods and applications
Oggetti 3D
Rilevamento
Immagini 2D
File in questo prodotto:
File Dimensione Formato  
Kovachev_Zlatko.pdf

accesso aperto

Dimensione 11.52 MB
Formato Adobe PDF
11.52 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/57086