La posa 6D degli oggetti nella computer vision si riferisce alla posizione e all’orientamento di oggetti tridimensionali all’interno di una scena. La stima precisa di questa posa è un elemento chiave in diverse applicazioni come la robotica, la realtà aumentata e la guida autonoma. In letteratura ci sono diversi algoritmi che si focalizzano sulla stima della posa 6D di oggetti attraverso tecniche di template-matching. Tuttavia tali tecniche presentano alcuni limiti come la necessità di avere a priori il modello CAD dell’oggetto da localizzare o la difficoltà di rilevare l’oggetto in tempo reale. Lo sviluppo di algoritmi di deep learning per questo task aiuta a superare tali limitazioni, a volte a discapito della precisione. Il seguente studio si occupa di analizzare vantaggi e svantaggi dei metodi dello stato dell’arte relativi alla stima della posa 6D di oggetti.

Dai metodi CAD-based ai foundation models: una nuova prospettiva sulla stima della posa di oggetti 6D

BIZZOTTO, NICOLA
2024/2025

Abstract

La posa 6D degli oggetti nella computer vision si riferisce alla posizione e all’orientamento di oggetti tridimensionali all’interno di una scena. La stima precisa di questa posa è un elemento chiave in diverse applicazioni come la robotica, la realtà aumentata e la guida autonoma. In letteratura ci sono diversi algoritmi che si focalizzano sulla stima della posa 6D di oggetti attraverso tecniche di template-matching. Tuttavia tali tecniche presentano alcuni limiti come la necessità di avere a priori il modello CAD dell’oggetto da localizzare o la difficoltà di rilevare l’oggetto in tempo reale. Lo sviluppo di algoritmi di deep learning per questo task aiuta a superare tali limitazioni, a volte a discapito della precisione. Il seguente studio si occupa di analizzare vantaggi e svantaggi dei metodi dello stato dell’arte relativi alla stima della posa 6D di oggetti.
2024
From CAD-based methods to foundation models: a new prospective on 6D pose estimation
6D
posa
foundation models
CAD
computer vision
File in questo prodotto:
File Dimensione Formato  
Bizzotto_Nicola.pdf

Accesso riservato

Dimensione 10.85 MB
Formato Adobe PDF
10.85 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/97824