La posa 6D degli oggetti nella computer vision si riferisce alla posizione e all’orientamento di oggetti tridimensionali all’interno di una scena. La stima precisa di questa posa è un elemento chiave in diverse applicazioni come la robotica, la realtà aumentata e la guida autonoma. In letteratura ci sono diversi algoritmi che si focalizzano sulla stima della posa 6D di oggetti attraverso tecniche di template-matching. Tuttavia tali tecniche presentano alcuni limiti come la necessità di avere a priori il modello CAD dell’oggetto da localizzare o la difficoltà di rilevare l’oggetto in tempo reale. Lo sviluppo di algoritmi di deep learning per questo task aiuta a superare tali limitazioni, a volte a discapito della precisione. Il seguente studio si occupa di analizzare vantaggi e svantaggi dei metodi dello stato dell’arte relativi alla stima della posa 6D di oggetti.
Dai metodi CAD-based ai foundation models: una nuova prospettiva sulla stima della posa di oggetti 6D
BIZZOTTO, NICOLA
2024/2025
Abstract
La posa 6D degli oggetti nella computer vision si riferisce alla posizione e all’orientamento di oggetti tridimensionali all’interno di una scena. La stima precisa di questa posa è un elemento chiave in diverse applicazioni come la robotica, la realtà aumentata e la guida autonoma. In letteratura ci sono diversi algoritmi che si focalizzano sulla stima della posa 6D di oggetti attraverso tecniche di template-matching. Tuttavia tali tecniche presentano alcuni limiti come la necessità di avere a priori il modello CAD dell’oggetto da localizzare o la difficoltà di rilevare l’oggetto in tempo reale. Lo sviluppo di algoritmi di deep learning per questo task aiuta a superare tali limitazioni, a volte a discapito della precisione. Il seguente studio si occupa di analizzare vantaggi e svantaggi dei metodi dello stato dell’arte relativi alla stima della posa 6D di oggetti.| File | Dimensione | Formato | |
|---|---|---|---|
|
Bizzotto_Nicola.pdf
Accesso riservato
Dimensione
10.85 MB
Formato
Adobe PDF
|
10.85 MB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/97824