SBEM è un robot differenziale autocostruito, realizzato come piattaforma educativa e per l’assistenza in ambienti domestici. Il sistema si basa sull’architettura ROS 2 Humble, che costituisce il framework principale per l’integrazione dei diversi sottosistemi. La struttura del robot è interamente stampata in 3D. Per la movimentazione, utilizza due motori ricavati da un hoverboard, controllati da una scheda Odrive che gestisce la velocità e fornisce un feedback di posizione. L’elaborazione è distribuita tra un Raspberry Pi 4 e un microcontrollore ESP32, utilizzati per il controllo delle varie periferiche. Il sistema di navigazione autonoma si basa su un sensore LIDAR 2D e sul pacchetto ROS NAV2. Inoltre, una telecamera consente il riconoscimento di marker Apriltag per eseguire operazioni di ricarica autonoma. L’interazione uomo-macchina è diventata un tema rilevante negli ultimi anni, grazie alla diffusione di modelli di linguaggio naturale, che hanno aperto un nuovo modo di interfacciarsi con le macchine. Per questo motivo, il robot è dotato di un'interfaccia multimodale basata su: speaker, microfoni e schermo touch. Grazie all’utilizzo di modelli LLM (Large-Language-Model), TTS (Text-To-Speech) e STT (Speech-To-Text) è in grado di interfacciarsi con gli utenti in modo naturale. Recentemente, un ulteriore passo in avanti è stato fatto grazie allo sviluppo di agenti AI, che permettono di estendere le capacità di un LLM attraverso l’implementazione di strumenti per il controllo di interfacce esterne. Per tale ragione, l’intera gestione è affidata a un agente che è in grado di prendere decisioni in modo autonomo e intelligente per soddisfare le richieste degli utenti. L’integrazione di LLM multimodali estende ulteriormente le funzionalità percettive, permettendo al robot di fornire descrizioni visive dettagliate dell’ambiente. Tra le principali sfide affrontate, vi è l’elevata richiesta computazionale necessaria per eseguire tutte le operazioni di AI sviluppate, che va ad impattare sulle prestazioni generali offerte dal prototipo. Questo ha portato, durante la realizzazione del progetto a numerose sfide tecniche, molte delle quali già risolte, mentre altre, prevalentemente legate a problematiche di ottimizzazione, rappresentano opportunità stimolanti di miglioramento continuo, rendendo SBEM una piattaforma aperta alla sperimentazione in ambito robotico-cognitivo.
SBEM: sviluppo di un’architettura robotico-cognitiva basata su ROS2 e agenti intelligenti
MORO, ENRICO
2024/2025
Abstract
SBEM è un robot differenziale autocostruito, realizzato come piattaforma educativa e per l’assistenza in ambienti domestici. Il sistema si basa sull’architettura ROS 2 Humble, che costituisce il framework principale per l’integrazione dei diversi sottosistemi. La struttura del robot è interamente stampata in 3D. Per la movimentazione, utilizza due motori ricavati da un hoverboard, controllati da una scheda Odrive che gestisce la velocità e fornisce un feedback di posizione. L’elaborazione è distribuita tra un Raspberry Pi 4 e un microcontrollore ESP32, utilizzati per il controllo delle varie periferiche. Il sistema di navigazione autonoma si basa su un sensore LIDAR 2D e sul pacchetto ROS NAV2. Inoltre, una telecamera consente il riconoscimento di marker Apriltag per eseguire operazioni di ricarica autonoma. L’interazione uomo-macchina è diventata un tema rilevante negli ultimi anni, grazie alla diffusione di modelli di linguaggio naturale, che hanno aperto un nuovo modo di interfacciarsi con le macchine. Per questo motivo, il robot è dotato di un'interfaccia multimodale basata su: speaker, microfoni e schermo touch. Grazie all’utilizzo di modelli LLM (Large-Language-Model), TTS (Text-To-Speech) e STT (Speech-To-Text) è in grado di interfacciarsi con gli utenti in modo naturale. Recentemente, un ulteriore passo in avanti è stato fatto grazie allo sviluppo di agenti AI, che permettono di estendere le capacità di un LLM attraverso l’implementazione di strumenti per il controllo di interfacce esterne. Per tale ragione, l’intera gestione è affidata a un agente che è in grado di prendere decisioni in modo autonomo e intelligente per soddisfare le richieste degli utenti. L’integrazione di LLM multimodali estende ulteriormente le funzionalità percettive, permettendo al robot di fornire descrizioni visive dettagliate dell’ambiente. Tra le principali sfide affrontate, vi è l’elevata richiesta computazionale necessaria per eseguire tutte le operazioni di AI sviluppate, che va ad impattare sulle prestazioni generali offerte dal prototipo. Questo ha portato, durante la realizzazione del progetto a numerose sfide tecniche, molte delle quali già risolte, mentre altre, prevalentemente legate a problematiche di ottimizzazione, rappresentano opportunità stimolanti di miglioramento continuo, rendendo SBEM una piattaforma aperta alla sperimentazione in ambito robotico-cognitivo.| File | Dimensione | Formato | |
|---|---|---|---|
|
SBEM_presentazione_finale.pdf
accesso aperto
Dimensione
2.08 MB
Formato
Adobe PDF
|
2.08 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/89458