Il problema dell’anticipazione del movimento umano consiste nel prevedere i movimenti futuri di una persona basandosi su quelli passati. La capacità di fare previsioni accurate permette di migliorare l'interazione uomo-macchina, rendendo questi sistemi più reattivi e sicuri. Tuttavia, ottenere sistemi predittivi che siano accurati e robusti è ancora un problema aperto, in quanto è difficile modellare la complessità e la variabilità del movimento umano. I modelli attuali allo stato dell’arte si basano solo sui dati delle pose passate della persona, senza includere informazioni sul contesto. Nonostante ciò, questo non è sufficiente, in quanto tali modelli falliscono nel prevedere con accuratezza i movimenti che includono transizioni tra azioni, ad esempio passare dal camminare al sedersi. L’obiettivo di questa tesi è quello di realizzare un modello innovativo di predizione del movimento umano, integrando l’informazione dei movimenti passati con la descrizione testuale della semantica del movimento stesso. Questa integrazione permette di aggiungere contesto ai movimenti e migliorare l’accuratezza delle previsioni, specialmente nelle transizioni tra diverse azioni. Il modello di anticipazione del movimento si basa sul Deep Learning e l’elaborazione delle informazioni testuali avviene tramite l’uso di un Large Language Model. Nel lavoro di questa tesi sono stati condotti numerosi esperimenti utilizzando diversi modelli di anticipazione e molteplici modelli di linguaggio. Per determinare l'efficacia dell'integrazione delle descrizioni testuali, è stata confrontata l’accuratezza delle previsioni dei modelli basati solo sulle pose passate con quelli che integrano anche l’informazione semantica. Tale approccio rappresenta uno strumento fondamentale per il futuro sviluppo di algoritmi di previsione del movimento umano, risultando applicabile in modo trasversale per il miglioramento di diversi modelli predittivi. Questa integrazione permette di aprire nuove possibilità per applicazioni avanzate in vari settori come la robotica, la sorveglianza e l'interazione uomo-macchina. L'approccio proposto rappresenta un passo avanti verso sistemi predittivi più intelligenti e versatili, capaci di comprendere e anticipare i movimenti umani in maniera più efficace e affidabile.

Miglioramento della Predizione del Movimento Umano tramite l’Integrazione di Descrizioni delle Azioni

MERCORELLA, PIETRO
2023/2024

Abstract

Il problema dell’anticipazione del movimento umano consiste nel prevedere i movimenti futuri di una persona basandosi su quelli passati. La capacità di fare previsioni accurate permette di migliorare l'interazione uomo-macchina, rendendo questi sistemi più reattivi e sicuri. Tuttavia, ottenere sistemi predittivi che siano accurati e robusti è ancora un problema aperto, in quanto è difficile modellare la complessità e la variabilità del movimento umano. I modelli attuali allo stato dell’arte si basano solo sui dati delle pose passate della persona, senza includere informazioni sul contesto. Nonostante ciò, questo non è sufficiente, in quanto tali modelli falliscono nel prevedere con accuratezza i movimenti che includono transizioni tra azioni, ad esempio passare dal camminare al sedersi. L’obiettivo di questa tesi è quello di realizzare un modello innovativo di predizione del movimento umano, integrando l’informazione dei movimenti passati con la descrizione testuale della semantica del movimento stesso. Questa integrazione permette di aggiungere contesto ai movimenti e migliorare l’accuratezza delle previsioni, specialmente nelle transizioni tra diverse azioni. Il modello di anticipazione del movimento si basa sul Deep Learning e l’elaborazione delle informazioni testuali avviene tramite l’uso di un Large Language Model. Nel lavoro di questa tesi sono stati condotti numerosi esperimenti utilizzando diversi modelli di anticipazione e molteplici modelli di linguaggio. Per determinare l'efficacia dell'integrazione delle descrizioni testuali, è stata confrontata l’accuratezza delle previsioni dei modelli basati solo sulle pose passate con quelli che integrano anche l’informazione semantica. Tale approccio rappresenta uno strumento fondamentale per il futuro sviluppo di algoritmi di previsione del movimento umano, risultando applicabile in modo trasversale per il miglioramento di diversi modelli predittivi. Questa integrazione permette di aprire nuove possibilità per applicazioni avanzate in vari settori come la robotica, la sorveglianza e l'interazione uomo-macchina. L'approccio proposto rappresenta un passo avanti verso sistemi predittivi più intelligenti e versatili, capaci di comprendere e anticipare i movimenti umani in maniera più efficace e affidabile.
2023
Enhancing Human Motion Prediction by Embedding Action Descriptions
HMP
deep learning
semantica
File in questo prodotto:
File Dimensione Formato  
Mercorella_Pietro.pdf

accesso aperto

Dimensione 1.95 MB
Formato Adobe PDF
1.95 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/74735