La gestione dei dati mancanti è un problema rilevante nell’analisi di dataset clinici e biomeccanici, in particolare nella gait analysis, dove i missing data possono compromettere l’affidabilità dei risultati. In questo lavoro vengono confrontati due metodi di imputazione basati sulle chained equations, MICE e SICE. A partire da un dataset completo, sono stati introdotti artificialmente diversi livelli di missingness secondo uno schema MCAR, al fine di valutarne le prestazioni in condizioni controllate. Il confronto, effettuato tramite RMSE, divergenza di Jensen–Shannon e analisi delle matrici di correlazione, mostra che entrambi i metodi sono efficaci con incompletezza moderata, mentre SICE risulta più stabile in presenza di livelli elevati di dati mancanti.
Confronto tra MICE e SICE in dataset di gait analysis di bambini con sindrome dell'X fragile
BRUNAZZO, LUDOVICA
2025/2026
Abstract
La gestione dei dati mancanti è un problema rilevante nell’analisi di dataset clinici e biomeccanici, in particolare nella gait analysis, dove i missing data possono compromettere l’affidabilità dei risultati. In questo lavoro vengono confrontati due metodi di imputazione basati sulle chained equations, MICE e SICE. A partire da un dataset completo, sono stati introdotti artificialmente diversi livelli di missingness secondo uno schema MCAR, al fine di valutarne le prestazioni in condizioni controllate. Il confronto, effettuato tramite RMSE, divergenza di Jensen–Shannon e analisi delle matrici di correlazione, mostra che entrambi i metodi sono efficaci con incompletezza moderata, mentre SICE risulta più stabile in presenza di livelli elevati di dati mancanti.| File | Dimensione | Formato | |
|---|---|---|---|
|
Brunazzo_Ludovica.pdf
Accesso riservato
Dimensione
716.22 kB
Formato
Adobe PDF
|
716.22 kB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/104198