Amyotrophic Lateral Sclerosis (ALS) is a progressive neurodegenerative disease caused by the degeneration of upper and lower motor neurons, leading to paralysis of limb, and bulbar and respiratory muscles. Its multifactorial etiology, stemming from genetic and environmental interactions, complicates accurate modeling and personalized therapy development. This thesis compares Online Machine Learning (OML) and traditional offline ML approaches for predicting ALS patient survival. Unlike offline models, which are trained once on static data, OML continuously updates its parameters as new data arrive, enabling adaptive learning over time. Three models were developed: two offline baselines (trained on data up to 2001 and 2012, respectively) and one online model that incrementally learned from yearly patient data streams. The dataset was temporally partitioned to ensure strict separation between training and testing phases, using two evaluation strategies: (i) all post cut-off visits, and (ii) each patient’s first visit to simulate early prediction. Results showed that the online model consistently outperformed the first offline model and matched or exceeded the second, despite being trained on substantially less data and earlier in time. Statistically significant improvements (p < 0.05, DeLong’s test) were observed across years. The online model trained with visits up to 2001 achieved an AUROC of 0.64 versus 0.61 for the offline equivalent, and with data up to 2002, it slightly surpassed the full offline model (0.67 vs. 0.66). Finally, the online model trained on the full dataset achieved a AUROC value equal to 0.68, which is higher that the 0.66 obtained by the offline. These results highlight the efficiency, adaptability, and clinical potential of OML for dynamic healthcare data and disease progression modeling.

La Sclerosi Laterale Amiotrofica (SLA) è una patologia neurodegenerativa progressiva che colpisce i motoneuroni superiori e inferiori, causando paralisi degli arti, dei muscoli bulbari e respiratori. L’origine multifattoriale, derivante dall’interazione tra fattori genetici e ambientali, rende complessa la modellizzazione della progressione della malattia e lo sviluppo di terapie personalizzate. Questa tesi confronta approcci di Machine Learning (ML) tradizionale e Online Machine Learning (OML) per la predizione della sopravvivenza dei pazienti affetti da SLA. A differenza dei modelli offline, addestrati una sola volta su dati statici, l’OML consente un aggiornamento incrementale e continuo dei parametri, adattandosi ai nuovi dati nel tempo e riflettendo la natura dinamica dei contesti clinici. Il confronto è stato condotto tra due modelli offline (uno addestrato su dati fino al 2001 e uno sull’intero dataset fino al 2012) e un modello online capace di aggiornarsi anno dopo anno simulando un flusso reale di dati clinici. La valutazione, basata su due strategie di test, una completa e una ridotta per predizione precoce, ha mostrato che il modello online supera il primo offline e ottiene prestazioni comparabili o superiori al secondo, pur utilizzando meno dati e con anni di anticipo. Il modello online addestrato con le visite fino al 2001 ha raggiunto un AUROC di 0.64 contro 0.61 dell’offline, e quello addestrato fino al 2002 ha superato il modello offline completo (0.67 vs 0.66). Infine, il modello online addestrato sull’intero set di dati ha raggiunto un valore AUROC pari a 0.68, superiore allo 0.66 ottenuto dal modello offline. Questi risultati evidenziano l’efficacia, l’adattabilità e la rilevanza clinica dell’OML nella previsione della sopravvivenza in contesti sanitari complessi e dinamici.

Online Machine Learning for Survival Prediction in Amyotrophic Lateral Sclerosis

ZAGARIA, MARIA LAURA
2024/2025

Abstract

Amyotrophic Lateral Sclerosis (ALS) is a progressive neurodegenerative disease caused by the degeneration of upper and lower motor neurons, leading to paralysis of limb, and bulbar and respiratory muscles. Its multifactorial etiology, stemming from genetic and environmental interactions, complicates accurate modeling and personalized therapy development. This thesis compares Online Machine Learning (OML) and traditional offline ML approaches for predicting ALS patient survival. Unlike offline models, which are trained once on static data, OML continuously updates its parameters as new data arrive, enabling adaptive learning over time. Three models were developed: two offline baselines (trained on data up to 2001 and 2012, respectively) and one online model that incrementally learned from yearly patient data streams. The dataset was temporally partitioned to ensure strict separation between training and testing phases, using two evaluation strategies: (i) all post cut-off visits, and (ii) each patient’s first visit to simulate early prediction. Results showed that the online model consistently outperformed the first offline model and matched or exceeded the second, despite being trained on substantially less data and earlier in time. Statistically significant improvements (p < 0.05, DeLong’s test) were observed across years. The online model trained with visits up to 2001 achieved an AUROC of 0.64 versus 0.61 for the offline equivalent, and with data up to 2002, it slightly surpassed the full offline model (0.67 vs. 0.66). Finally, the online model trained on the full dataset achieved a AUROC value equal to 0.68, which is higher that the 0.66 obtained by the offline. These results highlight the efficiency, adaptability, and clinical potential of OML for dynamic healthcare data and disease progression modeling.
2024
Online Machine Learning for Survival Prediction in Amyotrophic Lateral Sclerosis
La Sclerosi Laterale Amiotrofica (SLA) è una patologia neurodegenerativa progressiva che colpisce i motoneuroni superiori e inferiori, causando paralisi degli arti, dei muscoli bulbari e respiratori. L’origine multifattoriale, derivante dall’interazione tra fattori genetici e ambientali, rende complessa la modellizzazione della progressione della malattia e lo sviluppo di terapie personalizzate. Questa tesi confronta approcci di Machine Learning (ML) tradizionale e Online Machine Learning (OML) per la predizione della sopravvivenza dei pazienti affetti da SLA. A differenza dei modelli offline, addestrati una sola volta su dati statici, l’OML consente un aggiornamento incrementale e continuo dei parametri, adattandosi ai nuovi dati nel tempo e riflettendo la natura dinamica dei contesti clinici. Il confronto è stato condotto tra due modelli offline (uno addestrato su dati fino al 2001 e uno sull’intero dataset fino al 2012) e un modello online capace di aggiornarsi anno dopo anno simulando un flusso reale di dati clinici. La valutazione, basata su due strategie di test, una completa e una ridotta per predizione precoce, ha mostrato che il modello online supera il primo offline e ottiene prestazioni comparabili o superiori al secondo, pur utilizzando meno dati e con anni di anticipo. Il modello online addestrato con le visite fino al 2001 ha raggiunto un AUROC di 0.64 contro 0.61 dell’offline, e quello addestrato fino al 2002 ha superato il modello offline completo (0.67 vs 0.66). Infine, il modello online addestrato sull’intero set di dati ha raggiunto un valore AUROC pari a 0.68, superiore allo 0.66 ottenuto dal modello offline. Questi risultati evidenziano l’efficacia, l’adattabilità e la rilevanza clinica dell’OML nella previsione della sopravvivenza in contesti sanitari complessi e dinamici.
Survival Prediction
Online Learning
Machine Learning
ALS
File in questo prodotto:
File Dimensione Formato  
Zagaria_MariaLaura.pdf

embargo fino al 23/10/2028

Dimensione 4.52 MB
Formato Adobe PDF
4.52 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/96069