La tesi si concentra sull'applicazione di algoritmi di machine learning per la previsione dei peggioramenti nella sclerosi multipla (SM) e il loro evento scatenante. La SM è una malattia autoimmune che colpisce il sistema nervoso centrale e presenta una natura altamente variabile e difficile da prevedere. L'obiettivo principale della ricerca è anticipare quando si verificherà il peggioramento della malattia utilizzando la Scala di Invalidità Espansa (EDSS) come parametro di riferimento. Il lavoro fa parte di un progetto di ricerca europeo chiamato iDPP @ CLEF 2023, che mira a migliorare la prognosi e la gestione delle malattie complesse tramite l'intelligenza artificiale. Il dataset utilizzato per lo studio è stato raccolto durante le visite dei pazienti in due istituti clinici italiani e copre una vasta gamma di informazioni cliniche e storiche dei pazienti con SM. Il dataset è stato diviso in set di dati di addestramento e di test e include dati statici sui pazienti (come sesso, età e sintomi iniziali) e dati dinamici sull'evoluzione della malattia nel tempo (come valutazioni EDSS e risultati di risonanze magnetiche). Il processo di sviluppo dell'algoritmo coinvolge la scelta del classificatore più adatto per il compito. Tre classificatori sono stati testati: l'Albero Decisionale, la Random Forest e una rete neurale MLP. I dati sono stati preparati e suddivisi in categorie rilevanti per l'analisi, come valori EDSS, numero di ricadute e risultati delle risonanze magnetiche. I risultati mostrano che l'algoritmo MLP ha raggiunto l'accuratezza più elevata, pari al 91,8%, ed è in grado di riconoscere il 90% dei pazienti che andranno incontro al peggioramento della malattia. Tuttavia, l'analisi rivela che l'algoritmo tende a predire con maggiore precisione i casi che non peggioreranno, mentre ha una percentuale di "recall" bassa nel riconoscere i pazienti a rischio. Questo è dovuto alla distribuzione sbilanciata dei casi nel dataset di allenamento. Il lavoro sottolinea la necessità di un equilibrio nella distribuzione dei dati e suggerisce che ulteriori ricerche possono essere necessarie per migliorare ulteriormente le prestazioni dell'algoritmo. Inoltre, si evidenzia che l'algoritmo è in grado di classificare i pazienti in base alla loro storia clinica, ma non fornisce informazioni sul momento esatto in cui si verificherà il peggioramento della malattia. In sintesi, la tesina dimostra l'applicazione di algoritmi di machine learning per la previsione dei peggioramenti nella sclerosi multipla, sottolineando l'importanza della distribuzione equa dei dati e proponendo potenziali aree di miglioramento per future ricerche.

Machine Learning: predire l'avanzamento di una malattia autoimmune

BARZAN, DAVIDE
2022/2023

Abstract

La tesi si concentra sull'applicazione di algoritmi di machine learning per la previsione dei peggioramenti nella sclerosi multipla (SM) e il loro evento scatenante. La SM è una malattia autoimmune che colpisce il sistema nervoso centrale e presenta una natura altamente variabile e difficile da prevedere. L'obiettivo principale della ricerca è anticipare quando si verificherà il peggioramento della malattia utilizzando la Scala di Invalidità Espansa (EDSS) come parametro di riferimento. Il lavoro fa parte di un progetto di ricerca europeo chiamato iDPP @ CLEF 2023, che mira a migliorare la prognosi e la gestione delle malattie complesse tramite l'intelligenza artificiale. Il dataset utilizzato per lo studio è stato raccolto durante le visite dei pazienti in due istituti clinici italiani e copre una vasta gamma di informazioni cliniche e storiche dei pazienti con SM. Il dataset è stato diviso in set di dati di addestramento e di test e include dati statici sui pazienti (come sesso, età e sintomi iniziali) e dati dinamici sull'evoluzione della malattia nel tempo (come valutazioni EDSS e risultati di risonanze magnetiche). Il processo di sviluppo dell'algoritmo coinvolge la scelta del classificatore più adatto per il compito. Tre classificatori sono stati testati: l'Albero Decisionale, la Random Forest e una rete neurale MLP. I dati sono stati preparati e suddivisi in categorie rilevanti per l'analisi, come valori EDSS, numero di ricadute e risultati delle risonanze magnetiche. I risultati mostrano che l'algoritmo MLP ha raggiunto l'accuratezza più elevata, pari al 91,8%, ed è in grado di riconoscere il 90% dei pazienti che andranno incontro al peggioramento della malattia. Tuttavia, l'analisi rivela che l'algoritmo tende a predire con maggiore precisione i casi che non peggioreranno, mentre ha una percentuale di "recall" bassa nel riconoscere i pazienti a rischio. Questo è dovuto alla distribuzione sbilanciata dei casi nel dataset di allenamento. Il lavoro sottolinea la necessità di un equilibrio nella distribuzione dei dati e suggerisce che ulteriori ricerche possono essere necessarie per migliorare ulteriormente le prestazioni dell'algoritmo. Inoltre, si evidenzia che l'algoritmo è in grado di classificare i pazienti in base alla loro storia clinica, ma non fornisce informazioni sul momento esatto in cui si verificherà il peggioramento della malattia. In sintesi, la tesina dimostra l'applicazione di algoritmi di machine learning per la previsione dei peggioramenti nella sclerosi multipla, sottolineando l'importanza della distribuzione equa dei dati e proponendo potenziali aree di miglioramento per future ricerche.
2022
Machine Learning: predicting the progression of an autoimmune disease
Machine Learning
IA
Malattia autoimmune
File in questo prodotto:
File Dimensione Formato  
Barzan_Davide.pdf

accesso riservato

Dimensione 300.49 kB
Formato Adobe PDF
300.49 kB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/52354