Il seguente elaborato si pone come obiettivo quello di sviluppare un modello diagnostico adattativo per la classificazione di soggetti sani, prediabetici e diabetici di tipo II. Il modello si basa su tecniche di machine learning supervisionato che lavorano con sequenze di dati fornite dall’utilizzo di un sensore indossabile per il monitoraggio in continua della concentrazione di glucosio interstiziale. Da queste sequenze di dati (tracce), vengono poi calcolate diverse metriche (o features) che vanno ad alimentare il modello sopracitato. La prima fase dell’analisi svolta si occupa di valutare l’andamento delle tracce (e più precisamente di alcune features ) da un punto di vista grafico, per vedere se sono presenti particolari pattern e per valutarne visivamente la stabilità . In secondo luogo vengono calcolati matematicamente degli indicatori per un’analisi quantitativa di stabilità e convergenza delle features. In questo modo, per ogni tecnica adottata, tra tutte le features presenti nel dataset vengono selezionate solo quelle che meglio si comportano secondo l’indicatore calcolato. Successivamente, vengono creati diversi dataset, che differiscono per il numero di giorni considerati (e quindi per la quantità di dati in essi presenti), in particolare a partire dal primo giorno di monitoraggio e si aggiunge progressivamente un giorno di registrazione di dati. Dopodiché vengono valutati i diversi modelli con tutti i dataset creati, in modo da comprendere se ci sia la possibilità di ottenere una classificazione accettabile dei soggetti utilizzando un minor numero di giorni di osservazione rispetto ai dieci giorni totali considerati fino a questo punto dello studio. Un’ulteriore esplorazione viene effettuata selezionando tutte le possibili combinazioni di finestre temporali che si possono considerare, per comprendere quale possa essere la miglior soluzione possibile. Infine, una volta effettuate queste analisi, viene creato l’algoritmo in tempo reale che si prefigge di classificare un soggetto in ‘sano’, ‘prediabetico’ o ‘diabetico’. Anche in questo caso vengono testati i diversi metodi di selezione delle features per individuare quello che meglio si comporta nella classificazione. I risultati principali ottenuti in questo lavoro confermano la possibilità di effettuare una classificazione dei soggetti in sani, prediabetici e diabetici di tipo II con un livello di prestazioni accettabile. Inoltre, è stato appurato come sia possibile ottenere tali classificazioni basandosi su un volume di dati glicemici piuttosto ridotto (4 giorni di registrazione), rendendo l’applicazione dei dispositivi CGM a scopo diagnostico più accessibile sia dal punto di vista pratico che economico. Sebbene i risultati ottenuti siano da intendersi preliminari a causa della numerosità limitata del dataset a disposizione e dalla specificità delle scelte implementative effettuate in questo studio, essi aprono la strada a molteplici direzioni di sviluppo futuro, in quanto la flessibilità nelle scelte metodologiche offre ampio spazio per ottimizzazioni e per il conseguimento di risultati più validi e generalizzabili. Questo studio pone quindi le basi per ulteriori ricerche sull’applicazione diagnostica dei dispositivi CGM, ponendosi come un’alternativa promettente ed affidabile ai tradizionali metodi di diagnosi, i quali non sono esenti da problematiche e criticità.
Modelli diagnostici di diabete e pre-diabete basati su machine learning e classificazione di dati di monitoraggio in continua del glucosio.
GASTALDELLO, ALBERTO
2023/2024
Abstract
Il seguente elaborato si pone come obiettivo quello di sviluppare un modello diagnostico adattativo per la classificazione di soggetti sani, prediabetici e diabetici di tipo II. Il modello si basa su tecniche di machine learning supervisionato che lavorano con sequenze di dati fornite dall’utilizzo di un sensore indossabile per il monitoraggio in continua della concentrazione di glucosio interstiziale. Da queste sequenze di dati (tracce), vengono poi calcolate diverse metriche (o features) che vanno ad alimentare il modello sopracitato. La prima fase dell’analisi svolta si occupa di valutare l’andamento delle tracce (e più precisamente di alcune features ) da un punto di vista grafico, per vedere se sono presenti particolari pattern e per valutarne visivamente la stabilità . In secondo luogo vengono calcolati matematicamente degli indicatori per un’analisi quantitativa di stabilità e convergenza delle features. In questo modo, per ogni tecnica adottata, tra tutte le features presenti nel dataset vengono selezionate solo quelle che meglio si comportano secondo l’indicatore calcolato. Successivamente, vengono creati diversi dataset, che differiscono per il numero di giorni considerati (e quindi per la quantità di dati in essi presenti), in particolare a partire dal primo giorno di monitoraggio e si aggiunge progressivamente un giorno di registrazione di dati. Dopodiché vengono valutati i diversi modelli con tutti i dataset creati, in modo da comprendere se ci sia la possibilità di ottenere una classificazione accettabile dei soggetti utilizzando un minor numero di giorni di osservazione rispetto ai dieci giorni totali considerati fino a questo punto dello studio. Un’ulteriore esplorazione viene effettuata selezionando tutte le possibili combinazioni di finestre temporali che si possono considerare, per comprendere quale possa essere la miglior soluzione possibile. Infine, una volta effettuate queste analisi, viene creato l’algoritmo in tempo reale che si prefigge di classificare un soggetto in ‘sano’, ‘prediabetico’ o ‘diabetico’. Anche in questo caso vengono testati i diversi metodi di selezione delle features per individuare quello che meglio si comporta nella classificazione. I risultati principali ottenuti in questo lavoro confermano la possibilità di effettuare una classificazione dei soggetti in sani, prediabetici e diabetici di tipo II con un livello di prestazioni accettabile. Inoltre, è stato appurato come sia possibile ottenere tali classificazioni basandosi su un volume di dati glicemici piuttosto ridotto (4 giorni di registrazione), rendendo l’applicazione dei dispositivi CGM a scopo diagnostico più accessibile sia dal punto di vista pratico che economico. Sebbene i risultati ottenuti siano da intendersi preliminari a causa della numerosità limitata del dataset a disposizione e dalla specificità delle scelte implementative effettuate in questo studio, essi aprono la strada a molteplici direzioni di sviluppo futuro, in quanto la flessibilità nelle scelte metodologiche offre ampio spazio per ottimizzazioni e per il conseguimento di risultati più validi e generalizzabili. Questo studio pone quindi le basi per ulteriori ricerche sull’applicazione diagnostica dei dispositivi CGM, ponendosi come un’alternativa promettente ed affidabile ai tradizionali metodi di diagnosi, i quali non sono esenti da problematiche e criticità.File | Dimensione | Formato | |
---|---|---|---|
Gastaldello_Alberto.pdf
accesso riservato
Dimensione
2.9 MB
Formato
Adobe PDF
|
2.9 MB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/62078