Il diabete mellito di tipo 2 è una malattia metabolica caratterizzata da glicemia alta in un contesto di insulino-resistenza ed insulino-deficienza relativa. Rappresenta circa il 90% dei casi di diabete nel mondo e lo sviluppo della patologia è causato da una combinazione tra lo stile di vita, endocrinopatie, e fattori genetici. L'Organizzazione Mondiale della Sanità riconosce la condizione di diabete dopo una rilevazione di elevati valori di glucosio nel sangue con la presenza di sintomi tipici, ed in questo contesto risulta di fondamentale importanza la somministrazione di un test chiamato "Oral Glucose Tolerance Test", comunemente OGTT, tramite il quale è possibile avere una diagnosi precisa della patologia. Grazie allo sviluppo e all'utilizzo di un software, il "T2D Simulator", di un gruppo di ricerca dell'Università di Padova, che fra le tante cose ci ha permesso di simulare il suddetto test su soggetti virtuali, è stato possibile ricostruire delle vere e proprie condizioni sperimentali, che hanno consentito l'ottenimento di un certo numero di datasets successivamente analizzati ed utilizzati per l'addestramento di specifici algoritmi di Machine Learning. L'applicazione degli algoritmi di apprendimento automatico risulta motivata in primis dalla costante esigenza di approfondire le nostre conoscenze riguardo le patologie in generale, fattibile grazie alla possibilità di esplorare grandi quantità dati e di informazioni tramite l'utilizzo di strumenti ad hoc che semplificano enormemente questo processo, ed in secondo luogo per lo sviluppo di strumenti informatici potenzialmente utilizzabili a supporto di attività cliniche, che come nel caso del test OGTT, risultano essere leggermente invasive per i pazienti a causa dell'elevato numero di prelievi ematici, ed economicamente dispendiose per le aziende ospedaliere che le conducono. Sono dunque state condotte preliminarmente delle analisi di regressione sui dataset accuratamente organizzati, con l'obiettivo di sviluppare dei modelli capaci di poter stimare in maniera accurata specifici parametri funzionali per le cinetiche di secrezione ed assorbimento di glucosio ed insulina. I modelli testati sono di comune utilizzo nell'ambito delle analisi regressive se si parla di supervised learning, ed in particolare sono: Linear Regression, Regression Tree, Random Forest e Boosting. Uno step successivo ha riguardato lo sviluppo di modelli per la classificazione di soggetti diabetici, preliminarmente in relazione all'assunzione o meno di Metformina, e solo successivamente in base allo stadio di avanzamento della patologia. Si menzionano a tal proposito la Logistic Regression, il k-NN Classifier, il Naive-Bayes Classifier, i Classification Tree, le Random Forest e le Support Vector Machine. Da precisare che per tutti gli algoritmi elencati si è seguita la tipica pipeline di operazioni di preprocessing dei dataset e di taratura degli iperparametri tramite k-Fold Cross Validation, caratteristica degli studi nell'ambito del Machine Learning.

Metodi di Machine Learning applicati a popolazioni virtuali di soggetti affetti da diabete di tipo 2

CALIFANO, BENITO
2022/2023

Abstract

Il diabete mellito di tipo 2 è una malattia metabolica caratterizzata da glicemia alta in un contesto di insulino-resistenza ed insulino-deficienza relativa. Rappresenta circa il 90% dei casi di diabete nel mondo e lo sviluppo della patologia è causato da una combinazione tra lo stile di vita, endocrinopatie, e fattori genetici. L'Organizzazione Mondiale della Sanità riconosce la condizione di diabete dopo una rilevazione di elevati valori di glucosio nel sangue con la presenza di sintomi tipici, ed in questo contesto risulta di fondamentale importanza la somministrazione di un test chiamato "Oral Glucose Tolerance Test", comunemente OGTT, tramite il quale è possibile avere una diagnosi precisa della patologia. Grazie allo sviluppo e all'utilizzo di un software, il "T2D Simulator", di un gruppo di ricerca dell'Università di Padova, che fra le tante cose ci ha permesso di simulare il suddetto test su soggetti virtuali, è stato possibile ricostruire delle vere e proprie condizioni sperimentali, che hanno consentito l'ottenimento di un certo numero di datasets successivamente analizzati ed utilizzati per l'addestramento di specifici algoritmi di Machine Learning. L'applicazione degli algoritmi di apprendimento automatico risulta motivata in primis dalla costante esigenza di approfondire le nostre conoscenze riguardo le patologie in generale, fattibile grazie alla possibilità di esplorare grandi quantità dati e di informazioni tramite l'utilizzo di strumenti ad hoc che semplificano enormemente questo processo, ed in secondo luogo per lo sviluppo di strumenti informatici potenzialmente utilizzabili a supporto di attività cliniche, che come nel caso del test OGTT, risultano essere leggermente invasive per i pazienti a causa dell'elevato numero di prelievi ematici, ed economicamente dispendiose per le aziende ospedaliere che le conducono. Sono dunque state condotte preliminarmente delle analisi di regressione sui dataset accuratamente organizzati, con l'obiettivo di sviluppare dei modelli capaci di poter stimare in maniera accurata specifici parametri funzionali per le cinetiche di secrezione ed assorbimento di glucosio ed insulina. I modelli testati sono di comune utilizzo nell'ambito delle analisi regressive se si parla di supervised learning, ed in particolare sono: Linear Regression, Regression Tree, Random Forest e Boosting. Uno step successivo ha riguardato lo sviluppo di modelli per la classificazione di soggetti diabetici, preliminarmente in relazione all'assunzione o meno di Metformina, e solo successivamente in base allo stadio di avanzamento della patologia. Si menzionano a tal proposito la Logistic Regression, il k-NN Classifier, il Naive-Bayes Classifier, i Classification Tree, le Random Forest e le Support Vector Machine. Da precisare che per tutti gli algoritmi elencati si è seguita la tipica pipeline di operazioni di preprocessing dei dataset e di taratura degli iperparametri tramite k-Fold Cross Validation, caratteristica degli studi nell'ambito del Machine Learning.
2022
Machine Learning methods applied to virtual populations of subjects affected by type 2 diabetes
Machine Learning
diabete di tipo 2
Simulation
File in questo prodotto:
File Dimensione Formato  
Califano_Benito.pdf

accesso aperto

Dimensione 1.87 MB
Formato Adobe PDF
1.87 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/45802