La presente tesi esplora il ruolo emergente dei modelli fondativi (FMs) nell’ambito dell’imaging medico, analizzandone architetture, utilizzi clinici e prospettive future. Viene fornita una panoramica sulle caratteristiche distintive dei FMs, dalla transizione da modelli specifici a generalisti, fino ai paradigmi di apprendimento supervisionato e auto-supervisionato. Sono descritti i principali approcci di pre-training, i metodi di adattamento al task (zero-shot, few-shot, fine-tuning) e l’importanza dei dataset per l’efficacia dell’addestramento. La seconda parte del lavoro si concentra sugli impieghi in ambito clinico, con particolare attenzione alla segmentazione automatica delle immagini e alla generazione assistita di referti medici. Il terzo capitolo approfondisce alcune architetture fondative all’avanguardia, tra cui MedSAM, Open Flamingo, MVG, BiomedGPT e M3FM, evidenziando per ciascuna i dati utilizzati, le modalità di training e le metriche di valutazione. Infine, vengono discussi i principali limiti tecnici ed etici, le sfide legate alla trasferibilità dei modelli e le prospettive future, come l’integrazione con dati clinici eterogenei e il contributo della ricerca open-source. La tesi si propone di offrire una visione critica e aggiornata sul potenziale dei modelli fondativi nel trasformare l’imaging medico e i processi diagnostici.
Modelli Fondativi nell’Imaging Medico: Architetture, Implementazioni e Prospettive Future
MEFTAH, NEWEL
2024/2025
Abstract
La presente tesi esplora il ruolo emergente dei modelli fondativi (FMs) nell’ambito dell’imaging medico, analizzandone architetture, utilizzi clinici e prospettive future. Viene fornita una panoramica sulle caratteristiche distintive dei FMs, dalla transizione da modelli specifici a generalisti, fino ai paradigmi di apprendimento supervisionato e auto-supervisionato. Sono descritti i principali approcci di pre-training, i metodi di adattamento al task (zero-shot, few-shot, fine-tuning) e l’importanza dei dataset per l’efficacia dell’addestramento. La seconda parte del lavoro si concentra sugli impieghi in ambito clinico, con particolare attenzione alla segmentazione automatica delle immagini e alla generazione assistita di referti medici. Il terzo capitolo approfondisce alcune architetture fondative all’avanguardia, tra cui MedSAM, Open Flamingo, MVG, BiomedGPT e M3FM, evidenziando per ciascuna i dati utilizzati, le modalità di training e le metriche di valutazione. Infine, vengono discussi i principali limiti tecnici ed etici, le sfide legate alla trasferibilità dei modelli e le prospettive future, come l’integrazione con dati clinici eterogenei e il contributo della ricerca open-source. La tesi si propone di offrire una visione critica e aggiornata sul potenziale dei modelli fondativi nel trasformare l’imaging medico e i processi diagnostici.| File | Dimensione | Formato | |
|---|---|---|---|
|
Meftah_Newel.pdf
accesso aperto
Dimensione
1.51 MB
Formato
Adobe PDF
|
1.51 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/91734