ABSTRACT INTRODUCTION Determining the mutational status of the EGFR gene in lung adenocarcinoma (ADC) is crucial for therapy with tyrosine kinase inhibitors, but is limited by long execution times and tissue consumption for genetic material extraction. Artificial intelligence (AI) models based on Foundation Models, such as EAGLE, offer a rapid and tissue-sparing alternative, however, their generalizability requires rigorous local validation prior to clinical adoption. MATERIAL AND METHODS This thesis presents a retrospective study on a single-center cohort of 336 cases of ADC with known EGFR mutation status and availability of corresponding digital histological images. Initially, we validated the performance of the pre-trained EAGLE model on the entire cohort. Subsequently, the model underwent local fine-tuning on a training set (80% of cases, n=268) and its performance was measured on an independent test set (20%, n=68), created through stratified and balanced subdivision with respect to EGFR mutational status. RESULTS The pre-trained EAGLE model achieved an AUC of 0.8154 on our cohort, but with suboptimal accuracy (MCC=0.4222 at a threshold of 0.5). After local fine-tuning, the specialized model showed a significant improvement, achieving an AUC of 0.8906 on the independent test set. At a threshold of 0.5, the fine-tuned model demonstrated excellent balance, with an accuracy of 0.7391 and a sensitivity of 0.8500 (MCC=0.6982). CONCLUSION External validation is an essential step for the clinical translation of AI models. Our study demonstrates that local fine-tuning is an effective strategy for adapting a foundation model such as EAGLE, significantly improving its accuracy and reliability for use in a specific diagnostic context. These results support the potential of such tools to optimize the diagnostic-therapeutic pathway of ADC.

INTRODUZIONE La determinazione dello stato mutazionale del gene EGFR nell'adenocarcinoma polmonare (ADC) è cruciale per la terapia con inibitori tirosin-chinasici, ma è limitata da lunghi tempi di esecuzione e dal consumo di tessuto per l’estrazione del materiale genetico. Modelli di intelligenza artificiale (AI) basati su Foundation Models, come EAGLE, offrono un'alternativa rapida e tissue-sparing, tuttavia, la loro generalizzabilità richiede una rigorosa validazione locale prima dell'adozione clinica. MATERIALI E METODI Questa tesi presenta uno studio retrospettivo su una coorte monocentrica di 336 casi di ADC con stato mutazionale di EGFR noto e disponibilità delle immagini istologiche digitali corrispondenti. Inizialmente, abbiamo validato le performance del modello yEAGLE pre-addestrato sull'intera coorte. Successivamente, il modello è stato sottoposto a fine-tuning locale su un training set (80% dei casi, n=268) e la sua performance è stata misurata su un test set indipendente (20%, n=68), creato tramite suddivisione stratificata e bilanciata rispetto allo stato mutazionale di EGFR. RISULTATI Il modello EAGLE pre-addestrato ha ottenuto sulla nostra coorte una AUC di 0.8154, ma con una precisione sub-ottimale (MCC=0.4222 a soglia 0.5). Dopo il fine-tuning locale, il modello specializzato ha mostrato un significativo miglioramento, raggiungendo sul test set indipendente una AUC di 0.8906. A una soglia di 0.5, il modello fine-tunato ha dimostrato un eccellente equilibrio, con una precisione di 0.7391 e una sensibilità di 0.8500 (MCC=0.6982). CONCLUSIONI La validazione esterna è un passo indispensabile per la traslazione clinica dei modelli di AI. Il nostro studio dimostra che il fine-tuning locale è una strategia efficace per adattare un foundation model come EAGLE, migliorandone significativamente la precisione e l'affidabilità per l'uso in uno specifico contesto diagnostico. Questi risultati supportano il potenziale di tali strumenti per ottimizzare il percorso diagnostico-terapeutico dell’ADC.

FOUNDATION MODEL PER LA PREDIZIONE DI EGFR Validazione E Specializzazione Interna su di una coorte retrospettiva di 336 Casi di Adenocarcinoma Polmonare.

PELLIZZON, ALICE
2024/2025

Abstract

ABSTRACT INTRODUCTION Determining the mutational status of the EGFR gene in lung adenocarcinoma (ADC) is crucial for therapy with tyrosine kinase inhibitors, but is limited by long execution times and tissue consumption for genetic material extraction. Artificial intelligence (AI) models based on Foundation Models, such as EAGLE, offer a rapid and tissue-sparing alternative, however, their generalizability requires rigorous local validation prior to clinical adoption. MATERIAL AND METHODS This thesis presents a retrospective study on a single-center cohort of 336 cases of ADC with known EGFR mutation status and availability of corresponding digital histological images. Initially, we validated the performance of the pre-trained EAGLE model on the entire cohort. Subsequently, the model underwent local fine-tuning on a training set (80% of cases, n=268) and its performance was measured on an independent test set (20%, n=68), created through stratified and balanced subdivision with respect to EGFR mutational status. RESULTS The pre-trained EAGLE model achieved an AUC of 0.8154 on our cohort, but with suboptimal accuracy (MCC=0.4222 at a threshold of 0.5). After local fine-tuning, the specialized model showed a significant improvement, achieving an AUC of 0.8906 on the independent test set. At a threshold of 0.5, the fine-tuned model demonstrated excellent balance, with an accuracy of 0.7391 and a sensitivity of 0.8500 (MCC=0.6982). CONCLUSION External validation is an essential step for the clinical translation of AI models. Our study demonstrates that local fine-tuning is an effective strategy for adapting a foundation model such as EAGLE, significantly improving its accuracy and reliability for use in a specific diagnostic context. These results support the potential of such tools to optimize the diagnostic-therapeutic pathway of ADC.
2024
FOUNDATION MODEL FOR EGFR MUTATION PREDICTION Validation And Internal fine-tuning on a retrospective cohort of 336 Cases of Lung Adenocarcinoma.
INTRODUZIONE La determinazione dello stato mutazionale del gene EGFR nell'adenocarcinoma polmonare (ADC) è cruciale per la terapia con inibitori tirosin-chinasici, ma è limitata da lunghi tempi di esecuzione e dal consumo di tessuto per l’estrazione del materiale genetico. Modelli di intelligenza artificiale (AI) basati su Foundation Models, come EAGLE, offrono un'alternativa rapida e tissue-sparing, tuttavia, la loro generalizzabilità richiede una rigorosa validazione locale prima dell'adozione clinica. MATERIALI E METODI Questa tesi presenta uno studio retrospettivo su una coorte monocentrica di 336 casi di ADC con stato mutazionale di EGFR noto e disponibilità delle immagini istologiche digitali corrispondenti. Inizialmente, abbiamo validato le performance del modello yEAGLE pre-addestrato sull'intera coorte. Successivamente, il modello è stato sottoposto a fine-tuning locale su un training set (80% dei casi, n=268) e la sua performance è stata misurata su un test set indipendente (20%, n=68), creato tramite suddivisione stratificata e bilanciata rispetto allo stato mutazionale di EGFR. RISULTATI Il modello EAGLE pre-addestrato ha ottenuto sulla nostra coorte una AUC di 0.8154, ma con una precisione sub-ottimale (MCC=0.4222 a soglia 0.5). Dopo il fine-tuning locale, il modello specializzato ha mostrato un significativo miglioramento, raggiungendo sul test set indipendente una AUC di 0.8906. A una soglia di 0.5, il modello fine-tunato ha dimostrato un eccellente equilibrio, con una precisione di 0.7391 e una sensibilità di 0.8500 (MCC=0.6982). CONCLUSIONI La validazione esterna è un passo indispensabile per la traslazione clinica dei modelli di AI. Il nostro studio dimostra che il fine-tuning locale è una strategia efficace per adattare un foundation model come EAGLE, migliorandone significativamente la precisione e l'affidabilità per l'uso in uno specifico contesto diagnostico. Questi risultati supportano il potenziale di tali strumenti per ottimizzare il percorso diagnostico-terapeutico dell’ADC.
ADC
Predizione EGFR
Coorte retrospettiva
Foundation model
Deep Learning
File in questo prodotto:
File Dimensione Formato  
TESI PELLIZZON ALICE pdfA.pdf

Accesso riservato

Dimensione 1.07 MB
Formato Adobe PDF
1.07 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/93904