Propensity Score (PS) techniques represent a essential instrument of causal inference for estimating treatment effects in observational studies, where treatment assignment is non-randomized and potentially influenced by confounding factors. In this context, the PS facilitates the construction of populations balanced with respect to observed covariates, thereby enhancing comparability between treated and control groups. This thesis utilizes real-world clinical data from the LEADER study (Liraglutide Effect and Action in Diabetes: Evaluation of Cardiovascular Outcome Results), a multinational, multicenter, long-term, double-blind, placebo-controlled clinical trial designed to evaluate the treatment effect of liraglutide in patients with type 2 diabetes at high cardiovascular risk. The selection of this dataset is motivated by its high quality and the depth of available clinical information, as well as the availability of a reference treatment effect estimate, which serves as a benchmark for constructing diverse scenarios and comparing PS-based methodologies. Following a data pre-processing phase focused on feature selection and missing value management, several PS-based techniques are implemented, including: Propensity Score Matching (PSM), Inverse Probability of Treatment Weighting (IPTW), and Propensity Score Stratification (PSS). The analysis is conducted on a reference population initially balanced via PSM, serving as the baseline for defining various population scenarios. Specifically, scenarios involving the addition of control subjects and configurations with fixed treatment-to-control ratios are considered to evaluate the robustness of these methodologies against variations in sample composition. The Risk Ratio (RR) was adopted as the primary effect measure due to its interpretability in the presence of non-rare events. For each technique, the effect estimation is performed using procedures consistent with the measure of interest, while the associated uncertainty is assessed through approaches tailored to the specific estimation procedure. Overall, the PS-based methodologies exhibit significant differences: PSM ensures high covariate balance but reduces sample size due to subject selection; IPTW retains all observations but may exhibit instability in the presence of extreme weights, requiring potential corrections; and PSS is contingent upon adequate overlap between groups within the strata. The results demonstrate broadly consistent effect estimates, with RR values ranging approximately between 0.77 and 0.90 and largely overlapping Confidence Intervals (CI), indicating robust stability across different sample compositions. Taken together, these findings confirm the central role of PS-based techniques as operational tools for causal inference in observational settings, highlighting the necessity of a methodologically coherent approach between the population construction phase and the effect estimation phase.

Le tecniche basate sul Propensity Score (PS) rappresentano uno strumento fondamentale nell’ambito dell’inferenza causale per la stima dell’effetto del trattamento in studi osservazionali, in cui l’assegnazione al trattamento non è randomizzata e può essere influenzata da fattori di confondimento. In questo contesto, il PS consente di costruire popolazioni bilanciate rispetto alle covariate osservate, rendendo più comparabili i gruppi di trattati e controlli. Questa tesi utilizza dati clinici reali derivanti dallo studio LEADER (Liraglutide Effect and Action in Diabetes: Evaluation of Cardiovascular Outcome Results), un trial clinico multinazionale, multicentrico, a lungo termine, double-blind, controlli placebo e condotto con lo scopo di valutare l’effetto del trattamento della liraglutide in pazienti affetti da diabete di tipo 2 ad elevato rischio cardiovascolare. L’utilizzo di questo dataset è motivato dall’elevata qualità e dalle informazioni cliniche disponibili, nonché dalla possibilità di disporre di una stima di riferimento dell’effetto del trattamento, da utilizzare come base per la costruzione di diversi scenari e per il confronto delle metodologie basate sul PS. Dopo una fase di pre-processing dei dati, finalizzata alla selezione delle variabili rilevanti e alla gestione dei valori mancanti, vengono applicate diverse tecniche basate sul PS, tra cui: Propensity Score Matching (PSM), Inverse Probability of Treatment Weighting (IPTW) e Propensity Score Stratification (PSS). L’analisi è condotta su una popolazione di riferimento inizialmente bilanciata mediante PSM, che costituisce il punto di partenza per la definizione di diversi scenari di popolazione. In particolare, vengono considerati scenari ottenuti mediante l’aggiunta di soggetti di controllo e configurazioni con aggiunta di unità secondo un rapporto prestabilito tra trattati e controlli, al fine di valutare la robustezza delle metodologie rispetto a variazioni nella composizione del campione. La misura di effetto adottata è il Risk Ratio (RR), scelta per la sua interpretabilità in presenza di eventi non rari. Per ciascuna tecnica, la stima dell’effetto viene effettuata attraverso procedure coerenti con la misura di interesse, mentre l’incertezza associata alla stima viene valutata mediante approcci coerenti con la procedura di stima adottata. Nel complesso, le metodologie basate sul PS evidenziano differenze rilevanti: il PSM garantisce un elevato bilanciamento tra covariate ma riduce la dimensione campionaria per effetto della selezione dei soggetti; l’IPTW mantiene tutte le osservazioni ma può risultare instabile in presenza di pesi estremi, richiedendo eventuali correzioni; la PSS, infine, dipende dalla presenza di un adeguato overlap tra i gruppi all’interno degli strati. I risultati mostrano stime dell’effetto complessivamente coerenti, con valori del RR compresi approssimativamente tra 0.77 e 0.90 e intervalli di confidenza (CI) ampiamente sovrapposti, indicando una buona stabilità al variare della composizione del campione. Questi i risultati, nel loro insieme, confermano il ruolo centrale delle tecniche basate sul PS come strumenti operativi per l’inferenza causale in ambito osservazionale, sottolineando la necessità di un approccio metodologicamente coerente tra fase di costruzione della popolazione e fase di stima dell’effetto.

Confronto di tecniche basate sul Propensity Score per stimare l'effetto del trattamento: uno studio comparativo sul trial LEADER

LATINO, MATTEO
2025/2026

Abstract

Propensity Score (PS) techniques represent a essential instrument of causal inference for estimating treatment effects in observational studies, where treatment assignment is non-randomized and potentially influenced by confounding factors. In this context, the PS facilitates the construction of populations balanced with respect to observed covariates, thereby enhancing comparability between treated and control groups. This thesis utilizes real-world clinical data from the LEADER study (Liraglutide Effect and Action in Diabetes: Evaluation of Cardiovascular Outcome Results), a multinational, multicenter, long-term, double-blind, placebo-controlled clinical trial designed to evaluate the treatment effect of liraglutide in patients with type 2 diabetes at high cardiovascular risk. The selection of this dataset is motivated by its high quality and the depth of available clinical information, as well as the availability of a reference treatment effect estimate, which serves as a benchmark for constructing diverse scenarios and comparing PS-based methodologies. Following a data pre-processing phase focused on feature selection and missing value management, several PS-based techniques are implemented, including: Propensity Score Matching (PSM), Inverse Probability of Treatment Weighting (IPTW), and Propensity Score Stratification (PSS). The analysis is conducted on a reference population initially balanced via PSM, serving as the baseline for defining various population scenarios. Specifically, scenarios involving the addition of control subjects and configurations with fixed treatment-to-control ratios are considered to evaluate the robustness of these methodologies against variations in sample composition. The Risk Ratio (RR) was adopted as the primary effect measure due to its interpretability in the presence of non-rare events. For each technique, the effect estimation is performed using procedures consistent with the measure of interest, while the associated uncertainty is assessed through approaches tailored to the specific estimation procedure. Overall, the PS-based methodologies exhibit significant differences: PSM ensures high covariate balance but reduces sample size due to subject selection; IPTW retains all observations but may exhibit instability in the presence of extreme weights, requiring potential corrections; and PSS is contingent upon adequate overlap between groups within the strata. The results demonstrate broadly consistent effect estimates, with RR values ranging approximately between 0.77 and 0.90 and largely overlapping Confidence Intervals (CI), indicating robust stability across different sample compositions. Taken together, these findings confirm the central role of PS-based techniques as operational tools for causal inference in observational settings, highlighting the necessity of a methodologically coherent approach between the population construction phase and the effect estimation phase.
2025
Comparison of Propensity Score-based techniques for estimating treatment effect: a comparative study on the LEADER trial
Le tecniche basate sul Propensity Score (PS) rappresentano uno strumento fondamentale nell’ambito dell’inferenza causale per la stima dell’effetto del trattamento in studi osservazionali, in cui l’assegnazione al trattamento non è randomizzata e può essere influenzata da fattori di confondimento. In questo contesto, il PS consente di costruire popolazioni bilanciate rispetto alle covariate osservate, rendendo più comparabili i gruppi di trattati e controlli. Questa tesi utilizza dati clinici reali derivanti dallo studio LEADER (Liraglutide Effect and Action in Diabetes: Evaluation of Cardiovascular Outcome Results), un trial clinico multinazionale, multicentrico, a lungo termine, double-blind, controlli placebo e condotto con lo scopo di valutare l’effetto del trattamento della liraglutide in pazienti affetti da diabete di tipo 2 ad elevato rischio cardiovascolare. L’utilizzo di questo dataset è motivato dall’elevata qualità e dalle informazioni cliniche disponibili, nonché dalla possibilità di disporre di una stima di riferimento dell’effetto del trattamento, da utilizzare come base per la costruzione di diversi scenari e per il confronto delle metodologie basate sul PS. Dopo una fase di pre-processing dei dati, finalizzata alla selezione delle variabili rilevanti e alla gestione dei valori mancanti, vengono applicate diverse tecniche basate sul PS, tra cui: Propensity Score Matching (PSM), Inverse Probability of Treatment Weighting (IPTW) e Propensity Score Stratification (PSS). L’analisi è condotta su una popolazione di riferimento inizialmente bilanciata mediante PSM, che costituisce il punto di partenza per la definizione di diversi scenari di popolazione. In particolare, vengono considerati scenari ottenuti mediante l’aggiunta di soggetti di controllo e configurazioni con aggiunta di unità secondo un rapporto prestabilito tra trattati e controlli, al fine di valutare la robustezza delle metodologie rispetto a variazioni nella composizione del campione. La misura di effetto adottata è il Risk Ratio (RR), scelta per la sua interpretabilità in presenza di eventi non rari. Per ciascuna tecnica, la stima dell’effetto viene effettuata attraverso procedure coerenti con la misura di interesse, mentre l’incertezza associata alla stima viene valutata mediante approcci coerenti con la procedura di stima adottata. Nel complesso, le metodologie basate sul PS evidenziano differenze rilevanti: il PSM garantisce un elevato bilanciamento tra covariate ma riduce la dimensione campionaria per effetto della selezione dei soggetti; l’IPTW mantiene tutte le osservazioni ma può risultare instabile in presenza di pesi estremi, richiedendo eventuali correzioni; la PSS, infine, dipende dalla presenza di un adeguato overlap tra i gruppi all’interno degli strati. I risultati mostrano stime dell’effetto complessivamente coerenti, con valori del RR compresi approssimativamente tra 0.77 e 0.90 e intervalli di confidenza (CI) ampiamente sovrapposti, indicando una buona stabilità al variare della composizione del campione. Questi i risultati, nel loro insieme, confermano il ruolo centrale delle tecniche basate sul PS come strumenti operativi per l’inferenza causale in ambito osservazionale, sottolineando la necessità di un approccio metodologicamente coerente tra fase di costruzione della popolazione e fase di stima dell’effetto.
LEADER trial
Propensity Score
Studio comparativo
Diabete
Liraglutide
File in questo prodotto:
File Dimensione Formato  
Latino_Matteo.pdf

Accesso riservato

Dimensione 6.06 MB
Formato Adobe PDF
6.06 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/106856