La stratificazione principale è un ambito essenziale per l'inferenza causale che permette di analizzare l'effetto di un trattamento sul fenomeno di interesse in presenza di variabili di post-trattamento, ossia di variabili influenzate dal trattamento stesso e che contemporaneamente influiscono sulla variabile oggetto di studio. La forza di questo approccio risiede nell'uso degli strati principali, gruppi di unità definite da valori simili della variabile di post-trattamento potenziale sotto trattamento e sotto controllo. Mentre gli studi preesistenti si sono concentrati su variabili di post-trattamento binarie, la gestione di una variabile di post-trattamento continua rimane una sfida aperta. Quando la variabile di post-trattamento è continua, il problema centrale risiede nella necessità di stabilire come identificare e definire una partizione degli strati principali latenti. Tale partizione deve essere non solo statisticamente valida, ma soprattutto interpretabile, in modo da consentire la corretta stima e l'attribuzione di significato agli effetti causali principali. La presente tesi propone un innovativo modello bayesiano non parametrico che sfrutta una struttura a mistura per adattarsi dinamicamente alla complessità della distribuzione continua e identificare gli strati principali. La nuova prospettiva in esame vede come gli strati debbano emergere naturalmente come espressione diretta dell'eterogeneità dell'effetto causale del trattamento sulla variabile di post-trattamento stessa, lasciandosi guidare dai dati senza dipendere da scelte a priori. Gli esiti potenziali non osservati relativi alla variabile di post-trattamento vengono opportunamente imputati mediante i metodi bayesiani non parametrici, e al tempo stesso vengono introdotti degli stimatori causali appositi per misurare gli effetti causali condizionatamente alla struttura dello strato. Le capacità del modello vengono testate estensivamente attraverso una serie di simulazioni in diversi scenari, dimostrando che il modello è in grado di identificare correttamente gli strati e i rispettivi effetti causali attesi. Infine, il modello viene utilizzato per analizzare gli effetti causali derivanti dalle politiche di regolamentazione dell'inquinamento atmosferico sulla mortalità negli Stati Uniti, con un focus cruciale sull'eterogeneità mediata dai livelli di particolato atmosferico.
Un approccio bayesiano non parametrico alla stratificazione principale con post-trattamenti continui ed esiti binari
SCHIAVO, ROBERTO
2024/2025
Abstract
La stratificazione principale è un ambito essenziale per l'inferenza causale che permette di analizzare l'effetto di un trattamento sul fenomeno di interesse in presenza di variabili di post-trattamento, ossia di variabili influenzate dal trattamento stesso e che contemporaneamente influiscono sulla variabile oggetto di studio. La forza di questo approccio risiede nell'uso degli strati principali, gruppi di unità definite da valori simili della variabile di post-trattamento potenziale sotto trattamento e sotto controllo. Mentre gli studi preesistenti si sono concentrati su variabili di post-trattamento binarie, la gestione di una variabile di post-trattamento continua rimane una sfida aperta. Quando la variabile di post-trattamento è continua, il problema centrale risiede nella necessità di stabilire come identificare e definire una partizione degli strati principali latenti. Tale partizione deve essere non solo statisticamente valida, ma soprattutto interpretabile, in modo da consentire la corretta stima e l'attribuzione di significato agli effetti causali principali. La presente tesi propone un innovativo modello bayesiano non parametrico che sfrutta una struttura a mistura per adattarsi dinamicamente alla complessità della distribuzione continua e identificare gli strati principali. La nuova prospettiva in esame vede come gli strati debbano emergere naturalmente come espressione diretta dell'eterogeneità dell'effetto causale del trattamento sulla variabile di post-trattamento stessa, lasciandosi guidare dai dati senza dipendere da scelte a priori. Gli esiti potenziali non osservati relativi alla variabile di post-trattamento vengono opportunamente imputati mediante i metodi bayesiani non parametrici, e al tempo stesso vengono introdotti degli stimatori causali appositi per misurare gli effetti causali condizionatamente alla struttura dello strato. Le capacità del modello vengono testate estensivamente attraverso una serie di simulazioni in diversi scenari, dimostrando che il modello è in grado di identificare correttamente gli strati e i rispettivi effetti causali attesi. Infine, il modello viene utilizzato per analizzare gli effetti causali derivanti dalle politiche di regolamentazione dell'inquinamento atmosferico sulla mortalità negli Stati Uniti, con un focus cruciale sull'eterogeneità mediata dai livelli di particolato atmosferico.| File | Dimensione | Formato | |
|---|---|---|---|
|
Schiavo_Roberto.pdf
accesso aperto
Dimensione
22.86 MB
Formato
Adobe PDF
|
22.86 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/98949