Le equazioni di stima generalizzate penalizzate (PGEE) rappresentano uno dei possibili approcci all’analisi di dati correlati in scenari ad elevata dimensionalità. Diversi metodi comunemente utilizzati in elevata dimensionalità, come lasso, SCAD, MCP, si basano sull’assunzione di indipendenza; pertanto, tali metodi ignorerebbero la correlazione tra le osservazioni relative alla stessa unità. Vengono quindi proposte le GEE penalizzate, caratterizzate da una procedura di selezione delle variabili adeguata in presenza di dati correlati. Nel contesto ad elevata dimensionalità si inserisce anche il concetto di stability selection che combina un approccio di ricampionamento dei dati con algoritmi di selezione, per ottenere risultati più stabili. Il principale vantaggio è la possibilità di controllare il numero medio di falsi positivi, ossia il numero di variabili erroneamente selezionate dal modello. In questo lavoro si propone di utilizzare, come alternativa alla convalida incrociata, la procedura di stability selection per la selezione del modello nell’ambito delle equazioni di stima generalizzate penalizzate.

Stability selection nelle equazioni di stima generalizzate penalizzate

PIATTELLA, LUNA
2024/2025

Abstract

Le equazioni di stima generalizzate penalizzate (PGEE) rappresentano uno dei possibili approcci all’analisi di dati correlati in scenari ad elevata dimensionalità. Diversi metodi comunemente utilizzati in elevata dimensionalità, come lasso, SCAD, MCP, si basano sull’assunzione di indipendenza; pertanto, tali metodi ignorerebbero la correlazione tra le osservazioni relative alla stessa unità. Vengono quindi proposte le GEE penalizzate, caratterizzate da una procedura di selezione delle variabili adeguata in presenza di dati correlati. Nel contesto ad elevata dimensionalità si inserisce anche il concetto di stability selection che combina un approccio di ricampionamento dei dati con algoritmi di selezione, per ottenere risultati più stabili. Il principale vantaggio è la possibilità di controllare il numero medio di falsi positivi, ossia il numero di variabili erroneamente selezionate dal modello. In questo lavoro si propone di utilizzare, come alternativa alla convalida incrociata, la procedura di stability selection per la selezione del modello nell’ambito delle equazioni di stima generalizzate penalizzate.
2024
Stability selection in Penalized Generalized Estimating Equations
GEE
Stability selection
dati correlati
selezione modello
lasso
File in questo prodotto:
File Dimensione Formato  
Piattella_Luna.pdf

accesso aperto

Dimensione 2.16 MB
Formato Adobe PDF
2.16 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/98944