Le equazioni di stima generalizzate penalizzate (PGEE) rappresentano uno dei possibili approcci all’analisi di dati correlati in scenari ad elevata dimensionalità. Diversi metodi comunemente utilizzati in elevata dimensionalità, come lasso, SCAD, MCP, si basano sull’assunzione di indipendenza; pertanto, tali metodi ignorerebbero la correlazione tra le osservazioni relative alla stessa unità. Vengono quindi proposte le GEE penalizzate, caratterizzate da una procedura di selezione delle variabili adeguata in presenza di dati correlati. Nel contesto ad elevata dimensionalità si inserisce anche il concetto di stability selection che combina un approccio di ricampionamento dei dati con algoritmi di selezione, per ottenere risultati più stabili. Il principale vantaggio è la possibilità di controllare il numero medio di falsi positivi, ossia il numero di variabili erroneamente selezionate dal modello. In questo lavoro si propone di utilizzare, come alternativa alla convalida incrociata, la procedura di stability selection per la selezione del modello nell’ambito delle equazioni di stima generalizzate penalizzate.
Stability selection nelle equazioni di stima generalizzate penalizzate
PIATTELLA, LUNA
2024/2025
Abstract
Le equazioni di stima generalizzate penalizzate (PGEE) rappresentano uno dei possibili approcci all’analisi di dati correlati in scenari ad elevata dimensionalità. Diversi metodi comunemente utilizzati in elevata dimensionalità, come lasso, SCAD, MCP, si basano sull’assunzione di indipendenza; pertanto, tali metodi ignorerebbero la correlazione tra le osservazioni relative alla stessa unità. Vengono quindi proposte le GEE penalizzate, caratterizzate da una procedura di selezione delle variabili adeguata in presenza di dati correlati. Nel contesto ad elevata dimensionalità si inserisce anche il concetto di stability selection che combina un approccio di ricampionamento dei dati con algoritmi di selezione, per ottenere risultati più stabili. Il principale vantaggio è la possibilità di controllare il numero medio di falsi positivi, ossia il numero di variabili erroneamente selezionate dal modello. In questo lavoro si propone di utilizzare, come alternativa alla convalida incrociata, la procedura di stability selection per la selezione del modello nell’ambito delle equazioni di stima generalizzate penalizzate.| File | Dimensione | Formato | |
|---|---|---|---|
|
Piattella_Luna.pdf
accesso aperto
Dimensione
2.16 MB
Formato
Adobe PDF
|
2.16 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/98944