L'indice di performance R^2, ampiamente utilizzato in statistica, presenta una limitazione fondamentale nella costruzione dei modelli di regressione lineare. Il suo valore può solo crescere all'aumentare dei predittori, favorendo l'aggiunta di variabili al modello, anche se queste possono essere non necessarie per la capacità del modello di generalizzare su nuovi dati. Per risolvere questo problema è stato introdotto l'R^2 corretto (oppure R^2 adj), un criterio di selezione che tiene conto del numero di predittori nel modello. Tuttavia, anche l'R^2 adj non fornisce alcuna garanzia sulla capacità del modello selezionato di fare previsioni accurate su nuovi dati. Un’alternativa è rappresentata dalla statistica PRESS che valuta le prestazioni del modello escludendo ciascuna osservazione in sequenza e calcolando il suo valore predetto. In questo articolo viene confrontata la prestazione della statistica PRESS con altri criteri di selezione del modello tra cui l'R^2 adj, AIC, SBC e Cp di Mallow. In sintesi la statistica PRESS rappresenta una valida alternativa per valutare la capacità del modello di generalizzare su nuovi dati.
Selezione del modello tramite la statistica PRESS
DE TOMMASO, SARA
2022/2023
Abstract
L'indice di performance R^2, ampiamente utilizzato in statistica, presenta una limitazione fondamentale nella costruzione dei modelli di regressione lineare. Il suo valore può solo crescere all'aumentare dei predittori, favorendo l'aggiunta di variabili al modello, anche se queste possono essere non necessarie per la capacità del modello di generalizzare su nuovi dati. Per risolvere questo problema è stato introdotto l'R^2 corretto (oppure R^2 adj), un criterio di selezione che tiene conto del numero di predittori nel modello. Tuttavia, anche l'R^2 adj non fornisce alcuna garanzia sulla capacità del modello selezionato di fare previsioni accurate su nuovi dati. Un’alternativa è rappresentata dalla statistica PRESS che valuta le prestazioni del modello escludendo ciascuna osservazione in sequenza e calcolando il suo valore predetto. In questo articolo viene confrontata la prestazione della statistica PRESS con altri criteri di selezione del modello tra cui l'R^2 adj, AIC, SBC e Cp di Mallow. In sintesi la statistica PRESS rappresenta una valida alternativa per valutare la capacità del modello di generalizzare su nuovi dati.File | Dimensione | Formato | |
---|---|---|---|
DeTommaso_Sara.pdf
accesso aperto
Dimensione
635.3 kB
Formato
Adobe PDF
|
635.3 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/49977