L'indice di performance R^2, ampiamente utilizzato in statistica, presenta una limitazione fondamentale nella costruzione dei modelli di regressione lineare. Il suo valore può solo crescere all'aumentare dei predittori, favorendo l'aggiunta di variabili al modello, anche se queste possono essere non necessarie per la capacità del modello di generalizzare su nuovi dati. Per risolvere questo problema è stato introdotto l'R^2 corretto (oppure R^2 adj), un criterio di selezione che tiene conto del numero di predittori nel modello. Tuttavia, anche l'R^2 adj non fornisce alcuna garanzia sulla capacità del modello selezionato di fare previsioni accurate su nuovi dati. Un’alternativa è rappresentata dalla statistica PRESS che valuta le prestazioni del modello escludendo ciascuna osservazione in sequenza e calcolando il suo valore predetto. In questo articolo viene confrontata la prestazione della statistica PRESS con altri criteri di selezione del modello tra cui l'R^2 adj, AIC, SBC e Cp di Mallow. In sintesi la statistica PRESS rappresenta una valida alternativa per valutare la capacità del modello di generalizzare su nuovi dati.

Selezione del modello tramite la statistica PRESS

DE TOMMASO, SARA
2022/2023

Abstract

L'indice di performance R^2, ampiamente utilizzato in statistica, presenta una limitazione fondamentale nella costruzione dei modelli di regressione lineare. Il suo valore può solo crescere all'aumentare dei predittori, favorendo l'aggiunta di variabili al modello, anche se queste possono essere non necessarie per la capacità del modello di generalizzare su nuovi dati. Per risolvere questo problema è stato introdotto l'R^2 corretto (oppure R^2 adj), un criterio di selezione che tiene conto del numero di predittori nel modello. Tuttavia, anche l'R^2 adj non fornisce alcuna garanzia sulla capacità del modello selezionato di fare previsioni accurate su nuovi dati. Un’alternativa è rappresentata dalla statistica PRESS che valuta le prestazioni del modello escludendo ciascuna osservazione in sequenza e calcolando il suo valore predetto. In questo articolo viene confrontata la prestazione della statistica PRESS con altri criteri di selezione del modello tra cui l'R^2 adj, AIC, SBC e Cp di Mallow. In sintesi la statistica PRESS rappresenta una valida alternativa per valutare la capacità del modello di generalizzare su nuovi dati.
2022
Model selection using PRESS statistic
selezione modello
R^2 PRESS
predittori
File in questo prodotto:
File Dimensione Formato  
DeTommaso_Sara.pdf

accesso aperto

Dimensione 635.3 kB
Formato Adobe PDF
635.3 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/49977