L'analisi della varianza (ANOVA) è una tecnica statistica ampiamente utilizzata per confrontare le medie di gruppi indipendenti. Tuttavia, chi utilizza metodi statistici deve prestare particolare attenzione alla validità delle assunzioni sottostanti, poiché l'affidabilità dei risultati dipende dal rispetto di tali assunzioni. Ignorare i presupposti può portare a conclusioni errate e decisioni sbagliate. La seguente tesi esplora le conseguenze delle violazioni dei presupposti dell'ANOVA e, attraverso uno studio di simulazione condotto in R, propone metodi alternativi per gestirle. In primo luogo, vengono analizzati gli effetti della violazione dell'assunzione di normalità, di indipendenza dei dati e di omoschedasticità. Per quest'ultima, sono esaminati test diagnostici che consentono di rilevare la presenza di eteroschedasticità, come il test di Cochran, di Bartlett, di Hartley, di Levene, di Brown-Forsythe e di Fligner-Killeen. Per affrontare l'eteroschedasticità, vengono esplorati diversi metodi, tra cui la trasformazione dei dati, la versione non parametrica dell'ANOVA, ossia il test di Kruskal-Wallis, ma sono considerati anche il test di Welch, di Welch con medie troncate e varianze winsorizzate, di Alexander-Govern e di James del secondo ordine. Questi test sono valutati sulla loro efficacia nel gestire la non omogeneità delle varianze. In presenza di dati dipendenti, sono discusse proposte alternative all'analisi della varianza tradizionale come l'ANOVA a misure ripetute, la versione non parametrica di quest'ultima, ossia il test di Friedman, e i modelli ad effetti misti, che offrono soluzioni affidabili per la gestione della non indipendenza dei dati. Uno studio di simulazione è stato condotto per valutare l'impatto delle violazioni delle assunzioni sull'ANOVA e per confrontare l'efficacia dei metodi alternativi. Gli scenari considerati includono gruppi bilanciati o sbilanciati, con omoschedasticità o eteroschedasticità, e con osservazioni indipendenti o dipendenti. Inoltre, sono state distinte le situazioni in cui esiste una relazione positiva o negativa tra la numerosità interna ai gruppi e la loro varianza. Nei vari contesti, sono stati calcolati il tasso di errore di I tipo e la potenza dei test confrontati. Sono stati generati grafici per studiare, sotto l'ipotesi nulla, l'uniformità della distribuzione dei p-value e per confrontare la distribuzione delle statistiche test simulate con quella teorica prevista. I risultati indicano che le violazioni delle assunzioni possono compromettere significativamente la validità dell'ANOVA, influenzando negativamente l'accuratezza e la robustezza del test. Tuttavia, sono disponibili tecniche alternative che possono efficacemente mitigare questi effetti. In conclusione, questa tesi offre una comprensione approfondita delle limitazioni dell'ANOVA quando i presupposti di omoschedasticità e indipendenza non sono rispettati e propone soluzioni efficaci per migliorare l'affidabilità delle analisi statistiche in tali condizioni.

VIOLAZIONE DELLE ASSUNZIONI DELL’ANALISI DELLA VARIANZA: CONFRONTO CON METODI ALTERNATIVI ATTRAVERSO UNO STUDIO DI SIMULAZIONE IN R

DANESE, ELENA
2023/2024

Abstract

L'analisi della varianza (ANOVA) è una tecnica statistica ampiamente utilizzata per confrontare le medie di gruppi indipendenti. Tuttavia, chi utilizza metodi statistici deve prestare particolare attenzione alla validità delle assunzioni sottostanti, poiché l'affidabilità dei risultati dipende dal rispetto di tali assunzioni. Ignorare i presupposti può portare a conclusioni errate e decisioni sbagliate. La seguente tesi esplora le conseguenze delle violazioni dei presupposti dell'ANOVA e, attraverso uno studio di simulazione condotto in R, propone metodi alternativi per gestirle. In primo luogo, vengono analizzati gli effetti della violazione dell'assunzione di normalità, di indipendenza dei dati e di omoschedasticità. Per quest'ultima, sono esaminati test diagnostici che consentono di rilevare la presenza di eteroschedasticità, come il test di Cochran, di Bartlett, di Hartley, di Levene, di Brown-Forsythe e di Fligner-Killeen. Per affrontare l'eteroschedasticità, vengono esplorati diversi metodi, tra cui la trasformazione dei dati, la versione non parametrica dell'ANOVA, ossia il test di Kruskal-Wallis, ma sono considerati anche il test di Welch, di Welch con medie troncate e varianze winsorizzate, di Alexander-Govern e di James del secondo ordine. Questi test sono valutati sulla loro efficacia nel gestire la non omogeneità delle varianze. In presenza di dati dipendenti, sono discusse proposte alternative all'analisi della varianza tradizionale come l'ANOVA a misure ripetute, la versione non parametrica di quest'ultima, ossia il test di Friedman, e i modelli ad effetti misti, che offrono soluzioni affidabili per la gestione della non indipendenza dei dati. Uno studio di simulazione è stato condotto per valutare l'impatto delle violazioni delle assunzioni sull'ANOVA e per confrontare l'efficacia dei metodi alternativi. Gli scenari considerati includono gruppi bilanciati o sbilanciati, con omoschedasticità o eteroschedasticità, e con osservazioni indipendenti o dipendenti. Inoltre, sono state distinte le situazioni in cui esiste una relazione positiva o negativa tra la numerosità interna ai gruppi e la loro varianza. Nei vari contesti, sono stati calcolati il tasso di errore di I tipo e la potenza dei test confrontati. Sono stati generati grafici per studiare, sotto l'ipotesi nulla, l'uniformità della distribuzione dei p-value e per confrontare la distribuzione delle statistiche test simulate con quella teorica prevista. I risultati indicano che le violazioni delle assunzioni possono compromettere significativamente la validità dell'ANOVA, influenzando negativamente l'accuratezza e la robustezza del test. Tuttavia, sono disponibili tecniche alternative che possono efficacemente mitigare questi effetti. In conclusione, questa tesi offre una comprensione approfondita delle limitazioni dell'ANOVA quando i presupposti di omoschedasticità e indipendenza non sono rispettati e propone soluzioni efficaci per migliorare l'affidabilità delle analisi statistiche in tali condizioni.
2023
VIOLATION OF THE ASSUMPTIONS OF ANALYSIS OF VARIANCE: COMPARISON WITH ALTERNATIVE METHODS THROUGH A SIMULATION STUDY IN R
varianza
assunzioni
simulazione
File in questo prodotto:
File Dimensione Formato  
Danese_Elena.pdf

accesso aperto

Dimensione 2 MB
Formato Adobe PDF
2 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/71256