This thesis presents a unified introduction to dimensionality reduction with a focus on the methods PCA, t-SNE, and UMAP. We present the underlying principles, neighborhood construction, and optimization with a rigorous and accessible approach. Through a simulation study, we examine whether these methods preserve information while varying dimensionality and difficulty. We then apply the techniques to real data and compare the resulting embeddings using quantitative and qualitative criteria, discussing strengths, limitations, and the practical implications of hyperparameters. We conclude with usage guidelines for exploratory analysis.

Questa tesi introduce in modo unitario la riduzione della dimensionalità con focus sui metodi: PCA, t-SNE e UMAP. Presentiamo i principi, la costruzione delle vicinanze e l’ottimizzazione con un'impostazione rigorosa ed accessibile. Tramite uno studio di simulazione si prova a stabilire se tali metodi preservano informazione, variando dimensione e difficoltà. Applichiamo poi le tecniche a dati reali e confrontiamo le mappe ottenute con criteri quantitativi e qualitativi, discutendo punti di forza, limiti e implicazioni pratiche degli iperparametri. Concludiamo con linee guida d’uso per l’analisi esplorativa.

Un approfondimento su alcuni metodi non lineari di riduzione della dimensionalità

PAOLETTI, SIMONE
2024/2025

Abstract

This thesis presents a unified introduction to dimensionality reduction with a focus on the methods PCA, t-SNE, and UMAP. We present the underlying principles, neighborhood construction, and optimization with a rigorous and accessible approach. Through a simulation study, we examine whether these methods preserve information while varying dimensionality and difficulty. We then apply the techniques to real data and compare the resulting embeddings using quantitative and qualitative criteria, discussing strengths, limitations, and the practical implications of hyperparameters. We conclude with usage guidelines for exploratory analysis.
2024
An in-depth look at some nonlinear dimensionality reduction methods
Questa tesi introduce in modo unitario la riduzione della dimensionalità con focus sui metodi: PCA, t-SNE e UMAP. Presentiamo i principi, la costruzione delle vicinanze e l’ottimizzazione con un'impostazione rigorosa ed accessibile. Tramite uno studio di simulazione si prova a stabilire se tali metodi preservano informazione, variando dimensione e difficoltà. Applichiamo poi le tecniche a dati reali e confrontiamo le mappe ottenute con criteri quantitativi e qualitativi, discutendo punti di forza, limiti e implicazioni pratiche degli iperparametri. Concludiamo con linee guida d’uso per l’analisi esplorativa.
Riduzione
Dimensionalità
UMAP
t-SNE
File in questo prodotto:
File Dimensione Formato  
Paoletti_Simone.pdf

accesso aperto

Dimensione 33.18 MB
Formato Adobe PDF
33.18 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/92968