Questo elaborato si concentra sul problema dell’applicazione di DBSCAN a set di dati composti esclusivamente da variabili categoriali, nominali e ordinali. Dopo una breve introduzione al funzionamento dell’algoritmo originale proposto da Ester 1996, basato sulla distanza euclidea, vengono analizzate le criticità in presenza di dati non numerici. A partire da queste considerazioni, si esplorano diverse soluzioni per l'adattamento dell'algoritmo attraverso una misura di dissimilarità adatta a dati categoriali. In fine vengono confrontati diversi risultati ottenuti.
Raggruppamento di dati categoriali tramite DBSCAN
MARIANI, LORENZO
2024/2025
Abstract
Questo elaborato si concentra sul problema dell’applicazione di DBSCAN a set di dati composti esclusivamente da variabili categoriali, nominali e ordinali. Dopo una breve introduzione al funzionamento dell’algoritmo originale proposto da Ester 1996, basato sulla distanza euclidea, vengono analizzate le criticità in presenza di dati non numerici. A partire da queste considerazioni, si esplorano diverse soluzioni per l'adattamento dell'algoritmo attraverso una misura di dissimilarità adatta a dati categoriali. In fine vengono confrontati diversi risultati ottenuti.File in questo prodotto:
| File | Dimensione | Formato | |
|---|---|---|---|
|
Mariani_Lorenzo.pdf
accesso aperto
Dimensione
5.39 MB
Formato
Adobe PDF
|
5.39 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
Utilizza questo identificativo per citare o creare un link a questo documento:
https://hdl.handle.net/20.500.12608/92959