Questo elaborato si concentra sul problema dell’applicazione di DBSCAN a set di dati composti esclusivamente da variabili categoriali, nominali e ordinali. Dopo una breve introduzione al funzionamento dell’algoritmo originale proposto da Ester 1996, basato sulla distanza euclidea, vengono analizzate le criticità in presenza di dati non numerici. A partire da queste considerazioni, si esplorano diverse soluzioni per l'adattamento dell'algoritmo attraverso una misura di dissimilarità adatta a dati categoriali. In fine vengono confrontati diversi risultati ottenuti.

Raggruppamento di dati categoriali tramite DBSCAN

MARIANI, LORENZO
2024/2025

Abstract

Questo elaborato si concentra sul problema dell’applicazione di DBSCAN a set di dati composti esclusivamente da variabili categoriali, nominali e ordinali. Dopo una breve introduzione al funzionamento dell’algoritmo originale proposto da Ester 1996, basato sulla distanza euclidea, vengono analizzate le criticità in presenza di dati non numerici. A partire da queste considerazioni, si esplorano diverse soluzioni per l'adattamento dell'algoritmo attraverso una misura di dissimilarità adatta a dati categoriali. In fine vengono confrontati diversi risultati ottenuti.
2024
Clustering categorical data with DBSCAN
Clustering
DBSCAN
dati categoriali
File in questo prodotto:
File Dimensione Formato  
Mariani_Lorenzo.pdf

accesso aperto

Dimensione 5.39 MB
Formato Adobe PDF
5.39 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/92959