Questa tesi di laurea studia i principali algoritmi di rilevamento di distance-based outlier noti in letteratura. L'obiettivo principale è comprendere le definizioni di outlier adottate, studiare le strategie algoritmiche utilizzate e fornire una dettagliata analisi della complessità degli algoritmi. In una prima parte si fornisce una definizione della nozione di distance-based outlier e il problema del rilevamento di outlier. Successivamente, vengono descritti tre algoritmi proposti in due articoli, esplicitando le scelte implementative relative ad alcuni passaggi chiave e alle strutture dati da utilizzare. Per ciascun algoritmo viene effettuata l'analisi della complessità in termini di numero di operazioni e, in alcuni casi, di numero di blocchi trasferiti da disco a RAM e viceversa. Per un algoritmo viene anche fornita una versione che ne migliora notevolmente l'efficienza a scapito di una moderata perdita di accuratezza negli outlier identificati.

Algoritmi distance-based per l'identificazione di outlier

MORELLATO, BARTOLOMEO
2022/2023

Abstract

Questa tesi di laurea studia i principali algoritmi di rilevamento di distance-based outlier noti in letteratura. L'obiettivo principale è comprendere le definizioni di outlier adottate, studiare le strategie algoritmiche utilizzate e fornire una dettagliata analisi della complessità degli algoritmi. In una prima parte si fornisce una definizione della nozione di distance-based outlier e il problema del rilevamento di outlier. Successivamente, vengono descritti tre algoritmi proposti in due articoli, esplicitando le scelte implementative relative ad alcuni passaggi chiave e alle strutture dati da utilizzare. Per ciascun algoritmo viene effettuata l'analisi della complessità in termini di numero di operazioni e, in alcuni casi, di numero di blocchi trasferiti da disco a RAM e viceversa. Per un algoritmo viene anche fornita una versione che ne migliora notevolmente l'efficienza a scapito di una moderata perdita di accuratezza negli outlier identificati.
2022
Distance-based algorithms for outlier detection
Outliers
Algoritmi
Analisi complessità
Data mining
Knowledge discovery
File in questo prodotto:
File Dimensione Formato  
Morellato_Bartolomeo.pdf

accesso aperto

Dimensione 1.22 MB
Formato Adobe PDF
1.22 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/53339