Il problema dei duplicati in un database si riferisce alla presenza non desiderata ed eccessiva, di molteplici record identici o molto simili tra loro, che rappresentano la stessa entità o informazione. La presenza di questo fenomeno, come si può facilmente intuire, introduce, specie nei database di grandi dimensioni, una serie di problemi nella gestione del database stesso: le più evidenti sono: inconsistenze nei dati e peggioramento di prestazione generale del database, sia nell’esecuzione di query che nelle normali operazioni di gestione dello stesso come aggiornamenti e cancellazioni; la problematica invece meno evidente e più seccante è l’introduzione di errori sistematici in eventuali report e analisi basati su database che presentano dei duplicati a causa di conteggi errati, portando di conseguenza a possibili decisioni o strategie aziendali errate. Questa tesi verterà sull’analisi del problema dei duplicati e delle strategie e tecniche, che possono essere applicate per risolvere il problema al fine di una corretta gestione di un database

Analisi del problema dei duplicati in un database relazionale

FACCHIN, ANDREA
2024/2025

Abstract

Il problema dei duplicati in un database si riferisce alla presenza non desiderata ed eccessiva, di molteplici record identici o molto simili tra loro, che rappresentano la stessa entità o informazione. La presenza di questo fenomeno, come si può facilmente intuire, introduce, specie nei database di grandi dimensioni, una serie di problemi nella gestione del database stesso: le più evidenti sono: inconsistenze nei dati e peggioramento di prestazione generale del database, sia nell’esecuzione di query che nelle normali operazioni di gestione dello stesso come aggiornamenti e cancellazioni; la problematica invece meno evidente e più seccante è l’introduzione di errori sistematici in eventuali report e analisi basati su database che presentano dei duplicati a causa di conteggi errati, portando di conseguenza a possibili decisioni o strategie aziendali errate. Questa tesi verterà sull’analisi del problema dei duplicati e delle strategie e tecniche, che possono essere applicate per risolvere il problema al fine di una corretta gestione di un database
2024
Analysis of the duplicate problem in a relational database
ricerca
relazione
chiave primaria
File in questo prodotto:
File Dimensione Formato  
Facchin_Andrea.pdf

accesso aperto

Dimensione 488.18 kB
Formato Adobe PDF
488.18 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/89353