Il problema dei duplicati in un database si riferisce alla presenza non desiderata ed eccessiva, di molteplici record identici o molto simili tra loro, che rappresentano la stessa entità o informazione. La presenza di questo fenomeno, come si può facilmente intuire, introduce, specie nei database di grandi dimensioni, una serie di problemi nella gestione del database stesso: le più evidenti sono: inconsistenze nei dati e peggioramento di prestazione generale del database, sia nell’esecuzione di query che nelle normali operazioni di gestione dello stesso come aggiornamenti e cancellazioni; la problematica invece meno evidente e più seccante è l’introduzione di errori sistematici in eventuali report e analisi basati su database che presentano dei duplicati a causa di conteggi errati, portando di conseguenza a possibili decisioni o strategie aziendali errate. Questa tesi verterà sull’analisi del problema dei duplicati e delle strategie e tecniche, che possono essere applicate per risolvere il problema al fine di una corretta gestione di un database
Analisi del problema dei duplicati in un database relazionale
FACCHIN, ANDREA
2024/2025
Abstract
Il problema dei duplicati in un database si riferisce alla presenza non desiderata ed eccessiva, di molteplici record identici o molto simili tra loro, che rappresentano la stessa entità o informazione. La presenza di questo fenomeno, come si può facilmente intuire, introduce, specie nei database di grandi dimensioni, una serie di problemi nella gestione del database stesso: le più evidenti sono: inconsistenze nei dati e peggioramento di prestazione generale del database, sia nell’esecuzione di query che nelle normali operazioni di gestione dello stesso come aggiornamenti e cancellazioni; la problematica invece meno evidente e più seccante è l’introduzione di errori sistematici in eventuali report e analisi basati su database che presentano dei duplicati a causa di conteggi errati, portando di conseguenza a possibili decisioni o strategie aziendali errate. Questa tesi verterà sull’analisi del problema dei duplicati e delle strategie e tecniche, che possono essere applicate per risolvere il problema al fine di una corretta gestione di un database| File | Dimensione | Formato | |
|---|---|---|---|
|
Facchin_Andrea.pdf
accesso aperto
Dimensione
488.18 kB
Formato
Adobe PDF
|
488.18 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/89353