L'elaborato analizza il problema dell’Entity Resolution (ER), ovvero l’identificazione e l’unificazione di record che descrivono la stessa entità, sfida sempre più rilevante nell’era dei Big Data. L’attenzione è rivolta al ruolo del Blocking, tecnica fondamentale per contenere la complessità computazionale del processo. Vengono esaminate le principali strategie di Block Building e Block Processing, insieme al Filtering, presentato come approccio alternativo e complementare. L’elaborato evidenzia come l’efficacia dell’ER dipenda dall’equilibrio tra riduzione dei confronti e preservazione delle corrispondenze reali, sottolineando il potenziale delle soluzioni ibride e adattive per garantire scalabilità e affidabilità.
Entity Resolution: Strategie di Block Building e Processing
VOLPATO, SAMUELE
2024/2025
Abstract
L'elaborato analizza il problema dell’Entity Resolution (ER), ovvero l’identificazione e l’unificazione di record che descrivono la stessa entità, sfida sempre più rilevante nell’era dei Big Data. L’attenzione è rivolta al ruolo del Blocking, tecnica fondamentale per contenere la complessità computazionale del processo. Vengono esaminate le principali strategie di Block Building e Block Processing, insieme al Filtering, presentato come approccio alternativo e complementare. L’elaborato evidenzia come l’efficacia dell’ER dipenda dall’equilibrio tra riduzione dei confronti e preservazione delle corrispondenze reali, sottolineando il potenziale delle soluzioni ibride e adattive per garantire scalabilità e affidabilità.| File | Dimensione | Formato | |
|---|---|---|---|
|
Volpato_Samuele.pdf
accesso aperto
Dimensione
433.04 kB
Formato
Adobe PDF
|
433.04 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/92526