L'elaborato analizza il problema dell’Entity Resolution (ER), ovvero l’identificazione e l’unificazione di record che descrivono la stessa entità, sfida sempre più rilevante nell’era dei Big Data. L’attenzione è rivolta al ruolo del Blocking, tecnica fondamentale per contenere la complessità computazionale del processo. Vengono esaminate le principali strategie di Block Building e Block Processing, insieme al Filtering, presentato come approccio alternativo e complementare. L’elaborato evidenzia come l’efficacia dell’ER dipenda dall’equilibrio tra riduzione dei confronti e preservazione delle corrispondenze reali, sottolineando il potenziale delle soluzioni ibride e adattive per garantire scalabilità e affidabilità.

Entity Resolution: Strategie di Block Building e Processing

VOLPATO, SAMUELE
2024/2025

Abstract

L'elaborato analizza il problema dell’Entity Resolution (ER), ovvero l’identificazione e l’unificazione di record che descrivono la stessa entità, sfida sempre più rilevante nell’era dei Big Data. L’attenzione è rivolta al ruolo del Blocking, tecnica fondamentale per contenere la complessità computazionale del processo. Vengono esaminate le principali strategie di Block Building e Block Processing, insieme al Filtering, presentato come approccio alternativo e complementare. L’elaborato evidenzia come l’efficacia dell’ER dipenda dall’equilibrio tra riduzione dei confronti e preservazione delle corrispondenze reali, sottolineando il potenziale delle soluzioni ibride e adattive per garantire scalabilità e affidabilità.
2024
Entity Resolution: Block Building and Processing Strategies
Entity Resolution
Blocking
Bock Building
Block Processing
File in questo prodotto:
File Dimensione Formato  
Volpato_Samuele.pdf

accesso aperto

Dimensione 433.04 kB
Formato Adobe PDF
433.04 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/92526