La pubblicazione delle informazioni personali delle persone, come ad esempio i dati sanitari, risulta essere significativamente vantaggiosa per istituzioni ospedaliere e organizzazioni governative di vario genere, supportando la ricerca scientifica specialmente nel contesto medico. Queste informazioni sensibili sono tuttora gestite all’interno di cartelle cliniche elettroniche (Electronic Health Record, EHR), le quali sono continuamente soggette ad opere di condivisioni e raccolta, essenziali per il beneficio individuale e collettivo. Tuttavia, i dati sanitari contengono numerosi dettagli sensibili dei pazienti, la cui pubblicazione potrebbe essere causa di violazioni non intenzionali della privacy. In questo elaborato, vengono presentate le tecniche di Privacy Preserving Data Publishing (PPDP) più conosciute ed efficaci per la creazione di un ambiente sicuro per la condivisione dei dati, inquadrando, al contempo, lo scenario su cui esse operano. La General Data Protection Regulation (GDPR) e l’Health Insurance Portability and Accountability Act (HIPAA) sono due tra le normative che maggiormente aiutano nel trattamento di questi dati sensibili. Dopo l’introduzione delle basi legislative che regolano questo ambito, si esplora sia il concetto di de-identificazione dei dati attraverso due approcci distinti, ovvero la pseudonimizzazione e l’anonimizzazione, sia un metodo più avanzato e innovativo, come la differential privacy. Ci si concentra, in particolare, sulle tecniche generali di anonimizzazione dei dati, ponendo l’accento su un confronto tra gli algoritmi conosciuti per questo scopo: k-anonymous, l-diversity e t-closeness. Il lavoro si conclude con alcune implementazioni pratiche degli algoritmi capaci di sottolineare punti di forza e limitazioni di quanto discusso, specialmente in relazione ai rischi di divulgazione della privacy che maggiormente si corrono in seguito alla pubblicazione dei dati anonimizzati.

Tecniche e Algoritmi per l'Anonimizzazione dei Dati Biomedici Sensibili

PLUCHINO, ANDREA
2023/2024

Abstract

La pubblicazione delle informazioni personali delle persone, come ad esempio i dati sanitari, risulta essere significativamente vantaggiosa per istituzioni ospedaliere e organizzazioni governative di vario genere, supportando la ricerca scientifica specialmente nel contesto medico. Queste informazioni sensibili sono tuttora gestite all’interno di cartelle cliniche elettroniche (Electronic Health Record, EHR), le quali sono continuamente soggette ad opere di condivisioni e raccolta, essenziali per il beneficio individuale e collettivo. Tuttavia, i dati sanitari contengono numerosi dettagli sensibili dei pazienti, la cui pubblicazione potrebbe essere causa di violazioni non intenzionali della privacy. In questo elaborato, vengono presentate le tecniche di Privacy Preserving Data Publishing (PPDP) più conosciute ed efficaci per la creazione di un ambiente sicuro per la condivisione dei dati, inquadrando, al contempo, lo scenario su cui esse operano. La General Data Protection Regulation (GDPR) e l’Health Insurance Portability and Accountability Act (HIPAA) sono due tra le normative che maggiormente aiutano nel trattamento di questi dati sensibili. Dopo l’introduzione delle basi legislative che regolano questo ambito, si esplora sia il concetto di de-identificazione dei dati attraverso due approcci distinti, ovvero la pseudonimizzazione e l’anonimizzazione, sia un metodo più avanzato e innovativo, come la differential privacy. Ci si concentra, in particolare, sulle tecniche generali di anonimizzazione dei dati, ponendo l’accento su un confronto tra gli algoritmi conosciuti per questo scopo: k-anonymous, l-diversity e t-closeness. Il lavoro si conclude con alcune implementazioni pratiche degli algoritmi capaci di sottolineare punti di forza e limitazioni di quanto discusso, specialmente in relazione ai rischi di divulgazione della privacy che maggiormente si corrono in seguito alla pubblicazione dei dati anonimizzati.
2023
Techniques and Algorithms for the Anonymization of Sensitive Biomedical Data
Anonimizzazione
Algoritmi
Dati sensibili
GDPR
Privacy
File in questo prodotto:
File Dimensione Formato  
Pluchino_Andrea.pdf

accesso aperto

Dimensione 2.43 MB
Formato Adobe PDF
2.43 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/76490