La pubblicazione delle informazioni personali delle persone, come ad esempio i dati sanitari, risulta essere significativamente vantaggiosa per istituzioni ospedaliere e organizzazioni governative di vario genere, supportando la ricerca scientifica specialmente nel contesto medico. Queste informazioni sensibili sono tuttora gestite all’interno di cartelle cliniche elettroniche (Electronic Health Record, EHR), le quali sono continuamente soggette ad opere di condivisioni e raccolta, essenziali per il beneficio individuale e collettivo. Tuttavia, i dati sanitari contengono numerosi dettagli sensibili dei pazienti, la cui pubblicazione potrebbe essere causa di violazioni non intenzionali della privacy. In questo elaborato, vengono presentate le tecniche di Privacy Preserving Data Publishing (PPDP) più conosciute ed efficaci per la creazione di un ambiente sicuro per la condivisione dei dati, inquadrando, al contempo, lo scenario su cui esse operano. La General Data Protection Regulation (GDPR) e l’Health Insurance Portability and Accountability Act (HIPAA) sono due tra le normative che maggiormente aiutano nel trattamento di questi dati sensibili. Dopo l’introduzione delle basi legislative che regolano questo ambito, si esplora sia il concetto di de-identificazione dei dati attraverso due approcci distinti, ovvero la pseudonimizzazione e l’anonimizzazione, sia un metodo più avanzato e innovativo, come la differential privacy. Ci si concentra, in particolare, sulle tecniche generali di anonimizzazione dei dati, ponendo l’accento su un confronto tra gli algoritmi conosciuti per questo scopo: k-anonymous, l-diversity e t-closeness. Il lavoro si conclude con alcune implementazioni pratiche degli algoritmi capaci di sottolineare punti di forza e limitazioni di quanto discusso, specialmente in relazione ai rischi di divulgazione della privacy che maggiormente si corrono in seguito alla pubblicazione dei dati anonimizzati.
Tecniche e Algoritmi per l'Anonimizzazione dei Dati Biomedici Sensibili
PLUCHINO, ANDREA
2023/2024
Abstract
La pubblicazione delle informazioni personali delle persone, come ad esempio i dati sanitari, risulta essere significativamente vantaggiosa per istituzioni ospedaliere e organizzazioni governative di vario genere, supportando la ricerca scientifica specialmente nel contesto medico. Queste informazioni sensibili sono tuttora gestite all’interno di cartelle cliniche elettroniche (Electronic Health Record, EHR), le quali sono continuamente soggette ad opere di condivisioni e raccolta, essenziali per il beneficio individuale e collettivo. Tuttavia, i dati sanitari contengono numerosi dettagli sensibili dei pazienti, la cui pubblicazione potrebbe essere causa di violazioni non intenzionali della privacy. In questo elaborato, vengono presentate le tecniche di Privacy Preserving Data Publishing (PPDP) più conosciute ed efficaci per la creazione di un ambiente sicuro per la condivisione dei dati, inquadrando, al contempo, lo scenario su cui esse operano. La General Data Protection Regulation (GDPR) e l’Health Insurance Portability and Accountability Act (HIPAA) sono due tra le normative che maggiormente aiutano nel trattamento di questi dati sensibili. Dopo l’introduzione delle basi legislative che regolano questo ambito, si esplora sia il concetto di de-identificazione dei dati attraverso due approcci distinti, ovvero la pseudonimizzazione e l’anonimizzazione, sia un metodo più avanzato e innovativo, come la differential privacy. Ci si concentra, in particolare, sulle tecniche generali di anonimizzazione dei dati, ponendo l’accento su un confronto tra gli algoritmi conosciuti per questo scopo: k-anonymous, l-diversity e t-closeness. Il lavoro si conclude con alcune implementazioni pratiche degli algoritmi capaci di sottolineare punti di forza e limitazioni di quanto discusso, specialmente in relazione ai rischi di divulgazione della privacy che maggiormente si corrono in seguito alla pubblicazione dei dati anonimizzati.File | Dimensione | Formato | |
---|---|---|---|
Pluchino_Andrea.pdf
accesso aperto
Dimensione
2.43 MB
Formato
Adobe PDF
|
2.43 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/76490