La raccolta e l'analisi di grandi moli di dati costituiscono oggi una risorsa essenziale in numerosi ambiti applicativi e scientifici. Tuttavia l'utilizzo di dati particolari solleva importanti problematiche legate alla tutela della privacy individuale, garantita a livello legislativo dal Regolamento Generale sulla Protezione dei Dati (GDPR). In ambito statistico-matematico, la differential privacy (DP) rappresenta uno dei modelli più solidi per affrontare questa sfida fornendo garanzie probabilistiche contro il rischio di reidentificazione. Tale meccanismo si basa sull'introduzione controllata di rumore nei risultati delle analisi statistiche limitando l'influenza che un singolo dato può esercitare sull'esito complessivo. Questa tesi presenta i fondamenti teorici della differential privacy analizzandone le principali definizioni formali, i meccanismi fondamentali e le nozioni essenziali. L'implementazione è stata condotta utilizzando OpenDP, una libreria open source sviluppata dall’università di Harvard in collaborazione con Microsoft, la quale fornisce strumenti modulari e riproducibili per applicare la DP a diverse tipologie di query statistiche. L'obiettivo è valutare l'efficacia di questo approccio nell'ambito dell'analisi statistica con particolare attenzione al bilanciamento tra protezione della privacy e utilità dell'informazione.

Il rumore che protegge: teoria e pratica della Differential Privacy con OpenDP

SORGATO, ENRICO
2024/2025

Abstract

La raccolta e l'analisi di grandi moli di dati costituiscono oggi una risorsa essenziale in numerosi ambiti applicativi e scientifici. Tuttavia l'utilizzo di dati particolari solleva importanti problematiche legate alla tutela della privacy individuale, garantita a livello legislativo dal Regolamento Generale sulla Protezione dei Dati (GDPR). In ambito statistico-matematico, la differential privacy (DP) rappresenta uno dei modelli più solidi per affrontare questa sfida fornendo garanzie probabilistiche contro il rischio di reidentificazione. Tale meccanismo si basa sull'introduzione controllata di rumore nei risultati delle analisi statistiche limitando l'influenza che un singolo dato può esercitare sull'esito complessivo. Questa tesi presenta i fondamenti teorici della differential privacy analizzandone le principali definizioni formali, i meccanismi fondamentali e le nozioni essenziali. L'implementazione è stata condotta utilizzando OpenDP, una libreria open source sviluppata dall’università di Harvard in collaborazione con Microsoft, la quale fornisce strumenti modulari e riproducibili per applicare la DP a diverse tipologie di query statistiche. L'obiettivo è valutare l'efficacia di questo approccio nell'ambito dell'analisi statistica con particolare attenzione al bilanciamento tra protezione della privacy e utilità dell'informazione.
2024
Differential Privacy mechanisms: theory and application with OpenDP
Differential Privacy
OpenDP
Sicurezza dei dati
Privacy statistica
File in questo prodotto:
File Dimensione Formato  
Sorgato_Enrico.pdf

accesso aperto

Dimensione 1.35 MB
Formato Adobe PDF
1.35 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/92979