La raccolta e l'analisi di grandi moli di dati costituiscono oggi una risorsa essenziale in numerosi ambiti applicativi e scientifici. Tuttavia l'utilizzo di dati particolari solleva importanti problematiche legate alla tutela della privacy individuale, garantita a livello legislativo dal Regolamento Generale sulla Protezione dei Dati (GDPR). In ambito statistico-matematico, la differential privacy (DP) rappresenta uno dei modelli più solidi per affrontare questa sfida fornendo garanzie probabilistiche contro il rischio di reidentificazione. Tale meccanismo si basa sull'introduzione controllata di rumore nei risultati delle analisi statistiche limitando l'influenza che un singolo dato può esercitare sull'esito complessivo. Questa tesi presenta i fondamenti teorici della differential privacy analizzandone le principali definizioni formali, i meccanismi fondamentali e le nozioni essenziali. L'implementazione è stata condotta utilizzando OpenDP, una libreria open source sviluppata dall’università di Harvard in collaborazione con Microsoft, la quale fornisce strumenti modulari e riproducibili per applicare la DP a diverse tipologie di query statistiche. L'obiettivo è valutare l'efficacia di questo approccio nell'ambito dell'analisi statistica con particolare attenzione al bilanciamento tra protezione della privacy e utilità dell'informazione.
Il rumore che protegge: teoria e pratica della Differential Privacy con OpenDP
SORGATO, ENRICO
2024/2025
Abstract
La raccolta e l'analisi di grandi moli di dati costituiscono oggi una risorsa essenziale in numerosi ambiti applicativi e scientifici. Tuttavia l'utilizzo di dati particolari solleva importanti problematiche legate alla tutela della privacy individuale, garantita a livello legislativo dal Regolamento Generale sulla Protezione dei Dati (GDPR). In ambito statistico-matematico, la differential privacy (DP) rappresenta uno dei modelli più solidi per affrontare questa sfida fornendo garanzie probabilistiche contro il rischio di reidentificazione. Tale meccanismo si basa sull'introduzione controllata di rumore nei risultati delle analisi statistiche limitando l'influenza che un singolo dato può esercitare sull'esito complessivo. Questa tesi presenta i fondamenti teorici della differential privacy analizzandone le principali definizioni formali, i meccanismi fondamentali e le nozioni essenziali. L'implementazione è stata condotta utilizzando OpenDP, una libreria open source sviluppata dall’università di Harvard in collaborazione con Microsoft, la quale fornisce strumenti modulari e riproducibili per applicare la DP a diverse tipologie di query statistiche. L'obiettivo è valutare l'efficacia di questo approccio nell'ambito dell'analisi statistica con particolare attenzione al bilanciamento tra protezione della privacy e utilità dell'informazione.| File | Dimensione | Formato | |
|---|---|---|---|
|
Sorgato_Enrico.pdf
accesso aperto
Dimensione
1.35 MB
Formato
Adobe PDF
|
1.35 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/92979