Analisi e valutazione di modelli neurali per la de-identificazione di dati sensibili nei documenti di testo

Differenti tipi di reti neurali sono state considerate per la task di de-identificazione. L'obiettivo è quello di localizzare e anonimizzare dati sensibili all'interno di documenti di testo. Varie necessità e considerazioni fatte nella prima parte del progetto, ha spostato il focus verso approcci di Transfer Learning, dimostrando la capacità di modelli multilingua nel catturare efficacemente il contesto nei dati disponibili, indipendentemente dai linguaggi usati durante la fase di allenamento dei modelli.

DIfferent types of neural networks have been considered for the de-identification task. The objective is to detect and anonymize privacy-related entities inside text documents. Several needs and considerations made in the first part of the project, led the focus on Transfer Learning approches, demonstrating the capability of multilingual models on capturing effectively features context over available data independently from the languages used in the training phase of models.

Analisi e valutazione di modelli neurali per la de-identificazione di dati sensibili nei documenti di testo

GHEDIN, ROBERTO

2022/2023

Abstract

Differenti tipi di reti neurali sono state considerate per la task di de-identificazione. L'obiettivo è quello di localizzare e anonimizzare dati sensibili all'interno di documenti di testo. Varie necessità e considerazioni fatte nella prima parte del progetto, ha spostato il focus verso approcci di Transfer Learning, dimostrando la capacità di modelli multilingua nel catturare efficacemente il contesto nei dati disponibili, indipendentemente dai linguaggi usati durante la fase di allenamento dei modelli.

Scheda

Scheda DC

	Facoltà/Dipartimento
	
				Dipartimento di Ingegneria dell'Informazione - DEI
			
	Corso di studio
	
				COMPUTER ENGINEERING Laurea Magistrale (D.M. 270/2004)
			
	Anno Accademico
	
				2022
			
	Titolo inglese
	
				Analysis and evaluation of neural models for de-identification of privacy-related entities in text documents
			
	Abstract in italiano
	
				DIfferent types of neural networks have been considered for the de-identification task. The objective is to detect and anonymize privacy-related entities inside text documents. Several needs and considerations made in the first part of the project, led the focus on Transfer Learning approches, demonstrating the capability of multilingual models on capturing effectively features context over available data independently from the languages used in the training phase of models.
			
	Parola chiave
	
				De-identification
Anonymization
NER
Neural networks
NLP
			
	Relatore
	
				SATTA, GIORGIO
			
	Appare nelle tipologie:
	
				Lauree magistrali

File in questo prodotto:

File	Dimensione	Formato
Ghedin_Roberto.pdf accesso aperto Dimensione 1.12 MB Formato Adobe PDF Visualizza/Apri	1.12 MB	Adobe PDF	Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/45157

Analisi e valutazione di modelli neurali per la de-identificazione di dati sensibili nei documenti di testo

GHEDIN, ROBERTO

2022/2023

Abstract

Scheda Scheda DC

Informazioni

Conferma cancellazione

Scheda

Scheda DC