Differenti tipi di reti neurali sono state considerate per la task di de-identificazione. L'obiettivo è quello di localizzare e anonimizzare dati sensibili all'interno di documenti di testo. Varie necessità e considerazioni fatte nella prima parte del progetto, ha spostato il focus verso approcci di Transfer Learning, dimostrando la capacità di modelli multilingua nel catturare efficacemente il contesto nei dati disponibili, indipendentemente dai linguaggi usati durante la fase di allenamento dei modelli.

DIfferent types of neural networks have been considered for the de-identification task. The objective is to detect and anonymize privacy-related entities inside text documents. Several needs and considerations made in the first part of the project, led the focus on Transfer Learning approches, demonstrating the capability of multilingual models on capturing effectively features context over available data independently from the languages used in the training phase of models.

Analisi e valutazione di modelli neurali per la de-identificazione di dati sensibili nei documenti di testo

GHEDIN, ROBERTO
2022/2023

Abstract

Differenti tipi di reti neurali sono state considerate per la task di de-identificazione. L'obiettivo è quello di localizzare e anonimizzare dati sensibili all'interno di documenti di testo. Varie necessità e considerazioni fatte nella prima parte del progetto, ha spostato il focus verso approcci di Transfer Learning, dimostrando la capacità di modelli multilingua nel catturare efficacemente il contesto nei dati disponibili, indipendentemente dai linguaggi usati durante la fase di allenamento dei modelli.
2022
Analysis and evaluation of neural models for de-identification of privacy-related entities in text documents
DIfferent types of neural networks have been considered for the de-identification task. The objective is to detect and anonymize privacy-related entities inside text documents. Several needs and considerations made in the first part of the project, led the focus on Transfer Learning approches, demonstrating the capability of multilingual models on capturing effectively features context over available data independently from the languages used in the training phase of models.
De-identification
Anonymization
NER
Neural networks
NLP
File in questo prodotto:
File Dimensione Formato  
Ghedin_Roberto.pdf

accesso aperto

Dimensione 1.12 MB
Formato Adobe PDF
1.12 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/45157