Differenti tipi di reti neurali sono state considerate per la task di de-identificazione. L'obiettivo è quello di localizzare e anonimizzare dati sensibili all'interno di documenti di testo. Varie necessità e considerazioni fatte nella prima parte del progetto, ha spostato il focus verso approcci di Transfer Learning, dimostrando la capacità di modelli multilingua nel catturare efficacemente il contesto nei dati disponibili, indipendentemente dai linguaggi usati durante la fase di allenamento dei modelli.
DIfferent types of neural networks have been considered for the de-identification task. The objective is to detect and anonymize privacy-related entities inside text documents. Several needs and considerations made in the first part of the project, led the focus on Transfer Learning approches, demonstrating the capability of multilingual models on capturing effectively features context over available data independently from the languages used in the training phase of models.
Analisi e valutazione di modelli neurali per la de-identificazione di dati sensibili nei documenti di testo
GHEDIN, ROBERTO
2022/2023
Abstract
Differenti tipi di reti neurali sono state considerate per la task di de-identificazione. L'obiettivo è quello di localizzare e anonimizzare dati sensibili all'interno di documenti di testo. Varie necessità e considerazioni fatte nella prima parte del progetto, ha spostato il focus verso approcci di Transfer Learning, dimostrando la capacità di modelli multilingua nel catturare efficacemente il contesto nei dati disponibili, indipendentemente dai linguaggi usati durante la fase di allenamento dei modelli.File | Dimensione | Formato | |
---|---|---|---|
Ghedin_Roberto.pdf
accesso aperto
Dimensione
1.12 MB
Formato
Adobe PDF
|
1.12 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/45157