La presenza di stereotipi associati a gruppi storicamente svantaggiati costituisce una forte limitazione per la giustizia e il benessere della società. Gli stereotipi di genere sono tra i più radicati e hanno, nel tempo, dato origine a vere e proprie convenzioni che permeano vari aspetti della vita sociale, creando ingiustizie e talvolta discriminazioni. Questo studio si concentra sulla possibilità di identificare stereotipi di genere nei documenti testuali utilizzando strumenti di Machine Learning e Natural Language Processing. A tal fine, è stato raccolto un corpus di testi in lingua italiana e i partecipanti al test sono stati invitati a valutare ciascuna frase assegnando un punteggio che rivelasse la presenza di stereotipi di genere (femminili o maschili). I dati raccolti hanno permesso di etichettare le sezioni di testo del corpus, assegnando a ciascuna un "punteggio di genere". Il dataset così sviluppato può essere utilizzato per favorire lo sviluppo e/o la valutazione di strumenti automatici per il rilevamento degli stereotipi di genere, facilitando la scrittura di testi più inclusivi.

Un dataset italiano per l'analisi degli stereotipi di genere nei documenti testuali.

VISMARA, FEDERICO
2023/2024

Abstract

La presenza di stereotipi associati a gruppi storicamente svantaggiati costituisce una forte limitazione per la giustizia e il benessere della società. Gli stereotipi di genere sono tra i più radicati e hanno, nel tempo, dato origine a vere e proprie convenzioni che permeano vari aspetti della vita sociale, creando ingiustizie e talvolta discriminazioni. Questo studio si concentra sulla possibilità di identificare stereotipi di genere nei documenti testuali utilizzando strumenti di Machine Learning e Natural Language Processing. A tal fine, è stato raccolto un corpus di testi in lingua italiana e i partecipanti al test sono stati invitati a valutare ciascuna frase assegnando un punteggio che rivelasse la presenza di stereotipi di genere (femminili o maschili). I dati raccolti hanno permesso di etichettare le sezioni di testo del corpus, assegnando a ciascuna un "punteggio di genere". Il dataset così sviluppato può essere utilizzato per favorire lo sviluppo e/o la valutazione di strumenti automatici per il rilevamento degli stereotipi di genere, facilitando la scrittura di testi più inclusivi.
2023
An Italian dataset for the analysis of gender stereotypes in textual documents
AI
uguaglianza
web survey
File in questo prodotto:
File Dimensione Formato  
TesiFinale (2).pdf

accesso aperto

Dimensione 1.22 MB
Formato Adobe PDF
1.22 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/76179