La presenza di stereotipi associati a gruppi storicamente svantaggiati costituisce una forte limitazione per la giustizia e il benessere della società. Gli stereotipi di genere sono tra i più radicati e hanno, nel tempo, dato origine a vere e proprie convenzioni che permeano vari aspetti della vita sociale, creando ingiustizie e talvolta discriminazioni. Questo studio si concentra sulla possibilità di identificare stereotipi di genere nei documenti testuali utilizzando strumenti di Machine Learning e Natural Language Processing. A tal fine, è stato raccolto un corpus di testi in lingua italiana e i partecipanti al test sono stati invitati a valutare ciascuna frase assegnando un punteggio che rivelasse la presenza di stereotipi di genere (femminili o maschili). I dati raccolti hanno permesso di etichettare le sezioni di testo del corpus, assegnando a ciascuna un "punteggio di genere". Il dataset così sviluppato può essere utilizzato per favorire lo sviluppo e/o la valutazione di strumenti automatici per il rilevamento degli stereotipi di genere, facilitando la scrittura di testi più inclusivi.
Un dataset italiano per l'analisi degli stereotipi di genere nei documenti testuali.
VISMARA, FEDERICO
2023/2024
Abstract
La presenza di stereotipi associati a gruppi storicamente svantaggiati costituisce una forte limitazione per la giustizia e il benessere della società. Gli stereotipi di genere sono tra i più radicati e hanno, nel tempo, dato origine a vere e proprie convenzioni che permeano vari aspetti della vita sociale, creando ingiustizie e talvolta discriminazioni. Questo studio si concentra sulla possibilità di identificare stereotipi di genere nei documenti testuali utilizzando strumenti di Machine Learning e Natural Language Processing. A tal fine, è stato raccolto un corpus di testi in lingua italiana e i partecipanti al test sono stati invitati a valutare ciascuna frase assegnando un punteggio che rivelasse la presenza di stereotipi di genere (femminili o maschili). I dati raccolti hanno permesso di etichettare le sezioni di testo del corpus, assegnando a ciascuna un "punteggio di genere". Il dataset così sviluppato può essere utilizzato per favorire lo sviluppo e/o la valutazione di strumenti automatici per il rilevamento degli stereotipi di genere, facilitando la scrittura di testi più inclusivi.File | Dimensione | Formato | |
---|---|---|---|
TesiFinale (2).pdf
accesso aperto
Dimensione
1.22 MB
Formato
Adobe PDF
|
1.22 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/76179