The presence of stereotypes in the conception of genres constitutes a strong limitation for the justice and the welfare of society. Gender stereotypes are among the most entrenched and have given rise, over time, to real conventions that permeate various aspects of social life, creating equality and sometimes discrimination. This study does focuses on the possibility of identifying gender stereotypes in textual documents using artificial intelligence tools. We want to provide a corpus of texts in the language Italian cataloged according to the genre (understood in the conventional way) to which the reading is revolt. Texts were collected from various sources assuming: the presence of gender stereotypes in some and gender neutrality in others. Sections of these texts have been subsequently entered into a questionnaire in which a group of people were asked to evaluate the genre to which the text fragment was addressed. The statistical analysis of the results has allowed the cataloging of the sections of text presented by assigning each one a "gender score". The objective of the dataset thus developed is its potential use to train or test automatic tools that can identify gender stereotypes, facilitating the writing of more neutral and inclusive texts.

La presenza di stereotipi nella concezione dei generi costituisce un forte limite per la giustizia ed il benessere della società. Gli stereotipi di genere sono tra i più radicati ed hanno dato luogo, nel tempo, a vere e proprie convenzioni che permeano vari aspetti della vita sociale creando imparità e talvolta discriminazione. Il presente studio si concentra sulla possibilità di identificare stereotipi di genere nei documenti testuali utilizzando strumenti di intelligenza artificiale. Si vuole fornire un corpus di testi in lingua italiana catalogati secondo il genere (inteso in modo convenzionale) a cui la lettura è rivolta. Sono stati raccolti dei testi da varie fonti ipotizzando: la presenza di stereotipi di genere in alcune e la neutralità rispetto al genere in altre. Sezioni di questi testi sono state successivamente inserite in un questionario in cui è stato chiesto ad un gruppo di persone di valutare il genere a cui il frammento testo si rivolgeva. L’analisi statistica dei risultati ha permesso la catalogazione delle sezioni di testo presentate assegnando ad ognuna un ”punteggio di genere”. L’obiettivo del dataset così sviluppato è il suo potenziale utilizzo per allenare o testare strumenti automatici che possano individuare stereotipi di genere, facilitando la scrittura di testi più neutri ed inclusivi.

Sviluppo e validazione di un dataset in italiano per l’analisi di stereotipi di genere nei documenti testuali

SCAGNET, MARTINO
2022/2023

Abstract

The presence of stereotypes in the conception of genres constitutes a strong limitation for the justice and the welfare of society. Gender stereotypes are among the most entrenched and have given rise, over time, to real conventions that permeate various aspects of social life, creating equality and sometimes discrimination. This study does focuses on the possibility of identifying gender stereotypes in textual documents using artificial intelligence tools. We want to provide a corpus of texts in the language Italian cataloged according to the genre (understood in the conventional way) to which the reading is revolt. Texts were collected from various sources assuming: the presence of gender stereotypes in some and gender neutrality in others. Sections of these texts have been subsequently entered into a questionnaire in which a group of people were asked to evaluate the genre to which the text fragment was addressed. The statistical analysis of the results has allowed the cataloging of the sections of text presented by assigning each one a "gender score". The objective of the dataset thus developed is its potential use to train or test automatic tools that can identify gender stereotypes, facilitating the writing of more neutral and inclusive texts.
2022
Development and validation of a dataset in Italian for the analysis of gender stereotypes in textual documents
La presenza di stereotipi nella concezione dei generi costituisce un forte limite per la giustizia ed il benessere della società. Gli stereotipi di genere sono tra i più radicati ed hanno dato luogo, nel tempo, a vere e proprie convenzioni che permeano vari aspetti della vita sociale creando imparità e talvolta discriminazione. Il presente studio si concentra sulla possibilità di identificare stereotipi di genere nei documenti testuali utilizzando strumenti di intelligenza artificiale. Si vuole fornire un corpus di testi in lingua italiana catalogati secondo il genere (inteso in modo convenzionale) a cui la lettura è rivolta. Sono stati raccolti dei testi da varie fonti ipotizzando: la presenza di stereotipi di genere in alcune e la neutralità rispetto al genere in altre. Sezioni di questi testi sono state successivamente inserite in un questionario in cui è stato chiesto ad un gruppo di persone di valutare il genere a cui il frammento testo si rivolgeva. L’analisi statistica dei risultati ha permesso la catalogazione delle sezioni di testo presentate assegnando ad ognuna un ”punteggio di genere”. L’obiettivo del dataset così sviluppato è il suo potenziale utilizzo per allenare o testare strumenti automatici che possano individuare stereotipi di genere, facilitando la scrittura di testi più neutri ed inclusivi.
Dataset
Genere
Stereotipi
File in questo prodotto:
File Dimensione Formato  
Scagnet_Martino.pdf

accesso aperto

Dimensione 1.85 MB
Formato Adobe PDF
1.85 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/48854