This topic of this dissertation is gender bias in machine translation. The work starts with an exposition of the history and development of machine translation systems, with special attention paid to how the features of a language can play a part in hindering the process. The work continues with an analysis of the relationships between language, power, and gender, and the effects that such relationships may have on machine translation systems. It is reported that gender bias, i.e., the presence of stereotypes related to gender in machine translation output, are often the reflection of what is fed to the machine with the training material. The dissertation presents a literature review of the studies conducted on identifying and debiasing gender biased machine translation outputs. Starting with a brief excursus on the concept of gender, the study proposes a qualitative investigation on the behaviour of a number of machine translation systems from English into Italian, in relation with the translation of transgender and non-binary identities. The systems often prove inadequate in translating these identities, complicit the morphological void of the Italian language in accommodating non-binary gender identities.

Questa tesi di laurea presenta il problema del pregiudizio di genere nella traduzione automatica. Il lavoro parte da un'esposizione della storia e dello sviluppo della traduzione automatica, con un occhio volto alle caratteristiche della lingua che possono complicare il processo. Si procede poi la considerazione delle relazioni esistenti tra lingua, potere, e genere, e gli effetti di queste relazioni sui sistemi di traduzione automatica. Viene riportato che il pregiudizio di genere, ossia il fatto che un testo tradotto da una macchina, sia spesso portatore di stereotipi filtrati attraverso il materiale di addestramento. Il lavoro presenta anche una revisione degli studi condotti a proposito dell'individuazione e risoluzione di questo pregiudizio di genere. Con un breve excursus sullo stesso concetto di genere, lo studio propone un'indagine qualitativa sul comportamento di un numero di sistemi di traduzione automatica dalla lingua inglese alla lingua italiana in relazione alla traduzione di identità transgender e di genere non binario. I sistemi si dimostrano spesso inadatti a tradurre queste identità, complice il vuoto morfologico della lingua italiana nell'accomodare identità di genere non binario.

Gender bias in machine translation: an investigation of the causes, characteristics, and effects of gender-biased MT output

RIZZARDI, SERENA
2022/2023

Abstract

This topic of this dissertation is gender bias in machine translation. The work starts with an exposition of the history and development of machine translation systems, with special attention paid to how the features of a language can play a part in hindering the process. The work continues with an analysis of the relationships between language, power, and gender, and the effects that such relationships may have on machine translation systems. It is reported that gender bias, i.e., the presence of stereotypes related to gender in machine translation output, are often the reflection of what is fed to the machine with the training material. The dissertation presents a literature review of the studies conducted on identifying and debiasing gender biased machine translation outputs. Starting with a brief excursus on the concept of gender, the study proposes a qualitative investigation on the behaviour of a number of machine translation systems from English into Italian, in relation with the translation of transgender and non-binary identities. The systems often prove inadequate in translating these identities, complicit the morphological void of the Italian language in accommodating non-binary gender identities.
2022
Gender bias in machine translation: an investigation of the causes, characteristics, and effects of gender-biased MT output
Questa tesi di laurea presenta il problema del pregiudizio di genere nella traduzione automatica. Il lavoro parte da un'esposizione della storia e dello sviluppo della traduzione automatica, con un occhio volto alle caratteristiche della lingua che possono complicare il processo. Si procede poi la considerazione delle relazioni esistenti tra lingua, potere, e genere, e gli effetti di queste relazioni sui sistemi di traduzione automatica. Viene riportato che il pregiudizio di genere, ossia il fatto che un testo tradotto da una macchina, sia spesso portatore di stereotipi filtrati attraverso il materiale di addestramento. Il lavoro presenta anche una revisione degli studi condotti a proposito dell'individuazione e risoluzione di questo pregiudizio di genere. Con un breve excursus sullo stesso concetto di genere, lo studio propone un'indagine qualitativa sul comportamento di un numero di sistemi di traduzione automatica dalla lingua inglese alla lingua italiana in relazione alla traduzione di identità transgender e di genere non binario. I sistemi si dimostrano spesso inadatti a tradurre queste identità, complice il vuoto morfologico della lingua italiana nell'accomodare identità di genere non binario.
machine translation
gender bias
translation
File in questo prodotto:
File Dimensione Formato  
Rizzardi_Serena.pdf

accesso aperto

Dimensione 4.03 MB
Formato Adobe PDF
4.03 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/44266