Il presente progetto di tesi ha lo scopo di confrontare e analizzare le traduzioni italiane di articoli online di giornali russi effettuate da esseri umani e da due software di traduzione automatica: Google Translate e DeepL. Verranno utilizzati quattro corpora: il primo corpus formato dai testi originali degli articoli di giornale russi; il secondo costituito dalle relative traduzioni in italiano fatte da traduttori umani; il terzo raccoglie le traduzioni effettuate da Google Translate; il quarto corpus contiene le traduzioni realizzate da DeepL. La prima parte del progetto verterà sulla traduzione di parole russe che, almeno a priori, possiedono una corrispondente parola in italiano. Verrà innanzitutto selezionato un insieme di parole che presentano una traduzione immediata o univoca in italiano e verranno analizzate da una prospettiva sia qualitativa sia quantitativa le proposte dei traduttori umani e dei due traduttori automatici. Verrà osservato: 1- se il numero delle occorrenze delle parole univoche russe è rispettato o alterato nelle tre proposte di traduzione italiane; 2- se le parole univoche verranno effettivamente tradotte in modo univoco o se verranno usati dei presunti sinonimi; 3- quali differenze ci sono tra la traduzione umana e quella automatica. A questo scopo verrà fatto ampio ricorso alle concordanze e all'analisi dei contesti d'uso. Successivamente si analizzerà la ricchezza lessicale della traduzioni confrontando il TTR e la lunghezza media delle frasi per ogni testo contenuto nei tre corpora di traduzione. In questo modo si potrà verificare se le traduzioni automatiche sono meno ricche lessicalmente e sintatticamente rispetto alle traduzioni umane. Nella seconda parte del progetto verrà utilizzato il Machine Learning per verificare se, e in che misura, un algoritmo è in grado di distinguere la mano del traduttore umano dalla traduzione automatica di Google Translate o DeepL. Dopo aver validato attraverso il training del modello la capacità dell'algoritmo di riconoscere o meno il traduttore umano, verranno classificate in maniera automatica alcune traduzioni di testi. Con una prospettiva di analisi del contenuto, la terza fase di ricerca si focalizzerà sull’analisi degli argomenti (topic) utilizzati negli articoli per verificare se l'estrazione automatica da articoli originali in russo produce classi che coincidono con quelle identificate a partire dalle traduzioni umane e automatiche. In particolare, sembra interessante comprendere se i traduttori umani tendano a prendersi maggiori libertà rispetto ai traduttori automatici. Con una prospettiva che, infine, tralascia i contenuti e prende in considerazione le sole parole grammaticali, verrà effettuata una cluster analysis per verificare se è possibile distinguere lo stile di un traduttore umano attraverso un’analisi puramente grammaticale dei testi e se c’è un’influenza più o meno marcata del testo di partenza russo. Per analizzare le informazioni verranno utilizzati diversi software: AntConc e Voyant-tools per l'esplorazione preliminare e pacchetti sviluppati in ambiente R per le analisi statistiche (es. stylo, Iramuteq, caret).

Traduzione umana e automatica a confronto: un'analisi quantitativa di articoli tradotti dal russo all'italiano

RAGOGNA, FRANCESCA
2021/2022

Abstract

Il presente progetto di tesi ha lo scopo di confrontare e analizzare le traduzioni italiane di articoli online di giornali russi effettuate da esseri umani e da due software di traduzione automatica: Google Translate e DeepL. Verranno utilizzati quattro corpora: il primo corpus formato dai testi originali degli articoli di giornale russi; il secondo costituito dalle relative traduzioni in italiano fatte da traduttori umani; il terzo raccoglie le traduzioni effettuate da Google Translate; il quarto corpus contiene le traduzioni realizzate da DeepL. La prima parte del progetto verterà sulla traduzione di parole russe che, almeno a priori, possiedono una corrispondente parola in italiano. Verrà innanzitutto selezionato un insieme di parole che presentano una traduzione immediata o univoca in italiano e verranno analizzate da una prospettiva sia qualitativa sia quantitativa le proposte dei traduttori umani e dei due traduttori automatici. Verrà osservato: 1- se il numero delle occorrenze delle parole univoche russe è rispettato o alterato nelle tre proposte di traduzione italiane; 2- se le parole univoche verranno effettivamente tradotte in modo univoco o se verranno usati dei presunti sinonimi; 3- quali differenze ci sono tra la traduzione umana e quella automatica. A questo scopo verrà fatto ampio ricorso alle concordanze e all'analisi dei contesti d'uso. Successivamente si analizzerà la ricchezza lessicale della traduzioni confrontando il TTR e la lunghezza media delle frasi per ogni testo contenuto nei tre corpora di traduzione. In questo modo si potrà verificare se le traduzioni automatiche sono meno ricche lessicalmente e sintatticamente rispetto alle traduzioni umane. Nella seconda parte del progetto verrà utilizzato il Machine Learning per verificare se, e in che misura, un algoritmo è in grado di distinguere la mano del traduttore umano dalla traduzione automatica di Google Translate o DeepL. Dopo aver validato attraverso il training del modello la capacità dell'algoritmo di riconoscere o meno il traduttore umano, verranno classificate in maniera automatica alcune traduzioni di testi. Con una prospettiva di analisi del contenuto, la terza fase di ricerca si focalizzerà sull’analisi degli argomenti (topic) utilizzati negli articoli per verificare se l'estrazione automatica da articoli originali in russo produce classi che coincidono con quelle identificate a partire dalle traduzioni umane e automatiche. In particolare, sembra interessante comprendere se i traduttori umani tendano a prendersi maggiori libertà rispetto ai traduttori automatici. Con una prospettiva che, infine, tralascia i contenuti e prende in considerazione le sole parole grammaticali, verrà effettuata una cluster analysis per verificare se è possibile distinguere lo stile di un traduttore umano attraverso un’analisi puramente grammaticale dei testi e se c’è un’influenza più o meno marcata del testo di partenza russo. Per analizzare le informazioni verranno utilizzati diversi software: AntConc e Voyant-tools per l'esplorazione preliminare e pacchetti sviluppati in ambiente R per le analisi statistiche (es. stylo, Iramuteq, caret).
2021
Comparison between human and machine translation: a quantitative analysis of translated articles from russian to italian.
Human translation
Machine translation
Analisi quantitativa
Linguistica
Dati testuali
File in questo prodotto:
File Dimensione Formato  
Ragogna_Francesca.pdf

accesso aperto

Dimensione 3.83 MB
Formato Adobe PDF
3.83 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/33457