In the field of technical communication, controlled natural languages (CNLs) are widely used because they allow the production of texts that are clear, readable, understandable, unambiguous, safe, accessible, usable and inclusive. The use of controlled natural languages can benefit both human understanding of texts and machine processing. Previous studies indicate that the use of controlled natural languages in machine translation leads to better output quality, and it reduces the time and cost of the translation process. This research investigates the role of controlled natural languages in translation when using large language models (LLMs). Specifically, it focuses on Italiano Tecnico Semplificato and ChatGPT for the translation of technical communication texts. These texts include a consent form, an online communication of a product, a marketing brochure and an instruction manual. First, all translation outputs are evaluated using Mossop’s revision parameters (2020). Subsequently, translation outputs from Italian source texts are compared with the those which have been pre-edited with Italiano Tecnico Semplificato rules. Overall, the results show that ChatGPT can produce a good quality output that requires little post-editing. However, the use of Italiano Tecnico Semplificato seems to improve translation quality in only two of the four texts analysed. Therefore, pre-editing with Italiano Tecnico Semplificato does not seem to lead to improvements in translation with ChatGPT for the text of the marketing brochure, which is a technical but also a creative text, and for the instruction manual, which already has a good starting quality. These results are related to the analysed texts, so they are valid for the present case study. Further analyses on a larger sample of texts could provide more definitive results.

I linguaggi naturali controllati sono ampiamente utilizzati all’interno della comunicazione tecnica perché consentono di produrre testi chiari, leggibili, comprensibili, privi di ambiguità, sicuri, accessibili, usabili e inclusivi. L'uso dei linguaggi naturali controllati (LNC) ha effetti positivi sia per la comprensione umana dei testi sia per la loro elaborazione automatica. Studi precedenti hanno dimostrato che l'uso dei linguaggi naturali controllati nella traduzione automatica porta a una migliore qualità dell'output, e a una riduzione dei tempi e i costi del processo di traduzione. Questa tesi analizza l’uso dei linguaggi naturale controllati nella traduzione quando si utilizzano large language model (LLMs). In particolare, il presente studio si concentra su Italiano Tecnico Semplificato e ChatGPT, considerando la traduzione di quattro testi nel settore della comunicazione tecnica. Questi testi comprendono un modulo di consenso, una comunicazione online di un prodotto, una brochure di marketing e un manuale di istruzioni. In primo luogo, tutti i risultati della traduzione sono stati valutati utilizzando i parametri di revisione di Mossop (2020). Successivamente, i risultati della traduzione ottenuti dai testi di partenza italiani sono stati confrontati con quelli pre-editati secondo le regole dell'Italiano Tecnico Semplificato. Nel complesso, i risultati mostrano che ChatGPT è in grado di produrre un output di buona qualità che richiede poco post-editing. Tuttavia, l'uso dell’Italiano Tecnico Semplificato sembra migliorare la qualità della traduzione solo in due dei quattro testi analizzati. Pertanto, il pre-editing con l’Italiano Tecnico Semplificato non sembra portare a miglioramenti nella traduzione con ChatGPT per il testo della brochure di marketing, che è un testo sia tecnico che creativo, e per il manuale di istruzioni che ha già una buona qualità di partenza. Questi risultati sono relativi ai testi analizzati e quindi validi per il presente caso di studio. Ulteriori analisi su un campione più ampio di testi potrebbero fornire risultati più definitivi.

Translating controlled natural languages with large language models in technical communication

PELLIZZON, ALICE
2024/2025

Abstract

In the field of technical communication, controlled natural languages (CNLs) are widely used because they allow the production of texts that are clear, readable, understandable, unambiguous, safe, accessible, usable and inclusive. The use of controlled natural languages can benefit both human understanding of texts and machine processing. Previous studies indicate that the use of controlled natural languages in machine translation leads to better output quality, and it reduces the time and cost of the translation process. This research investigates the role of controlled natural languages in translation when using large language models (LLMs). Specifically, it focuses on Italiano Tecnico Semplificato and ChatGPT for the translation of technical communication texts. These texts include a consent form, an online communication of a product, a marketing brochure and an instruction manual. First, all translation outputs are evaluated using Mossop’s revision parameters (2020). Subsequently, translation outputs from Italian source texts are compared with the those which have been pre-edited with Italiano Tecnico Semplificato rules. Overall, the results show that ChatGPT can produce a good quality output that requires little post-editing. However, the use of Italiano Tecnico Semplificato seems to improve translation quality in only two of the four texts analysed. Therefore, pre-editing with Italiano Tecnico Semplificato does not seem to lead to improvements in translation with ChatGPT for the text of the marketing brochure, which is a technical but also a creative text, and for the instruction manual, which already has a good starting quality. These results are related to the analysed texts, so they are valid for the present case study. Further analyses on a larger sample of texts could provide more definitive results.
2024
Translating controlled natural languages with large language models in technical communication
I linguaggi naturali controllati sono ampiamente utilizzati all’interno della comunicazione tecnica perché consentono di produrre testi chiari, leggibili, comprensibili, privi di ambiguità, sicuri, accessibili, usabili e inclusivi. L'uso dei linguaggi naturali controllati (LNC) ha effetti positivi sia per la comprensione umana dei testi sia per la loro elaborazione automatica. Studi precedenti hanno dimostrato che l'uso dei linguaggi naturali controllati nella traduzione automatica porta a una migliore qualità dell'output, e a una riduzione dei tempi e i costi del processo di traduzione. Questa tesi analizza l’uso dei linguaggi naturale controllati nella traduzione quando si utilizzano large language model (LLMs). In particolare, il presente studio si concentra su Italiano Tecnico Semplificato e ChatGPT, considerando la traduzione di quattro testi nel settore della comunicazione tecnica. Questi testi comprendono un modulo di consenso, una comunicazione online di un prodotto, una brochure di marketing e un manuale di istruzioni. In primo luogo, tutti i risultati della traduzione sono stati valutati utilizzando i parametri di revisione di Mossop (2020). Successivamente, i risultati della traduzione ottenuti dai testi di partenza italiani sono stati confrontati con quelli pre-editati secondo le regole dell'Italiano Tecnico Semplificato. Nel complesso, i risultati mostrano che ChatGPT è in grado di produrre un output di buona qualità che richiede poco post-editing. Tuttavia, l'uso dell’Italiano Tecnico Semplificato sembra migliorare la qualità della traduzione solo in due dei quattro testi analizzati. Pertanto, il pre-editing con l’Italiano Tecnico Semplificato non sembra portare a miglioramenti nella traduzione con ChatGPT per il testo della brochure di marketing, che è un testo sia tecnico che creativo, e per il manuale di istruzioni che ha già una buona qualità di partenza. Questi risultati sono relativi ai testi analizzati e quindi validi per il presente caso di studio. Ulteriori analisi su un campione più ampio di testi potrebbero fornire risultati più definitivi.
translation
technical
large language model
File in questo prodotto:
File Dimensione Formato  
Pellizzon_Alice.pdf

accesso riservato

Dimensione 3.55 MB
Formato Adobe PDF
3.55 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/83601