Per un progetto come Terminology Without Borders, che si propone di immagazzinare e fornire crescenti quantità di dati strutturati come glossari multilingue, è vantaggioso disporre di un sistema di gestione dati efficiente. Attualmente le organizzazioni aderenti al progetto forniscono nuove risorse sottoforma di fogli di calcolo. Un database relazionale, in questo contesto, potrebbe portare numerosi vantaggi quali eliminare i duplicati, fornire una fonte centralizzata di dati, maggiore scalabilità, garantire consistenza e integrità dei dati e permettere interrogazioni complesse con il linguaggio SQL. Il presente elaborato si propone di illustrare un modo per migrare i dati da fogli di calcoli con schemi eterogenei esistenti verso un database relazionale in maniera automatizzata, applicato ad un sottoprogetto di Yourterm. A causa della struttura disomogenea tra vari fogli di uno stesso file e tra file di progetti diversi, è necessaria una analisi dei campi esistenti per creare uno schema onnicomprensivo, standardizzato, coerente e non ridondante. Infine, l’approccio di questo lavoro potrebbe essere riutilizzato per essere applicato ad altri progetti Yourterm, che presentano caratteristiche e problematiche simili.

Per un progetto come Terminology Without Borders, che si propone di immagazzinare e fornire crescenti quantità di dati strutturati come glossari multilingue, è vantaggioso disporre di un sistema di gestione dati efficiente. Attualmente le organizzazioni aderenti al progetto forniscono nuove risorse sottoforma di fogli di calcolo. Un database relazionale, in questo contesto, potrebbe portare numerosi vantaggi quali eliminare i duplicati, fornire un fonte centralizzata di dati, maggiore scalabilità, garantire consistenza e integrità dei dati e permettere interrogazioni complesse con il linguaggio SQL. Il presente elaborato si propone di illustrare un modo per migrare i dati da fogli di calcoli con schemi eterogenei esistenti verso un database relazionale in maniera automatizzata, applicato ad un sottoprogetto di Yourterm. A causa della struttura disomogenea tra vari fogli di uno stesso file e tra file di progetti diversi, è necessaria una analisi dei campi esistenti per creare uno schema onnicomprensivo, standardizzato, coerente e non ridondante. Infine, l’approccio di questo lavoro potrebbe essere riutilizzato per essere applicato ad altri progetti Yourterm, che presentano caratteristiche e problematiche simili.

Migrazione e standardizzazione di terminologia multilingue da file Excel a database relazionali: analisi dei dati di Terminology Without Borders

ZHU, YIHUI
2022/2023

Abstract

Per un progetto come Terminology Without Borders, che si propone di immagazzinare e fornire crescenti quantità di dati strutturati come glossari multilingue, è vantaggioso disporre di un sistema di gestione dati efficiente. Attualmente le organizzazioni aderenti al progetto forniscono nuove risorse sottoforma di fogli di calcolo. Un database relazionale, in questo contesto, potrebbe portare numerosi vantaggi quali eliminare i duplicati, fornire una fonte centralizzata di dati, maggiore scalabilità, garantire consistenza e integrità dei dati e permettere interrogazioni complesse con il linguaggio SQL. Il presente elaborato si propone di illustrare un modo per migrare i dati da fogli di calcoli con schemi eterogenei esistenti verso un database relazionale in maniera automatizzata, applicato ad un sottoprogetto di Yourterm. A causa della struttura disomogenea tra vari fogli di uno stesso file e tra file di progetti diversi, è necessaria una analisi dei campi esistenti per creare uno schema onnicomprensivo, standardizzato, coerente e non ridondante. Infine, l’approccio di questo lavoro potrebbe essere riutilizzato per essere applicato ad altri progetti Yourterm, che presentano caratteristiche e problematiche simili.
2022
Migration and standardization of multilingual terminology from Excel files to a relational database: analysis of Teminology Without Borders data
Per un progetto come Terminology Without Borders, che si propone di immagazzinare e fornire crescenti quantità di dati strutturati come glossari multilingue, è vantaggioso disporre di un sistema di gestione dati efficiente. Attualmente le organizzazioni aderenti al progetto forniscono nuove risorse sottoforma di fogli di calcolo. Un database relazionale, in questo contesto, potrebbe portare numerosi vantaggi quali eliminare i duplicati, fornire un fonte centralizzata di dati, maggiore scalabilità, garantire consistenza e integrità dei dati e permettere interrogazioni complesse con il linguaggio SQL. Il presente elaborato si propone di illustrare un modo per migrare i dati da fogli di calcoli con schemi eterogenei esistenti verso un database relazionale in maniera automatizzata, applicato ad un sottoprogetto di Yourterm. A causa della struttura disomogenea tra vari fogli di uno stesso file e tra file di progetti diversi, è necessaria una analisi dei campi esistenti per creare uno schema onnicomprensivo, standardizzato, coerente e non ridondante. Infine, l’approccio di questo lavoro potrebbe essere riutilizzato per essere applicato ad altri progetti Yourterm, che presentano caratteristiche e problematiche simili.
migrazione dati
terminologia
multilinguismo
File in questo prodotto:
File Dimensione Formato  
Zhu_Yihui.pdf

accesso aperto

Dimensione 1.92 MB
Formato Adobe PDF
1.92 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/52414