Per un progetto come Terminology Without Borders, che si propone di immagazzinare e fornire crescenti quantità di dati strutturati come glossari multilingue, è vantaggioso disporre di un sistema di gestione dati efficiente. Attualmente le organizzazioni aderenti al progetto forniscono nuove risorse sottoforma di fogli di calcolo. Un database relazionale, in questo contesto, potrebbe portare numerosi vantaggi quali eliminare i duplicati, fornire una fonte centralizzata di dati, maggiore scalabilità, garantire consistenza e integrità dei dati e permettere interrogazioni complesse con il linguaggio SQL. Il presente elaborato si propone di illustrare un modo per migrare i dati da fogli di calcoli con schemi eterogenei esistenti verso un database relazionale in maniera automatizzata, applicato ad un sottoprogetto di Yourterm. A causa della struttura disomogenea tra vari fogli di uno stesso file e tra file di progetti diversi, è necessaria una analisi dei campi esistenti per creare uno schema onnicomprensivo, standardizzato, coerente e non ridondante. Infine, l’approccio di questo lavoro potrebbe essere riutilizzato per essere applicato ad altri progetti Yourterm, che presentano caratteristiche e problematiche simili.
Per un progetto come Terminology Without Borders, che si propone di immagazzinare e fornire crescenti quantità di dati strutturati come glossari multilingue, è vantaggioso disporre di un sistema di gestione dati efficiente. Attualmente le organizzazioni aderenti al progetto forniscono nuove risorse sottoforma di fogli di calcolo. Un database relazionale, in questo contesto, potrebbe portare numerosi vantaggi quali eliminare i duplicati, fornire un fonte centralizzata di dati, maggiore scalabilità, garantire consistenza e integrità dei dati e permettere interrogazioni complesse con il linguaggio SQL. Il presente elaborato si propone di illustrare un modo per migrare i dati da fogli di calcoli con schemi eterogenei esistenti verso un database relazionale in maniera automatizzata, applicato ad un sottoprogetto di Yourterm. A causa della struttura disomogenea tra vari fogli di uno stesso file e tra file di progetti diversi, è necessaria una analisi dei campi esistenti per creare uno schema onnicomprensivo, standardizzato, coerente e non ridondante. Infine, l’approccio di questo lavoro potrebbe essere riutilizzato per essere applicato ad altri progetti Yourterm, che presentano caratteristiche e problematiche simili.
Migrazione e standardizzazione di terminologia multilingue da file Excel a database relazionali: analisi dei dati di Terminology Without Borders
ZHU, YIHUI
2022/2023
Abstract
Per un progetto come Terminology Without Borders, che si propone di immagazzinare e fornire crescenti quantità di dati strutturati come glossari multilingue, è vantaggioso disporre di un sistema di gestione dati efficiente. Attualmente le organizzazioni aderenti al progetto forniscono nuove risorse sottoforma di fogli di calcolo. Un database relazionale, in questo contesto, potrebbe portare numerosi vantaggi quali eliminare i duplicati, fornire una fonte centralizzata di dati, maggiore scalabilità, garantire consistenza e integrità dei dati e permettere interrogazioni complesse con il linguaggio SQL. Il presente elaborato si propone di illustrare un modo per migrare i dati da fogli di calcoli con schemi eterogenei esistenti verso un database relazionale in maniera automatizzata, applicato ad un sottoprogetto di Yourterm. A causa della struttura disomogenea tra vari fogli di uno stesso file e tra file di progetti diversi, è necessaria una analisi dei campi esistenti per creare uno schema onnicomprensivo, standardizzato, coerente e non ridondante. Infine, l’approccio di questo lavoro potrebbe essere riutilizzato per essere applicato ad altri progetti Yourterm, che presentano caratteristiche e problematiche simili.File | Dimensione | Formato | |
---|---|---|---|
Zhu_Yihui.pdf
accesso aperto
Dimensione
1.92 MB
Formato
Adobe PDF
|
1.92 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/52414