This thesis originates from a collaboration with CWBI S.r.l., a software company based in Padua, specialized in developing innovative solutions for the banking and financial sectors. The main objective of the project was the fine-tuning of an artificial intelligence model (LLM) dedicated to the automatic analysis and comparison of software scripts produced by developers. The developed model was designed to: verify compliance with corporate standards and best practices; suggest and apply corrections; and support the standardization of projects through the use of reference templates. In this context, templates are not considered merely as static models, but as dynamic tools that guide the development of derived projects. The thesis describes a systematic approach that integrates: dataset collection; training and fine-tuning of LLMs; and validation of the generated corrections, with a focus on quality and adherence to corporate standards. The work offers a dual perspective: on one hand, it enables the improvement of applications by identifying anomalies and optimizations; on the other, it allows the refinement of the base template, enriching it based on observations gathered during the analysis, thereby contributing to the development of intelligent tools for the continuous improvement of the software lifecycle.

Questa tesi nasce dalla collaborazione con CWBI S.r.l., software house con sede a Padova specializzata nello sviluppo di soluzioni innovative per il settore bancario e finanziario. L'obiettivo principale del progetto è stato il fine-tuning di un modello di intelligenza artificiale (LLM) dedicato all'analisi e confronto automatico di script informatici prodotti dagli sviluppatori. Il modello sviluppato è stato progettato per: verificare la conformità rispetto a standard e best practice aziendali; suggerire e applicare correzioni; supportare la standardizzazione dei progetti tramite l'utilizzo di template di riferimento.\ In questo contesto, i template non sono considerati solo come modelli statici, ma come strumenti dinamici che guidano lo sviluppo dei progetti derivati. La tesi descrive un approccio sistematico che integra: raccolta del dataset; addestramento e fine-tuning di modelli LLM; validazione delle correzioni generate con focus sulla qualità e sull'aderenza agli standard aziendali. Il lavoro offre una duplice prospettiva: da un lato, consente di migliorare gli applicativi individuando anomalie e ottimizzazioni; dall'altro, permette di perfezionare il template di base, arricchendolo sulla base delle osservazioni raccolte durante l'analisi, contribuendo allo sviluppo di strumenti intelligenti per il miglioramento continuo del ciclo di vita del software.

Dallo Standard al Codice: Fine-Tuning di un LLM per il Rilevamento di Non Conformità e la Proposta di Suggerimenti

MAGNELLI, GABRIELE ISACCO
2024/2025

Abstract

This thesis originates from a collaboration with CWBI S.r.l., a software company based in Padua, specialized in developing innovative solutions for the banking and financial sectors. The main objective of the project was the fine-tuning of an artificial intelligence model (LLM) dedicated to the automatic analysis and comparison of software scripts produced by developers. The developed model was designed to: verify compliance with corporate standards and best practices; suggest and apply corrections; and support the standardization of projects through the use of reference templates. In this context, templates are not considered merely as static models, but as dynamic tools that guide the development of derived projects. The thesis describes a systematic approach that integrates: dataset collection; training and fine-tuning of LLMs; and validation of the generated corrections, with a focus on quality and adherence to corporate standards. The work offers a dual perspective: on one hand, it enables the improvement of applications by identifying anomalies and optimizations; on the other, it allows the refinement of the base template, enriching it based on observations gathered during the analysis, thereby contributing to the development of intelligent tools for the continuous improvement of the software lifecycle.
2024
From Standard to Code: Fine-Tuning an LLM for Non-Compliance Detection and Suggestion Proposals
Questa tesi nasce dalla collaborazione con CWBI S.r.l., software house con sede a Padova specializzata nello sviluppo di soluzioni innovative per il settore bancario e finanziario. L'obiettivo principale del progetto è stato il fine-tuning di un modello di intelligenza artificiale (LLM) dedicato all'analisi e confronto automatico di script informatici prodotti dagli sviluppatori. Il modello sviluppato è stato progettato per: verificare la conformità rispetto a standard e best practice aziendali; suggerire e applicare correzioni; supportare la standardizzazione dei progetti tramite l'utilizzo di template di riferimento.\ In questo contesto, i template non sono considerati solo come modelli statici, ma come strumenti dinamici che guidano lo sviluppo dei progetti derivati. La tesi descrive un approccio sistematico che integra: raccolta del dataset; addestramento e fine-tuning di modelli LLM; validazione delle correzioni generate con focus sulla qualità e sull'aderenza agli standard aziendali. Il lavoro offre una duplice prospettiva: da un lato, consente di migliorare gli applicativi individuando anomalie e ottimizzazioni; dall'altro, permette di perfezionare il template di base, arricchendolo sulla base delle osservazioni raccolte durante l'analisi, contribuendo allo sviluppo di strumenti intelligenti per il miglioramento continuo del ciclo di vita del software.
LLM
Fine-Tuning
Conformità
Suggerimenti
Parsing
File in questo prodotto:
File Dimensione Formato  
Magnelli_GabrieleIsacco.pdf

accesso aperto

Dimensione 2.18 MB
Formato Adobe PDF
2.18 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/102059