This internship project focuses on the development of an information retrieval-based generation (RAG) system, built in Python, integrated with Ollama, using the CodeLlama 7 model and supported by a MySQL database. The main goal is to create an internal infrastructure for managing business processes without depending on external language model providers. The system, containerized via Docker and configured with DDEV, allows you to perform advanced analyzes on company data, providing precise answers based on specific documentation and previous projects. The end result is a system that can be used for internal research, code analysis and process automation, promoting continuous improvement of company activities. The methodology adopted uses containerization techniques to guarantee a flexible and scalable system, adaptable to the needs of various business projects. Thanks to the integration of machine learning tools and the use of language models on local servers, the system is designed to offer a modular and customizable architecture, optimizing the management of internal information resources.
Questo progetto di tirocinio si concentra sullo sviluppo di un sistema di generazione basato su recupero delle informazioni (RAG), realizzato in Python, integrato con Ollama, utilizzando il modello CodeLlama 7 e supportato da un database MySQL. L'obiettivo principale è creare un'infrastruttura interna per la gestione dei processi aziendali senza dipendere da fornitori esterni di modelli linguistici. Il sistema, containerizzato tramite Docker e configurato con DDEV, permette di eseguire analisi avanzate sui dati aziendali, fornendo risposte precise basate su documentazione specifica e progetti precedenti. Il risultato finale è un sistema utilizzabile per ricerche interne, analisi del codice e automazione dei processi, favorendo un miglioramento continuo delle attività aziendali. La metodologia adottata utilizza tecniche di containerizzazione per garantire un sistema flessibile e scalabile, adattabile alle esigenze di vari progetti aziendali. Grazie all'integrazione di strumenti di machine learning e all'uso di modelli di linguaggio su server locali, il sistema è progettato per offrire un'architettura modulare e personalizzabile, ottimizzando la gestione delle risorse informative interne.
Sviluppo di un Sistema di Generazione Basato su Recupero delle Informazioni (RAG) per l'Analisi e l'Automazione dei Processi Aziendali
CARRARO, ALESSANDRO
2023/2024
Abstract
This internship project focuses on the development of an information retrieval-based generation (RAG) system, built in Python, integrated with Ollama, using the CodeLlama 7 model and supported by a MySQL database. The main goal is to create an internal infrastructure for managing business processes without depending on external language model providers. The system, containerized via Docker and configured with DDEV, allows you to perform advanced analyzes on company data, providing precise answers based on specific documentation and previous projects. The end result is a system that can be used for internal research, code analysis and process automation, promoting continuous improvement of company activities. The methodology adopted uses containerization techniques to guarantee a flexible and scalable system, adaptable to the needs of various business projects. Thanks to the integration of machine learning tools and the use of language models on local servers, the system is designed to offer a modular and customizable architecture, optimizing the management of internal information resources.File | Dimensione | Formato | |
---|---|---|---|
tesiCarraroSpazioDevFinale.pdf
accesso aperto
Dimensione
233.32 kB
Formato
Adobe PDF
|
233.32 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/80223