Negli ultimi anni l'interesse per la classificazione automatica di testi in categorie è in forte espansione. I fattori principali che hanno contribuito a promuovere questa espansione sono la maggiore disponibilità di documenti in forma digitale e la conseguente necessità di definire una struttura per la loro organizzazione in modo da migliorarne la gestione. L'approccio alla classificazione automatica si basa soprattutto su tecniche di machine learning: un processo induttivo che costruisce in modo automatico un classificatore di testi sulla base dell'analisi di un insieme di documenti preclassificati e sulle caratteristiche delle categorie di interesse. Non esiste un metodo standard per la definizione di questi classificatori; per questo i ricercatori studiano e propongono nuove soluzione per la costruzione di questi strumenti. I risultati vengono quindi pubblicati in documenti scientifici che solitamente contengono la definizione della configurazione e le prestazioni che questa configurazione ha ottenuto negli esperimenti svolti. Dai dati che solitamente vengono inseriti nelle pubblicazioni, non si hanno a disposizione tutte le informazioni per poter riprodurre gli esperimenti; ne si ha la possibilità di confrontare in modo diretto i risultati ottenuti. Lo scopo di questo progetto è quindi quello di costruire uno strumento che permetta di storicizzare gli esperimenti e che dia la possibilità di confrontare i risultati ottenuti con le diverse configurazioni. La realizzazione può essere concettualmente divisa in due parti: nella prima parte si andrà a definire come è stata progettata la base di dati che permette di memorizzare in dettaglio gli esperimenti ed i relativi risultati ottenuti, successivamente, si analizzerà come è stato strutturato ed implementato il progetto in Java che si basa sulle architetture Spring e Hibernate per la gestione ed interrogazione della base di dati. Il documento termina con le considerazioni personali sull'attività svolta e delle proposte per il miglioramento dei risultati ottenuti

Progettazione e realizzazione di un sistema di gestione di esperimenti scientifici basato su architetture Spring-Hibernate

Rampazzo, Marco
2012/2013

Abstract

Negli ultimi anni l'interesse per la classificazione automatica di testi in categorie è in forte espansione. I fattori principali che hanno contribuito a promuovere questa espansione sono la maggiore disponibilità di documenti in forma digitale e la conseguente necessità di definire una struttura per la loro organizzazione in modo da migliorarne la gestione. L'approccio alla classificazione automatica si basa soprattutto su tecniche di machine learning: un processo induttivo che costruisce in modo automatico un classificatore di testi sulla base dell'analisi di un insieme di documenti preclassificati e sulle caratteristiche delle categorie di interesse. Non esiste un metodo standard per la definizione di questi classificatori; per questo i ricercatori studiano e propongono nuove soluzione per la costruzione di questi strumenti. I risultati vengono quindi pubblicati in documenti scientifici che solitamente contengono la definizione della configurazione e le prestazioni che questa configurazione ha ottenuto negli esperimenti svolti. Dai dati che solitamente vengono inseriti nelle pubblicazioni, non si hanno a disposizione tutte le informazioni per poter riprodurre gli esperimenti; ne si ha la possibilità di confrontare in modo diretto i risultati ottenuti. Lo scopo di questo progetto è quindi quello di costruire uno strumento che permetta di storicizzare gli esperimenti e che dia la possibilità di confrontare i risultati ottenuti con le diverse configurazioni. La realizzazione può essere concettualmente divisa in due parti: nella prima parte si andrà a definire come è stata progettata la base di dati che permette di memorizzare in dettaglio gli esperimenti ed i relativi risultati ottenuti, successivamente, si analizzerà come è stato strutturato ed implementato il progetto in Java che si basa sulle architetture Spring e Hibernate per la gestione ed interrogazione della base di dati. Il documento termina con le considerazioni personali sull'attività svolta e delle proposte per il miglioramento dei risultati ottenuti
2012-04-17
62
machine learning, indicizzazione automatica, esperimenti scientifici, basi di dati, Hibernate-Spring, Java
File in questo prodotto:
File Dimensione Formato  
Tesi.pdf

accesso aperto

Dimensione 4.36 MB
Formato Adobe PDF
4.36 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/15556