Negli ultimi anni l'interesse per la classificazione automatica di testi in categorie è in forte espansione. I fattori principali che hanno contribuito a promuovere questa espansione sono la maggiore disponibilità di documenti in forma digitale e la conseguente necessità di definire una struttura per la loro organizzazione in modo da migliorarne la gestione. L'approccio alla classificazione automatica si basa soprattutto su tecniche di machine learning: un processo induttivo che costruisce in modo automatico un classificatore di testi sulla base dell'analisi di un insieme di documenti preclassificati e sulle caratteristiche delle categorie di interesse. Non esiste un metodo standard per la definizione di questi classificatori; per questo i ricercatori studiano e propongono nuove soluzione per la costruzione di questi strumenti. I risultati vengono quindi pubblicati in documenti scientifici che solitamente contengono la definizione della configurazione e le prestazioni che questa configurazione ha ottenuto negli esperimenti svolti. Dai dati che solitamente vengono inseriti nelle pubblicazioni, non si hanno a disposizione tutte le informazioni per poter riprodurre gli esperimenti; ne si ha la possibilità di confrontare in modo diretto i risultati ottenuti. Lo scopo di questo progetto è quindi quello di costruire uno strumento che permetta di storicizzare gli esperimenti e che dia la possibilità di confrontare i risultati ottenuti con le diverse configurazioni. La realizzazione può essere concettualmente divisa in due parti: nella prima parte si andrà a definire come è stata progettata la base di dati che permette di memorizzare in dettaglio gli esperimenti ed i relativi risultati ottenuti, successivamente, si analizzerà come è stato strutturato ed implementato il progetto in Java che si basa sulle architetture Spring e Hibernate per la gestione ed interrogazione della base di dati. Il documento termina con le considerazioni personali sull'attività svolta e delle proposte per il miglioramento dei risultati ottenuti
Progettazione e realizzazione di un sistema di gestione di esperimenti scientifici basato su architetture Spring-Hibernate
Rampazzo, Marco
2012/2013
Abstract
Negli ultimi anni l'interesse per la classificazione automatica di testi in categorie è in forte espansione. I fattori principali che hanno contribuito a promuovere questa espansione sono la maggiore disponibilità di documenti in forma digitale e la conseguente necessità di definire una struttura per la loro organizzazione in modo da migliorarne la gestione. L'approccio alla classificazione automatica si basa soprattutto su tecniche di machine learning: un processo induttivo che costruisce in modo automatico un classificatore di testi sulla base dell'analisi di un insieme di documenti preclassificati e sulle caratteristiche delle categorie di interesse. Non esiste un metodo standard per la definizione di questi classificatori; per questo i ricercatori studiano e propongono nuove soluzione per la costruzione di questi strumenti. I risultati vengono quindi pubblicati in documenti scientifici che solitamente contengono la definizione della configurazione e le prestazioni che questa configurazione ha ottenuto negli esperimenti svolti. Dai dati che solitamente vengono inseriti nelle pubblicazioni, non si hanno a disposizione tutte le informazioni per poter riprodurre gli esperimenti; ne si ha la possibilità di confrontare in modo diretto i risultati ottenuti. Lo scopo di questo progetto è quindi quello di costruire uno strumento che permetta di storicizzare gli esperimenti e che dia la possibilità di confrontare i risultati ottenuti con le diverse configurazioni. La realizzazione può essere concettualmente divisa in due parti: nella prima parte si andrà a definire come è stata progettata la base di dati che permette di memorizzare in dettaglio gli esperimenti ed i relativi risultati ottenuti, successivamente, si analizzerà come è stato strutturato ed implementato il progetto in Java che si basa sulle architetture Spring e Hibernate per la gestione ed interrogazione della base di dati. Il documento termina con le considerazioni personali sull'attività svolta e delle proposte per il miglioramento dei risultati ottenutiFile | Dimensione | Formato | |
---|---|---|---|
Tesi.pdf
accesso aperto
Dimensione
4.36 MB
Formato
Adobe PDF
|
4.36 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/15556