In questa tesi viene studiata la riproducibilità di GRAS, un algoritmo di stemming che utilizza metodi probabilistici per raggruppare le parole di un lexicon in classi morfologicamente correlate, a cui viene assegnata una radice linguistica comune. L'obiettivo è riprodurre quanto svolto dagli autori dell'articolo in cui GRAS è stato presentato, sia per quanto riguarda l'implementazione del codice, sia per la parte relativa alla valutazione sperimentale

Data-Driven Information Retrieval: Riproducibilità di uno stemmer probabilistico

Busato, Giulio
2017/2018

Abstract

In questa tesi viene studiata la riproducibilità di GRAS, un algoritmo di stemming che utilizza metodi probabilistici per raggruppare le parole di un lexicon in classi morfologicamente correlate, a cui viene assegnata una radice linguistica comune. L'obiettivo è riprodurre quanto svolto dagli autori dell'articolo in cui GRAS è stato presentato, sia per quanto riguarda l'implementazione del codice, sia per la parte relativa alla valutazione sperimentale
2017-04-13
IR, Data-Driven, riproducibilità, Stemmer
File in questo prodotto:
File Dimensione Formato  
tesi_busato_giulio.pdf

accesso aperto

Dimensione 844.23 kB
Formato Adobe PDF
844.23 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/25682