In questa tesi viene affrontato il tema dell'espansione delle interrogazioni nel contesto dell'Information Retrieval. L'espansione delle interrogazioni è il processo mediante il quale si arricchisce l'interrogazione iniziale con termini aggiuntivi (descrittori), selezionati attraverso differenti tecniche. Nel lavoro presente, questo processo è completamente automatizzato in quanto tutte le tecniche proposte si basano sulla retroazione di pseudo-rilevanza. L'obiettivo della tesi è analizzare e confrontare l'impatto di differenti procedure di espansione sull'efficacia di un sistema di IR, rispetto a una baseline priva di espansione, utilizzando metriche di valutazione standard per la qualità del reperimento. L'analisi è condotta sulla collezione TREC 2004 Robust, elaborata mediante l'uso di ElasticSearch e programmi scritti in Python, con l'intento di verificare se e quanto le tecniche proposte apportino un contributo significativo alle prestazioni, e quale tra esse risulti più efficace.
Analisi comparativa tra BM25 e Metodi di Espansione di Query basati su Pseudo Relevance Feedback
QUARTUCCIO, ANDREA
2024/2025
Abstract
In questa tesi viene affrontato il tema dell'espansione delle interrogazioni nel contesto dell'Information Retrieval. L'espansione delle interrogazioni è il processo mediante il quale si arricchisce l'interrogazione iniziale con termini aggiuntivi (descrittori), selezionati attraverso differenti tecniche. Nel lavoro presente, questo processo è completamente automatizzato in quanto tutte le tecniche proposte si basano sulla retroazione di pseudo-rilevanza. L'obiettivo della tesi è analizzare e confrontare l'impatto di differenti procedure di espansione sull'efficacia di un sistema di IR, rispetto a una baseline priva di espansione, utilizzando metriche di valutazione standard per la qualità del reperimento. L'analisi è condotta sulla collezione TREC 2004 Robust, elaborata mediante l'uso di ElasticSearch e programmi scritti in Python, con l'intento di verificare se e quanto le tecniche proposte apportino un contributo significativo alle prestazioni, e quale tra esse risulti più efficace.| File | Dimensione | Formato | |
|---|---|---|---|
|
Quartuccio_Andrea.pdf
accesso aperto
Dimensione
513.01 kB
Formato
Adobe PDF
|
513.01 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/88539