In questa tesi viene affrontato il tema dell'espansione delle interrogazioni nel contesto dell'Information Retrieval. L'espansione delle interrogazioni è il processo mediante il quale si arricchisce l'interrogazione iniziale con termini aggiuntivi (descrittori), selezionati attraverso differenti tecniche. Nel lavoro presente, questo processo è completamente automatizzato in quanto tutte le tecniche proposte si basano sulla retroazione di pseudo-rilevanza. L'obiettivo della tesi è analizzare e confrontare l'impatto di differenti procedure di espansione sull'efficacia di un sistema di IR, rispetto a una baseline priva di espansione, utilizzando metriche di valutazione standard per la qualità del reperimento. L'analisi è condotta sulla collezione TREC 2004 Robust, elaborata mediante l'uso di ElasticSearch e programmi scritti in Python, con l'intento di verificare se e quanto le tecniche proposte apportino un contributo significativo alle prestazioni, e quale tra esse risulti più efficace.

Analisi comparativa tra BM25 e Metodi di Espansione di Query basati su Pseudo Relevance Feedback

QUARTUCCIO, ANDREA
2024/2025

Abstract

In questa tesi viene affrontato il tema dell'espansione delle interrogazioni nel contesto dell'Information Retrieval. L'espansione delle interrogazioni è il processo mediante il quale si arricchisce l'interrogazione iniziale con termini aggiuntivi (descrittori), selezionati attraverso differenti tecniche. Nel lavoro presente, questo processo è completamente automatizzato in quanto tutte le tecniche proposte si basano sulla retroazione di pseudo-rilevanza. L'obiettivo della tesi è analizzare e confrontare l'impatto di differenti procedure di espansione sull'efficacia di un sistema di IR, rispetto a una baseline priva di espansione, utilizzando metriche di valutazione standard per la qualità del reperimento. L'analisi è condotta sulla collezione TREC 2004 Robust, elaborata mediante l'uso di ElasticSearch e programmi scritti in Python, con l'intento di verificare se e quanto le tecniche proposte apportino un contributo significativo alle prestazioni, e quale tra esse risulti più efficace.
2024
Comparative Analysis between BM25 and Query Expansion Methods based on Pseudo Relevance Feedback
Query Expansion
Word embeddings
Word2Vec
ROBUST 2004
File in questo prodotto:
File Dimensione Formato  
Quartuccio_Andrea.pdf

accesso aperto

Dimensione 513.01 kB
Formato Adobe PDF
513.01 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/88539