Superare il limite delle 'Stelle': l'uso di modelli ontologici e Gemini per la Sentiment Analysis

Il presente lavoro di tesi esplora diverse metodologie di Sentiment Analysis applicate a un corpus di recensioni estratte dalla piattaforma Trustpilot tramite tecniche di web scraping. L’obiettivo centrale è il confronto tra gli approcci computazionali tradizionali e le potenzialità offerte dai Large Language Models (LLM). La ricerca analizza e confronta l’accuratezza di diversi modelli ontologici, utilizzando nello specifico il pacchetto TextWiller, con l’implementazione di molteplici algoritmi, oltre ai modelli TALL e Syuzhet. L'efficacia di tali sistemi, fondati su regole linguistiche e vocabolari predefiniti, è stata testata in parallelo alle potenzialità del modello generativo. Per garantire una validità statistica, è stato applicato Efficient Prediction-Powered Inference (PPI++). Questa metodologia permette di integrare le previsioni dei modelli con una validazione manuale effettuata su un campione ridotto, correggendo i potenziali bias algoritmici attraverso una rettifica. Lo studio dimostra come l’uso di modelli ontologici e LLM consenta di ottenere una visione accurata e statisticamente affidabile del sentiment su larga scala, anche partendo da un corpus limitato di dati etichettati.

Superare il limite delle 'Stelle': l'uso di modelli ontologici e Gemini per la Sentiment Analysis

BIRGAUAN, FLOAREA

2025/2026

Abstract

Il presente lavoro di tesi esplora diverse metodologie di Sentiment Analysis applicate a un corpus di recensioni estratte dalla piattaforma Trustpilot tramite tecniche di web scraping. L’obiettivo centrale è il confronto tra gli approcci computazionali tradizionali e le potenzialità offerte dai Large Language Models (LLM). La ricerca analizza e confronta l’accuratezza di diversi modelli ontologici, utilizzando nello specifico il pacchetto TextWiller, con l’implementazione di molteplici algoritmi, oltre ai modelli TALL e Syuzhet. L'efficacia di tali sistemi, fondati su regole linguistiche e vocabolari predefiniti, è stata testata in parallelo alle potenzialità del modello generativo. Per garantire una validità statistica, è stato applicato Efficient Prediction-Powered Inference (PPI++). Questa metodologia permette di integrare le previsioni dei modelli con una validazione manuale effettuata su un campione ridotto, correggendo i potenziali bias algoritmici attraverso una rettifica. Lo studio dimostra come l’uso di modelli ontologici e LLM consenta di ottenere una visione accurata e statisticamente affidabile del sentiment su larga scala, anche partendo da un corpus limitato di dati etichettati.

Scheda

Scheda DC

	Facoltà/Dipartimento
	
				Dipartimento di Scienze Statistiche
			
	Corso di studio
	
				SCIENZE STATISTICHE Laurea Magistrale (D.M. 270/2004)
			
	Anno Accademico
	
				2025
			
	Titolo inglese
	
				Surpassing the limit of 'Stars': the use of ontological models and Gemini for Sentiment Analysis
			
	Parola chiave
	
				Text mining
Sentiment analysis
TextWiller
AI
PPI
			
	Relatore
	
				FINOS, LIVIO
			
	Appare nelle tipologie:
	
				Lauree magistrali

File in questo prodotto:

File	Dimensione	Formato
Birgauan_Floarea.pdf Accesso riservato Dimensione 3.88 MB Formato Adobe PDF	3.88 MB	Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/105765