Il presente lavoro di tesi esplora diverse metodologie di Sentiment Analysis applicate a un corpus di recensioni estratte dalla piattaforma Trustpilot tramite tecniche di web scraping. L’obiettivo centrale è il confronto tra gli approcci computazionali tradizionali e le potenzialità offerte dai Large Language Models (LLM). La ricerca analizza e confronta l’accuratezza di diversi modelli ontologici, utilizzando nello specifico il pacchetto TextWiller, con l’implementazione di molteplici algoritmi, oltre ai modelli TALL e Syuzhet. L'efficacia di tali sistemi, fondati su regole linguistiche e vocabolari predefiniti, è stata testata in parallelo alle potenzialità del modello generativo. Per garantire una validità statistica, è stato applicato Efficient Prediction-Powered Inference (PPI++). Questa metodologia permette di integrare le previsioni dei modelli con una validazione manuale effettuata su un campione ridotto, correggendo i potenziali bias algoritmici attraverso una rettifica. Lo studio dimostra come l’uso di modelli ontologici e LLM consenta di ottenere una visione accurata e statisticamente affidabile del sentiment su larga scala, anche partendo da un corpus limitato di dati etichettati.

Superare il limite delle 'Stelle': l'uso di modelli ontologici e Gemini per la Sentiment Analysis

BIRGAUAN, FLOAREA
2025/2026

Abstract

Il presente lavoro di tesi esplora diverse metodologie di Sentiment Analysis applicate a un corpus di recensioni estratte dalla piattaforma Trustpilot tramite tecniche di web scraping. L’obiettivo centrale è il confronto tra gli approcci computazionali tradizionali e le potenzialità offerte dai Large Language Models (LLM). La ricerca analizza e confronta l’accuratezza di diversi modelli ontologici, utilizzando nello specifico il pacchetto TextWiller, con l’implementazione di molteplici algoritmi, oltre ai modelli TALL e Syuzhet. L'efficacia di tali sistemi, fondati su regole linguistiche e vocabolari predefiniti, è stata testata in parallelo alle potenzialità del modello generativo. Per garantire una validità statistica, è stato applicato Efficient Prediction-Powered Inference (PPI++). Questa metodologia permette di integrare le previsioni dei modelli con una validazione manuale effettuata su un campione ridotto, correggendo i potenziali bias algoritmici attraverso una rettifica. Lo studio dimostra come l’uso di modelli ontologici e LLM consenta di ottenere una visione accurata e statisticamente affidabile del sentiment su larga scala, anche partendo da un corpus limitato di dati etichettati.
2025
Surpassing the limit of 'Stars': the use of ontological models and Gemini for Sentiment Analysis
Text mining
Sentiment analysis
TextWiller
AI
PPI
File in questo prodotto:
File Dimensione Formato  
Birgauan_Floarea.pdf

Accesso riservato

Dimensione 3.88 MB
Formato Adobe PDF
3.88 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/105765