Il presente lavoro di tesi esplora diverse metodologie di Sentiment Analysis applicate a un corpus di recensioni estratte dalla piattaforma Trustpilot tramite tecniche di web scraping. L’obiettivo centrale è il confronto tra gli approcci computazionali tradizionali e le potenzialità offerte dai Large Language Models (LLM). La ricerca analizza e confronta l’accuratezza di diversi modelli ontologici, utilizzando nello specifico il pacchetto TextWiller, con l’implementazione di molteplici algoritmi, oltre ai modelli TALL e Syuzhet. L'efficacia di tali sistemi, fondati su regole linguistiche e vocabolari predefiniti, è stata testata in parallelo alle potenzialità del modello generativo. Per garantire una validità statistica, è stato applicato Efficient Prediction-Powered Inference (PPI++). Questa metodologia permette di integrare le previsioni dei modelli con una validazione manuale effettuata su un campione ridotto, correggendo i potenziali bias algoritmici attraverso una rettifica. Lo studio dimostra come l’uso di modelli ontologici e LLM consenta di ottenere una visione accurata e statisticamente affidabile del sentiment su larga scala, anche partendo da un corpus limitato di dati etichettati.
Superare il limite delle 'Stelle': l'uso di modelli ontologici e Gemini per la Sentiment Analysis
BIRGAUAN, FLOAREA
2025/2026
Abstract
Il presente lavoro di tesi esplora diverse metodologie di Sentiment Analysis applicate a un corpus di recensioni estratte dalla piattaforma Trustpilot tramite tecniche di web scraping. L’obiettivo centrale è il confronto tra gli approcci computazionali tradizionali e le potenzialità offerte dai Large Language Models (LLM). La ricerca analizza e confronta l’accuratezza di diversi modelli ontologici, utilizzando nello specifico il pacchetto TextWiller, con l’implementazione di molteplici algoritmi, oltre ai modelli TALL e Syuzhet. L'efficacia di tali sistemi, fondati su regole linguistiche e vocabolari predefiniti, è stata testata in parallelo alle potenzialità del modello generativo. Per garantire una validità statistica, è stato applicato Efficient Prediction-Powered Inference (PPI++). Questa metodologia permette di integrare le previsioni dei modelli con una validazione manuale effettuata su un campione ridotto, correggendo i potenziali bias algoritmici attraverso una rettifica. Lo studio dimostra come l’uso di modelli ontologici e LLM consenta di ottenere una visione accurata e statisticamente affidabile del sentiment su larga scala, anche partendo da un corpus limitato di dati etichettati.| File | Dimensione | Formato | |
|---|---|---|---|
|
Birgauan_Floarea.pdf
Accesso riservato
Dimensione
3.88 MB
Formato
Adobe PDF
|
3.88 MB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/105765