This thesis develops a new measure of economic uncertainty for Italy based on Facebook posts from a wide array of news outlets. Traditional dictionary methods used in the Economic Policy Uncertainty (EPU) index face important limitations when applied to social media data, since short and informal posts rarely match rigid keyword lists. To overcome this, we employ an Italian BERT-based model, which the literature has shown to perform better than keyword approaches by capturing semantic and contextual signals of uncertainty. The resulting index remains broadly consistent with the official EPU while providing a representation that appears to reflect the linguistic dynamics of online communication better. The indexes are evaluated within a Vector Autoregressive framework. Impulse Response Functions and Forecast Error Variance Decomposition confirm its ability to reproduce the established effects of uncertainty shocks on Italian macroeconomic variables, while in some dimensions offering evidence of stronger explanatory performance relative to the official EPU. A central contribution of this work is to demonstrate the importance of coverage: whereas the official EPU relies on a narrow set of newspapers, our results show that including a broader range of outlets tends to improve explanatory power. The analysis also ventures into defining a novel index of sentiment that is considered alongside uncertainty. Results point to a pronounced asymmetry: positive sentiment appears to add explanatory power for macroeconomic outcomes, whereas negative sentiment does not. Coverage also plays a key role in this context: expanding the set of outlets used for the index enhances the accuracy with which sentiment dynamics are identified in the economy.

Questa tesi sviluppa una nuova misura dell’incertezza economica per l’Italia basata sui post di Facebook provenienti da un’ampia gamma di testate giornalistiche. I metodi tradizionali basati su dizionari, impiegati nell’Economic Policy Uncertainty (EPU) index, presentano importanti limiti quando applicati ai dati dei social media, poiché post brevi e informali raramente corrispondono a rigide liste di parole chiave. Per superare tali limiti, utilizziamo un modello BERT in italiano, che la letteratura ha mostrato essere più efficace degli approcci basati su dizionari, in quanto capace di cogliere segnali semantici e contestuali di incertezza. L’indice risultante rimane ampiamente coerente con l’EPU ufficiale, offrendo al contempo una rappresentazione che sembra riflettere meglio le dinamiche linguistiche della comunicazione online. Gli indici sono valutati all’interno di un modello Vector Autoregressive (VAR). Le Impulse Response Functions e la Forecast Error Variance Decomposition confermano la capacità dell’indice di riprodurre gli effetti consolidati degli shock di incertezza sulle variabili macroeconomiche italiane, offrendo in alcune dimensioni evidenza di una maggiore capacità esplicativa rispetto all’EPU ufficiale. Un contributo centrale di questo lavoro consiste nel dimostrare l’importanza della copertura: mentre l’EPU ufficiale si basa su un insieme ristretto di quotidiani, i nostri risultati mostrano che includere un ventaglio più ampio di fonti tende a migliorare il potere esplicativo. L’analisi esplora inoltre la definizione di un nuovo indice di sentiment, considerato accanto a quello di incertezza. I risultati evidenziano una marcata asimmetria: il sentiment positivo sembra aggiungere potere esplicativo per gli andamenti macroeconomici, mentre quello negativo no. Anche in questo contesto la copertura svolge un ruolo fondamentale: ampliare l’insieme delle testate utilizzate per l’indice accresce la precisione con cui le dinamiche del sentiment vengono identificate nell’economia.

The Social Media Footprint of Economic Uncertainty: Exploring the Informational Value of News Sources and the Power of Deep Language Models

CHIOCCA, ANDREA NICOLA
2024/2025

Abstract

This thesis develops a new measure of economic uncertainty for Italy based on Facebook posts from a wide array of news outlets. Traditional dictionary methods used in the Economic Policy Uncertainty (EPU) index face important limitations when applied to social media data, since short and informal posts rarely match rigid keyword lists. To overcome this, we employ an Italian BERT-based model, which the literature has shown to perform better than keyword approaches by capturing semantic and contextual signals of uncertainty. The resulting index remains broadly consistent with the official EPU while providing a representation that appears to reflect the linguistic dynamics of online communication better. The indexes are evaluated within a Vector Autoregressive framework. Impulse Response Functions and Forecast Error Variance Decomposition confirm its ability to reproduce the established effects of uncertainty shocks on Italian macroeconomic variables, while in some dimensions offering evidence of stronger explanatory performance relative to the official EPU. A central contribution of this work is to demonstrate the importance of coverage: whereas the official EPU relies on a narrow set of newspapers, our results show that including a broader range of outlets tends to improve explanatory power. The analysis also ventures into defining a novel index of sentiment that is considered alongside uncertainty. Results point to a pronounced asymmetry: positive sentiment appears to add explanatory power for macroeconomic outcomes, whereas negative sentiment does not. Coverage also plays a key role in this context: expanding the set of outlets used for the index enhances the accuracy with which sentiment dynamics are identified in the economy.
2024
The Social Media Footprint of Economic Uncertainty: Exploring the Informational Value of News Sources and the Power of Deep Language Models
Questa tesi sviluppa una nuova misura dell’incertezza economica per l’Italia basata sui post di Facebook provenienti da un’ampia gamma di testate giornalistiche. I metodi tradizionali basati su dizionari, impiegati nell’Economic Policy Uncertainty (EPU) index, presentano importanti limiti quando applicati ai dati dei social media, poiché post brevi e informali raramente corrispondono a rigide liste di parole chiave. Per superare tali limiti, utilizziamo un modello BERT in italiano, che la letteratura ha mostrato essere più efficace degli approcci basati su dizionari, in quanto capace di cogliere segnali semantici e contestuali di incertezza. L’indice risultante rimane ampiamente coerente con l’EPU ufficiale, offrendo al contempo una rappresentazione che sembra riflettere meglio le dinamiche linguistiche della comunicazione online. Gli indici sono valutati all’interno di un modello Vector Autoregressive (VAR). Le Impulse Response Functions e la Forecast Error Variance Decomposition confermano la capacità dell’indice di riprodurre gli effetti consolidati degli shock di incertezza sulle variabili macroeconomiche italiane, offrendo in alcune dimensioni evidenza di una maggiore capacità esplicativa rispetto all’EPU ufficiale. Un contributo centrale di questo lavoro consiste nel dimostrare l’importanza della copertura: mentre l’EPU ufficiale si basa su un insieme ristretto di quotidiani, i nostri risultati mostrano che includere un ventaglio più ampio di fonti tende a migliorare il potere esplicativo. L’analisi esplora inoltre la definizione di un nuovo indice di sentiment, considerato accanto a quello di incertezza. I risultati evidenziano una marcata asimmetria: il sentiment positivo sembra aggiungere potere esplicativo per gli andamenti macroeconomici, mentre quello negativo no. Anche in questo contesto la copertura svolge un ruolo fondamentale: ampliare l’insieme delle testate utilizzate per l’indice accresce la precisione con cui le dinamiche del sentiment vengono identificate nell’economia.
Uncertainty index
Social media
VAR model
BERT
File in questo prodotto:
File Dimensione Formato  
Chiocca_AndreaNicola.pdf

accesso aperto

Dimensione 30.6 MB
Formato Adobe PDF
30.6 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/94763