Lo studio mira a confrontare le performance dei valutatori umani e LLMs nell'analisi di memorie autentiche e fabbricate attraverso l'analisi di set di dati di ricordi autobiografici. Il primo (Monaro et al., 2020) include narrazioni su vacanze passate trascritte da interviste video. I valutatori umani e il modello automatico sono stati istruiti ad estrapolare dettagli insieme al framework del Reality Monitoring e Verifiability Approach. Questa analisi è stata quindi replicata su un sottoinsieme del dataset Hippocorpus (Sap et al., 2022), che include dichiarazioni in inglese su memorie genuine e ingannevoli di esperienze passate significative. I risultati mostrano un'ottima concordanza tra LLMs e umani nell'applicazione del Reality Monitoring, mentre appare una forte discrepanza per quanto riguarda l'uso del Verifiability Approach.
Confronto tra annotatori umani e LLMs nello scoring di ricordi autobiografici genuini e mentiti per la valutazione della credibilità.
PACHERA, CHIARA
2023/2024
Abstract
Lo studio mira a confrontare le performance dei valutatori umani e LLMs nell'analisi di memorie autentiche e fabbricate attraverso l'analisi di set di dati di ricordi autobiografici. Il primo (Monaro et al., 2020) include narrazioni su vacanze passate trascritte da interviste video. I valutatori umani e il modello automatico sono stati istruiti ad estrapolare dettagli insieme al framework del Reality Monitoring e Verifiability Approach. Questa analisi è stata quindi replicata su un sottoinsieme del dataset Hippocorpus (Sap et al., 2022), che include dichiarazioni in inglese su memorie genuine e ingannevoli di esperienze passate significative. I risultati mostrano un'ottima concordanza tra LLMs e umani nell'applicazione del Reality Monitoring, mentre appare una forte discrepanza per quanto riguarda l'uso del Verifiability Approach.File | Dimensione | Formato | |
---|---|---|---|
Pachera_Chiara.pdf
accesso aperto
Dimensione
2.18 MB
Formato
Adobe PDF
|
2.18 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/75284