Nel seguente elaborato verrano presentate tecniche di NLP su dati relativi a podcast di Spotify. I podcast rappresentano una vasta e crescente raccolta di dialoghi audio. Si cercherà di studiare il comportamento delle trascrizioni dei diversi episodi a disposizione, con particolare attenzione agli argomenti che questi presentano. Oltre a questi verranno utilizzati anche delle descrizioni di ogni puntata presenti nei metadati, forniti dai diversi autori, le quali rappresentano di fatto un breve riassunto teoricamente più incentrato sulle tematiche affrontate rispetto alle trascrizioni a disposizione. Le metodologie presentate fanno parte dei cosi detti Topic modelling i quali possono essere utilizzati in diverse forme, supervisionati nei quali viene introdotta una variabile risposta, e stutturati nei quali vengono intrdotte delle covariate a livello di topic.
Supervised or structural topic modelling: un'analisi di podcast su spotify
TORI, GIANLUCA IVO
2022/2023
Abstract
Nel seguente elaborato verrano presentate tecniche di NLP su dati relativi a podcast di Spotify. I podcast rappresentano una vasta e crescente raccolta di dialoghi audio. Si cercherà di studiare il comportamento delle trascrizioni dei diversi episodi a disposizione, con particolare attenzione agli argomenti che questi presentano. Oltre a questi verranno utilizzati anche delle descrizioni di ogni puntata presenti nei metadati, forniti dai diversi autori, le quali rappresentano di fatto un breve riassunto teoricamente più incentrato sulle tematiche affrontate rispetto alle trascrizioni a disposizione. Le metodologie presentate fanno parte dei cosi detti Topic modelling i quali possono essere utilizzati in diverse forme, supervisionati nei quali viene introdotta una variabile risposta, e stutturati nei quali vengono intrdotte delle covariate a livello di topic.File | Dimensione | Formato | |
---|---|---|---|
Tori_GianlucaIvo.pdf
accesso aperto
Dimensione
2.56 MB
Formato
Adobe PDF
|
2.56 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/58713