TikTok è una tra le applicazioni più popolari del momento e permette di creare e condividere brevi video di varia natura e toni. L’applicazione promuove la creazione di video che seguono la popolarità delle tendenze del momento e consente ai brand che lo desiderano di farsi pubblicità tramite le challenge. Si tratta di sfide dove gli utenti sono invitati a postare contenuti definiti da TikTok e ognuna di queste è rappresentata da uno o più hashtag. In questo modo però le campagne pubblicitarie sono in mano agli utenti e a volte il risultato può rivelarsi diverso dalle aspettative. Sebbene la maggior parte dei Creators rispetti correttamente i principi della sfida, altri utenti cercano di trarne guadagno sfruttandone la popolarità e utilizzando impropriamente gli hashtag. Questo fenomeno è conosciuto come hashjacking e consiste nell'utilizzare hashtag con un determinato significato per contenuti diversi, con lo scopo principale di cogliere la popolarità della tendenza del momento. In questo lavoro sono state raccolte informazioni relative ai video della challenge Ti Racconto l'Italia che consisteva nel postare video relativi alla cultura e ai luoghi italiani. L'obiettivo principale è quello di separare i contenuti che sono stati raccolti a causa del fenomeno di hashjacking e analizzare i vari argomenti che sono presenti nel dataset. Le informazioni relative a 7138 video sono state raccolte utilizzando i file HAR e da questi ne è stato ricavato il dataset. Si poteva disporre della descrizione del video, di eventuali testi inseriti all'interno di questo durante la fase di montaggio, informazioni riguardo la qualità e infine le varie statistiche principali del video come numero di likes. Per il profilo si era a conoscenza del testo inserito nella biografia e delle statistiche quali numero di follower, following. È stato necessario effettuare una normalizzazione delle variabili testuali che ha portato a mantenere i termini che si presentavano almeno nell'1% delle osservazioni. Dalle prime analisi esplorative è emerso che il dataset è molto vario passando da veri e propri tormentoni con migliaia di interazioni a video con sole poche decine. Dalle variabili testuali si notano alcuni termini che sembrano essere estranei alla sfida scelta. Si vuole quindi individuare eventuali porzioni di video che sono estranei alla sfida, anche se queste saranno in netta minoranza nel dataset. Per risolvere tale problematica si decide di utilizzare i modelli a classi latenti per cercare di separare le osservazioni sulla base dei vari argomenti presenti. Tra i vari modelli stimati, quello che considera 28 classi latenti e che utilizza solamente i termini che derivano dalla descrizione del video e dei testi inseriti all'interno di esso ha permesso di individuare gruppi di video non inerenti alla sfida. Su 6220 video finali analizzati, emerge che almeno il 7.7% di questi non sono adatti alla challenge scelta. Negli altri gruppi invece le tematiche affrontate erano valide e consistevano nel descrivere principalmente le città, le attività svolte oppure racconti della cultura locale. Le varie informazioni testuali si sono rivelate molto utili nel raggruppamento delle osservazioni e nella valutazione delle varie classi. In futuri lavoro si potrebbero raccogliere più informazioni quali fermo-immagini dei video e catturare eventuali particolarità che accomunano quelli che non sono inerenti alla sfida.

Hashjacking su TikTok: analisi di contenuti italiani tramite modelli a classi latenti.

STECCA, FRANCESCA
2021/2022

Abstract

TikTok è una tra le applicazioni più popolari del momento e permette di creare e condividere brevi video di varia natura e toni. L’applicazione promuove la creazione di video che seguono la popolarità delle tendenze del momento e consente ai brand che lo desiderano di farsi pubblicità tramite le challenge. Si tratta di sfide dove gli utenti sono invitati a postare contenuti definiti da TikTok e ognuna di queste è rappresentata da uno o più hashtag. In questo modo però le campagne pubblicitarie sono in mano agli utenti e a volte il risultato può rivelarsi diverso dalle aspettative. Sebbene la maggior parte dei Creators rispetti correttamente i principi della sfida, altri utenti cercano di trarne guadagno sfruttandone la popolarità e utilizzando impropriamente gli hashtag. Questo fenomeno è conosciuto come hashjacking e consiste nell'utilizzare hashtag con un determinato significato per contenuti diversi, con lo scopo principale di cogliere la popolarità della tendenza del momento. In questo lavoro sono state raccolte informazioni relative ai video della challenge Ti Racconto l'Italia che consisteva nel postare video relativi alla cultura e ai luoghi italiani. L'obiettivo principale è quello di separare i contenuti che sono stati raccolti a causa del fenomeno di hashjacking e analizzare i vari argomenti che sono presenti nel dataset. Le informazioni relative a 7138 video sono state raccolte utilizzando i file HAR e da questi ne è stato ricavato il dataset. Si poteva disporre della descrizione del video, di eventuali testi inseriti all'interno di questo durante la fase di montaggio, informazioni riguardo la qualità e infine le varie statistiche principali del video come numero di likes. Per il profilo si era a conoscenza del testo inserito nella biografia e delle statistiche quali numero di follower, following. È stato necessario effettuare una normalizzazione delle variabili testuali che ha portato a mantenere i termini che si presentavano almeno nell'1% delle osservazioni. Dalle prime analisi esplorative è emerso che il dataset è molto vario passando da veri e propri tormentoni con migliaia di interazioni a video con sole poche decine. Dalle variabili testuali si notano alcuni termini che sembrano essere estranei alla sfida scelta. Si vuole quindi individuare eventuali porzioni di video che sono estranei alla sfida, anche se queste saranno in netta minoranza nel dataset. Per risolvere tale problematica si decide di utilizzare i modelli a classi latenti per cercare di separare le osservazioni sulla base dei vari argomenti presenti. Tra i vari modelli stimati, quello che considera 28 classi latenti e che utilizza solamente i termini che derivano dalla descrizione del video e dei testi inseriti all'interno di esso ha permesso di individuare gruppi di video non inerenti alla sfida. Su 6220 video finali analizzati, emerge che almeno il 7.7% di questi non sono adatti alla challenge scelta. Negli altri gruppi invece le tematiche affrontate erano valide e consistevano nel descrivere principalmente le città, le attività svolte oppure racconti della cultura locale. Le varie informazioni testuali si sono rivelate molto utili nel raggruppamento delle osservazioni e nella valutazione delle varie classi. In futuri lavoro si potrebbero raccogliere più informazioni quali fermo-immagini dei video e catturare eventuali particolarità che accomunano quelli che non sono inerenti alla sfida.
2021
Hashjacking on TikTok: analysis of Italian contents through latent class models.
TikTok
Hashjacking
Latent class models
File in questo prodotto:
File Dimensione Formato  
Stecca_Francesca.pdf

accesso riservato

Dimensione 8.51 MB
Formato Adobe PDF
8.51 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/11378