Clustering nell'industria cinematografica: un'analisi integrata con Large Language Models

Nel panorama dell'industria cinematografica, la fusione tra creatività artistica e progresso di tecnologie digitali sta ridefinendo il modo in cui i film vengono concepiti, prodotti e distribuiti. L'analisi dei dati, dunque, gioca un ruolo sempre più centrale in questo processo, diventando uno strumento indispensabile per ottimizzare decisioni e strategie in tutte le fasi del ciclo di vita di un film. Questa tesi si propone di esplorare l'applicazione di tecniche di clustering per analizzare e classificare i film, integrando dati strutturati, come genere, cast, voto della critica e degli utenti con informazioni non strutturate, come le recensioni rilasciate dagli utenti. Il clustering, infatti, rappresenta uno strumento fondamentale per individuare gruppi omogenei di film sulla base di caratteristiche condivise, consentendo di rivelare pattern nascosti e relazioni latenti. Utilizzando un dataset di film distribuiti dal 2010 in poi, ottenuto tramite scraping dal sito IMDb, l’analisi combina metodologie statistiche e word embeddings, in modo da trattare dati di natura eterogenea.

Clustering nell'industria cinematografica: un'analisi integrata con Large Language Models

PISANI, CHIARA

2024/2025

Abstract

Nel panorama dell'industria cinematografica, la fusione tra creatività artistica e progresso di tecnologie digitali sta ridefinendo il modo in cui i film vengono concepiti, prodotti e distribuiti. L'analisi dei dati, dunque, gioca un ruolo sempre più centrale in questo processo, diventando uno strumento indispensabile per ottimizzare decisioni e strategie in tutte le fasi del ciclo di vita di un film. Questa tesi si propone di esplorare l'applicazione di tecniche di clustering per analizzare e classificare i film, integrando dati strutturati, come genere, cast, voto della critica e degli utenti con informazioni non strutturate, come le recensioni rilasciate dagli utenti. Il clustering, infatti, rappresenta uno strumento fondamentale per individuare gruppi omogenei di film sulla base di caratteristiche condivise, consentendo di rivelare pattern nascosti e relazioni latenti. Utilizzando un dataset di film distribuiti dal 2010 in poi, ottenuto tramite scraping dal sito IMDb, l’analisi combina metodologie statistiche e word embeddings, in modo da trattare dati di natura eterogenea.

Scheda

Scheda DC

	Facoltà/Dipartimento
	
				Dipartimento di Scienze Statistiche
			
	Corso di studio
	
				SCIENZE STATISTICHE Laurea Magistrale (D.M. 270/2004)
			
	Anno Accademico
	
				2024
			
	Titolo inglese
	
				Clustering in the Film Industry: An Analysis Supported by Large Language Models
			
	Parola chiave
	
				Clustering
Large Language Model
BERT
			
	Relatore
	
				ALIVERTI, EMANUELE
			
	Appare nelle tipologie:
	
				Lauree magistrali

File in questo prodotto:

File	Dimensione	Formato
Pisani_Chiara.pdf Accesso riservato Dimensione 5.97 MB Formato Adobe PDF	5.97 MB	Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/84092