La presente tesi descrive lo sviluppo di due estensioni Chrome, progettate per automatizzare l'estrazione e l'analisi di contenuti web tramite tecniche di web scraping. La prima estensione si concentra sull’automazione nell’ambito dei social network, permettendo l’estrazione di dati dai post presenti sul proprio profilo social, facilitando così la gestione e l’analisi delle interazioni social. La seconda estensione è dedicata all’analisi dell’accessibilità dei siti web, identificando immagini prive di testo alternativo (alt) e video senza sottotitoli. Inoltre, attraverso l’integrazione con modelli linguistici di grandi dimensioni (LLM) forniti dall’azienda proponente, l’estensione è in grado di generare automaticamente descrizioni testuali e sottotitoli mancanti.

Estensioni Chrome per il web scraping: dall’automazione sui social network all’analisi dell’accessibilità dei siti

BIANCHI, ENRICO
2024/2025

Abstract

La presente tesi descrive lo sviluppo di due estensioni Chrome, progettate per automatizzare l'estrazione e l'analisi di contenuti web tramite tecniche di web scraping. La prima estensione si concentra sull’automazione nell’ambito dei social network, permettendo l’estrazione di dati dai post presenti sul proprio profilo social, facilitando così la gestione e l’analisi delle interazioni social. La seconda estensione è dedicata all’analisi dell’accessibilità dei siti web, identificando immagini prive di testo alternativo (alt) e video senza sottotitoli. Inoltre, attraverso l’integrazione con modelli linguistici di grandi dimensioni (LLM) forniti dall’azienda proponente, l’estensione è in grado di generare automaticamente descrizioni testuali e sottotitoli mancanti.
2024
Chrome Extensions for web scraping: from social network automation to website accessibility analysis
Estensione Chrome
Web scraping
Automazione social
Accessibilità web
File in questo prodotto:
File Dimensione Formato  
thesis.pdf

accesso aperto

Dimensione 2.58 MB
Formato Adobe PDF
2.58 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/102042