La presente tesi descrive lo sviluppo di due estensioni Chrome, progettate per automatizzare l'estrazione e l'analisi di contenuti web tramite tecniche di web scraping. La prima estensione si concentra sull’automazione nell’ambito dei social network, permettendo l’estrazione di dati dai post presenti sul proprio profilo social, facilitando così la gestione e l’analisi delle interazioni social. La seconda estensione è dedicata all’analisi dell’accessibilità dei siti web, identificando immagini prive di testo alternativo (alt) e video senza sottotitoli. Inoltre, attraverso l’integrazione con modelli linguistici di grandi dimensioni (LLM) forniti dall’azienda proponente, l’estensione è in grado di generare automaticamente descrizioni testuali e sottotitoli mancanti.
Estensioni Chrome per il web scraping: dall’automazione sui social network all’analisi dell’accessibilità dei siti
BIANCHI, ENRICO
2024/2025
Abstract
La presente tesi descrive lo sviluppo di due estensioni Chrome, progettate per automatizzare l'estrazione e l'analisi di contenuti web tramite tecniche di web scraping. La prima estensione si concentra sull’automazione nell’ambito dei social network, permettendo l’estrazione di dati dai post presenti sul proprio profilo social, facilitando così la gestione e l’analisi delle interazioni social. La seconda estensione è dedicata all’analisi dell’accessibilità dei siti web, identificando immagini prive di testo alternativo (alt) e video senza sottotitoli. Inoltre, attraverso l’integrazione con modelli linguistici di grandi dimensioni (LLM) forniti dall’azienda proponente, l’estensione è in grado di generare automaticamente descrizioni testuali e sottotitoli mancanti.| File | Dimensione | Formato | |
|---|---|---|---|
|
thesis.pdf
accesso aperto
Dimensione
2.58 MB
Formato
Adobe PDF
|
2.58 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/102042