Most of the data available online are published as unstructured making them easy to view but difficult to analyze for statistical purposes. Data are extracted from web pages using web scraping techniques, are processed, structured stored using databases and analyzed. This paper focuses on track and field competitions of Federazione Italiana di Atletica Leggera and program and database development for extraction and storage of events data. The goal is to allow a statistical analysis of the competitions based on place, category, type of competition, event and attendance.

La maggior parte dei dati presenti su internet sono distribuiti in modo non strutturato rendendo facilmente fruibile la consultazione ma difficile un’analisi complessiva ai fini statistici. Le tecniche di web scraping permettono di estrarre i dati dalle pagine web per consentirne l'elaborazione, l'archiviazione strutturata mediante database e l'analisi. Questa tesi prende in esame le manifestazioni della Federazione Italiana di Atletica Leggera e lo sviluppo del programma e del database per l'estrazione e l'archiviazione dei dati derivanti dalle gare. L'obiettivo è consentire un’analisi statistica delle manifestazioni per località, categoria degli atleti, tipologia di manifestazione, specialità e partecipazione.

Web scraping per l'atletica: estrazione dati, elaborazione ed archiviazione per l'analisi statistica delle manifestazioni FIDAL

PELLEGRINI, LUCA
2022/2023

Abstract

Most of the data available online are published as unstructured making them easy to view but difficult to analyze for statistical purposes. Data are extracted from web pages using web scraping techniques, are processed, structured stored using databases and analyzed. This paper focuses on track and field competitions of Federazione Italiana di Atletica Leggera and program and database development for extraction and storage of events data. The goal is to allow a statistical analysis of the competitions based on place, category, type of competition, event and attendance.
2022
Web scraping for track and field: data extraction, processing and storage for statistical analysis of FIDAL events
La maggior parte dei dati presenti su internet sono distribuiti in modo non strutturato rendendo facilmente fruibile la consultazione ma difficile un’analisi complessiva ai fini statistici. Le tecniche di web scraping permettono di estrarre i dati dalle pagine web per consentirne l'elaborazione, l'archiviazione strutturata mediante database e l'analisi. Questa tesi prende in esame le manifestazioni della Federazione Italiana di Atletica Leggera e lo sviluppo del programma e del database per l'estrazione e l'archiviazione dei dati derivanti dalle gare. L'obiettivo è consentire un’analisi statistica delle manifestazioni per località, categoria degli atleti, tipologia di manifestazione, specialità e partecipazione.
web scraping
database
atletica
File in questo prodotto:
File Dimensione Formato  
Pellegrini_Luca.pdf

accesso aperto

Dimensione 1.75 MB
Formato Adobe PDF
1.75 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/52397