Most of the data available online are published as unstructured making them easy to view but difficult to analyze for statistical purposes. Data are extracted from web pages using web scraping techniques, are processed, structured stored using databases and analyzed. This paper focuses on track and field competitions of Federazione Italiana di Atletica Leggera and program and database development for extraction and storage of events data. The goal is to allow a statistical analysis of the competitions based on place, category, type of competition, event and attendance.
La maggior parte dei dati presenti su internet sono distribuiti in modo non strutturato rendendo facilmente fruibile la consultazione ma difficile un’analisi complessiva ai fini statistici. Le tecniche di web scraping permettono di estrarre i dati dalle pagine web per consentirne l'elaborazione, l'archiviazione strutturata mediante database e l'analisi. Questa tesi prende in esame le manifestazioni della Federazione Italiana di Atletica Leggera e lo sviluppo del programma e del database per l'estrazione e l'archiviazione dei dati derivanti dalle gare. L'obiettivo è consentire un’analisi statistica delle manifestazioni per località, categoria degli atleti, tipologia di manifestazione, specialità e partecipazione.
Web scraping per l'atletica: estrazione dati, elaborazione ed archiviazione per l'analisi statistica delle manifestazioni FIDAL
PELLEGRINI, LUCA
2022/2023
Abstract
Most of the data available online are published as unstructured making them easy to view but difficult to analyze for statistical purposes. Data are extracted from web pages using web scraping techniques, are processed, structured stored using databases and analyzed. This paper focuses on track and field competitions of Federazione Italiana di Atletica Leggera and program and database development for extraction and storage of events data. The goal is to allow a statistical analysis of the competitions based on place, category, type of competition, event and attendance.File | Dimensione | Formato | |
---|---|---|---|
Pellegrini_Luca.pdf
accesso aperto
Dimensione
1.75 MB
Formato
Adobe PDF
|
1.75 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/52397