Over the past decades, thanks to the advancement of information technology, there has been an explosion in data available from a wide variety of contexts. In some of these, such as the social sciences, we are interested in studying the relationship among individuals. In this case, subjects and their relations are represented mathematically through a graph (or network). This change in perspective, where we cannot assume the observations are independent, poses a difficulty for some of the statistical instruments used in more "classical" contexts. In fact, it's the dependence among these observations that is of interest. This new context has made necessary the revision of some statistical methods, or even to design new ones, in order to properly represent and analyze this new type of data. In this work we give an overview of some of these methods, focusing in particular on sampling and bootstrap techniques for network data. In particular, we will be studying how to efficiently obtain confidence intervals for the mean degree of a network.

Negli ultimi anni, grazie anche allo sviluppo delle tecnologie informatiche, si è assistito ad un aumento della mole di dati disponibile da analizzare nei contesti più disparati. In alcuni di questi, come ad esempio le scienze sociali, è di interesse studiare le relazioni tra i vari soggetti osservati. In questo caso le relazioni tra le unità vengono rappresentate matematicamente tramite un grafo (o rete). Questo cambiamento pone alcuni dei concetti della statistica concepita in contesti più “classici” in difficoltà in quanto non si può assumere l’indipendeza delle osservazioni di cui si dispone. Anzi, è proprio la dipendeza tra le unità osservate ad essere d’interesse. Questo nuovo contesto in cui ci si è trovati ad operare ha fatto sı̀ che fosse necessario rivedere alcuni degli strumenti statistici concepiti in precedenza, o di concepirne di nuovi, in modo da poterli adattare a questo particolare tipo di dato. In questo lavoro si vuole dare una rassegna di alcuni di questi metodi, concentrandosi in particolare sul campionamento e sul bootstrap applicato ai dati di rete. Nello specifico, si andrà a studiare come ottenere degli intervalli di confidenza in modo efficiente per il grado medio di una rete.

Metodi Bootstrap per l'Inferenza su Grafi Casuali

CALDARONE, ALEX JOHN
2023/2024

Abstract

Over the past decades, thanks to the advancement of information technology, there has been an explosion in data available from a wide variety of contexts. In some of these, such as the social sciences, we are interested in studying the relationship among individuals. In this case, subjects and their relations are represented mathematically through a graph (or network). This change in perspective, where we cannot assume the observations are independent, poses a difficulty for some of the statistical instruments used in more "classical" contexts. In fact, it's the dependence among these observations that is of interest. This new context has made necessary the revision of some statistical methods, or even to design new ones, in order to properly represent and analyze this new type of data. In this work we give an overview of some of these methods, focusing in particular on sampling and bootstrap techniques for network data. In particular, we will be studying how to efficiently obtain confidence intervals for the mean degree of a network.
2023
Bootstrap Methods for Inference on Random Graphs
Negli ultimi anni, grazie anche allo sviluppo delle tecnologie informatiche, si è assistito ad un aumento della mole di dati disponibile da analizzare nei contesti più disparati. In alcuni di questi, come ad esempio le scienze sociali, è di interesse studiare le relazioni tra i vari soggetti osservati. In questo caso le relazioni tra le unità vengono rappresentate matematicamente tramite un grafo (o rete). Questo cambiamento pone alcuni dei concetti della statistica concepita in contesti più “classici” in difficoltà in quanto non si può assumere l’indipendeza delle osservazioni di cui si dispone. Anzi, è proprio la dipendeza tra le unità osservate ad essere d’interesse. Questo nuovo contesto in cui ci si è trovati ad operare ha fatto sı̀ che fosse necessario rivedere alcuni degli strumenti statistici concepiti in precedenza, o di concepirne di nuovi, in modo da poterli adattare a questo particolare tipo di dato. In questo lavoro si vuole dare una rassegna di alcuni di questi metodi, concentrandosi in particolare sul campionamento e sul bootstrap applicato ai dati di rete. Nello specifico, si andrà a studiare come ottenere degli intervalli di confidenza in modo efficiente per il grado medio di una rete.
Bootstrap
Inferenza
Grafi
File in questo prodotto:
File Dimensione Formato  
Caldarone_AlexJohn_PDFA.pdf

accesso aperto

Dimensione 1.71 MB
Formato Adobe PDF
1.71 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/71247