La recente crescita nella disponibilità di dati referenziati tramite coordinate, oltre alla parallela facilità nell'accesso ad una moltitudine di informazioni, ha reso possibile lo sviluppo di una branca della statistica dedicata all'analisi di fenomeni e strutture difficilmente indagabili senza considerarne la natura spaziale. È molto frequente, quando si trattano dati aventi tale natura, imbattersi in misure rilevate su scale continue, certamente importanti in un gran numero di applicazioni. Si pensi, come accennato in precedenza, a fenomeni meteorologici quali precipitazioni, temperature e rilevazioni climatiche in genere piuttosto che a studi topografici relativi ad altitudine o profondità marine. In sintesi, i dati spaziali “continui” sono caratterizzati dall'assenza di confini definiti e da transizioni progressive e “lisce” tra i diversi valori appartenenti al supporto della variabile di interesse. Talvolta, però, l'informazione disponibile e gli scopi di ricerca sono maggiormente compatibili con problemi a cui, nell'analisi statistica e nel “data mining”, ci si riferisce col nome di “classificazione”. Sono questi i casi in cui le rilevazioni vengono espresse sotto forma di variabili dicotomiche ad indicare la presenza (o assenza) di un determinato carattere oppure, generalizzando la casistica, di variabili categoriali. In questo secondo caso, sia possibile imbattersi sia in variabili categoriali sconnesse, sia in variabili categoriali ordinali. Risulta evidente come la presenza di una scala ordinale fornisca maggiore informazione e possa semplificare il lavoro dell'analista. Nel presente lavoro, di conseguenza, l'attenzione è rivolta a questa tipologia di dati, facendo particolare riferimento a variabili di natura sconnessa come l'utilizzazione e la copertura del suolo. Dopo un capitolo introduttivo dedicato ai dati spaziali e alle loro caratteristiche intrinseche, si illustrano i principali metodi di analisi utilizzati attualmente. Successivamente viene testato il modello di riferimento per dati categoriali, ovvero quello che fa utilizzo dei cosiddetti “transiogrammi”, mediante opportune simulazioni in diverse condizioni e tramite il confronto con un altro metodo di ricostruzione delle immagini. Infine, il modello viene applicato a diversi casi di studio per valutarne l’utilità in contesti reali. In conclusione, la disponibilità di un modello parametrico per l'analisi della dipendenza spaziale nel contesto di dati categoriali permette di trattare con successo le informazioni disponibili e indicizzate da un sistema di coordinate. Trattandosi, inoltre, di un modello dalla grande facilità interpretativa e dalla flessibilità delle sue specificazioni, risulta potenzialmente trasferibile in altri contesti applicativi, come quelli socio-economico, medico o geologico. Per il prosieguo della trattazione relativa al metodo MCS, alcuni futuri sviluppi possibili possono riguardare generalizzazioni ed estensioni del modello, ad esempio introducendo effetti anisotropici, diversi tipi di transiogrammi teorici, funzioni non parametriche per la stima degli stessi e, possibilmente, l'introduzione di variabili esogene che consentano una previsione più accurata del processo di interesse.
Metodi statistici per l'analisi di dati spaziali categoriali: un'applicazione su dati di utilizzazione del suolo
GUGOLE, FRANCESCO
2021/2022
Abstract
La recente crescita nella disponibilità di dati referenziati tramite coordinate, oltre alla parallela facilità nell'accesso ad una moltitudine di informazioni, ha reso possibile lo sviluppo di una branca della statistica dedicata all'analisi di fenomeni e strutture difficilmente indagabili senza considerarne la natura spaziale. È molto frequente, quando si trattano dati aventi tale natura, imbattersi in misure rilevate su scale continue, certamente importanti in un gran numero di applicazioni. Si pensi, come accennato in precedenza, a fenomeni meteorologici quali precipitazioni, temperature e rilevazioni climatiche in genere piuttosto che a studi topografici relativi ad altitudine o profondità marine. In sintesi, i dati spaziali “continui” sono caratterizzati dall'assenza di confini definiti e da transizioni progressive e “lisce” tra i diversi valori appartenenti al supporto della variabile di interesse. Talvolta, però, l'informazione disponibile e gli scopi di ricerca sono maggiormente compatibili con problemi a cui, nell'analisi statistica e nel “data mining”, ci si riferisce col nome di “classificazione”. Sono questi i casi in cui le rilevazioni vengono espresse sotto forma di variabili dicotomiche ad indicare la presenza (o assenza) di un determinato carattere oppure, generalizzando la casistica, di variabili categoriali. In questo secondo caso, sia possibile imbattersi sia in variabili categoriali sconnesse, sia in variabili categoriali ordinali. Risulta evidente come la presenza di una scala ordinale fornisca maggiore informazione e possa semplificare il lavoro dell'analista. Nel presente lavoro, di conseguenza, l'attenzione è rivolta a questa tipologia di dati, facendo particolare riferimento a variabili di natura sconnessa come l'utilizzazione e la copertura del suolo. Dopo un capitolo introduttivo dedicato ai dati spaziali e alle loro caratteristiche intrinseche, si illustrano i principali metodi di analisi utilizzati attualmente. Successivamente viene testato il modello di riferimento per dati categoriali, ovvero quello che fa utilizzo dei cosiddetti “transiogrammi”, mediante opportune simulazioni in diverse condizioni e tramite il confronto con un altro metodo di ricostruzione delle immagini. Infine, il modello viene applicato a diversi casi di studio per valutarne l’utilità in contesti reali. In conclusione, la disponibilità di un modello parametrico per l'analisi della dipendenza spaziale nel contesto di dati categoriali permette di trattare con successo le informazioni disponibili e indicizzate da un sistema di coordinate. Trattandosi, inoltre, di un modello dalla grande facilità interpretativa e dalla flessibilità delle sue specificazioni, risulta potenzialmente trasferibile in altri contesti applicativi, come quelli socio-economico, medico o geologico. Per il prosieguo della trattazione relativa al metodo MCS, alcuni futuri sviluppi possibili possono riguardare generalizzazioni ed estensioni del modello, ad esempio introducendo effetti anisotropici, diversi tipi di transiogrammi teorici, funzioni non parametriche per la stima degli stessi e, possibilmente, l'introduzione di variabili esogene che consentano una previsione più accurata del processo di interesse.File | Dimensione | Formato | |
---|---|---|---|
Gugole_Francesco.pdf
accesso aperto
Dimensione
19.44 MB
Formato
Adobe PDF
|
19.44 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/11374