The improvements in online data-acquisition have made it possible to collect a huge amount of data in many applications. The huge quantity of measurements generated sequentially and in real time by a wide range of sensors, known as big data, contains detailed information on the process that generated them, providing opportunities for the improvement of statistical control. However, online monitoring of this data is a challenging task: as the streams have a large volume and are generated at high speed, real-time analysis will necessarily be affected by hardware constraints. It is therefore often required to identify, record, and utilise only the most valuable information for real-time analysis. An example of high-dimensional data is given by images. Images are often analysed using a multivariate statistical approach commonly known in SPC as “Multivariate Image Analysis” (MIA). The main contribution of the present work is to compare two Phase II MIA approaches, named ST-PCA and SASAM, which deal with the statistical monitoring of images with two different dimensionality reduction approaches. Both procedures constitute an improvement of existing control charts in the literature, which is achieved in both cases through the inclusion of intrinsic spatial information in the monitored process. The aim is therefore to highlight possible advantages or disadvantages of these two procedures when applied to the same dataset, comparing the responsiveness of the charts, their computational efficiency and their effectiveness in detecting anomalies in the monitored process.

I progressi della misurazione online hanno permesso di raccogliere una mole ingente di dati in molte applicazioni. L'enorme quantità di rilevamenti generati sequenzialmente ed in tempo reale da una vasta gamma di sensori, nota come big data, contiene informazioni dettagliate sul processo che le ha generate, fornendo opportunità per il miglioramento della sorveglianza statistica. Tuttavia, la sorveglianza online di questi dati è un compito impegnativo: poiché i flussi hanno un grande volume e sono generati ad alta velocità, l'analisi in tempo reale sarà obbligatoriamente influenzata da vincoli hardware. Spesso è richiesto quindi di identificare, registrare ed utilizzare solamente le informazioni più preziose per l'analisi in tempo reale. Un esempio di dati ad alta dimensionalità è rappresentato dalle immagini. Le immagini vengono spesso analizzate attraverso un approccio statistico multivariato comunemente noto nell'SPC come “Multivariate Image Analysis” (MIA). Il contributo principale della presente trattazione consiste nel porre a confronto due approcci MIA di Fase II, denominati ST-PCA e SASAM, che trattano la sorveglianza statistica di immagini con due differenti approcci di riduzione dimensionale. Entrambe queste procedure costituiscono un miglioramento di carte di controllo esistenti in letteratura, il quale avviene in entrambi i casi grazie all’inclusione dell’informazione spaziale intrinseca nel processo monitorato. Lo scopo è dunque quello di evidenziare eventuali vantaggi o svantaggi di queste due procedure nel caso esse vengano applicate ad uno stesso dataset, confrontando la reattività delle carte, la loro efficienza in termini computazionali e la loro efficacia nel rilevare anomalie nel processo sorvegliato.

Sorveglianza statistica di immagini: confronto tra due approcci di riduzione dimensionale

TASINATO, FEDERICO
2021/2022

Abstract

The improvements in online data-acquisition have made it possible to collect a huge amount of data in many applications. The huge quantity of measurements generated sequentially and in real time by a wide range of sensors, known as big data, contains detailed information on the process that generated them, providing opportunities for the improvement of statistical control. However, online monitoring of this data is a challenging task: as the streams have a large volume and are generated at high speed, real-time analysis will necessarily be affected by hardware constraints. It is therefore often required to identify, record, and utilise only the most valuable information for real-time analysis. An example of high-dimensional data is given by images. Images are often analysed using a multivariate statistical approach commonly known in SPC as “Multivariate Image Analysis” (MIA). The main contribution of the present work is to compare two Phase II MIA approaches, named ST-PCA and SASAM, which deal with the statistical monitoring of images with two different dimensionality reduction approaches. Both procedures constitute an improvement of existing control charts in the literature, which is achieved in both cases through the inclusion of intrinsic spatial information in the monitored process. The aim is therefore to highlight possible advantages or disadvantages of these two procedures when applied to the same dataset, comparing the responsiveness of the charts, their computational efficiency and their effectiveness in detecting anomalies in the monitored process.
2021
Image-based statistical process control: a comparison between two dimensionality reduction approaches
I progressi della misurazione online hanno permesso di raccogliere una mole ingente di dati in molte applicazioni. L'enorme quantità di rilevamenti generati sequenzialmente ed in tempo reale da una vasta gamma di sensori, nota come big data, contiene informazioni dettagliate sul processo che le ha generate, fornendo opportunità per il miglioramento della sorveglianza statistica. Tuttavia, la sorveglianza online di questi dati è un compito impegnativo: poiché i flussi hanno un grande volume e sono generati ad alta velocità, l'analisi in tempo reale sarà obbligatoriamente influenzata da vincoli hardware. Spesso è richiesto quindi di identificare, registrare ed utilizzare solamente le informazioni più preziose per l'analisi in tempo reale. Un esempio di dati ad alta dimensionalità è rappresentato dalle immagini. Le immagini vengono spesso analizzate attraverso un approccio statistico multivariato comunemente noto nell'SPC come “Multivariate Image Analysis” (MIA). Il contributo principale della presente trattazione consiste nel porre a confronto due approcci MIA di Fase II, denominati ST-PCA e SASAM, che trattano la sorveglianza statistica di immagini con due differenti approcci di riduzione dimensionale. Entrambe queste procedure costituiscono un miglioramento di carte di controllo esistenti in letteratura, il quale avviene in entrambi i casi grazie all’inclusione dell’informazione spaziale intrinseca nel processo monitorato. Lo scopo è dunque quello di evidenziare eventuali vantaggi o svantaggi di queste due procedure nel caso esse vengano applicate ad uno stesso dataset, confrontando la reattività delle carte, la loro efficienza in termini computazionali e la loro efficacia nel rilevare anomalie nel processo sorvegliato.
SPC
immagini
big data
high-dimensional
File in questo prodotto:
File Dimensione Formato  
Tasinato_Federico.pdf

accesso aperto

Dimensione 10.21 MB
Formato Adobe PDF
10.21 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/33016