Ci troviamo in un’era in cui il numero di dati cosmologici è in costante aumento grazie all’uso di strumenti in grado di raccogliere sempre più informazione ed è quindi necessario sviluppare dei mezzi capaci di comprimere i dataset in summary statistics. Negli anni si è imposto l’uso di reti neurali per rispondere a questo problema, arrivando alle IMNN, in grado di analizzare attraverso l’uso di reti neurali spettri non lineari e altre statistiche più complesse. Teoricamente conosciamo la massima quantità d’informazione estraibile dalle varie statistiche, ma vo- gliamo testare quanto le reti neurali si avvicinano a tale limite. Partendo da questa idea, in questo lavoro viene studiata la capacità di diversi Multilayer Perceptron (MLP) fully-conncted di estrarre in modo ottimale l’informazione cosmologica contenuta nello spettro di potenza lineare del modello ΛCDM. L’obiettivo è valutare in che misura diverse architetture possano avvicinarsi al limite teorico fissato dalla matrice di Fisher del power spectrum fiduciale (dato dai parametri delle osservazioni Planck2018), in modo tale da ottenere la struttura che in maniera più ottimale estragga informa- zione sui parametri al meno costo. Ciò è utile in diverse applicazioni, tra le quali Simulation-based inference, per le quali è necessario comprimere informazione in modo efficiente sia dal punto di vista dell’estrazione sia per quanto riguarda il costo computazionale. Vengono generati 20 000 power spectrum tramite Latin Hypercube Sampling in due diversi insiemi di prior, uno ampio e uno ristretto attorno ai valori di Planck2018. I MLP vengono addestrati a ricostruire i parametri cosmologici, variando profondità e larghezza delle architetture, e valutati at- traverso errori relativi e confronto diretto tra la Fisher teorica e la Fisher del MLP. È inoltre proposta una formulazione approssimata della Fisher del MLP, validata confrontando le predizioni con il limite lineare. L’analisi mostra che l’informazione del power spectrum lineare satura per reti con profondità maggiore di cinque strati, mentre l’aumento del numero di neuroni ha un impatto marginale. Le architetture piramidali risultano le più efficaci nel regime di prior ampi, dimostrando una migliore capacità di generalizzazione. Questo lavoro pone una base per estensioni future dell’analisi a scale non lineari e più complesse del power spectrum.
Optimal information extraction from cosmological summary statistics with neural networks
ZUCCOTTI, NICOLA
2024/2025
Abstract
Ci troviamo in un’era in cui il numero di dati cosmologici è in costante aumento grazie all’uso di strumenti in grado di raccogliere sempre più informazione ed è quindi necessario sviluppare dei mezzi capaci di comprimere i dataset in summary statistics. Negli anni si è imposto l’uso di reti neurali per rispondere a questo problema, arrivando alle IMNN, in grado di analizzare attraverso l’uso di reti neurali spettri non lineari e altre statistiche più complesse. Teoricamente conosciamo la massima quantità d’informazione estraibile dalle varie statistiche, ma vo- gliamo testare quanto le reti neurali si avvicinano a tale limite. Partendo da questa idea, in questo lavoro viene studiata la capacità di diversi Multilayer Perceptron (MLP) fully-conncted di estrarre in modo ottimale l’informazione cosmologica contenuta nello spettro di potenza lineare del modello ΛCDM. L’obiettivo è valutare in che misura diverse architetture possano avvicinarsi al limite teorico fissato dalla matrice di Fisher del power spectrum fiduciale (dato dai parametri delle osservazioni Planck2018), in modo tale da ottenere la struttura che in maniera più ottimale estragga informa- zione sui parametri al meno costo. Ciò è utile in diverse applicazioni, tra le quali Simulation-based inference, per le quali è necessario comprimere informazione in modo efficiente sia dal punto di vista dell’estrazione sia per quanto riguarda il costo computazionale. Vengono generati 20 000 power spectrum tramite Latin Hypercube Sampling in due diversi insiemi di prior, uno ampio e uno ristretto attorno ai valori di Planck2018. I MLP vengono addestrati a ricostruire i parametri cosmologici, variando profondità e larghezza delle architetture, e valutati at- traverso errori relativi e confronto diretto tra la Fisher teorica e la Fisher del MLP. È inoltre proposta una formulazione approssimata della Fisher del MLP, validata confrontando le predizioni con il limite lineare. L’analisi mostra che l’informazione del power spectrum lineare satura per reti con profondità maggiore di cinque strati, mentre l’aumento del numero di neuroni ha un impatto marginale. Le architetture piramidali risultano le più efficaci nel regime di prior ampi, dimostrando una migliore capacità di generalizzazione. Questo lavoro pone una base per estensioni future dell’analisi a scale non lineari e più complesse del power spectrum.| File | Dimensione | Formato | |
|---|---|---|---|
|
Zuccotti_Nicola.pdf
accesso aperto
Dimensione
4.46 MB
Formato
Adobe PDF
|
4.46 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/100499