The activities of complex communities of microbes, called microbiota, affect a great number of ecosystems, from the human body to the soil. These microbes engage with one another and with the environment to compose ecological communities that can be represented through an interaction network. The study of these ecological networks is the first step in understanding how targeted modifications of the microbiota may be used to shape the environment to a desired state. In recent years high-throughput sequencing techniques, such as 16S ribosomal RNA gene sequencing (16S-rDNA-seq experiments) have provided valuable insights into these microbiota communities’ compositions. Based on these data several co-occurrence network inference techniques have been proposed. This work aims to evaluate the validity of common methods for inferring microbial ecological networks through the use of in-silico-generated data coming from realistic simulations. We evaluate 15 network inference methods across several simulation scenarios (e.g., different network topologies, different number of species, ...) in terms of adherence of the reconstructed network to the assumed ground truth and by applying classical network analysis on both the true and inferred networks. We found that methods described the interaction patterns rather inadequately especially as the density and/or the level of competition increases. The results indicate that co-occurrence network approaches may be insufficient in interpreting species interactions in microbiome studies and that further development is needed in the field.

Le attivià di complesse comunità di microrganismi, chiamate microbiota, influenzano vari ecosistemi, dal corpo umano fino al suolo. Questi microrganismi interagiscono tra di loro e con l’ambiente circostante per formare delle comunit`a ecologiche che possono essere rappresentate attraverso un network di interazioni. Lo studio di questi network è il primo passo per capire come interventi mirati per modificare la composizione del microbiota possano essere usati per manipolare l’ambiente con cui il microbiota interagisce. Negli ultimi anni le tecnologie di sequenziamento di nuova generazione, come il sequenziamento del gene ribosomale 16S RNA (16S rDNA-seq), hanno fornito importanti informazioni sulla composizione di queste comunità di microrganismi. Sulla base di questi dati diverse tecniche di inferenza per stimare il network delle comunità sono stati proposti. Lo scopo di questo elaborato di tesi è valutare la validità di questi metodi di inferenza usando dati sintetici generati da simulazioni realistiche. Abbiamo valutato le performance di 15 metodi di inferenza, variando diversi scenari di simulazione (topologie del network, numero di specie, numero di campioni, ...), in termini di somiglianza del network ricostruito con quello vero e applicando varie tecniche di analisi dei grafi. I risultati ottenuti mostrano come i vari metodi descrivono i pattern di interazione in modo non ottimale specialmente all’aumentare della densità e del livello di competizione tra le specie. In generale gli esiti finali indicano che basare l’inferenza di network di associazioni solamente su dati di abbondanze potrebbe non essere sufficiente per interpretare le complesse interazioni presenti nelle comunit`a di microrganismi. Questo sembra indicare che siano necessari maggiori sforzi di ricerca per migliorare gli attuali metodi di inferenza o per sviluppare nuovi approcci.

Benchmarking of network inference methods applied to 16S rDNA-seq data

MARIOTTO, PIERO
2023/2024

Abstract

The activities of complex communities of microbes, called microbiota, affect a great number of ecosystems, from the human body to the soil. These microbes engage with one another and with the environment to compose ecological communities that can be represented through an interaction network. The study of these ecological networks is the first step in understanding how targeted modifications of the microbiota may be used to shape the environment to a desired state. In recent years high-throughput sequencing techniques, such as 16S ribosomal RNA gene sequencing (16S-rDNA-seq experiments) have provided valuable insights into these microbiota communities’ compositions. Based on these data several co-occurrence network inference techniques have been proposed. This work aims to evaluate the validity of common methods for inferring microbial ecological networks through the use of in-silico-generated data coming from realistic simulations. We evaluate 15 network inference methods across several simulation scenarios (e.g., different network topologies, different number of species, ...) in terms of adherence of the reconstructed network to the assumed ground truth and by applying classical network analysis on both the true and inferred networks. We found that methods described the interaction patterns rather inadequately especially as the density and/or the level of competition increases. The results indicate that co-occurrence network approaches may be insufficient in interpreting species interactions in microbiome studies and that further development is needed in the field.
2023
Benchmarking of network inference methods applied to 16S rDNA-seq data
Le attivià di complesse comunità di microrganismi, chiamate microbiota, influenzano vari ecosistemi, dal corpo umano fino al suolo. Questi microrganismi interagiscono tra di loro e con l’ambiente circostante per formare delle comunit`a ecologiche che possono essere rappresentate attraverso un network di interazioni. Lo studio di questi network è il primo passo per capire come interventi mirati per modificare la composizione del microbiota possano essere usati per manipolare l’ambiente con cui il microbiota interagisce. Negli ultimi anni le tecnologie di sequenziamento di nuova generazione, come il sequenziamento del gene ribosomale 16S RNA (16S rDNA-seq), hanno fornito importanti informazioni sulla composizione di queste comunità di microrganismi. Sulla base di questi dati diverse tecniche di inferenza per stimare il network delle comunità sono stati proposti. Lo scopo di questo elaborato di tesi è valutare la validità di questi metodi di inferenza usando dati sintetici generati da simulazioni realistiche. Abbiamo valutato le performance di 15 metodi di inferenza, variando diversi scenari di simulazione (topologie del network, numero di specie, numero di campioni, ...), in termini di somiglianza del network ricostruito con quello vero e applicando varie tecniche di analisi dei grafi. I risultati ottenuti mostrano come i vari metodi descrivono i pattern di interazione in modo non ottimale specialmente all’aumentare della densità e del livello di competizione tra le specie. In generale gli esiti finali indicano che basare l’inferenza di network di associazioni solamente su dati di abbondanze potrebbe non essere sufficiente per interpretare le complesse interazioni presenti nelle comunit`a di microrganismi. Questo sembra indicare che siano necessari maggiori sforzi di ricerca per migliorare gli attuali metodi di inferenza o per sviluppare nuovi approcci.
Network Inference
Benchmarking
Microbiota
16S rDNA-seq data
File in questo prodotto:
File Dimensione Formato  
Mariotto_Piero.pdf

embargo fino al 07/03/2027

Dimensione 4.94 MB
Formato Adobe PDF
4.94 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/62372