Metagenomics is one of the main fields of application of bioinformatics. Metagenomics deals with the study of communities of microbial organisms directly in their natural environments, bypassing the need for isolation and lab cultivation of individual species. Next-generation sequencing technologies enable us to sequence whole genomes in just a few hours, thus producing huge quantities of data on a daily basis. We therefore need efficient tools to analyze this data. In recent years, many different pieces of software have been developed, which levarage modern deep learning techniques to study this metagenomic data. In this work, we'll focus on one specific such software, DeepVirFinder, which uses a convolutional neural network to identify viral sequences in metagenomic data. We'll describe the architecture of DeepVirFinder in great detail, and we'll analyze its performace through some experiments.

Uno dei principali campi di applicazione della moderna bioinformatica è la metagenomica, che si occupa di studiare le comunità microbiche direttamente nel loro ambiente naturale, senza la necessità di isolare e coltivare in laboratorio le singole specie. Le tecnologie di sequenziamento di nuova generazione permettono di sequenziare interi genomi in poche ore, generando quotidianamente enormi quantità di dati, che necessitano di strumenti efficaci per essere analizzati. Negli ultimi anni, sono stati sviluppati diversi software che sfruttano moderne tecniche di deep learning per studiare i dati metagenomici. In questo elaborato ci concentreremo in particolare su uno di questi software, DeepVirFinder, che sfrutta una rete neurale convoluzionale per identificare sequenze virali all'interno di dati metagenomici. Descriveremo nel dettaglio l'architettura del modello di DeepVirFinder, e ne analizzeremo le prestazioni attraverso alcuni esperimenti.

Analisi delle prestazioni di DeepVirFinder nell'identificazione di sequenze virali

PELLEGRINI, LUCA
2023/2024

Abstract

Metagenomics is one of the main fields of application of bioinformatics. Metagenomics deals with the study of communities of microbial organisms directly in their natural environments, bypassing the need for isolation and lab cultivation of individual species. Next-generation sequencing technologies enable us to sequence whole genomes in just a few hours, thus producing huge quantities of data on a daily basis. We therefore need efficient tools to analyze this data. In recent years, many different pieces of software have been developed, which levarage modern deep learning techniques to study this metagenomic data. In this work, we'll focus on one specific such software, DeepVirFinder, which uses a convolutional neural network to identify viral sequences in metagenomic data. We'll describe the architecture of DeepVirFinder in great detail, and we'll analyze its performace through some experiments.
2023
Analysis of DeepVirFinder performance at identifying viral sequences
Uno dei principali campi di applicazione della moderna bioinformatica è la metagenomica, che si occupa di studiare le comunità microbiche direttamente nel loro ambiente naturale, senza la necessità di isolare e coltivare in laboratorio le singole specie. Le tecnologie di sequenziamento di nuova generazione permettono di sequenziare interi genomi in poche ore, generando quotidianamente enormi quantità di dati, che necessitano di strumenti efficaci per essere analizzati. Negli ultimi anni, sono stati sviluppati diversi software che sfruttano moderne tecniche di deep learning per studiare i dati metagenomici. In questo elaborato ci concentreremo in particolare su uno di questi software, DeepVirFinder, che sfrutta una rete neurale convoluzionale per identificare sequenze virali all'interno di dati metagenomici. Descriveremo nel dettaglio l'architettura del modello di DeepVirFinder, e ne analizzeremo le prestazioni attraverso alcuni esperimenti.
bioinformatica
metagenomica
virus
DeepVirFinder
File in questo prodotto:
File Dimensione Formato  
Pellegrini_Luca.pdf

accesso aperto

Dimensione 2.12 MB
Formato Adobe PDF
2.12 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/71134