Metagenomics is the study of microbial communities directly in their environment. In this context, a fundamental operation is the taxonomic classification of metagenomic sequences. This process requires the development of increasingly performing tools in terms of time and reliability. Kraken 2 is a software that allows the assignment of taxonomic labels to sequencing reads. However, to make the software more performing, have been adopted techniques that may produce some errors in the classification. In this thesis, we will evaluate the kraken 2 error rate for sequences of different lengths.

La metagenomica consiste nello studio di comunità microbiche direttamente nel loro ambiente. In quest’ambito, un’operazione fondamentale è la classificazione tassonomica di sequenze metagenomiche. Questo processo richiede lo sviluppo di strumenti sempre più performanti in termini di tempo e affidabilità. Kraken 2 è un software che permette l’assegnamento di etichette tassonomiche alle letture di sequenziamento. Tuttavia, per rendere il software più performante, sono state adottate delle tecniche che possono introdurre un errore nella classificazione. In questa tesi, si valuterà il tasso d’errore di kraken 2 per sequenze di lunghezze diverse.

Valutazione del tasso d'errore di Kraken 2 per sequenze metagenomiche di lunghezze variabili

TRINCANATO, MARCO
2021/2022

Abstract

Metagenomics is the study of microbial communities directly in their environment. In this context, a fundamental operation is the taxonomic classification of metagenomic sequences. This process requires the development of increasingly performing tools in terms of time and reliability. Kraken 2 is a software that allows the assignment of taxonomic labels to sequencing reads. However, to make the software more performing, have been adopted techniques that may produce some errors in the classification. In this thesis, we will evaluate the kraken 2 error rate for sequences of different lengths.
2021
Evaluation of the Kraken 2 error rate for metagenomic sequences of variable lengths
La metagenomica consiste nello studio di comunità microbiche direttamente nel loro ambiente. In quest’ambito, un’operazione fondamentale è la classificazione tassonomica di sequenze metagenomiche. Questo processo richiede lo sviluppo di strumenti sempre più performanti in termini di tempo e affidabilità. Kraken 2 è un software che permette l’assegnamento di etichette tassonomiche alle letture di sequenziamento. Tuttavia, per rendere il software più performante, sono state adottate delle tecniche che possono introdurre un errore nella classificazione. In questa tesi, si valuterà il tasso d’errore di kraken 2 per sequenze di lunghezze diverse.
bioinformatica
metagenomica
kraken
File in questo prodotto:
File Dimensione Formato  
Trincanato_Marco.pdf

accesso aperto

Dimensione 1.25 MB
Formato Adobe PDF
1.25 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/34682