Predicting the secondary, i.e. base-pairing structure of a folded RNA strand is an important problem in synthetic and computational biology. First-principle algorithmic approaches to this task are challenging because existing models of the folding process are inaccurate, and even if a perfect model existed, finding an optimal solution would be in general NP-complete. It's propose a simple, yet extremely effective data-driven approach. It represents RNA sequences in the form of three-dimensional tensors in which we encode possible relations between all pairs of bases in a given sequence. It's then use a convolutional neural network to predict a two-dimensional map which represents the correct pairings between the bases. This model achieves significant accuracy improvements over existing methods on two standard datasets.

Predire il secondario, i.e. struttura di base-accoppiamento di un filamento di RNA piegato è un problema importante nella biologia sintetica e computazionale. Primo principio algoritmico approcci a questo compito sono difficili perché i modelli esistenti del processo di piegatura sono imprecisi, e anche se esistesse un modello perfetto, trovare una soluzione ottimale sarebbe in generale NP-completa. Si propone un semplice, ma estremamente efficace approccio data-driven. Si rappresenta le sequenze del RNA sotto forma di tridimensionale tensori in cui codifichiamo le possibili relazioni tra tutte le coppie di basi in un dato sequenza. E 'quindi utilizzare una rete neurale convoluzionale per prevedere una mappa bidimensionale che rappresenta gli accoppiamenti corretti tra le basi. Questo modello raggiunge significativi miglioramenti dell'accuratezza rispetto ai metodi esistenti su due set di dati standard.

Previsione della struttura secondaria del RNA con Reti Neurali Convoluzionali

BALDASSAR, DAVIDE
2022/2023

Abstract

Predicting the secondary, i.e. base-pairing structure of a folded RNA strand is an important problem in synthetic and computational biology. First-principle algorithmic approaches to this task are challenging because existing models of the folding process are inaccurate, and even if a perfect model existed, finding an optimal solution would be in general NP-complete. It's propose a simple, yet extremely effective data-driven approach. It represents RNA sequences in the form of three-dimensional tensors in which we encode possible relations between all pairs of bases in a given sequence. It's then use a convolutional neural network to predict a two-dimensional map which represents the correct pairings between the bases. This model achieves significant accuracy improvements over existing methods on two standard datasets.
2022
RNA secondary structure prediction with Convolutional Neural Networks
Predire il secondario, i.e. struttura di base-accoppiamento di un filamento di RNA piegato è un problema importante nella biologia sintetica e computazionale. Primo principio algoritmico approcci a questo compito sono difficili perché i modelli esistenti del processo di piegatura sono imprecisi, e anche se esistesse un modello perfetto, trovare una soluzione ottimale sarebbe in generale NP-completa. Si propone un semplice, ma estremamente efficace approccio data-driven. Si rappresenta le sequenze del RNA sotto forma di tridimensionale tensori in cui codifichiamo le possibili relazioni tra tutte le coppie di basi in un dato sequenza. E 'quindi utilizzare una rete neurale convoluzionale per prevedere una mappa bidimensionale che rappresenta gli accoppiamenti corretti tra le basi. Questo modello raggiunge significativi miglioramenti dell'accuratezza rispetto ai metodi esistenti su due set di dati standard.
RNA
Struttura secondaria
Reti neurali
File in questo prodotto:
File Dimensione Formato  
Baldassar_Davide.pdf

accesso riservato

Dimensione 814.62 kB
Formato Adobe PDF
814.62 kB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/48823