Title: RNA structure: tRNA
1RNA structure tRNA
GCGGAUUUAGCUCAGUUGGGAGAGCGCCAGACUGAAUAUCUGGAGGUCCU
GUGUUCGAUCCCACAGAAUUCGCACCA
2RNA Bio-Algorithmics
- Structure prediction
- given one sequence
- or given a set of (homologous) sequences
- Design sequence prediction (given structure)
- Structural pattern-matching
- Comparison of two or several structures
3RNA structure levels
RNA structure Graph of bounded degree,
containing a (known) hamiltonian path. ?
Arc-annotated sequences
Crossing (Secondary structure with pseudoknots)
General (Tertiary structure)
Plain (Primary structure)
Nested (Secondary structure without pseudoknots)
4The Chomsky Hierarchy
Language
Automaton
Grammar
Recognition
Dependency
Biology
Recursively Enumerable Languages
Turing Machine
Unrestricted Baa ? A
Undecidable
Arbitrary
Unknown
Context- Sensitive Languages
Linear-Bounded
Context-Sensitive At ? aA
NP-Complete
Crossing
Pseudoknots, etc.
Context- Free Languages
Pushdown (stack)
Context-Free S ? gSc
Polynomial
Nested
Orthodox 2o Structure
Regular Languages
Finite-State Machine
Regular A ? cA
Linear
Strictly Local
Central Dogma
From D. Searls
5Prédiction de structure dARN
Séquence ? Structure de plus faible énergie libre
(selon un modèle dénergie
donné)
GCGGAUUUAGCUCAGUUGGGAGAGCGCCAGACUGAAUAUCUGGAGGUCCU
GUGUUCGAUCCCACAGAAUUCGCACCA
6La prédiction de structure dARN est un problème
NP-complet.
Lyngso, Pedersen 2000
7Que faire face à un pb NP-complet ?
- Chercher un algorithme exact fûté (mais sans
garantie de temps) - Chercher un algorithme dapproximation
- Chercher une heuristique dapproximation
- Contraindre les données du problème
GCGGAUUUAGCUCAGUUGGGAGAGCGCCAGACUGAAUAUCUGGAGGUCCU
GUGUUCGAUCCCACAGAAUUCGCACCA
8Prédiction de structure Nussinov (1978)
- Prédiction de structure
- sans pseudo-nœud,
- en maximisant le nombre de nucléotides appariés.
- ?(i,j) nombre dappariements dans la structure
entre les ième et jème nucléotides. - d(i,j) 1 si i et j sont appariables, 0 sinon.
9Algorithme de Nussinov (1978)
2.
1.
3.
Les 4 façons possibles de construire la meilleure
structure entre i et j, connaissant les
meilleures sous-structures entre i1 et j-1.
4.
10Le plus utilisé mfold (Zuker-Stiegler)
11RNA Bio-Algorithmics
- Structure prediction
- given one sequence
- or given a set of (homologous) sequences
- Design sequence prediction (given structure)
- Structural pattern-matching
- Comparison of two or several structures