Title: NP-compl
1NP-complétude de EDIT(Nested, Nested)
- G.Blin, G. Fertin, I. Rusu, C. Sinoquet
Institut de Recherche en Informatique de Nantes
2Motivations
- Comparaison de structures secondaires dARN.
- Prise en compte simultanément des structures
primaire et secondaire. - Études plus pertinentes
- Réponse à un problème ouvert proposé par Zhang et
al en 2001
3EDIT(Nested, Nested) ?
- Distance dédition entre deux séquences annotées
par des arcs. - Plain
- Nested
- Crossing
- Unlimited
ACGUCCGUGCAUAUUAA
(op1,op2,), (op4,op1,),
CGUCGGAUCUAGCUAUC
C1
C2
min
Distance dédition
4EDIT(Nested, Nested) ?
- Opérations sur les bases
- Suppression wd,
- Insertion wd,
- Substitution wm
U A
U U
- U
U -
Base-deletion wd
Base-insertion wd
Base-mismatch wm
Base-match
5EDIT(Nested, Nested) ?
Lin,Ma,Zhang RECOMB01
- Opérations sur arcs wam, wb, wa, wr
ACGUCCGUGCAUAUUAA
ACUGAC UGCA AUUA
-
-
-
Arc-mismatch wam
Arc-breaking wb
Arc-altering wa
Arc-removing wr
Arc-match
6Exemple de calcul EDIT(Nested, Nested)
ACGUCCGU CAUAUUAA
-
AGUGAC UGCA A UA
-
-
-
-
Score(?) Wa Wr Wb Wam 2Wm 2 Wd
7Complexité de EDIT
Unlimited Crossing Nested Plain
Unlimited Max SNP-Hard Max SNP-Hard Max SNP-Hard Max SNP-Hard
Crossing Max SNP-Hard Max SNP-Hard Max SNP-Hard
Nested ? O(nm3) où m taille de séqu. plain
Plain O(nm)
EDIT(Nested, Nested) est NP-Complet
8Problème NP-Complet
- Deux grandes classes de problèmes
- P
- Polynomiaux.
- Réponse exacte en temps raisonnable
- NP
- Non polynomiaux
- NP-Complet (sous-classe de NP)
- Les plus difficiles
- Réponse exacte en un temps non raisonnable (en
centaines dannées avec la meilleure des machines)
9Preuve de NP-Complétude
I
I0
Réponse(I0) -gt Réponse(I)
Problème difficile
Notre problème
est difficile
10Complexité de EDIT(Nested, Nested) ?
- Max Independent Set Ensemble stable de taille
maximale - MIS est NP-Complet sur des graphes cubiques
planaires connexes et sans isthme (noté MIS-3p).
G
11Complexité de EDIT(Nested, Nested) ?
- MIS-3p -gt plongement sur 2 pages
- Chaque sommet nest pas de degré nul sur une page
reliure
12Complexité de EDIT(Nested, Nested) ?
- MIS-3p -gt plongement sur 2 pages
- Chaque sommet nest pas de degré nul sur une page
? algorithme polynomial pour cette classe de
graphe
Lin,Chen,Jiang,Wen ICALP01
13Construction
- Sommet degré 2 UAUAGG
- Sommet degré 1 GGUAUA
Alignement canonique
3.n.wr wd
14Construction
Alignement non canonique Alignement non optimal
Alignement avec des substitutions Alignement
non optimal
Alignement canonique
15Construction
- Copie la configuration des arcs du plongement en
doublant chacun des arcs
16Les 18 types dalignements locaux
17Alignements locaux symétriques
S1
S1
S2
S2
Coût similaire
18Démarche
- Un des 18 types représente les sommets de
lensemble stable - Navoir que des alignements locaux de deux types
- Lautre type représentant les sommets
nappartenant pas à lensemble stable
19Démarche
Score(?)
gt
Score(?)
gt
Score(?)
alignement Canonique G-Stable
20Choix des deux types
- tuas et tgs (le type des sommets de lensemble
stable) - Idée pénaliser larc-removing
s
s
wb
wa
s
s
wr
21Les Conditions posées par le remplacement
22Les Conditions posées par le remplacement
Edit(Nested,Nested)
Cas général
est difficile
Sous conditions 1 à 4
Cas spécifique
est difficile
23Exemple
Un alignement contenant un sommet de type t1
nest pas optimal
?
Score(?) lt Score(?) ?
0 ? lt 2wd ? ?
0 lt wd
?
?
2wd
24Exemple
Un alignement contenant un sommet de type t9
nest pas optimal
?
2wb
Score(?) lt Score(?) ?
0 2wb ? lt 2wd 2wa ? ?
wb lt wa
2wd
?
2wa
25Exemple
Un alignement contenant un sommet de type t9
nest pas optimal
?
2wa
Score(?) lt Score(?) ?
0 2wa ? lt 2wd 2wr ? ?
wa wd lt wr
2wd
?
2wr
26Exemple
Un alignement contenant un sommet de type t9
nest pas optimal
?
wb
wa
Score(?) lt Score(?) ?
0 wa wb ? lt 2wd wr wa ? ?
wb lt wr
2wd
wa
?
wr
27Preuve de léquivalence des problèmes
On veut maximiser k dans les deux problèmes
Edit(S1,S2) ? s où s
G possède un ensemble indépendant V tel que V
? k
28Conclusion et perspectives
- (1) On peut trouver en temps raisonnable une
instance de Edit(Nested,Nested) à partir dun
graphe cubique connexe planaire sans isthme - (2) Les instances construites sont biologiquement
correctes - Alphabet U,C,G,A
- les arcs U-A représentent les liens hydrogènes
- (3) Démarche théorique
- Plonger un graphe intéressant vers une instance
de notre problème - Contraindre les coûts pour favoriser deux types
de sommets - Empêcher les liens entre deux sommets de
lensemble stable
29Conclusion et perspectives
- On apporte une réponse au problème ouvert dans
Lin,Ma,Zhang RECOMB01 en faisant intervenir
des notions non triviales issues de domaines
diverses. - Déterminer la complexité dautres mesures de
similarité sur lARN.
30NP-complétude de EDIT(Nested, Nested)
Questions?
- G.Blin, G. Fertin, I. Rusu, C. Sinoquet
Institut de Recherche en Informatique de Nantes