Title: Pr
1Séminaire Bioinfo-Ouest / Symbiose - 29 avril 2004
répétitions et duplications intra-chromosomiques
Alain.Viari_at_inrialpes.fr
2Plan
- 1- Introduction
- -2- Définitions
- -3 - Expérience 1 répétitions chez B. subtilis
- 4 - Expérience 2 Levure et extensions
- -5- Aspects algorithmiques
3Introduction
-gt duplications à différents niveaux
4niveaux de duplication dans les génomes (1)
5niveaux de duplication dans les génomes (2)
6niveaux de duplication dans les génomes (3)
mais encore...
Escherichia coli
- 4,6 Mb
- 4 288 gènes
- Séquences répétées
- - 22 IS
- - 7 rDNA, 5 Rhs, 314 REP, etc.
- - 1 345 gènes dupliqués.
7Plan
- 1- Introduction
- -2- Définitions
- -3 - Expérience 1 répétitions chez B. subtilis
- 4 - Expérience 2 Levure et extensions
- -5- Aspects algorithmiques
8Repétitions dans les génomes
- nature de lobjet répété (structural, lexical)
- nature des copies (exact, approximatif)
- nombre de copies (r 2)
- aspect inattendu (taille minimale)
- aspect biologique (inter/intra espèce
chromosome)
9Nature de lobjet répété répétitions
structurales
exemple 1 tRNA
pb recherche / inférence
10Répétitions lexicales nombre de copies
11Répétitions lexicales nature de la copie
répétition exacte ou approchée
12Répétitions lexicales orientation de la copie
répétition directe / inverse
ATTTG
CAAAT
5
3
5
3
GTTTA
TAAAG
13Répétitions lexicales aspect biologiques
14Pourquoi chercher des répétitions ?
Aspect entomologique Trace de lévolution
outil pour lanalyse de la dynamique des génomes
15Plan
- 1- Introduction
- -2- Définitions
- -3 - Expérience 1 répétitions chez B. subtilis
- 4 - Expérience 2 Levure et extensions
- -5- Aspects algorithmiques
16Montage expérimental
17Densité de répétitions
Rocha et al. MBE 99
18Distribution des répétitions
19Distribution des répétitions chez B. subtilis
20Transfert horizontal chez B. subtilis (hypothèse)
Horizontal transfert in B. subtilis (hypothesis)
21Inserted Elements (IE) in B. subtilis
Transfert horizontal chez B. subtilis (hypothèse)
17 elements 5 of the total size of
genome mean spacer size is 10.6 kb (10 kb
expected) gt50 of genes in spacers does not
exhibit B. subtilis codon usage 2/3 of genes
in spacers are UFO mostly represented
identified functions are - production of
antibiotics - detoxification -
restriction/modification and DNA reparation
- motility and transport
22Plan
- 1- Introduction
- -2- Définitions
- -3 - Expérience 1 répétitions chez B. subtilis
- 4 - Expérience 2 Levure et extensions
- -5- Aspects algorithmiques
23Objectif
Les répétitions comme outil détude de la
dynamique des génomes
- Mouvements et évolution des génomes.
- Observation directe impossible
- rechercher des traces de son activité
(répétitions). - Répétitions générateur dinstabilités
chromosomiques (recombinaison).
Répétitions traces et moteur de la dynamique
des génomes.
24Un modèle (trop) simple
duplication
répétition stricte
séquence unique
25Montage expérimental (1)
-gt répétitions approchées sur lADN
heuristique
26Montage expérimental (2)
Alignement local (prog. dyn)
27Montage expérimental (résumé)
Détection Lmin 15 - 17 bp
Filtre entropique subtélomérique
dans les subtélomères
basse complexité
CACACACA
CACACACA
Extension
Longeur gt 30 Identité gt 50
Filtre Répétitions particulières
Ty, solos, ARNt, ARNr
28Paramètres
note spacer gt 0
29Résultats (1)
Génome de la levure
30Spacer distributions
réel
aléatoire (x 10)
Répétitions inversées
Répétitions directes
total
total
1bp
3bp
100bp
1kb
10kb
100kb
3.2Mb
1bp
3bp
100bp
1kb
10kb
100kb
3.2Mb
spacer
spacer
CDR
Les Close Direct Repeats (CDR) sont
surreprésentés.
31Spacer corrélation avec le identité entre les
copies
Les CDR présentent une corrélation négative avec
le identité
32Spacer corrélation avec la longueur
Les CDR présentent une corrélation positive avec
la taille
33Un modèle (moins) simple
La recombinaison est négativement corrélée à la
taille du spacer.
34Données expérimentales (littérature)
recombinaison
35identité et longueur distributions
réel
aléatoire
Répétitions directes
Répétitions inversées
36Un modèle (un peu plus) complet
tectonique des répétitions
37Extension à dautres eucaryotes
Saccharomyces cerevisiae 16 chromosomes 12.1
Mb(génome complet)
Homo sapiens 2 chromosomes 67.3 Mb
(Achaz et al., 2001)
38Distribution du spacer
S. cerevisiae
A. thaliana
P. falciparum
directes
inversées
Nombre
C. elegans
H. sapiens
D. melanogaster
Nombre
39Corrélations du spacer
Spacer vs. Longueur
Spacer vs. Identité
CDR
Espèces
p
t
p
t
De(/Mb)
N
lt10-4
0.45
lt10-3
-0.32
5.0
60
S. cerevisiae
gt0.05
0.06
gt0.05
-0.08
49.8
100
P. falciparum
lt10-4
0.39
lt10-4
-0.35
23.9
889
A. thaliana
lt10-4
0.24
lt10-4
-0.31
34.0
3,242
C. elegans
lt10-4
0.41
lt10-4
-0.36
4.7
546
D. melanogaster
lt10-4
0.33
lt10-4
-0.30
15.5
1,042
H. sapiens
40Densité en bases
Répétitions inversées (du chromosome)
5
4
3
2
C. elegans
1
0
0
5
1
0
1
5
2
0
Répétitions directes ( du chromosome)
Les répétitions directes sont (un peu) plus
nombreuses que les inversées.
41Densité en évènements
n/N
D
e
Répétitions inversées (/Mb)
5
0
4
0
3
0
2
0
C. elegans
1
0
0
0
2
0
4
0
6
0
8
0
1
0
0
Répétitions directes (/Mb)
Les chromosomes de la même espèce présentent une
De similaire -gt propriété nucléaire globale ?
42Conclusion
eucaryotes idem procaryotes (50 génomes)
les répétitions comme outil détude de la
dynamique des génomes
43Plan
- 1- Introduction
- -2- Définitions
- -3 - Expérience 1 répétitions chez B. subtilis
- 4 - Expérience 2 Levure et extensions
- -5- Aspects algorithmiques
44Un problème algorithmique (classique)
45En pratique...
pb pratique trouver toutes les 2-répétions
maximales de tailles Lmin
note en utilisation pratique Lmin est tel que n2
ltlt N
46Vers des très grandes séquences
47Remerciements
Guillaume ACHAZ
Frédéric BOYER
Eric COISSAC
Eduardo ROCHA
Pierre NETTER
48(No Transcript)