Title: Biodiversit des espces modles:
1- Biodiversité des espèces modèles
- Procaryotes et eucaryotes unicellulaires
- Guy Perrière
- Pôle Bioinformatique Lyonnais
- Laboratoire de Biométrie et Biologie Évolutive
- UMR CNRS n 5558
http//pbil.univ-lyon1.fr
2Larbre du vivant
- Principe de lévolu-tion par descendance et
modification - La classification du vivant est dordre
phylogénétique - Représentation sous la forme dun arbre.
- Chaque espère appar-tient à un genre.
- Chaque genre appar-tient à une famille.
Darwin (1859)
3Classification phylogénétique
- Premier arbre univer-sel du vivant
- Subdivision en trois règnes
- Plantes.
- Animaux.
- Protistes.
- Organismes microsco-piques unicellulaires
- Question qui se pose encore aujourdhui.
Haeckel (1866)
4Les trois domaines du vivant
Bactéries
Physarum
Drosophila
Homo
Eucaryotes
Escherichia
Oryza
Pseudomonas
Saccharomyces
Prorocentrum
Bacillus
Tetrahymena
Anacystis
Thermus
Strepto- myces
Crithidia
Methano- coccus
Halococcus
Desulfuro- coccus
Thermo- proteus
Methano- bacterium
Halo- bacterium
Archées
5Histoire de la vie sur Terre
Formation de la Terre
Dinosaures
1ers micro- organismes
Arthropodes
2,0
1,5
1,0
4,5
4,0
3,5
3,0
2,5
0,5
Milliards dannées
0,0035
Humains
Âge des microbes
6Les procaryotes
- Comprennent les bac-téries et les archées
- Organisation générale comparable
- Organismes unicellu-laires dépourvus de noyau.
- Différences au niveau
- Des mécanismes de ré-plication et de traduc-tion.
- Des phospholipides de la membrane plasmique.
Structure générale dune cellule procaryote
7Comment les classer
- Critères morphologiques inopérants.
- Pendant longtemps, utilisation de critères
biochimiques - Coloration (Gram positives et Gram négatives).
- Fonctions biochimiques (principe des galeries
Api). - Depuis 1977, utilisation des données de séquences.
8La paroi bactérienne
- La plupart des bactéries possèdent une paroi
- Structure de type peptidoglycane (polymère de
glucides et dacides aminés) - Organisation différente chez les Gram positives
et les Gram négatives. - Exceptions
- Certaines bactéries du genre Mycoplasma
- Membrane plasmique renforcée.
- Vivent dans un mileu où la pression osmotique est
faible (hôte).
9Paroi des Gram négatives
Lipopolysaccharide
Porine
Lipoprotéine
Membrane extérieure
Peptido-glycane
Périplasme
Membrane cytoplasmique
10Paroi des Gram positives
Protéine de surface
Acide téichoïque
Acide lipo-téichoïque
Peptido-glycane
Paroi
Membrane cytoplasmique
11Le cas des archées
- Structure particulière de la paroi
- Pas de peptidoglycane
- Dans certains cas, pré-sence dun
pseudo-peptidoglycane. - Lipides membranaires possèdant des branche-ments.
- Liaisons de type ether entre les acides gras et
le glycérol.
Liaison ester
Glycérol
Acide stéarique
Diglycéride bactérien
CH2O-
CH2O-
Liaison ether
CH2OH
Phytanol
Glycérol
Diglycéride archéen
12Diversité métabolique
- Animaux, plantes et champignons nutilisent
quune seule méthode pour récupérer le carbone et
produire de lATP. - Bactéries et archées utilisent plusieurs
méthodes - Sources de carbone organiques ou inorganiques.
- Production dATP par photosynthèse ou par
oxydation de composés organiques ou
inorganiques - Augmentation de la quantité dATP produite en
fonction de la différence dénergie libre (?G)
entre le donneur et laccepteur delectrons.
13Donneurs et accepteurs
Bactéries et archées peuvent utiliser différents
types de donneurs et daccepteurs delectrons
14Fixation de lazote minéral
- Certaines bactéries et archées utilisent lazote
minéral, et en constituent la source nutritive
pour tous les êtres vivants - La croissance des plantes est étroitement
dépendante de la disponibilité en azote - Symbiose avec de nombreuses espèces bactériennes
(e.g., Ralstonia). - Bactéries et archées sont les seuls organismes
capables de fixer lazote atmosphérique. - Toutes les bactéries et archées fixatrices
dazote pos-sèdent des gène nif, codant pour des
nitrogénases. - Les gènes nif ont pu se répandre par transfert
horizontal.
15Le cycle de lazote
N2 dans latmosphère
Fixation par les bacté-ries et les archées
Dénitrification par les bactéries et les archées
Décomposition des protéines et des acides
nucléiques
Plantes, animaux
Nitrification par les bactéries
Nitrification par les bactéries
16Pollution par le nitrate
1. Lammoniaque (NH3) est utilisé comme
fertilisant.
2. Les plantes cultivées utilisent le NH3 pour
synthétiser leurs protéines. Les bactéries et les
archées présentes dans le sol lutilisent comme
donneur delectrons.
3. Le nitrate produit passe des champs aux
rivières, puis se déverse dans la mer.
4. Le nitrate est soit (a) utilisé par les
cyanobactéries et les algues pour synthétiser
leurs protéines, (b) utilisé comme accepteur
delectrons par les bactéries. Lazote produit
est rejeté dans latmosphère. Les populations de
bactéries et dalgues croissent massivement.
5. Quand ces organismes meurent, bactéries et
archées hétérotrophes croissent rapidement, et
consomment loxygène.
6. Plus de vie possible du fait de la déperdition
en O2.
17Fonctions et classification
Ochman et al. (2000)
18Contenu global en GC
- Calculé en pourcentage de bases GC
- Constitue une des premières mesures moléculaires
appli-quée à la systématique. - Méthodes de dénaturation par la chaleur
- Mesure de la variation de labsorption UV en
fonction de la température. - La valeur du Tm est linéaire-ment proportionnelle
au GC de lorganisme.
19Distribution
- Mesure faite sur 772 bactéries.
- Minimum Mycoplas-ma capricolum (24 ).
- Maximum Micrococ-cus luteus (77 ).
- Variations de 5 et 10 au sein dune espèce et
dun genre.
Nombre
GC
20Source de la variation
- Différences de pression de mutation entre les
paires AT et GC. - Le ratio u/v est différent dune espèce à
lautre - Distribution observée chez les bactéries.
21Phylogénie moléculaire
- Point de départ
- Un ensemble de séquences (nucléiques ou
protéiques) homologues alignées. - Résultat obtenu
- Un arbre décrivant les relations évolutives entre
les séquences ( arbre phylogénétique).
SYNP7 MRFNKILIANRGEIALRILRTCEELGIGTIAVHSTVDRNAL
HVQLADEAVCIGEAASSKS SYNY3 MQFAKILIANRGEIALRIIHS
CEELGIPTVAVHSTIDRHALHVQLANESVCIGPPPSNKS ECOLI
M-LDKIVIANRGEIALRILRACKELGIKTVAVHSSADRDLKHVLLADETV
CIGPAPSVKS HAEIN M-LEKVVIANRGEIALRILRACKELGIKTV
AVHSTADRDLKHVLLADETICIGPAPSAKS PSEAE
M-LEKVLIANRGEIALRILRACKELGIKTVAVHSTADRELMHLSLADESV
CIGPAPATQS BACSU M-IKKLLIANRGEIAVRIIRACRELGIETV
AVYSEADKDALHVQMADEAFCIGPKASKDS METJA
M-FNKVLIANRGEIAIRIIRACWELGIKTVAVYSEADKRSLHATLADEAY
CIGPAPAAKS
. .
22Arbre phylogénétique
- Branche interne
- Entre deux nuds.
- Branche externe
- Entre un nud et une feuille.
- Longueur des branches horizontales
- Distance évolutive
- Temps ? Vitesse.
- Topologie
- Forme de larbre.
23Notion de clade
Archées
Bactérie
Groupes monophylé- tiques ou clades
Bactérie
Bactérie
Eucaryote
Eucaryote
Eucaryote
Eucaryote
24Méthodes de reconstruction
- Il existe quatre grandes familles de métho-des de
reconstruction phylogénétique - Parcimonie.
- Méthodes basées sur des matrices de distances
- Unweighted Pair-Group Method with Arithmetic
means (UPGMA). - Neighbor Joining (NJ).
- Maximum de vraisemblance.
- Méthodes bayesiennes.
25Fiabilité dun arbre
- Linformation véhiculée par un arbre réside
en-tièrement dans ses branches internes - La topologie dun arbre se déduit de la liste de
ses bran-ches internes. - Fiabilité dun arbre fiabilité des branches
internes.
26Procédure de bootstrap
90
70
27Limitations et usage
- Limitations du boot-strap
- Surestimation des scores faibles.
- Sous-estimation des scores forts.
- Non indépendance entre clades.
- Hypothèses définies a posteriori.
28Problèmes
- De nombreux facteurs limitent lemploi des
données de la phylogénie moléculaire - Paralogies cachées.
- Transferts horizontaux.
- Choix dun marqueur ad hoc.
- Distances évolutives très importantes
- Phénomène de saturation.
- Biais compositionnels.
29Homologie ou similarité ?
- La phylogénie moléculaire se base sur
luti-lisation de gènes homologues - Deux séquences sont dites homologues si elles
possèdent un ancêtre commun. - Lexistence dun ancêtre commun est inférée à
partir de la similarité. - Seuil pour les protéines
- 30 didentité sur une longueur de 100 AA ?
homologie entre les séquences.
30Similarité sans homologie
- La similarité nest pas toujours due à de
lhomologie - Convergence ou simple hasard pour de courtes
séquences (quelques résidus). - Existence de régions de faible complexité (e.g.,
cas de la fibroïne GSGAGAn) - Présentes dans 40 des protéines.
- Peuvent représenter jusquà 15 du total des
résidus (Ala, Gly, Pro, Ser, Glu et Gln).
31Homologie sans similarité
- Deux séquences peuvent être homologues sans que
leur similarité soit forte
ACP_KLEAE ---MEMKIDALAGTLESSDVMVRIGPAAQPGIQLEIDSI
VKQEFGAAIQQVVRETLAQLG ACP_ECOLI
STIEERVKKIIGEQLGVKQEEVTDN--ASFVEDLGADSLDTVELVMALEE
EFDTEIPDEE
ACP_KLEAE
VKECDNVQLARVQAAALRWQQ ACP_ECOLI
AEKITTVQAAIDYINGHQA--
- La similarité entre ces protéines est faible mais
les données fonctionnelles et biochimiques
montrent quelles sont homologues.
32Orthologues et paralogues
Gène ancestral
Duplication
Primates
Rongeurs
Spéciation
Orthologie
INS1
INS2
Paralogie
INS Homme
INS1 Rat
INS1 Souris
INS2 Rat
INS2 Souris
33Paralogues et phylogénies
34Un exemple de duplication
Grande sous-unité de la glutamate synthase
35Duplications multiples
Aminotransférases pyridoxal-phosphate dépendantes
(III)
36Les transferts horizontaux
- Transmission de gènes entre des espèces
dif-férentes. - Phénomènes supposés très fréquents chez les
procaryotes - Implication de diffé-rents mécanismes.
- 17,6 des gènes dE. coli auraient été obte-nus
par transfert.
37La transformation
Cellule donneuse
Receveur compétent
- Capture par la cellule de fragments dADN nu
présents dans le milieu. - La transformation naturelle est restreinte à
certaines espèces bactériennes compétentes .
38La conjugaison
Évènement fréquent
Évènement rare
- Transfert par lintermédiaire dun plasmide
conju-gatif (e.g., le plasmide F chez E. coli). - La conjugaison serait le mécanisme le plus
courant déchange dADN entre organismes distants.
39La transduction
Receveur
Donneur infecté
- Transfert dADN par lintermédiaire de
bactério-phages. - Implique généralement des bactéries appartenant à
des espèces proches (spécificité dhôte) - Certains phages (e.g., ?) possèdent un large
spectre.
40Cas du gène pyrH
Famille de lUridine mono- phosphate kinase
Synechocystis sp.
Synechocystis sp.
Bactéries Archées Eucaryotes
41Endosymbiose et transferts
Noyau
Chloroplaste
Cyanobactérie
42B. suis
68
B. melitensis
100
54
A. aeolicus
M. loti
57
A. aeolicus
B. japonicum
100
99
H. pylori J99
61
A. tumefasciens
C. jejuni
C. crescentus
52
N. meningitidis
NADH quinone oxidoreductase chaîne C/D
NADH quinone oxidoreductase chaîne B
X. axonopodis
R. solanacearum
93
97
X. campestris
97
100
X. fastidiosa
X. fastidiosa
X. axonopodis
100
R. solanacearum
X. campestris
59
R. conorii
100
R. conorii
R. prowazekii
R. prowazekii
100
N. meningitidis
C. crescentus
A. aeolicus
100
B. melitensis
99
M. tuberculosis
52
B. suis
S. coelicolor
M. loti
59
D. radiodurans
B. japonicum
66
100
C. jejuni
A. tumefasciens
H. pylori J99
100
Anabaena sp.
T. acidophilum
S. elongatus
Synechocystis sp.
E. coli
67
55
Y. pestis
95
S. typhimurium
B. aphidicola
Y. pestis
S. typhimurium
B. aphidicola
100
100
E. coli
S. oneidensis
S. flexneri
P. putida
86
S. oneidensis
P. aeruginosa
P. aeruginosa
S. coelicolor
59
P. putida
100
C. tepidum
S. coelicolor
L. interrogans
90
D. radiodurans
Anabaena sp.
100
S. coelicolor
Synechocystis sp.
98
M. tuberculosis
S. elongatus
L. interrogans
Synechocystis sp.
T. acidophilum
100
100
S. tokodaii
T. volcanium
83
S. solfataricus
C. tepidum
A. pernix
98
Halobacterium sp.
99
P. aerophilum
P. horikoshii
100
M. mazei
100
P. abyssi
53
M. acetivorans
P. furiosus
93
B. japonicum
53
M. thermoautotrophicus
100
M. tuberculosis
M. kandleri
92
M. kandleri
87
M. jannaschii
100
99
M. thermoautotrophicus
100
99
M. thermoautotrophicus
M. jannaschii
56
M. jannaschii
100
M. thermoautotrophicus
M. mazei
M. jannaschii
T. tengcongensis
97
61
100
P. furiosus
S. tokodaii
100
72
P. abyssi
S. solfataricus
100
P. horikoshii
A. fulgidus
95
M. mazei
A. pernix
P. aerophilum
T. tengcongensis
54
82
P. furiosus
P. horikoshii
100
100
P. abyssi
P. abyssi
100
100
P. furiosus
65
P. horikoshii
T. maritima
T. maritima
M. acetivorans
M. acetivorans
43Impact des transferts
- Les transferts horizontaux constituent un facteur
primordial de ladaptation à de nouveaux
milieux - Résistance aux antibiotiques et aux métaux
lourds, pathogénicité - Avantage à court terme.
- Abondance au cours de lhistoire de la vie ?
44Choix dun marqueur
- Les temps de diver-gences sont énormes (107-109
ans) - Gènes évoluant très lentement et pour les-quels
il ny a pas eu de transferts - ARNr (petite ou grande sous-unité).
- Facteurs délongation.
- Protéines ribosomales.
ACGTACGTACGT ACGTACTTACGT ACGTACTTACGT GCGTACGTACG
T
ACGTACGTACGT GTGCATGATTGA TGACAGTGATTG CACATATCGTC
A
Divergence trop importante
Divergence insuffisante
Pas dinformation
45Structure des ARNr
ARNt
23S
16S
Escherichia coli
18S
25S
5.8S
Saccharomyces cerevisiae
ITS1
ITS2
Encephalitozoon cuniculi
16S
23S
ITS1
46Séquences disponibles
- 237 034 séquences dARNr 16S/18S dans GenBank
(janvier 2005). - Banques de données contenant des séquen-ces
alignées - Ribosomal Database Project
- http//rdp.cme.msu.edu/index.jsp
- European ribosomal RNA database
- http//www.psb.ugent.be/rRNA/index.html
47Principaux taxons bactériens
48Bactéries pathogènes
- Le postulat de Koch a constitué le départ de la
médecine moderne - Base de la théorie relative aux germes
infectieux. - La virulence est favorisée dans le cas de
bactéries à transmission rapide - Un pathogène peut passer dans un nouvel hôte
avant davoir tué le précédent. - La résistance aux antibiotiques croît du fait de
leur utilisation massive.
49Quelques exemples
Espèce Chlamydia trachomatis Clostridium
botulinum Clostridium tetani Haemophilus
influenzae Mycobacterium tuberculosis Neisseria
gonorrhoeae Propionibacterium acnes Pseudomonas
aeruginosa Salmonella enteritidis Streptococcus
pneumoniae Streptococcus pyogenes Treponema
pallidum Vibrio parahaemolyticus Yersinia pastis
Division Chlamydiales Gram positives Gram
positives Protéobactéries Gram
positives Protéobactéries Gram positives Protéobac
téries Protéobactéries Gram positives Gram
positives Spirochètes Protéobactéries Protéobactér
ies
Tissus affectés Canal uro-génital, yeux Système
nerveux, tractus gastro-intestinal Système
nerveux Conduit auditif, système nerveux Tractus
respiratoire Canal uro-génital Peau Canal
uro-génital, yeux, conduit auditif Tractus
gastro-intestinal Tractus respiratoire Tractus
respiratoire Canal uro-génital Tractus
gastro-intestinal Lymphe et sang
Maladie Infection du tractus génital Botulisme Té
tanos Infections de loreille, méningites Tubercul
ose Gonorrhée Acné Infections du tractus
urinaire, des yeux et de loreille Intoxication
alimentaire Pneumonie Scarlatine Syphillis Intoxic
ation alimentaire Peste
50Température de croissance
Thermophiles
Hyperthermophiles
Mésophiles
Psychrotrophes
Psychrophiles
Vitessse de croissance
-10
0
10
20
30
40
50
60
70
80
90
100
110
Température (C)
51Thermotogales
- Hyperthermophiles.
- Représentant le mieux connu
- Thermotoga maritima
- Hyperthermophile aérobie.
- Vit dans les sédiments marins près des chemi-nées
géothermales. - Topt 90C.
Vues en contraste en en coupe de T. maritima
52Aquificales
- Hyperthermophiles
- Aérobies.
- Microaérobies chémo-litho-autotrophes.
- Représentant le mieux connu
- Aquifex aeolicus
- Pousse sur des sources minérales de H2, O2 et
CO2. - Topt 95C.
Vue en coupe et au microscope à balayage dA.
pyrophilus
53Planctomycètes
- Présence de comparti-ments intracellulaires
- Existence dun nuclé-oïde.
- Absence de peptido-glycane au niveau de la paroi.
- Structures cratérifor-mes à la surface.
- Division par bourgeon-nement.
Vue en coupe de Gemmata obscuriglobus
54La découverte des archées
- Avant 1977, considérées comme des bactéries.
- Proposition dun nouveau domaine du vivant par
Woese et Fox (1977). - Les données moléculaires fournies par lARNr
(16S/18S) justifient la séparation. - Confirmation par de nombreuses études au niveau
génomique et/ou biochimique. - Longtemps supposées ne vivre que dans des milieux
extrêmes (température, salinité, pH)
55Principaux taxons archéens
Genres représentatifs Thermoproteus, Pyrobaculum,
Thermofilum Sulfolobus, Acidianus Aeropyrum,
Desulfurococcus Cenarchaeum Caldisphaera Methanoba
cterium, Methanothermobacter Methanococcus,
Methanothermococcus Halobacterium,
Halococcus Thermoplasma, Ferroplasma Pyrococcus,
Thermococcus Archaeoglobus Methanopyrus Methanosar
cina, Methanoculleus Séquences environementales Na
noarchaeum
Division Crénarchées Euryarchées Korar
chées Nanoarchées
Subdivision Thermoprotéales Sulfolobales Désulfuro
coccales Cénarchéales Caldisphérales Méthanobacter
ia Méthanococci Halobactéria Thermoplasmata Thermo
cocci Archaeoglobi Methanopyri Methanomicrobia
56Larbre de Brown (1997)
Champignons
Animaux
Archées
Plantes
Entamoeba
Euglena
Euryarchées
Bactéries
Korarchées
Crénarchées
Kinétoplastes (e.g., Trypanosoma)
Gram positives Haut GC
Gram positives Bas GC
Parabasaliiens (e.g., Trichomonas)
?/?-Protéobactéries
?-Protéobactéries / Mitochondries
Microsporidies ? (e.g., Nosema)
?/?-Protéobactéries
Spirochètes
Métamonades (e.g., Giardia)
Fusobactéries
Thermotogales
Flexibacter Bactéroïdes
Cyanobactéries Chloroplastes
Thermus
Eucaryotes
Aquifex
LUCA
57Larbre de Stetter (1996)
Plantes
Flagellés
Microsporidies
Animaux
Fungi
Ciliés
Eucaryotes
Myxomycètes
Diplomonades
Bactéries vertes non sulfureuses
Bactéries
Gram-positives
Sulfolobus
Desulfu-rococcus
Thermofilum
Protéobacteries
Thermotoga
Thermoproteus
Archées
Cyanobactéries
Pyrobaculum
Flavobactéries
Pyrococcus
Methanothermus
Methanobacterium
Archaeoglobus
1
Halococcus
2
Halobacterium
Methano-pyrus
3
Methanoplanus
Aquifex
4
Methanospirillum
Methano-coccus
Methanosarcina
58Substitutions multiples
- La distance évolutive réelle (D) est généralement
supérieure aux différences observées (d). - En faisant des hypothèses sur la nature du
proces-sus évolutif, on peut estimer D à partir
de d.
59Phénomène de saturation
- Trop de substitutions depuis la divergence avec
lancêtre com-mun - Perte du signal phylo-génétique.
- Impossibilité de re-construire larbre vrai
quelle que soit la mé-thode employée.
Ancêtre
A
B
C
60Artefact des longues branches
Arbre vrai
Arbre observé
61Effet de loutgroup
Arbre vrai
Arbre obtenu
Attraction de la longue branche de la séquence A
par la longue branche de loutgroup (O)
62Pas de lien GC / Topt
80
70
60
GC
50
40
30
r2 0,036
20
10
20
30
40
50
60
70
80
90
100
110
Topt
63Relation GC ARNr / Topt
85
80
r2 0,446
75
70
GC ARNr
65
60
55
50
10
20
30
40
50
60
70
80
90
100
110
Topt (C)
64Structure de lARNr 16S (1)
65Structure de lARNr 16S (2)
Stem (double brin)
Boucle interne (simple brin)
Boucle externe (simple brin)
66La méthode slow-fast
- Consiste à nutiliser que les sites évoluant
lente-ment pour construire une phylogénie - Définition dun nombre maximum de changements
pour une position donnée dans lalignement - Problème du seuil à utiliser.
Escherichia CAGTAGCGGCGAGCGAACGGGGAGCAGCCCAGAGCC
TGAATCAGTGTGTGTGTTAGT Pseudomonas
TAGTAGTGGCGAGCGAACGGGGATTAGCCCTTAAGCTTCATTGATTTTAG
CG----- Rhodobacter TAGTAGTGGCGAGCGAACGCGGACCAGC
CGAGCCGTGAGAACGAGTG---------- Bacillus
GAGTAGCGGCGA-CGAACACGGGATCAGCCCAAACCAAGAGGCTTGCCTC
TGTGGTT Micrococcus TAGTAGTGGCGAGCGAACGCGGATGGGG
CT-AAACCGTATGTGTGTGATACCCGGCA Streptomyces
GAGTAGTGGCGAGCGAAACCGGATGAGGCC-AAACCGTATACGTGTGAGA
CCCGGCA Pirellula CAGTAGCGGCGAGCGAAAGCGAAATAGC
CC-AAACCGTGGGGATTTTCCTCACGGGG Anacystis
CAGTAGCGGCGAGCGAACGGGGACCAGCCT-AAACCAAACTCCACGGAGT
TTGGGGT Ruminobacter AAGTAGTGGCGAACGAACGGGAAGCAGC
CC-AAAAGTTGTATAAGTCATAGTT---- Leptospira
CAGTAGCGGTGAGCGAACGCGGAAGAGCCT-AAACCCCTGCCTACGTTAC
AGATCTA Thermus GAGTAGCGGCGAGCGAAAGGGGACCAGC
CT-AAACCGTCCGGCTTGTCCGGGCGGGG
67Larbre de Brochier (2002)
Utilisation des sites de lARNr évoluant lentement
68Autres gènes
- Utilisation de gènes présents dans les trois
domaines du vivant - Protéines heat-shock (e.g., Hsp70).
- Facteurs délongation de la traduction.
- Protéines ribosomiques.
- Résultats incongruents entre eux ou avec la
phylogénie basée sur lARNr - Interprétation comme lindice de la présence de
nombreux transferts horizontaux.
69Projets génomes
- Génomes eucaryotes séquencés et publiés
- A. gambiae, A. thaliana, A. gossypii, B. mori, C.
briggsae, C. elegans, C. glabrata, C.
intestinalis, C. parvum, C. merolae, D. hansenii,
D. melanogaster, E. cuniculi, G. theta, H.
sapiens, K. lactis, M. musculus, N. crassa, O.
sativa ssp. indica, O. sativa ssp. japonica, P.
falciparum, P. yoelii, R. norvegicus, S.
cerevisiae, S. pombe, T. rubripes, Y. lipolytica.
70Phylogénie et génomes
- Utilisation de génomes complets pour tenter
délucider la phylogénie des procaryotes - Codage en présence/absence des gènes.
- Concaténation de gènes orthologues présents dans
de nombreuses espèces. - Construction de super-arbres intégrant
linfor-mation de nombreuses familles.
71Codage en présence-absence
- Méthode utilisée par Tekaia et al. (1999) et
Dutilh et al. (2003) - Détermination de tous les orthologues pré-sents
ou non dans un ensemble despèces. - Construction dune matrice binaire.
- Calcul de larbre par parcimonie.
72Larbre de Tekaia (1999)
C. elegans
S. pombe
S. cerevisiae
M. jannaschii
M. thermoautotrophicum
A. fulgidus
P. horikoshii
T. pallidum
B. burgdorferi
Eucaryotes Archées Hyperthermophiles Cyanobactérie
s Chlamydiales Gram bas GC Spirochètes Gram
haut GC Protéobactéries
M. genitalium
M. pneumoniae
M. tuberculosis
H. pylori
C. jejuni
E. coli
H. influenzae
Synechocystis sp.
B. subtilis
A. aeolicus
C. trachomatis
R. prowazekii
73Problèmes et limitations
- Pas de prise en compte de linformation
phylogénétique contenue dans les gènes. - Faible nombre de gènes en commun entre les
différents organismes considérés - Possibilités limitées de construire un arbre
comprenant beaucoup de taxons. - Topologies peu soutenues.
- Polyphylie de certains grands groupes
taxono-miques (e.g., Gram positives bas GC).
74Concaténation dorthologues
- Utilisation de séquences de 23 gènes conser-vés
dans 45 espèces (Brown et al., 2001) - Méthode très sensible à laddition ou au retrait
de gènes - Parmi ces 23 gènes, neuf auraient été lobjet de
transferts horizontaux. - Pas de prise en compte de la diversité des
vites-ses dévolution entre les gènes - La concaténation va atténuer linformation
plutôt que la mettre en évidence.
75Larbre de Brown (2001)
Eucaryotes Crénarchées Euryarchées Spirochètes Chl
amydiales Bactéries vertes sulfureuses Gram
haut GC Déinococcales Gram bas
GC Hyperthermophiles Cyanobactéries Protéobactéri
es
76Larbre de Brochier (2001)
77Approche par super-arbres
- Incorporation de linformation et du support
statistique de centaines darbres de gènes - Sélection dun ensemble de gènes orthologues.
- Calcul des arbres.
- Sélection dun sous-ensemble darbres congru-ents
entre eux - Élimination des paralogies et des transferts.
- Intégration de linformation apportée
- Utilisation de linformation portée par les
branches internes de lintégralité des arbres.
78Larbre de Daubin (2002)
B. burgdorferi
T. pallidum
100
C. pneumoniae
C. muridarum
100
C. trachomatis
100
100
M. tuberculosis
M. leprae
100
S. coelicolor
100
72
73
D. radiodurans
Synechocystis sp.
S. aureus
B. halodurans
100
Spirochètes Chlamydiales Gram haut
GC Déinococcales Cyanobactéries Gram bas
GC Hyperthermophiles Protéobactéries Euryarchées
Crénarchées Eucaryotes
B. subtilis
75
100
100
L. lactis
S. pyogenes
100
M. pneumoniae
98
M. genitalium
100
100
U. parvum
A. aeolicus
T. maritima
100
C. jejuni
H. pylori
100
R. prowazekii
C. crescentus
87
100
N. meningitidis
100
X. fastidiosa
E. coli
100
V. cholerae
88
P. multocida
94
100
H. influenzae
100
100
Buchnera sp.
100
P. aeruginosa
Halobacterium sp.
T. acidophilum
M. jannashii
P. horikoshii
61
P. abyssi
100
63
M. thermoautotrophicum
73
A. fulgidus
A. pernix
S. solfataricus
100
C. elegans
D. melanogaster
100
62
A. thaliana
100
S. cerevisiae
79Problèmes et limitations
- Biais déchantillonnage vers des espèces
dinterêt médical - Présence de nombreux parasites, parfois
endo-cellulaires (chlamydiales, R. prowazekii) - Biais vers AT.
- Taux dévolution élevés.
- Les mycoplasmes se groupent bien avec les autres
Gram-positives à bas GC - Robustesse du super-arbre vis-à-vis de ces biais.
80Les microsporidies
- Eucaryotes unicellulaires dépourvus de
mitochon-dries et de peroxisomes - Plus de 1000 espèces, subdivisées en 150 genres.
- Ne subsistent que sous la forme de spores à
lextérieur des cellules hôtes. - Parasites intracellulaires obligatoires
- Nosema Bombycis, responsable de la pébrine du ver
à soie. - Encephalitozoon cuniculi, infections secondaires
chez les personnes immunodéficientes.
81Structure de la spore
disque dancrage
polaroplaste
exospore
endospore
membrane plasmique
filament polaire
20 ?m
ribosomes
noyau
vacuole postérieure
(Franzen et Müller, 1999)
82Histoire évolutive
- Hypothèse 1 émergence précoce avant
lendo-symbiose à lorigine des mitochondries - Ribosomes de type procaryote
- ARNr de type 16S et 23S.
- Absence dARNr 5,8S.
- Sous-unité du ribosome de type 30S et 50S.
- Position dans les phylogénies de lARNr et de
EF-1?. - Hypothèse 2 champignons hautement divergés
ayant perdu leurs mitochondries - Position dans les phylogénies des ?- et
?-tubulines et de Hsp70.
83Phylogénie de lARNr
Animaux Champignons Plantes Alvéolobiontes Stramén
opiles Mycétozoaires Euglénobiontes Diplomonades T
richomonades Microsporidies Archées Bactéries
Anemonia sulcata
Artemia salina
Saccharomyces cerevisiae
Mucor racemosus
100
Acquisition des mitochondries
Volvox carterii
Oxytricha nova
Prorocentrum micans
61
Ochromonas danica
Achlya bisexualis
49
Dictyostelium discoideum
60
Entamoeba histolytica
Naegleria gruberi
63
94
Physarum polycephalum
Euglena gracilis
99
64
Crithidia fasciculata
100
Trypanosoma brucei
66
Hexamita inflata
89
Giardia lamblia
100
Archezoa
Tritrichomonas foetus
Vairimorpha necatrix
Halobacterium volcanii
100
100
Thermoplasma acidophilum
Sulfolobus solfataricus
Escherichia coli
79
100
Rickettsia rickettsii
Mycoplasma gallisepticum
84Phylogénie dEF-1?
Homo sapiens
Xenopus laevis
Artemia salina
89
Podospora anserina
Absidia glauca
Schizosaccharomyces pombe
Arabidopsis thaliana
Animaux Champignons Plantes Euglénobiontes Alvéolo
biontes Mycétozoaires Straménopiles Diplomonades M
icrosporidies Archées
Pisum sativum
Porphyra purpurea
Dictyostelium discoideum
64
Euglena gracilis
Trypanosoma brucei
Trypanosoma cruzi
Stylonychia lemnae
Plasmodium falciparum
Euplotes crassus A1
Tetrahymena pyriformis
84
Trimyema compressum
Entamoeba histolytica
75
Blastocystis hominis
Hexamita inflata
Giardia lamblia
Glugea plecoglossi
Sulfolobus acidocaldarius
85Phylogénie de la ?-tubuline
Aspergillus nidulans
64
100
Neurospora crassa B
Histoplasma capsulatum 1
Schizophyllum commune B
100
Schizophyllum commune A
61
Pneumocystis carinii
Schizosaccharomyces pombe 1
100
Schizosaccharomyces pombe 2
96
Saccharomyces cerevisiae 1
Encephalitozoon hellem
66
100
Nosema locuslae
64
Spraguea lophii
Aspergillus nidulans 2
100
Neurospora crassa A
Haemonchius contorius
Homo sapiens
Urechis caupo
Champignons Microsporidies Plantes Animaux Trichom
onades Diplomonades
Paracentrotus lividus
Schistosoma mansoni
67
Drosophila melanogaster
Octopus dopleini
Trichomitus batrachorum
100
Monocercomonas sp. 2
Archezoa
Hexamita sp. 50330
100
Spironucleus muris
93
Hexamita inflata
86Phylogénie de Hsp70
Borrelia bugdorferi
Bactéries Trichomonades Euglénobiontes Alvéolobion
tes Plantes Animaux Champignons Microsporidies
Chlamydia trachomatis
Chlamydia pneumoniae
100
Francisella tularensis
Burkholderia cepacia
100
Haemophilus ducreyi
Haemophilus influenzae
71
Salmonella typhimurium
Escherichia coli
Rhodobacter capsulatus
Caulobacter crescentus
99
Protéobactéries ?
Brucella ovis
99
Agrobacterium tumefasciens
Rhizobium meliloti
Trichomonas vaginalis
Trypanosoma cruzi
71
Crithidia fasciculata
57
Eimeria tenella
Pisum sativum
Mitochondries
Solanum tuberosum
99
Homo sapiens
Drosophila melanogaster
100
Saccharomyces cerevisiae
Schizosaccharomyces pombe
100
72
Nosema locustae
87Analyse systématique
- Utilisation du génome complet dE. cuniculi
- Recherche de tous les gènes ayant des orthologues
- Chez au moins cinq autres espèces parmi
lesquelles au moins un champignon. - Chez au moins un procaryote (racinement de
larbre).
Animaux
Animaux
Champignons
Champignons
Plantes
Microsporidies
Microsporidies
Plantes
Bactéries
Bactéries
Archées
Archées
Émergence basale
Proximité des champignons
88Données et méthodes
- Récupération de 103 familles dorthologues à
partir des 2001 gènes dE. cuniculi. - Construction des arbres à laide de deux
méthodes - Maximum de vraisemblance (PROTML).
- Méthode de distance (BIONJ).
- Analyse de laccord entre les méthodes.
- Étude des vitesses dévolution.
89Positionnement des gènes
Accord 93
Désaccord 10
Gènes
12 C C
7 C E
1 M E
1 CP C
1 MP C
1 M M
3 CM CM
77 E E
Méthode
PROTML
BIONJ
E Eucaryotes CM Champignons Métazoaires
Emergence à la base des
C Champignons CP Champignons Plantes
M Métazoaires MP Métazoaires Plantes
Désaccord faibles valeurs de bootstrap ?
Absence de signal phylogénétique fort
90Émergence basale
PROTML
BIONJ
Homo
Homo
100
Homo
Homo
100
Drosophila
Drosophila
68
75
Saccharomyces
Saccharomyces
Saccharomyces
Saccharomyces
100
100
Schizosaccharomyces
Schizosaccharomyces
100
99
Gibberella
Gibberella
Oryza
Oryza
100
Arabidopsis
100
Arabidopsis
Arabidopsis
Arabidopsis
Encephalitozoon
Encephalitozoon
Methanothermobacter
Methanothermobacter
Thermotoga
Chlamydia
Chlamydia
Methanococcus
Methanococcus
Escherichia
Escherichia
Bacillus
99
Bacillus
Thermotoga
100
Aeropyrum
Aeropyrum
Pyrococcus
Pyrococcus
CTP synthase
91Émergence tardive
PROTML
BIONJ
Homo
Homo
Drosophila
Drosophila
Drosophila
Drosophila
100
100
Homo
Homo
Caenorhabditis
Caenorhabditis
92
60
Ashbya
Ashbya
Neurospora
Neurospora
99
100
97
Schizosaccharomyces
Schizosaccharomyces
87
Encephalitozoon
Encephalitozoon
Dictyostelium
Dictyostelium
Mesembryanthemum
Entamoeba
100
Arabidopsis
Mesembryanthemum
Arabidopsis
Scherffelia
100
88
96
Scherffelia
Cyanidium
51
95
Trypanosoma
Cyanidium
97
67
Entamoeba
Trypanosoma
100
100
Plasmodium
Plasmodium
Giardia
Giardia
Aeropyrum
Aeropyrum
Archaeoglobus
68
Archaeoglobus
85
Thermus
Thermus
Streptococcus
Streptococcus
ATP synthase
92Bilan global
Accord 93
Désaccord 10
Gènes
12 C C
7 C E
1 M E
1 CP C
1 MP C
1 M M
3 CM CM
77 E E
Méthode
PROTML
BIONJ
PROTML E 77 C 19 Autres 7 BIONJ E
85 C 14 Autres 4
Lien entre vitesse dévolution et position dans
larbre ?
93Vitesse dévolution
- Estimation de la vitesse dévolution relative des
gènes dE. cuniculi - Utilisation du rapport entre la distance
Homo-Encephalitozoon (dHE) et la distance
Homo-Saccharomyces (dHS) - Le rapport dHE/dHS sera dautant plus élevé que
la microsporidie aura évolué vite.
Homo
Saccharomyces
dHS
dHE
VE
dHE/dHS
Encephalitozoon
94Vitesse et positionnement
PROTML
dHE/dHS
Gènes
95Homologues mitochondriaux
- Il existe des homologues de protéines
mito-chondriales dans le génome dE. cuniculi - Atm1 (transporteur mitochondrial).
- Isu1 et Isu2.
- Nfs1 (clivage intron/exon des gènes dARNt).
- Pdb1 (sous-unité ? de la pyruvate déshydro-génase
E1). - Ssq1 (protéine Hsp70).
- Yah1.
- Perte secondaire de la mitochondrie.
96Conclusion
- Gènes évoluant rapidement
- Positionnement à la base des eucaryotes pour une
majorité de gènes - Accélération de la vitesse dévolution liée au
mode de vie parasitaire ? - Biais systématique lié au phénomène dattraction
des longues branches ? - Gènes évoluant lentement
- Positionnement à la base des champignons
- Variabilité des vitesses dévolution relative
chez Saccharomyces ?