Title: Codage et expression de l
1Codage et expression de linformation génétique
- Pascale Giraudet
- www.univ-tln.fr/giraudet
Séminaire GRIM 4 mars 2003
2Plan de lexposé
- Introduction quest-ce que linformation
génétique ? - Codage et transmission de linformation génétique
- Expression de linformation génétique
- Génétique et informatique
3 Quest-ce que linformation génétique ?
- Chaque individu présente des caractères propres
- Certains sont acquis (musculature, )
- Dautres héréditaires (couleur des yeux, groupe
sanguin, ) transmis dune génération à lautre - information génétique
4- Introduction quest-ce que linformation
génétique ? - Codage et transmission de linformation génétique
- Localisation de linformation génétique
- Support de linformation génétique
- Codage de linformation génétique sur lADN
- Transmission de linformation génétique
- Expression de linformation génétique
- Génétique et informatique
5I.1) Localisation de linformation génétique
- Expérience de Gurdon (1960)
- Noyau cellule grenouille B
- Œuf énucléé grenouille A
- gt obtention dun clone de la grenouille B
6I.2) Support de linformation génétique
Cellule G 1000 N 1013
Chromosome G 10 000 N 223
ADN G 107 L ? 2 m
7I.2) Support de linformation génétique
Watson et Crick, 1953
Paires de bases G 107 N ? 3 109
8I.2) Support de linformation génétique
Bases puriques (R)
Bases pyrimidiques (Y)
(A)
(G)
(T)
(C)
-gt ADN ? Succession de 3 109 lettres dun
alphabet quaternaire
9I.3) Codage de linformation génétique sur lADN
- Succession presque linéaire de 3109 lettres dun
alphabet moléculaire quaternaire (A,C,G,T) - Seule non-linéarité ADN porté par 2n
chromosomes (n23 chez lhomme) - Le brin complémentaire napporte aucun complément
dinformation (stabilité chimique) - Il existe de lADN hors du noyau ADN
mitochondrial (104 paires de bases)
10I.4) Transmission de linformation génétique
- Transmission conforme la réplication lors de la
division cellulaire - Brassage génétique lors de la reproduction sexuée
Génération N
Cellule du père 2n chromosomes
Cellule de la mère 2n chromosomes
méiose
Gamète du père n chromosomes
Gamète du père n chromosomes
Gamète de la mère n chromosomes
Gamète de la mère n chromosomes
fécondation
Cellule oeuf nn chromosomes
Génération N1
11I.4) Transmission de linformation génétique
- Erreurs de copie les mutations
- Substitution aléatoire dune lettre par une autre
lettre de lalphabet - Insertion aléatoire dune lettre (ou dun groupe
de lettres) - Suppression aléatoire dune lettre (ou dun
groupe de lettres) - Sélection des mutants
ACCTGC
ACTTGC
ACCTGC
ACCATGC
ACCTGC
AGC
12- Introduction
- Codage et transmission de linformation génétique
- Expression de linformation génétique
- Principes de lexpression les protéines
- De lADN à la protéine
- Transcription
- Traduction et code génétique
- Régulations de lexpression génétique
- Génétique et informatique
13II.1) Principes de lexpression les protéines
Génotype
Protéines
Phénotype
Protéines constitutives
Métabolisme Physiologie Développement
ADN
Protéines sécrétées
Enzymes (protéines)
Production De glucides
Production De lipides
14II.1) Principes de lexpression les protéines
- Les protéines, molécules de passage du génotype
(information génétique) au phénotype (ensemble
des caractères) - La génétique sintéresse à lexpression de
linformation génétique jusquà la production des
protéines - Létude du rôle des protéines dans lexpression
du phénotype est du domaine de la biochimie, de
la biologie cellulaire, du développement, de la
physiologie
15II.1) Principes de lexpression les protéines
16(No Transcript)
17II.2) De lADN à la protéine
ADN
Transcription
ARN m
Traduction
Protéine
18II.3) Transcription
19Épissage
20II.4) Traduction et code génétique
21Bilan
- Notion de gène
- Un gène ? une protéine (excision des introns)
- Un gène du codon départ au codon STOP
- Ensemble des gènes ? zone exprimée de lADN
- 35 000 gènes chez lHumain
- 1,5 de lADN -gt à quoi sert le reste ??
- Similitude entre les gènes des êtres vivants
- 40 de nos gènes commun avec une plante
- 80 avec un Mammifère
- 98,5 avec un Chimpanzé
- 99,9 avec un autre Humain
- Linéarité apparente de lexpression génétique
- Codage quasi-linéaire de linformation génétique
sur lADN - Transcription bijection de A, T, C, G sur A,
U, C, G - Traduction surjection de A, U, C, G3 sur
Phe, Leu, Ile, Met, Val, Ser, Pro, Thr, Ala,
Tyr, His, Gln, Asn, Lys, Asp, Glu, Cys, Trp, Arg,
Gly
22Bilan
- Pourtant variabilité de lexpression
- Dans lespace
- Toutes les cellules nont pas la même forme
- Toutes les cellules nont pas la même fonction
- Dans le temps
- Activité cellulaire dépendant du stade de
développement - Selon lenvironnement
- Activité cellulaire dépendant de son
environnement chimique - Réorganisation de linformation génétique lors de
son expression par régulations multiples
23II.5) Régulations de lexpression génétique
gène
Organisation structurale de lADN
transcription
Facteurs de régulation de la transcription
noyau
pré-ARNm
épissage
Epissage alternatif
ARNm
Maturation, transport, adressage des ARNm
Durée de vie des ARNm
ARNm
traduction
Contrôle de la traduction des ARNm
protéine
Modifications post-traductionnelles
protéine modifiée
protéine active
Adressage, et régulation de lactivité
protéine dégradée
Contrôle de la dégradation protéique
24II.5) Régulations de lexpression génétique
gène
transcription
Facteurs de régulation de la transcription
noyau
pré-ARNm
épissage
Epissage alternatif
ARNm
ARNm
traduction
protéine
protéine modifiée
protéine active
Produits de lactivité protéique
Environnement
protéine dégradée
25Un exemple de la régulation de la transcription
chez les Procaryotes lopéron tryptophane
Gènes codants pour les enzymes nécessaires à la
synthèse du tryptophane
26Un exemple eucaryote les gènes homéotiques
27Epissage alternatif
28- Introduction quest-ce que linformation
génétique ? - Codage et transmission de linformation génétique
- Expression de linformation génétique
- Génétique et informatique
- Apports de linformatique à la génétique
- Linspiration génétique en informatique
29III.1) Apports de linformatique à la génétique
- Analyse de séquences de bases
- Identification de motifs
- Localisation de motifs connus
- Détection de régularités, périodicités
- Comparaison de séquences
- Recherche des similarités
- Recherche des mutations
- Calcul de taux de divergence
- Élaboration de modèles dévolution
- Élaboration darbres phylogénétiques
- Modélisation de la structure 3d de protéines
30III.1) Apports de linformatique à la génétique
- Analyse de séquences de bases
- Identification de motifs
- Localisation de motifs connus
- Détection de régularités, périodicités
- Comparaison de séquences
- Recherche des similarités
- Recherche des mutations
- Calcul de taux de divergence
- Élaboration de modèles dévolution
- Élaboration darbres phylogénétiques
- Modélisation de la structure 3d de protéines
31IDENTIFICATION DE MOTIFS (PROGICIEL SQX, SITE
INFOBIOGEN)
POS 1 2 3 TOTAL A 24 31 23 26 C
25 21 26 24 G 34 22 24 27 T
18 26 27 24
Fréquence des bases sur un gène de 7784 pb
Phe TTT 1.7 Ser TCT 1.6 Tyr TAT 1.2 Cys TGT
0.8 Phe TTC 2.0 Ser TCC 0.5 Tyr TAC 1.7 Cys
TGC 1.3 Leu TTA 0.9 Ser TCA 0.9 TAA 1.2
TGA 0.9 Leu TTG 0.6 Ser TCG 0.7 TAG
0.2 Trp TGG 1.4 Leu CTT 1.4 Pro CCT 0.9 His
CAT 1.3 Arg CGT 3.8 Leu CTC 1.0 Pro CCC 0.3
His CAC 1.4 Arg CGC 1.9 Leu CTA 0.4 Pro CCA
1.0 Gln CAA 1.4 Arg CGA 1.1 Leu CTG 4.0 Pro
CCG 2.2 Gln CAG 2.1 Arg CGG 0.7 Ile ATT 2.3
Thr ACT 1.0 Asn AAT 1.0 Ser AGT 0.4 Ile ATC
2.3 Thr ACC 1.5 Asn AAC 2.5 Ser AGC 1.8 Ile
ATA 0.3 Thr ACA 0.9 Lys AAA 3.9 Arg AGA 0.8
Met ATG 1.9 Thr ACG 0.8 Lys AAG 1.7 Arg AGG
0.3 Val GTT 2.7 Ala GCT 1.9 Asp GAT 2.5 Gly
GGT 2.6 Val GTC 1.1 Ala GCC 1.5 Asp GAC 2.5
Gly GGC 2.8 Val GTA 1.5 Ala GCA 2.1 Glu GAA
4.7 Gly GGA 0.9 Val GTG 1.9 Ala GCG 2.8 Glu
GAG 1.9 Gly GGG 0.7
Fréquence () des bases sur le même gène de 2594
codons
32DÉTECTION DE PÉRIODICITÉS (LAB INFO DE lIGM)
Proba 1
- Proba dapparition de GTC n bases après CGC en
phase de lecture -gt périodicité 0 3 - Proba dapparition de TCG n bases après ATC en
phase de lecture -gt périodicité 1 3 - Proba dapparition de CGT n bases après CCC en
phase de lecture -gt périodicité 2 3
n
Proba 3
Proba 2
n
n
33Classement des trinucléotides en fonction de leur
phase d'apparition préférentielle
- Propriétés de ces 3 classes de trinucléotides
d'un point de vue théorie des codes - ces 3 classes de trinucléotides s'échangent par
permutation circulaire, - ce sont, toutes les trois, des codes circulaires
maximaux, - ces 3 codes possèdent une propriété de
complémentarité auto-complémentarité pour T0,
et échange de T1 et T2 par complémentarité, - codes non triviaux (? codes obtenus par des
techniques classiques de génération).
34- Hypothèse biologique gènes primitifs mots du
langage To ? - Phase de lecture repérable automatiquement -gt ne
nécessite pas de codon initiateur - Auto-complémentarité -gt codage simultané et en
phase des deux brins de lADN - Modélisation de lévolution de ce langage selon
mutations
35(No Transcript)
36CALCUL DE TAUX DE DIVERGENCE
- Comparaison de 2 séquences
- Définition des opérations élémentaires pour
passer de lune à lautre mutations
(substitution, insertion, suppression) - Attribution dun coût à chaque opération
élémentaire (w1,w2,w3) - Calcul du coût total minimal d pour passer dune
chaîne à lautre - d(ai,bj)mind(ai-1,bj-1) w1 (ai?bj),
d(ai,bj-1) w2, d(ai-1,bj) w3 - d(?,?)0 d(?, bj)d(?, bj-1) w2
d(ai,?) d(ai-1,? ) w3 - ou autres méthodes plus rapides (réseaux
systoliques) - Alignement pour coût total minimal distance
entre les deux séquences - But élaboration dun arbre phylogénétique
37ÉLABORATION DARBRES PHYLOGÉNÉTIQUES
- Distance augmentant linéairement avec le temps
depuis divergence (horloge biologique) - Dépend de la base utilisée
- Dépend du choix de la distance dune feuille à
un nœud non terminal
38III.2) Linspiration génétique en informatique
Inspiration génétique Support de linformation génétique Codage et transmission de linformation génétique
Applications Enroulement de lADN et théorie des nœuds Algorithmes génétiques
Applications Ordinateurs génétiques Ordinateurs génétiques
39ENROULEMENT DE LADN ET THÉORIE DES NŒUDS
Double hélice dADN Transcription -gt
sur-enroulement en amont, et sous-enroulement en
aval -gt activité des topo-isomérases Chez
Procaryotes, chromosome circulaire inspirant un
parallèle avec la théorie des nœuds
- Nœuds topologiquement équivalents si on peut
passer de lun à lautre sans topo-isomérase - Une topo-isomérase est responsable dune
transformation mathématique élémentaire (flip,
décroisement)
40- Prennent en compte
- Codage et transmission de linformation génétique
- Aspects aléatoires des mutations
- Sélection naturelle des meilleurs résultats
- Ne prennent pas en compte
- Modularité de lexpression
41ORDINATEURS GÉNÉTIQUES
42merci
et à la prochaine fois pour le codage neuronal ?