Codage et expression de l - PowerPoint PPT Presentation

About This Presentation
Title:

Codage et expression de l

Description:

Codage et expression de l information g n tique Pascale Giraudet www.univ-tln.fr/~giraudet S minaire GRIM 4 mars 2003 Plan de l expos Introduction : qu est ... – PowerPoint PPT presentation

Number of Views:228
Avg rating:3.0/5.0
Slides: 40
Provided by: giraudetU
Category:

less

Transcript and Presenter's Notes

Title: Codage et expression de l


1
Codage et expression de linformation génétique
  • Pascale Giraudet
  • www.univ-tln.fr/giraudet

Séminaire GRIM 4 mars 2003
2
Plan de lexposé
  • Introduction quest-ce que linformation
    génétique ?
  • Codage et transmission de linformation génétique
  • Expression de linformation génétique
  • Génétique et informatique

3
Quest-ce que linformation génétique ?
  • Chaque individu présente des caractères propres
  • Certains sont acquis (musculature, )
  • Dautres héréditaires (couleur des yeux, groupe
    sanguin, ) transmis dune génération à lautre
  • information génétique

4
  • Introduction quest-ce que linformation
    génétique ?
  • Codage et transmission de linformation génétique
  • Localisation de linformation génétique
  • Support de linformation génétique
  • Codage de linformation génétique sur lADN
  • Transmission de linformation génétique
  • Expression de linformation génétique
  • Génétique et informatique

5
I.1) Localisation de linformation génétique
  • Expérience de Gurdon (1960)
  • Noyau cellule grenouille B
  • Œuf énucléé grenouille A
  • gt obtention dun clone de la grenouille B

6
I.2) Support de linformation génétique
Cellule G 1000 N 1013
Chromosome G 10 000 N 223
ADN G 107 L ? 2 m
7
I.2) Support de linformation génétique
Watson et Crick, 1953
Paires de bases G 107 N ? 3 109
8
I.2) Support de linformation génétique
Bases puriques (R)
Bases pyrimidiques (Y)
(A)
(G)
(T)
(C)
-gt ADN ? Succession de 3 109 lettres dun
alphabet quaternaire
9
I.3) Codage de linformation génétique sur lADN
  • Succession presque linéaire de 3109 lettres dun
    alphabet moléculaire quaternaire (A,C,G,T)
  • Seule non-linéarité ADN porté par 2n
    chromosomes (n23 chez lhomme)
  • Le brin complémentaire napporte aucun complément
    dinformation (stabilité chimique)
  • Il existe de lADN hors du noyau ADN
    mitochondrial (104 paires de bases)

10
I.4) Transmission de linformation génétique
  • Transmission conforme la réplication lors de la
    division cellulaire
  • Brassage génétique lors de la reproduction sexuée

Génération N
Cellule du père 2n chromosomes
Cellule de la mère 2n chromosomes
méiose
Gamète du père n chromosomes
Gamète du père n chromosomes
Gamète de la mère n chromosomes
Gamète de la mère n chromosomes
fécondation
Cellule oeuf nn chromosomes
Génération N1
11
I.4) Transmission de linformation génétique
  • Erreurs de copie les mutations
  • Substitution aléatoire dune lettre par une autre
    lettre de lalphabet
  • Insertion aléatoire dune lettre (ou dun groupe
    de lettres)
  • Suppression aléatoire dune lettre (ou dun
    groupe de lettres)
  • Sélection des mutants

ACCTGC
ACTTGC
ACCTGC
ACCATGC
ACCTGC
AGC
12
  • Introduction
  • Codage et transmission de linformation génétique
  • Expression de linformation génétique
  • Principes de lexpression les protéines
  • De lADN à la protéine
  • Transcription
  • Traduction et code génétique
  • Régulations de lexpression génétique
  • Génétique et informatique

13
II.1) Principes de lexpression les protéines
Génotype
Protéines
Phénotype
Protéines constitutives
Métabolisme Physiologie Développement
ADN
Protéines sécrétées
Enzymes (protéines)
Production De glucides
Production De lipides
14
II.1) Principes de lexpression les protéines
  • Les protéines, molécules de passage du génotype
    (information génétique) au phénotype (ensemble
    des caractères)
  • La génétique sintéresse à lexpression de
    linformation génétique jusquà la production des
    protéines
  • Létude du rôle des protéines dans lexpression
    du phénotype est du domaine de la biochimie, de
    la biologie cellulaire, du développement, de la
    physiologie

15
II.1) Principes de lexpression les protéines
16
(No Transcript)
17
II.2) De lADN à la protéine
ADN
Transcription
ARN m
Traduction
Protéine
18
II.3) Transcription
19
Épissage
20
II.4) Traduction et code génétique
21
Bilan
  • Notion de gène
  • Un gène ? une protéine (excision des introns)
  • Un gène du codon départ au codon STOP
  • Ensemble des gènes ? zone exprimée de lADN
  • 35 000 gènes chez lHumain
  • 1,5 de lADN -gt à quoi sert le reste ??
  • Similitude entre les gènes des êtres vivants
  • 40 de nos gènes commun avec une plante
  • 80 avec un Mammifère
  • 98,5 avec un Chimpanzé
  • 99,9 avec un autre Humain
  • Linéarité apparente de lexpression génétique
  • Codage quasi-linéaire de linformation génétique
    sur lADN
  • Transcription bijection de A, T, C, G sur A,
    U, C, G
  • Traduction surjection de A, U, C, G3 sur
    Phe, Leu, Ile, Met, Val, Ser, Pro, Thr, Ala,
    Tyr, His, Gln, Asn, Lys, Asp, Glu, Cys, Trp, Arg,
    Gly

22
Bilan
  • Pourtant variabilité de lexpression
  • Dans lespace
  • Toutes les cellules nont pas la même forme
  • Toutes les cellules nont pas la même fonction
  • Dans le temps
  • Activité cellulaire dépendant du stade de
    développement
  • Selon lenvironnement
  • Activité cellulaire dépendant de son
    environnement chimique
  • Réorganisation de linformation génétique lors de
    son expression par régulations multiples

23
II.5) Régulations de lexpression génétique
gène
Organisation structurale de lADN
transcription
Facteurs de régulation de la transcription
noyau
pré-ARNm
épissage
Epissage alternatif
ARNm
Maturation, transport, adressage des ARNm
Durée de vie des ARNm
ARNm
traduction
Contrôle de la traduction des ARNm
protéine
Modifications post-traductionnelles
protéine modifiée
protéine active
Adressage, et régulation de lactivité
protéine dégradée
Contrôle de la dégradation protéique
24
II.5) Régulations de lexpression génétique
gène
transcription
Facteurs de régulation de la transcription
noyau
pré-ARNm
épissage
Epissage alternatif
ARNm
ARNm
traduction
protéine
protéine modifiée
protéine active
Produits de lactivité protéique
Environnement
protéine dégradée
25
Un exemple de la régulation de la transcription
chez les Procaryotes lopéron tryptophane
Gènes codants pour les enzymes nécessaires à la
synthèse du tryptophane
26
Un exemple eucaryote les gènes homéotiques
27
Epissage alternatif
28
  • Introduction quest-ce que linformation
    génétique ?
  • Codage et transmission de linformation génétique
  • Expression de linformation génétique
  • Génétique et informatique
  • Apports de linformatique à la génétique
  • Linspiration génétique en informatique

29
III.1) Apports de linformatique à la génétique
  • Analyse de séquences de bases
  • Identification de motifs
  • Localisation de motifs connus
  • Détection de régularités, périodicités
  • Comparaison de séquences
  • Recherche des similarités
  • Recherche des mutations
  • Calcul de taux de divergence
  • Élaboration de modèles dévolution
  • Élaboration darbres phylogénétiques
  • Modélisation de la structure 3d de protéines

30
III.1) Apports de linformatique à la génétique
  • Analyse de séquences de bases
  • Identification de motifs
  • Localisation de motifs connus
  • Détection de régularités, périodicités
  • Comparaison de séquences
  • Recherche des similarités
  • Recherche des mutations
  • Calcul de taux de divergence
  • Élaboration de modèles dévolution
  • Élaboration darbres phylogénétiques
  • Modélisation de la structure 3d de protéines

31
IDENTIFICATION DE MOTIFS (PROGICIEL SQX, SITE
INFOBIOGEN)
POS 1 2 3 TOTAL A 24 31 23 26 C
25 21 26 24 G 34 22 24 27 T
18 26 27 24
Fréquence des bases sur un gène de 7784 pb
Phe TTT 1.7 Ser TCT 1.6 Tyr TAT 1.2 Cys TGT
0.8 Phe TTC 2.0 Ser TCC 0.5 Tyr TAC 1.7 Cys
TGC 1.3 Leu TTA 0.9 Ser TCA 0.9 TAA 1.2
TGA 0.9 Leu TTG 0.6 Ser TCG 0.7 TAG
0.2 Trp TGG 1.4 Leu CTT 1.4 Pro CCT 0.9 His
CAT 1.3 Arg CGT 3.8 Leu CTC 1.0 Pro CCC 0.3
His CAC 1.4 Arg CGC 1.9 Leu CTA 0.4 Pro CCA
1.0 Gln CAA 1.4 Arg CGA 1.1 Leu CTG 4.0 Pro
CCG 2.2 Gln CAG 2.1 Arg CGG 0.7 Ile ATT 2.3
Thr ACT 1.0 Asn AAT 1.0 Ser AGT 0.4 Ile ATC
2.3 Thr ACC 1.5 Asn AAC 2.5 Ser AGC 1.8 Ile
ATA 0.3 Thr ACA 0.9 Lys AAA 3.9 Arg AGA 0.8
Met ATG 1.9 Thr ACG 0.8 Lys AAG 1.7 Arg AGG
0.3 Val GTT 2.7 Ala GCT 1.9 Asp GAT 2.5 Gly
GGT 2.6 Val GTC 1.1 Ala GCC 1.5 Asp GAC 2.5
Gly GGC 2.8 Val GTA 1.5 Ala GCA 2.1 Glu GAA
4.7 Gly GGA 0.9 Val GTG 1.9 Ala GCG 2.8 Glu
GAG 1.9 Gly GGG 0.7
Fréquence () des bases sur le même gène de 2594
codons
32
DÉTECTION DE PÉRIODICITÉS (LAB INFO DE lIGM)
Proba 1
  1. Proba dapparition de GTC n bases après CGC en
    phase de lecture -gt périodicité 0 3
  2. Proba dapparition de TCG n bases après ATC en
    phase de lecture -gt périodicité 1 3
  3. Proba dapparition de CGT n bases après CCC en
    phase de lecture -gt périodicité 2 3

n
Proba 3
Proba 2
n
n
33
Classement des trinucléotides en fonction de leur
phase d'apparition préférentielle
  • Propriétés de ces 3 classes de trinucléotides
    d'un point de vue théorie des codes
  • ces 3 classes de trinucléotides s'échangent par
    permutation circulaire,
  • ce sont, toutes les trois, des codes circulaires
    maximaux,
  • ces 3 codes possèdent une propriété de
    complémentarité  auto-complémentarité pour T0,
    et échange de T1 et T2 par complémentarité,
  • codes non triviaux (? codes obtenus par des
    techniques classiques de génération).


34
  • Hypothèse biologique gènes primitifs mots du
    langage To ?
  • Phase de lecture repérable automatiquement -gt ne
    nécessite pas de codon initiateur
  • Auto-complémentarité -gt codage simultané et en
    phase des deux brins de lADN
  • Modélisation de lévolution de ce langage selon
    mutations

35
(No Transcript)
36
CALCUL DE TAUX DE DIVERGENCE
  • Comparaison de 2 séquences
  • Définition des opérations élémentaires pour
    passer de lune à lautre mutations
    (substitution, insertion, suppression)
  • Attribution dun coût à chaque opération
    élémentaire (w1,w2,w3)
  • Calcul du coût total minimal d pour passer dune
    chaîne à lautre
  • d(ai,bj)mind(ai-1,bj-1) w1 (ai?bj),
    d(ai,bj-1) w2, d(ai-1,bj) w3
  • d(?,?)0 d(?, bj)d(?, bj-1) w2
    d(ai,?) d(ai-1,? ) w3
  • ou autres méthodes plus rapides (réseaux
    systoliques)
  • Alignement pour coût total minimal distance
    entre les deux séquences
  • But élaboration dun arbre phylogénétique

37
ÉLABORATION DARBRES PHYLOGÉNÉTIQUES
  • Distance augmentant linéairement avec le temps
    depuis divergence (horloge biologique)
  • Dépend de la base utilisée
  • Dépend du choix de la distance dune feuille à
    un nœud non terminal

38
III.2) Linspiration génétique en informatique
Inspiration génétique Support de linformation génétique Codage et transmission de linformation génétique
Applications Enroulement de lADN et théorie des nœuds Algorithmes génétiques
Applications Ordinateurs génétiques Ordinateurs génétiques
39
ENROULEMENT DE LADN ET THÉORIE DES NŒUDS
Double hélice dADN Transcription -gt
sur-enroulement en amont, et sous-enroulement en
aval -gt activité des topo-isomérases Chez
Procaryotes, chromosome circulaire inspirant un
parallèle avec la théorie des nœuds
  • Nœuds topologiquement équivalents si on peut
    passer de lun à lautre sans topo-isomérase
  • Une topo-isomérase est responsable dune
    transformation mathématique élémentaire (flip,
    décroisement)


40
  • Prennent en compte
  • Codage et transmission de linformation génétique
  • Aspects aléatoires des mutations
  • Sélection naturelle des meilleurs résultats
  • Ne prennent pas en compte
  • Modularité de lexpression

41
ORDINATEURS GÉNÉTIQUES
42
merci
et à la prochaine fois pour le codage neuronal ?
Write a Comment
User Comments (0)
About PowerShow.com