Title: Les microarrays, vue densemble et applications Frdric Bassilana
1Les micro-arrays, vue densemble et
applicationsFrédéric Bassilana
I - Notions fondamentales
II - Des arrays aux biopuces
III - Traitement de linformation biologique
2I - Notions fondamentales
3Notions fondamentales
Organismes
Organes
Tissus
Cellules
Noyau
Gènes
4Chromosomes humains en métaphase
5Des chromosomes aux gènes - I
6Des chromosomes aux gènes - II
Daprès Watson et Crick (Nature 1953)
7Des chromosomes aux gènes - III
8Des chromosomes aux gènes - IV
9Deux grandes phases
Noyau
Cytoplasme
Cellule
Membrane
10Une complexité croissante
11La transcription
12Des gènes aux proteines
TSS
TES
Enhancer / Repressor
Enhancer / Repressor
Intron 2
Intron 1
Intron 3
Intron 4
Intron 5
Promoter
PAS
ADN (2 brins) A, T, C, G
Exon1
2
Exon3
4
Exon5
AATAAA
TATA box
13La transcription - II
14La transcription - III
ARN pré-messager
1
2
3
4
5
15La traduction
16La traduction
AAAAAAAAA
17Le code génétique
18Lhybridation
19Lhybridation
Taille différente
20Principes de détection des acides nucléiques
Southern Blot
Southern, E.M. Detection of specific sequences
among DNA fragments separated by gel
electrophoresis. J. Mol. Biol. 98, 503517 (1975).
21Principes de détection des acides nucléiques
Northern Blot
ARNm
Foie
Coeur
Rein
Taille
Membrane de nylon
22Paramètres de lhydridation
23Résumé
Membrane
Noyau
Cytoplasme
Cellule
- On postule quun modification transcriptionnelle
va avoir un impact sur une fonction
- Les acides nucléiques sont complémentaires (AT,
CG)
- Lefficacité dhybridation dépend notamment de
la température et de la longueur de lalignement
exact.
24II - Des arrays aux Biopuces
25Quelques chiffres
Séquencé Mb Chromosomes Gènes Saccharomyces
cerevisiae 1996 12 I-XVI 6 103 Caenorhabditis
elegans 12 / 1998 100 I-V X 20
103 Drosophila melanogaster 04 / 2000 135 3
XY 14 103 Arabidopsis thaliana 12 /
2000 120 I-V 26 103 Homo sapiens 02 /
2001 3300 22 XY 23 à 50 103 Mus
musculus 2004 3000 19 XY 25 à 94 103
http//www2.ebi.ac.uk/genomes/mot/
http//www.ensembl.org/
26Pourquoi les arrays sont-ils nécessaires
Connu
ARNm
Foie
Coeur
Rein
Taille
A tester
Membrane de nylon
27Principe
28Les 2 grandes étapes
A - Matérielle (dépôt, sondes, hybridation,
scanner)
B - Traitement du signal
29A - Etape matérielle
30Le design des sondes
31Une longueur idéale ?
Hugues et al APRIL 2001 VOLUME 19 nature
biotechnology
32Les supports
33Le dépôt
La densité augmentant, le problème est de déposer
les sondes
34Dépôt avec contact
Synthèse
Dépôt
35Dépôt sans contact / Synthèse in situ
Technologie Jet dencre
Sonde Oligonucléotide (60), cDNA
Lame 25mm X 75mm
36Synthèse in situ
Photo-déprotection
Sonde Oligonucléotides (25)
12.8mm X 10mm
37Le marquage
38Distance à la matrice accessibilité
PEG
Oligonucléotide
40 angströms
Southern et al, nature genetics supplement
volume 21 january 1999
39Structure secondaire disponibilité
- Les fragments testés peuvent former des
structures secondaires
40Conditions optimales
41Lhybridation
- Oligonucléotide 20 - 60 bases
- Taille et type de léchantillon
42Acquisition des données
I - Pellicule photographique
43Deux grands principes
44II - Traitement du signal
45Traitement de limage
46Quelques problèmes classiques
47Le principe Affymetrix
- Après traitement de limage il y a 22 à 32
valeurs par échantillon
48Test de spécificité
Libre
50
C
Tm
49Qualification dun probe set - I
80
80
80
80
80
80
80
80
80
80
PM
MM
10
20
30
40
50
60
70
80
90
100
50Qualification dun probe set - II
51Calcul de la valeur dexpression
- One-Step Tukeys Biweight Estimate
- Le bruit de fond est calculé en prenant en
compte tous les MM CT
- Par paire, on calcule log (PM - MM) ou log (PM -
CT) si MM gt PM
- Cette valeur est pondérée en considérant sa
distance à la médiane du probe set
- Le signal est la moyenne de toutes ces valeurs
exprimée de façon linéaire
52Tableau de résultats
P-value
Call
Valeur
Clé
1345434_at
0.0001
P
1228
._at
0.23
A
A
M
X 104 entrées
53Les systèmes à 2 canaux
- Après traitement de limage il y a une valeur
par échantillon, mais lon sintéresse
généralement au rapport de la valeur des deux
échantillons
- Le déséquilibre Cy3 / Cy5, bien que mieux pris
en compte aujourdhui rend souvent nécessaire
un swap
54III - Traitement de linformation biologique
55Evolution des publications sur les Biopuces
Multiplexed biochemical assays with biological
chips Fodor et al Nature 1993 Aug
5364(6437)555-6
Light-generated oligonucleotide arrays for rapid
DNA sequence analysis Pease AC et al Proc Natl
Acad Sci U S A 1994 May 2491(11)5022-6
56Bibliographie de Biopuces
Trouvé dans Medline en Août 2003
57La préparation des données
58Comparaison en paire
59Interprétation
- Linterprétation se fait souvent par recoupement
dinformations
60Comparaison de plusieurs groupes
61Les signatures comme une alternative aux voies
métaboliques
Cluster
Dépend de la distance (Euclidienne, Manhatan,
min, max )
62Le clustering hiérarchique dEisen
Eisen et al., PNAS vol95 14863 - 14868, 1998
63Classification
Echantillon1
n échantillon présentant une histologie
similaire
Référence
Echantillon2
64Classification
65Ce nest quun début
66Une nouvelle ambition
Organismes
Organes
Tissus
Cellules
Voies métaboliques
Noyau
Réseaux
Gènes
67Les réseaux
R lt -r0
R gt r0
68Les réseaux
69Comment intégrer toutes ces données ?
Expérience
70Un effort international
Japon
CIBEX
http//cibex.nig.ac.jp/cibex/HTML/index.html
USA
Gene Expression Omnibus (NCBI)
http//www.ncbi.nlm.nih.gov/geo/
ArrayExpress (EBI)
Europe
http//www.ebi.ac.uk/arrayexpress/
71Il faut se méfier des apparences
- Il faut donc multiplier les angles dobservation
pour approcher la réalité
72La confirmation par une technique alternative est
un bon indicateur
73Il faut bénéficier des autres informations
disponibles
Expérience - Conditions de lexpérience -
Données dexpression
74Conclusions
Clinique
Préclinique
Optimisation
HTS
Recherche