Title: Analiza danych pochodzacych z mikromacierzy DNA
1Analiza danych pochodzacych z mikromacierzy DNA
- Agnieszka Ludwików
- Jan Sadowski
- Uniwersytet im. Adama Mickiewicza
- ludwika_at_amu.edu.pl
2Etapy eksperymentu microarray
Planowanie eksperymentu microarray
Eksperyment
Analiza danych
Interpretacja danych
Weryfikacja danych
3Zastosowanie mikromacierzy DNA
- Profilowanie ekspresji genów
- Wykrywanie mutacji (SNP)
- Genotypowanie
- Szacowanie liczby kopii (CGH)
- Mapowanie genów i klonów
4Problemy?
- Opis genów bazy danych
- Krzyzowa hybrydyzacja
- (rodziny genowe)
- Niepowtarzalnosc warunków eksperymentu
- (warunki hodowli, wyposazenie uzyte do
eksperymentu) - Material biologiczny
- (ilosc, jakosc)
5Planowanie eksperymentu
- Mikromacierze
- GeneChip Affymetrix
- cDNA, oligo na szkielkach
- Makromacierze
- - cDNA nylony
6GeneChip Affymetrix
- kazdy gen reprezentowany jest przez 11- 20 par
25-merów. - Pary PM i MM (pomiar tla i niespecyficznej
hybrydyzacji)
7Eksperyment microarray
Zródlo zmiennosci
- Procedura
- (izolacja RNA, znakowanie, hybrydyzacja,
skanowanie) - Replikacje techniczne i biologiczne
- (zmiennosc biologiczna)
8Replikacje techniczne
1
2
3
1
2
3
9Replikacje biologiczne
Ile replikacji?
- Zyskujemy zmiennosc biologiczna, która
reprezentuje populacje ! - ALE
- Tracimy zmiennosc osobnicza
Peng X. i inni, 2003, BMC Bioinformatics 2003,
426 Bakay M. i inni, 2002, BMC Bioinformatics
2002, 34
10Analiza danych
- Analizy jakosciowe
- dCHIP detekcja chipów poza norma (outlier
detection) oraz - PCA (Analiza komponentów glównych)
11Analiza danych
- Normalizacja
- To minimize non-biological variation and focus
on real biological changes - dCHIP http//www.dchip.org/
- Li Ch. Wong W.H., 2001, Proc. Natl. Acad.
Sci. Vol. 98, 31-36. - Zhong S., 2003, Nucleic Acids Research. Vol.
31, 3483-3486. - RMAExpress http//www.bioconductor.org/
- Bolstad B.M. i inni, 2003, Bioinformatics
19(2)185-193 - Irizarry R.A., i inni, 2003, Nucleic Acids
Research 31(4)e15 -
- Genespring http//www.silicongenetix.com
12Analiza danych
ID Kontrola1 Kontrola2 Kontrola3 ozonowana1 ozonowana2 ozonowana3
267454_at 928,9 953,7 870,2 92,82 97,82 95,82
267461_at 83,3 113,6 54,6 173,5 189,5 199,5
267435_at 95,7 92,8 85,7 144,6 176,6 132,6
267411_at 50,65 52,00 52,00 520,9 495,9 465,9
- Otrzymujemy liste genów, których poziom
transkrypcji spada lub rosnie - Czy i na ile wykryta zmiana jest rzeczywista?
13Analiza danych
ID Kontrola1 Kontrola2 Kontrola3 ozonowana1 ozonowana2 ozonowana3
267454_at 928,9 953,7 870,2 92,82 97,82 95,82
267461_at 83,3 113,6 54,6 173,5 189,5 199,5
267435_at 95,7 92,8 85,7 144,6 176,6 132,6
267411_at 50,65 52,00 52,00 520,9 495,9 465,9
P-value
4,45E-05
5,68E-06
4,89E-04
4,80E-05
- Uzyj metod statystycznych do oszacowania
istotnosci uzyskanych zmian. - UWAGA 2 typy bledów tzw. False positives
False negatives - Uzyj parametru krotnosci zmian (Fold change) by
oszacowac zróznicowanie profili. 2 krotna
represja lub indukcja jest powtarzalna przez
analizy ilosciowe - UWAGA Zazwyczaj wyzsze krotnosci zmian
wykazuja geny o niskim poziomie transkrypcji - Geny, które zmieniaja poziom transkrypcji z
zadanym statystycznym prawdopodobienstwem
(P-VALUE) i z zadana krotnoscia zmian!!!
14Analiza danych
- Poszukiwanie zwiazku miedzy poziomem transkryptu
a sekwencja genu, jego funkcja, szlakiem
sygnalowym, szlakiem metabolicznym etc. - Geny kodujace bialka uczestniczace w tym samym
procesie lub sa czescia tego sameo kompleksu
najczesciej sa koregulowane. - Klastery genów spelniajacych podobne funkcje
czesto wykazuja skorelowany profil transkrypcji w
warunkach róznych stresów, warunków srodowiska
etc. - Typy klusterów Hierarchiczne, Self Organizing
Maps (SOM), K-mean - Poszukiwanie cis-sekwencji u koregulujacych sie
genów - AGRIS http//arabidopsis.med.ohio-state.edu/
- PlantProm DB http//www.softberry.com/berry.phtml
- PlantCare http//oberon.fvms.ugent.be8080/PlantC
ARE/index.html - Place http//www.dna.affrc.go.jp/PLACE/
- Transfac http//www.gene-regulation.com/pub/datab
ases.htmltransfac - MEME http//meme.sdsc.edu/meme/website/intro.html
- MotifSampler http//www.esat.kuleuven.ac.be/thi
js/Work/MotifSampler.html
15Weryfikacja danych
Microarray nie jest technika ilosciowa Poziom
intensywnosci sygnalu wzglednie swiadczy o
poziomie transkryptu.
Analizy ilosciowe relative quantification - gen
referencyjny np. aktyna2, 18S rRNA
- Northern
- Taniguchi M. i inni, 2001, Genomics. Jan
171(1)34-9. - ilosciowy Real time RT-PCR
- Tricarico C. i inni, 2002, Analytical
Biochemistry 309 (2002) 293300 - Jenson S.D. i inni, 2003, J Clin Pathol Mol
Pathol56307312 - http//info.med.yale.edu/wmkeck/affymetrix/rtpcr/
16Roslinne bazy danych microarray
- The Nottingham Arabidopsis Stock Centre's (NASC)
-
http//arabidopsis.info/ - Stress Genomics Consortium http//www.osmid.org/
- http//www.stress-genomics.org
- The Arabidopsis Functional Genomics Consortium
(AFGC) - Stanford Microarray Database (SMD)
http//www.arabidopsis.org - Soybean genomics and microarray database (SGMD)
http//psi081.ba.ars.usda.gov - Complete Arabidopsis Transcriptome MicroArray
database (CATMA) - http//www.catma.org/
- Tomato Expression Database (TED)
http//ted.bti.cornell.edu/ - http//sgn.cornell.edu/
- Plant-Arrays database
- http//www.univ-montp2.fr/plant_arrays/databa
ses.html