Title: Vorlesung: 18.11.2003
1Vorlesung 18.11.2003 ANOVA II
2Übersicht
- Warum sollte man eine ANOVA überhaupt
durchführen? - Ein Vergleich mit dem t-Test
- - Beispiel 1 Zwei Gruppen Vergleich
- - Beispiel 2 gt2 Gruppen Vergleich
- Überblick
- Anwendung der ANOVA bei Microarray-Datenauswertu
ngen - Beispiel Kandidatengene
- Beispiel Normalisierung von Microarray Daten
3Übersicht
- Warum sollte man eine ANOVA überhaupt
durchführen? - Ein Vergleich mit dem t-Test
- - Beispiel 1 Zwei Gruppen Vergleich
- - Beispiel 2 gt2 Gruppen Vergleich
- Überblick
- Anwendung der ANOVA bei Microarray-Datenauswertu
ngen - Beispiel Kandidatengene
- Beispiel Normalisierung von Microarray Daten
4Gedankenexperiment 1 Raucher und Nichtraucher
Angenommen, wir wollen untersuchen, ob A man
bei Rauchern tendenziell ein anderes Level von
Protein x mißt als bei Nichtrauchern B Raucher
ein signifikant höheres Level von Protein x haben
als Nichtraucher
Messungen
5Gedankenexperiment 2 4 Laboratorien
Angenommen, wir wollen untersuchen, ob 4
verschiedene Laboratorien bei der Messung des
Cholesterinspiegels von Patienten dieselben
Ergebnisse liefern
1
4
2
3
Messungen
Mittelwert STD
6Fragestellung
7Raucher und Nichtraucher Zusammenfassung der
Daten
8Raucher und Nichtraucher Zusammenfassung der
Daten
- Was sehen wir?
- Tendenziell höhere Wert bei Rauchern
- hohe Varianz
- Es gibt durchaus Nichtraucher, die einen höheren
Wert haben als einige Raucher - Sind die Unterschiede signifikant?
94 Laboratorien Zusammenfassung der Daten
- Was sehen wir?
- Tendenziell unterschiedliche Resultate
- hohe Varianz
- Labor 2, 3 fast gleiches Mittel,
unterschiedliche Varianz - Sind die Unterschiede signifikant?
1
4
2
3
x
10T-Test oder ANOVA?
T-test Angenommen, wir haben zwei Proben. Die
erste Probe X1, ..., Xn umfaßt n Stichproben, die
aus einer Normalverteilung mit Erwartungswert ?X
und Varianz ?2 gezogen wurden die zweite Probe
Y1, ..., Ym umfaßt m Stichproben, die aus einer
Normalverteilung mit Erwartungswert ?Y und
Varianz ?2 gezogen wurden.
Wenn man nun Differenzen zwischen den beiden
Gruppen betrachten möchte ist das intuitive Maß
die Differenz der Mittelwerte ?X - ?Y
Tatsächlich ist die Differenz normalverteilter
Zufallsvariablen wieder normalverteilt, d.h. in
diesem Fall mit Erwartungswert ?X - ?Y und
Varianz ?2 (1/n1/m).
11T-Test oder ANOVA?
Definition pooled sample variance
Satz Angenommen, X1, ..., Xn sind n unabhängig
normalverteilte Zufallsvariablen mit
Erwartungswert ?X und Varianz ?2 . Ebenso seien
Y1, ..., Ym m unabhängige normalverteilte
Zufallsvariablen mit Erwartungswert ?Y und
Varianz ?2 . Außerdem sind die Xi unabhängig von
den Yj für alle i,j. Dann folgt die
Statistik einer t-Verteilung mit mn-2
Freiheitsgraden.
12Was ist eine t-Verteilung?
Dichte einer t-Verteilung
t-Verteilung
fr(t)
Fr(t)
rFreiheitsgrade
13Raucher und Nichtraucher t-Test
Messungen
x
14Raucher und Nichtraucher t-Test
Zweiseitiger Test
Einseitige Tests
15Raucher und Nichtraucher t-Test
t 3.3333 Signifikanzlevel0.05
- P(H1) 0.0033
- P(H2) 0.001656512
- P(H3) 0.9983435
x
16Raucher und Nichtraucher ANOVA
174 Laboratorien ein neues Problem
Nun haben wir aber mehr als zwei Probenreihen...
n
1
3
2
4
6 t- Tests
184 Laboratorien t-Test
1 2 3 4
Laboratorien
194 Laboratorien ANOVA
20Übersicht
- Warum sollte man eine ANOVA überhaupt
durchführen? - Ein Vergleich mit dem t-Test
- - Beispiel 1 Zwei Gruppen Vergleich
- - Beispiel 2 gt2 Gruppen Vergleich
- Überblick
- Anwendung der ANOVA bei Microarray-Datenauswertu
ngen - Beispiel Kandidatengene
- Beispiel Normalisierung von Microarray Daten
21Anwendung der ANOVA bei Microarray-Datenauswertung
en 1. Beispiel Kandidatengene
Drei Behandlungen
Für welche Gene gibt es Unterschiede in den
beiden Behandlungsmethoden?
22Anwendung der ANOVA bei Microarray-Datenauswertung
en 1. Beispiel Kandidatengene
23Anwendung der ANOVA bei Microarray-Datenauswertung
en 1. Beispiel Kandidatengene
Wir schauen uns erstmal nur ein Gen an
x
24- Warum sollte man eine ANOVA überhaupt
durchführen? - Ein Vergleich mit dem t-Test
- - Beispiel 1 Zwei Gruppen Vergleich
- - Beispiel 2 gt2 Gruppen Vergleich
- Überblick
- Anwendung der ANOVA bei Microarray-Datenauswertu
ngen - Beispiel Kandidatengene
- Beispiel Normalisierung von Microarray Daten
25Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
Array 1
Array 2
Patient Grün Kontrolle Rot
Patient Rot Kontrolle Grün
26Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
27Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
Farbstoff Grün Farbstoff Rot
Kontrolle
Patient
Array 1 Array 2
Patient
Kontrolle
- Dye Swap Setting
- Latin Square Setting
28Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
2-Interaktionseffekte 3-Interaktionseffekte
29Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
ADV DV AV AD ADVG DVG AVG ADG
Gesamtmittel A D V G AG DG VG
30Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
Modell von G.Churchill/K.Kerr
Jede Messung in einem Micoarrayexperiment wird
mit einer ganz speziellen Kombination der
Parameter Array, Dye (Farbstoff),
Variety(Probentyp), und Gen assoziiert.
Angenommen, y ijkg Bezeichnet die
Intensitätsmessung des g-ten Gens auf dem i-ten
Array mit dem j-ten Farbstoff im k-ten Probentyp.
31Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
Modell von G.Churchill/K.Kerr
Dann kann man das folgende Modell einführen
log(y ijkg) ? Ai Dj Vk Gg (AG)ig
(VG)kg ?ijkg
Dabei ist ? der Gesamtmittelwert
Ai bezeichnet den Arrayeffekt des i-ten Arrays
Dj bezeichnet den Farbstoffeffekt des j-ten
Farbstoffs
Vk bezeichnet den k-ten Probentypeffekt
Gg bezeichnet den Geneffekt des g-ten Gens
(AG)ig bezeichnet den Interaktioneffekt von Array
i und Gen g
und (VG)kg bezeichnet den Interaktionseffekt des
k-ten Probentyps und des g-ten Gens.
?ijkg ist ein N(0,?) Fehlerterm.
32Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
Modell von G.Churchill/K.Kerr
Farbstoff Grün Farbstoff Rot
Muskel
Leber
Array 1 Array 2
Leber
Muskel
Welche Gene sind in Leber und Muskel
unterschiedlich exprimiert?
33Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
Modell von G.Churchill/K.Kerr
Farbstoff Grün Farbstoff Rot
Array i1,2 Dye j1,2 Gewebe k1,2 Gene g1,..
.,n
Array 1 Array 2
Leber
Muskel
Leber
Muskel
Index Set (i,j,k) ? (1,1,1) , (1,2,2) ,
(2,1,2) , (2,2,1) d.h. jeder Clone Index (Gen)
g1,...,n erscheint genau einmal mit jeder
Kombination (i,j,k)
34Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
Modell von G.Churchill/K.Kerr
log(y ijkg) ? Ai Dj Vk Gg (AG)ig
(VG)kg ?ijkg
Quadrat der Summe der Residuen RSQ ?ijkl
(log(y ijkg) (? Ai Dj Vk Gg (AG)ig
(VG)kg ?ijkg))2 Berechne die Parameter so, daß
die Residuen möglichst klein sind. Dazu berechne
die partiellen Ableitungen und setze diese gleich
Null.
?RSQ / ? (VG)kg 0
35Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
36Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten
(VG)k1g - (VG)k2g
Die exponierten Differenzen exp((VG)k1g -
(VG)k2g ) können als Schätzer für fold
changes zwischen den beiden betrachteten Gruppen
angesehen werden.
37Anwendung der ANOVA bei Microarray-Datenauswertung
en 2. Beispiel Normalisierung von Microarray
Daten