Title: Folie 1
1Multivariate Analysemethoden und Multivariates
Testen
Vorlesung
18.07.2007 25.06.2007
Günter Meinhardt Johannes Gutenberg Universität
Mainz
2Univariates Testen ANOVA rm ANOVA
Trendtests in ANOVA und rm ANOVA
Allgemeines
- Nach der Overall-Signifikanz die Ergebnisse der
Wirkungsweise explorieren. - Trends sind definierbar, wenn die Stufen der
UVs metrische Levels (Dosen, Zeiten,
Anzahlen) repräsentieren, nicht jedoch bei
kategorialen UVs. - Einfach zu interpretieren sind orthogonale
Trendpolynome. - Jede Ordnung des Polynoms liefert eine
orthogonale Trendkompo- nente, dessen
Varianzanteil getrennt bestimmt und getest
werden kann. - Ermöglicht Prognose des Erreichens von
Kriterien.
Voraussetzung
- Signifikanz des Faktors, unter dem Trends
vermutet werden. - In rm Designs die üblichen Voraussetzungen der
rm ANOVA (paarweise homogene
Varianz-Covarianzmatrizen (streng), bzw.
Homogene Varianzen der Abweichungen von Zellen
(Spherizität), Normalverteilung).
3Univariates Testen Trendtests
Beispiel
Mittelwerte mit Konfidenzintervallen
20
16
12
Anzahl Fahrfehler
8
4
0
0 pm
0.2 pm
0.4 pm
0.6 pm
0.8 pm
1.0 pm
Alkohohl-Dosis
PrototypischeDatensituation
- Ein Dosierungsfaktor mit k- Stufen, k gt 5 oder
Messwiederholungen über mind. 5 Zeitpunkte - monoton steigender oder fallender Gesamtverlauf
- Strategie 1. Absichern des Trends
2. Mit gezielten Einzelvergleichen Effekt gegen
Baseline absichern 3. Superposition der
signifikanten Trendkomponenten zur
Trendberechnung und Kriteriumsvorhersage verwenden
4Univariates Testen Trendtests
Trendpolynom
für einen Dosisfaktor mit k- Stufen beschreibt
die Daten perfekt, wenn alle Komponenten bis k-1
eingehen.
Übliche Polynome
- Lineares Polynom Anpassungsgerade
- Ein quadratisches Polynom beschreibt monotones
nichtlineares Wachstum oder Abfallen der
Werte - Ein kubisches Polynom kann auch Änderungen im
Verlauf der Kurve beschreiben
5Univariates Testen Trendtests
Orthogonale Polynome
Wird als Gleichung für die Mittelwerte der j
Stufen geschätzt
mit
usw.
Für Linearkombinationen Ci werden Koeffizienten
so gewählt, Daß die Trendkomponenten stets
orthogonal sind
Bedingungen
mit
(Kontrastbedingung)
(Orthogonalität der Ordnungen)
6Univariates Testen Trendtests
Orthogonale Polynome
Die Koeffizienten cij liegen bis zu hohen
Anzahlen für k in Tabellen vor.
7Univariates Testen Trendtests
Quadratsummen
Mit diesen Koeffizienten gilt
Die Treatmentquadratsumme zerlegt sich additiv in
die Quadratsummen- Anteile der einzelnen
orthogonalen Trendpolynome.
Trend-QS
Test
Jede Trendkomponente hat einen Freiheitsgrad (df
1). Dann gilt der F- Test
Mit dfzähler 1 und df Nenner dferror.
In komplexeren Designs oder rm Designs ist die
die jeweilige Testvarianz des Faktors einzusetzen.
8Univariates Testen Trendtests
Komponenten
Man teilt oft ein in lineare Komponenten und
Restkomponenten, um den nichtlinearen Anteil
abzuschätzen.
Diese Komponente hat k-2 Freiheitsgrade (df
k-2). Dann gilt der F- Test
Nichtlinearer Trend-Test
Mit dfzähler k-2 und df Nenner dferror.
Linearer Trend
Die Polynomkoeffizienten aller Trendkomponenten
erhält man wie üblich über die Methode der
Normalgleichungen. Für die lineare Komponente
eines aufsteigend (1,2,3) ganzzahlig gestuf-ten
Dosisfaktor gibt es einfache Beziehungen aus den
Quadratsummen
(Steigung)
(falls Stufen aufsteigend Integer)
(Schnittpunkt)
9Univariates Testen Trendtests
h2
Das Eta Quadrat kann aufgefasst werden als das
Quadrat der Korrelation von den Daten mit der
einem Polynom vom Grad k-1
Entsprechend kann man die einzelnen Trendanteile
bewerten
Trendvarianz-Aufklärung
Damit kann man die Zunahme der Varianzaufklärung
durch Hinzunahme einzelner Trendkomponenten
bewerten.
Man kann eine Intraklassenkorrelation von
Faktorstufen und Treatment berechnen
Intra-Class Correlation
mit
Sie gibt den korrelativen Zusammenhang der
Treatmentstufen mit den Daten an.
10Univariates Testen Trendtests
Einzelvergleiche
In der ANOVA prüft man Kontraste gewöhnlich über
F- Tests. Wegen
ist ein t- Test einem F- Test äquivalent. Es gilt
Für den Standardfehler eines Vergleichs
gilt
F-Test Kontraste
mit den Kontrastbedingungen
(Kontrast über F-Test prüfen)
11Univariates Testen Trendtests
Orthogonale Einzelvergleiche
Für orthogonale Einzelvergleiche gelten
gesonderte Konstruktionsregeln
Zwei Einzelvergleiche j und k sind orthogonal,
wenn gilt
Vollständige Sätze von orthogonalen Kontrasten
Man kann Mengen konstruieren, die k-1 orthogonale
Einzelvergleiche enthalten. Für solche
vollständigen Sätze von Einzelvergleichen gilt
Die Treatmentquadratsumme ist additiv aus
den Quadratsummen der Einzelvergleiche eines
voll- ständigen Satzes zusammengesetzt.
Alle in einem vollständigen orthogonalen Satz von
Einzelvergleichen enthaltenen Kontraste sind auf
dem a- Niveau des gesamten F- Testsfür den
Treatmentfaktor abgesichert, weil sie lediglich
Anteile an der Treatmentquadratsumme darstellen.
Excel-Beispiel
12Univariates Testen Trendtests
Konstruktion
Es gibt verschiedene Konstruktionsregeln. Z.B.
Helmert-Regel
Für k5 (Beispiel) führt dies auf die zeilenweise
orthogonale (4 x 5) Koeffizientenmatrix
Alle Vergleiche (Zeilen) sind orthogonal.
13Univariates Testen Trendtests
Paarvergleiche
Für reine Paarvergleiche gilt, dass es nur bis zu
orthogonale
Vergleiche in einem Satz geben kann.
Für mehr Paarvergleiche muss das a- Niveau gegen
multiples Testen adjustiert werden (Bonferroni),
um konservativ sicher zu testen.
Strategie
- Teste Trends im Treatmentfaktor. Signifikanz des
linearen Trends sichert bereits die monotone
Folge der Stufen ab. Signifikanz des
quadratischen Trends sicher den nichtlinearen
Anstieg (Abfall). - Sichere den Unterschied der letzten Faktorstufen
gegen den der ersten Faktorstufen mit wenigen
Einzeltests ab. Damit ist zumeist der gesamte
Gehalt der inhaltliche Hypothesen über
Lernverlauf oder Sättigung statistisch geprüft.
Man konstruiere sich ein Set von orthogonalen
Einzelvergleichen, welches viele der gewünschten
a-priori Kontraste enthält. Darüber
hinausgehende Vergleiche führt man mit a-
Adjustage durch. A-Posteriori Vergleiche
(Scheffe, Duncan) liefern meist mehr
konservative kritische Differenzen für Kontraste,
da in a-posteriori Tests alle möglichen
Paarvergleiche eingehen.
Excel-Beispiel
14Univariates Testen rm
ANOVA
Trendtests in rm ANOVA
Allgemeines
- Trendanalyse ist ein häufig eingesetztes
Verfahren in rm ANOVA Designs, da sie die
Art der Wirkverlaufes einer Intervention
beurteilen lässt. - Trends sind in rm Designs grundsätzlich
definierbar, da die Stufen der UVs als
Zeitpunkte oder Anzahlen der Wiederholung der
Gabe eines Treatment grundsätzlich metrische
Levels repräsentieren. - Trends sind ebenfalls in Mischdesigns mit
Grouping-Faktoren und rm Faktoren
definierbar. Für die Testung des Trends gilt,
dass der Trend immer an der Prüfvarianz des
Faktors geprüft wird. - Trendanalyse ermöglicht eine Prognose des
Zeitpunktes, an dem ein Lern- oder
Wirkkriterium voraussichtlich erreicht ist.
Voraussetzung
- Die Testung der Signifikanz des rm Faktors, der
mögliche Trends enthält, ist in der rm ANOVA
an strenge Voraussetzungen gebunden.
(Eigenschaften der Varianz-Covarianz Matrix). Bei
Verletzungen führt der F- Test zu
progressiven Entscheidungen. - Verletzungen der Voraussetzungen können mit
geeigneten Verfahren (Box, Greenhouse-Geisser)
korrigiert werden.
15Voraussetzungen rm ANOVA
Sind für insgesamt k Messzeitpunkte die
Korrelationen zwischen allen Messzeitpunkten
gleich und ebenfalls die Varianzen, so erhält man
als Varianz-Covarianz-Matrix
Verbundene Symmetrie
(verbund-symmetrische Matrix). Diese strenge
Forderung an dieStruktur der Daten für die
rm-ANOVA ist aber nicht nötig. Statt dessen muss
für die Gültigkeit der F-Statistik folgende
Bedingung erfüllt sein
Homogenitäts- Voraussetzung der rm ANOVA
Die Varianz der Differenz der Messwerte zweier
beliebiger Messzeit-punkte j und j muss
dieselbe Konstante ergeben. Verletzungen dieser
Voraussetzung führen zu progressiven
Verfälschungen des F-Tests.
16Voraussetzungen rm ANOVA
Anders geschrieben
Matrix-Bedingung Zirkularität
Varianz-Covarianz Matrizen S, die diese Bedingung
erfüllen, heissen zirkulär.
Beispiel
Man verifiziert ebenso, dass eine verbunden
symmetrische Matrix ebenfalls die Eigenschaft der
Zirkularität besitzt.
Excel-Beispiel
17Voraussetzungen rm ANOVA
Sei A eine Matrix mit gleichen Zeilenelementen,
so gilt
Generische Regel
ist zirkulär.
Beispiel (k3, l5)
Die Eigenschaft der Zirkularität der
Varianz-Covarianz Matrix ist über statistische
Tests prüfbar. Dazu bedient man sich einer aus
der Zirkularität abgeleiteten Eigenschaft von S,
der Spherizität.
Test über Spherizität
Sei M eine (k-1) x k Matrix mit orthogonalen
Zeilen.
Die (k-1) x (k-1) Matrix
ist sphärisch, gdw SX zirkulär ist.
Excel-Beispiel
18Voraussetzungen rm ANOVA
Man verwende als Matrix M eine Matrix der
c-Koeffizienten, die einen vollständigen Satz
orthogonaler Einzelvergleiche definiert. Die
Vektoren normiere man zeilenweise (orthonormale
Matrix M)
Sphärische Matrix SY
Beispiel (k3)
Diagonalmatrix SY
Da A gleiche Zeilenelemente hat, und die Summe
der Zeilenelemente von M Null ergibt, folgt
Damit
Folgerung
Wenn SX zirkulär ist, ist SY sphärisch (diagonal)
19Voraussetzungen rm ANOVA
Abweichung von Spherizität
Man definiert ein Abweichungsmaß e für die
Abweichung von der Spherizität
li die Eigenwerte von SY .
Range der möglichen Abweichung
Damit kann man den Range der möglichen
Abweichungen bewerten (Beispiel k4)
(perfekt)
(max. Abweichung)
Der Range der möglichen Abweichungen ist
(k-1)-11
20Voraussetzungen rm ANOVA
Mauchley-Test
Man teste die Nullhypothese
über die Stichprobenmatrizen SX und SY .
Test-Statistik Mauchleys W
mit
(tr die Spur der Matrix)
W ist austabelliert (e.g. Winer, Anhang D).
EntscheidungsRegel
Lehne die Nullhypothese (Spherizitätshypothese)
ab, wenn
sonst behalte Spherizitätshypothese bei. a
sollte nicht konservativ gewählt werden (e.g. a
0.25)
Aus W berechnet man die c2 verteilte Prüfstatistik
(nur approx.)
mit
21Voraussetzungen rm ANOVA
Mauchley-Test W-Tabelle
22Voraussetzungen rm ANOVA
Freiheitsgrad-korrektur
Unabhängig vom Ergebnis des Mauchley-Tests kann
der F-Test durch eine Adjustage der
Freiheitsgrade konservativer gemacht werden.
Box-Correction
Nach Box ist die F- Statistik in rm Designs
verteilt wie
()
Greenhouse-Geisser Correction
Da die untere Grenze für e (maximale Verletzung)
1/(k-1) ist, folgt
als konservativster F- Test, der jede
Spherizitätsverletzung auffängt.
Die Gültigkeit von () ist gut untersucht. Huynh
und Feldt schlagen vor, korrigierte e in () zu
verwenden
Huynh-Feldt-Correction
aber kombiniert mit der Regel
(den Abweichungswert auf 1 setzen, falls
größer wird)