Title: T-Tests und Varianzanalysen
1T-Tests und Varianzanalysen
2Allgemein
- Bei all diesen Tests geht es um Zusammenhänge
zwischen 2 oder mehr Variablen. - Dabei ist die abhängige Variable(AV) mindestens
Intervallskalenniveau und die unabhängige/n
Variable/n(UV) kategorial. - Es werden die arithmetischen Mittel erfasst und
auf signifikante Unterschiede geprüft.
3T-Tests
- Untersuchen, ob sich die Mittelwerte zweier SP
signifikant unterscheiden (außer T-Test für eine
SP Vergleich eines Mittelwertes einer SP mit
beliebigen Mittelwert ) - Voraussetzungen
- Normalverteilung
- min. intervallskalierte AV
- dichotome UV
- Nicht zu große Stichprobenumfänge (neigt dann zu
signifikanten Ergebnissen) und Zufallsauswahl - für T-Test für unabhängige Stichproben(SP)
unabhängige (Teil-)Stichproben - für T-Test für gepaarte SP abhängige (Teil-)SP
4Quelle Kähler 2006 414.
5T-Test bei einer SP
- Datensatz Master_FP_2006.sav
- Es geht um das Alter der Befragten Variable
alter - Forschungsinteresse Wir wollen herausfinden, ob
sich der Altersdurchschnitt dieser Studie
signifikant vom Altersdurchschnitt des
Hochschulgesamtdatensatz unterscheidet. - ?Hier wollen wir dazu den Ein-Stichproben-T-Test
verwenden. - andere Anwendungsmöglichkeiten z.B. Vergleich
des Durchschnittseinkommen der eigenen Studie mit
offiziellem Durchschnittseinkommen der
Gesamtbevölkerung
6T-Test bei einer SP
- Analysieren?Mittelwerte vergleichen?T-Test bei
einer SP - Hypothesen (für zweiseitig)
- H0 µ empir33,8935
- H1 µ empir ?33,8935
Quelle Janssen 2003 306.
7T-Test bei einer SP -Fenster
- Testvariable(n) Variable(n) bei der der Test
durchgeführt werden soll - ?hier alter
- Testwert Wert, mit dem der empirische Mittelwert
verglichen werden soll - ?hier 33,8935 (aus Hochschulgesamtdatensatz)
- Optionen
- Konfidenzintervall
- Fehlende Werte Fallausschluss Test für Test...
nur Ausschluss der Fälle, bei denen in der gerade
analysierten abhängigen oder unabhängigen
Variable ein fehlender Wert auftritt - Listenweiser
Fallausschluss Ausschluss aller Fälle, in denen
in irgendeiner dieser Variablen ein fehlender
Wert auftritt
8T-Test bei einer SP -Ausgaben
Streuung um den Mittelwert
in diesem Bereich liegt mit 95iger Sicherheit
der wahre Wert
Freiheits-grade
Mittelwertsdifferenz Differenz zum Testwert
T-Wert
tgttkrit1,96 UND Sig.(2-seitig) lt 0,05
?H0 ist abzulehnen (mit
Irrtumswahrscheinlichkeit von 5)
für 1-seitige Hypothesen Sig.(2-seitig) durch 2
teilen
9T-Test bei unabhängigen SP
- Datensatz Master_FP_2006.sav
- Es geht um die Frage 51
10Menü Mittelwerte
- Analysieren ? Mittelwerte vergleichen ?
Mittelwerte - zum Vergleich der Mittelwerte u. a.
deskriptiver Statistik sowie Kontrolle der
Drittvariablen - Fenster
- abhängige Variablen f51beruf
- unabhängige Variablen f65gesch
- Optionen Zellenstatistikwas gewünscht
- ANOVA-Tabelle
Varianzanalyse (ohne Einbeziehung -
der Kontrollvariablen) - und Eta zur
Bestimmung des Anteils der erklärten -
Varianz - Linearitätstest prüft,
ob Zusammenhang durch lineare Regression erfasst
werden kann (metrische, klassifizierte UV nötig) - Weiter zur Einführung von Kontrollvariablen
11Menü Mittelwerte
Forschungsinteresse Sind die Mittelwertunterschie
de signifikant oder zufällig? ?Prüfung mit
2-Stichproben-T-Test für unabhängige SP
12T-Test bei unabhängigen SP
- Analysieren?Mittelwerte vergleichen?T-Test bei
unabhängigen SP - Hypothesen (für zweiseitig)
- H0 µweibl µmännl
- H1 µ weibl ? µmännl
- Fenster
- Testvariable(n) ?hier f51beruf
- GruppenvariableUV ?hier f65gesch
- Gruppen def. Gruppe 1 ?hier 1
- Gruppe 2 ?hier 2
- Trennwert
Teilungspunkt für - ordinale oder
metrische UV? - Bildung v. 2
Gruppen - Optionen
- Konfidenzintervall
- Fehlende Werte Fallausschluss Test für Test
- Listenweiser
Fallausschluss
13T-Test bei unabhängigen SP -Ausgaben
14T-Test bei unabhängigen SP -Ausgaben
Standardab-weichung der Differenz
F-Wert
15T-Test bei unabhängigen SP -Ausgaben
- Levene-Test für Varianzgleichheit
- H0 Varianzen der Variablen gleich
- H1 Varianzen sind nicht gleich
- Ergebnis Signifikanz gt 0,05
- Varianzen sind nicht gleich ablesen
- T-Test
- tgttkrit1,96 UND Sig.(2-seitig) lt 0,05
- ?H0 ist abzulehnen (mit Irrtumswahrscheinlichkeit
von 5)
16T-Test bei gepaarten SP
- Datensatz abm.sav
- Einkommen von Teilnehmern einer
Arbeitsbeschaffungsmaßnahme - Forschungsinteresse Unterschiede des Einkommen
der Teilnehmer vor und nach der
Arbeitsbeschaffungsmaßnahme - ?Prüfung mit 2-Stichproben-T-Test für abhängige
SP - Analysieren?Mittelwerte vergleichen?T-Test bei
gepaarten SP
17T-Test bei gepaarten SP
- Hypothesen (für zweiseitig)
- H0 µvar225 µvar310
- H1 µvar225 ? µvar310
- Fenster
- Gepaarte Variablen es sind mehrere Paare möglich
?hier var225(Bruttoeinkommen vor ABM)
?Strg-Taste halten ?var310(erstes Bruttoeinkommen
nach ABM) - Optionen
- Konfidenzintervall
- Fehlende Werte Fallausschluss Test für Test
- Listenweiser
Fallausschluss
18T-Test bei gepaarten SP
Korrelation recht hoch
19T-Test bei gepaarten SP
Mittelwert der Differenzen zwischen den
Zeitpunkten
Standard-abweichung der Differenzen zwischen den
Zeitpunkten
tlttkrit1,994 UND Sig.(2-seitig) gt 0,05
? H0 kann nicht abgelehnt werden ?kein
signifikanter Unterschied im Einkommen
20Varianzanalysen
- Untersucht, ob sich die Mittelwerte von mehr als
2 SP signifikant unterscheiden - Prüft nur, ob Unterschied zwischen min. einem der
verglichenen Paare signifikant ist ? zur Prüfung
zwischen welchen Vergleichspaaren signifikante
Differenzen Post-Hoc-Tests - Voraussetzungen
- UV alle Skalenniveaus möglich, kategorisiert
- AV min. Intervallskalierung
- Varianzhomogenität ?geprüft mit Levene-Test
- Normalverteilung
- Zufallsstichproben
- Für ANOVA unabhängige SP
- Für Varianzanalyse mit Meßwiederholung abhängige
SP
21Quelle Kähler 2006 441.
22Einfaktorielle ANOVA
- Datensatz Master_2006_FP
- Forschungsinteresse Frage 51?Gibt es
Unterschiede zwischen den Geburtskohorten? - ?Prüfung mit Einfaktorieller ANOVA
- Analysieren?Mittelwerte vergleichen?Einfaktorielle
ANOVA - Hypothesen (für zweiseitig)
- H0 µ1µ2µi
- H1 µ1?µ2??µi
23Einfaktorielle ANOVA
- Fenster
- Abhängige Variablen ?hier f51beruf
- Faktor UV ?hier f66gebja_koh
- Kontraste Polynomial UND Grad Erklärung der
- Summe der
Abweichungsquadrate zwischen - den Gruppen durch
Polynomterme bis zur - 5.Ordnung
- Kontrast 1 von 1
Koeffizienten t-Test für a priori - festgelegte
Kontrastgruppen ?Kodierung mit -1 - und 1 für zu
vergleichende Gruppen und 0 für - ausgeschlossene
Gruppen - (Koeffizientensumme
Koeffizienten müssen 0 - ergeben)
24Einfaktorielle ANOVA - Post-Hoc
- Post-Hoc
- Varianz-Gleichheit angenommen
- LSD
- Bonferroni
- Sidak
- Scheffé Vergleich der
Mittelwerte und -
Berechnung der kritischen Differenz ?hier -
Scheffe-Test - etc.
- Keine Varianzgleichheit angenommen
- Tamhane-T2
- etc.
- Signifikanzniveau angeben als ,05 etc.
25Einfaktorielle ANOVA - Optionen
- Optionen
- Statistik Deskriptive Statistik
- Feste und zufällige Effekte
Statistiken für Modell mit - festen
Effekten(Standardabweichung, - Standardfehler,
Konfidenzintervall) und zufälligen - Effekten(Standardfeh
ler, Konfidenzintervall, Varianz - zwischen
Komonenten) - Test auf Homogenität der
Varianzen Levene-test - Brown-Forsythe Test auf
Gleichheit der Mittelwerte der - Gruppen für
ungleiche Varianzen - Welch siehe
Brown-Forsythe-Test - Diagramm der Mittelwerte Liniendiagramm aus
Punkten der Mittelwerte der Gruppen - Fehlende Werte Fallauschluss Test für Test
- Listenweiser
Testausschluss
26Einfaktorielle ANOVA
F-Wert
Flt Fkrit2,21 UND Signifikanz
gt0,05 ?Varianzhomogenität ?falls nicht kann
Varianzanalyse nicht durchgeführt werden
27Einfaktorielle ANOVA
Zerlegung der sum-mierten Ab-weichungsquadrate in
SAQzw , SAQin und SAQge
Varianzen
Fgt Fkrit2,21 UND Signifikanz
lt0,05 ?signifikante Unterschiede zwischen
Geburtskohorten
28(No Transcript)
29Einfaktorielle ANOVA
Signifikanz innerhalb den Gruppen
3 homogene Gruppen, deren Mittelwerte sich nicht
signifikant unterscheiden Gruppe 1 1-3 und
Gruppe 2 3-5 und Gruppe 3 4-6
30Weitere Varianzanalysen
- Analysieren?Allgemeines lineares
Modell?Univariat für eine AV - Analysieren?Allgemeines lineares
Modell?Multivariat für mehrere AV - Analysieren?Allgemeines lineares
Modell?Meßwiederholung Varianzanalyse für
abhängige SP - Analysieren?Allgemeines lineares
Modell?Varianzkomponenten schätzt bei Modellen
mit gemischten Effekten den Beitrag jedes
Zufallseffekts zur Varianz der abhängigen
Variablen.
312-faktorielle Varianzanalyse
- Kann auch Wirkung ihrer Kombination(Interaktion)
untersuchen - gleiche Zellhäufigkeiten alle Zellen mit
gleicher Anzahl der Fälle besetzt? wechselseitig
voneinander unabhängig - Gegenteil ungleiche Zellhäufigkeiten Effekte
korrelieren miteinander - Datensatz allbus90.sav
- Forschungsinteresse Welchen Einfluss hat der
Schulbildung und das Geschlecht auf das Einkommen
unter Kontrolle der Variablen Alter? - ?Prüfung mit 2-faktorieller Varianzanalyse
- Analysieren?Allgemeines lineares Modell?Univariat
32Analysieren?Allgemeines lineares Modell?Univariat
- Univariat
- Abhängige Variable ?hier eink
- Feste Faktoren alle relevanten Merkmale des
Faktors sind - durch Untersuchungsanordnun
g vorgegeben - ?hier geschl, schul2
- Zufallsfaktoren kommen durch bzgl. dieses
Merkmals - zufällige Zuweisung von
Fällen zu - Untersuchungsgruppen
zustande - Kovariaten zusätzliche Einführung einer mit
- metrischen Variable
(wichtig keine - Korrelation zu Faktoren)
?Kontrollvariable - ?hier alt
- WLS-Gewichtung für Gewichtung der Fälle
- (vorher Gewichtungsvariable
bilden)
33Analysieren?Allgemeines lineares Modell?Univariat
- Modell Gesättigtes Modell alle Faktoren und
Kovariate sowie - Wechselwirkungen
zwischen Faktoren gehen ins Modell ein - ?hier gesättigtes Modell
- Anpassen Auswahl der
Haupteffekte (Faktoren und Kovariate) - und
Wechselwirkungen (auch mit Kovariaten), die in
Modell - eingehen sollen
- ?Term(e) konstruieren
u.a. Alle ?-Weg Wechselwirkungen der - ?.Ordnung
- Quadratsumme zur Berechnung der
Summe der Abweichungen - ? Typ I Hierarchisch
Jeder Term wird nur für die in der - Liste vor
ihm stehenden korrigiert?Reihenfolge hat Einfluss - auf Ergebnis
- Typ II
Regressionsmodell Berechnung der Haupteffekte um
- alle anderen
Terme (außer Interaktionen) korrigiert - Typ III
Berechnung der Quadratsumme eines Effekts um alle
- anderen
Effekte bereinigt, die nicht im Effekt enthalten
sind -
?robust gegenüber ungleichen Zellhäufigkeiten -
?ungeeignet für leere Zellen - Typ IV für leere
Zellen
34Analysieren?Allgemeines lineares Modell?Univariat
- Kontraste Vergleich von Gruppen (nur 1 Faktor)
über a priori - definierte Kontraste
(ähnlich wie bei ANOVA) - Einfach Vergleich der Mittelwerte
aller Faktorstufen (außer -
Referenzkategorie) mit Mittelwert der - Referenzkategorie
- Wiederholt Vergleich des
Mittelwerts jeder Faktorstufe - (außer der
letzten) mit dem Mittelwert der - folgenden
Faktorstufe - Polynomial Vergleich des linearen
etc. Effekts ? für - Schätzung von
polynomialen Trends - etc.
- Referenzkategorie erste oder
letzte Faktorstufe
35Analysieren?Allgemeines lineares Modell?Univariat
- Diagramme Profilplots stellen den
- Zusammenhang
zwischen max. - 2 Faktoren und der
AV dar - Horizontale Achse 1.Faktor
- ?hier schul
- Separate Linien 2.Faktor
- ?hier geschl
- Separate Diagramme 3.Faktor
- Post-Hoc wie bei ANOVA
- (Speichern Hier kann man festlegen, dass
bestimmte Werte als neue Variablen gespeichert
werden können)
36Analysieren?Allgemeines lineares Modell?Univariat
- Optionen
- Geschätzte Randmittel
- Mittelwerte anzeigen für Auswahl
der Faktoren und - kombinationen für
Ausgabe der Mittelwerte - ?hier (Insgesamt)
- Haupteffekte vergleichen UND
Anpassung des - Konfidenzintervalls
Auswahl von Post-Hoc-Tests - Anzeigen
- Deskriptive Statistik für jede
Faktorstufenkomination - Schätzer der Effektgröße partielle
Eta-Werte für erklärte - Varianz für jeden
Faktor, Interaktion und Kovariate - ?hier beide ankreuzen
- Beobachtete Schärfe
Wahrscheinlichkeit einen tatsächlich - vorhandenen Effekt auch
zu entdecken - etc.
- Signifikanzniveau
372-faktorielle Varianzanalyse
382-faktorielle Varianzanalyse
392-faktorielle Varianzanalyse
Signifikanzgt0,05?Keine signifikante Interaktion
??Prüfung der Signifikanz der Haupteffekte
Geschlecht und Schulbildung haben signifikante
Wirkung, weil Signifikanzlt0,05 Kovariate Alter
hat keine signifikante Wirkung, weil Sig.
gt0,05 (korrigiertes) R20,199? Modell erklärt ca.
20 der Gesamtvarianz davon erklärt die
Schulbildung ca. 7 und das Geschlecht ca. 15
der Varianz?Geschlecht hat stärkere Wirkung als
Schulbildung
402-faktorielle Varianzanalyse
41(No Transcript)
422-faktorielle Varianzanalyse-Diagrammauswertung
- Separate Linien
- Wenn Zeilenvariable keinen Einfluss besitzt,
verläuft sie parallel zur x-Achse - Besitzt sie Einfluss, steigt oder fällt sie
- ?hier Einfluss des Geschlechts auf Einkommen
- Wenn sie Einfluss hat, kann sie in verschiedenen
Abschnitten unterschiedlich verlaufen, aber nicht
parallel - Horizontale Achse
- Wenn Spaltenvariable keinen Einfluss besitzt,
fallen die einzelnen Linien zusammen - Wenn sie Einfluss hat Abstand zwischen den
Linien - ?hier Einfluss des Geschlechts auf Einkommen
vorhanden - Wenn Interaktion vorliegt, verlaufen Linien
zumindest in Bereichen nicht parallel - ?hier Linien verlaufen im Bereich
Fachhochschule/Abi nicht mehr parallel?leichte
Interaktion - Wenn keine Interaktion vorliegt, verlaufen die
Linien parallel ?Konstanz des Abstands
43Aufgaben
- Für diese Aufgaben wird der Datensatz
Master_FP_2006 benötigt. - Es geht um die Variablen studfach(1.abgeschlossene
s Studienfach) und f51aufst(Berufserfolg bedeutet
gute Aufstiegschancen zu haben). Es interessiert
hier, ob das Studienfach beeinflusst, wie sehr
der Aussage (nicht) zugestimmt wird, dass
Beruflicher Erfolg ist gute Aufstiegschancen
zu haben. - Vergleicht zuerst die Mittelwerte der Gruppen der
Variable studfach untereinander und mit dem
Gesamtmittelwert der Variable studfach! - Nun soll herausgefunden werden, ob sich die
Mittelwerte von f51einko signifikant
unterscheiden, je nachdem welches Studienfach
studiert wurde. Welchen Test könnt ihr dazu
verwenden? - Führt den Test durch! Was ist das Ergebnis?
- Welchen Test müsste man verwenden, wenn man
herausfinden will, ob es signifikante
Mittelwertsdifferenzen bezüglich f70gesch(Haben
Sie Geschwister?) bzgl. f51aufst gibt? - Führt den Test durch! Was ist das Ergebnis?
44Literaturempfehlungen
- CD-Rom
- Fröhlich, Romy/Wutz, Gertraud, Rossmann,
Raphael(2005) Einführung in die
sozialwissenschaftliche Datenanalyse, Ein
multimediales Selbstlernprogramm. Wiesbaden VS
Verlag für Sozialwissenschaften/GWV Fachverlage
GmbH. - Lehrbuch
- Janssen, Jürgen/Laatz, Wilfried(2005)
Statistische Datenanalyse mit SPSS für Windows.
Berlin, Heidelberg Springer-Verlag. - SPSS
- Ergebnis-Assistent bei Tabellen (in Englisch)
- Hilfe-Taste auf den Fenstern (erklärt Vorgang und
seine Bedeutung)
45Quellen
- Backhaus, Klaus/Erichson, Bernd/Plinke,
Wulff/Weiber, Rolf(2006) Multivariate
Analysemethoden. Berlin/Heidelberg
Springer-Verlag. - Bellgardt, Egon(2004) Statistik mit SPSS.
München Verlag Franz Vahlen GmbH. - Fahrmeir, Ludwig ed.al.(2005) Arbeitsbuch
Statistik. Berlin/Heidelberg Springer-Verlag. - Fröhlich, Romy/Wutz, Gertraud, Rossmann,
Raphael(2005) Einführung in die
sozialwissenschaftliche Datenanalyse, Ein
multimediales Selbstlernprogramm. Wiesbaden VS
Verlag für Sozialwissenschaften/GWV Fachverlage
GmbH. - Kähler, Wolf-Michael(2006) Statistische
Datenanalyse. Wiesbaden Friedr. Vieweg Sohn
Verlag/GWV Fachverlage GmbH. - Janssen, Jürgen/Laatz, Wilfried(2003)
Statistische Datenanalyse mit SPSS für Windows.
Berlin, Heidelberg Springer-Verlag.