Title: Statistik I
1Statistik I
- demnächst in Hörsaal 16 !!
2- PD Dr. Ina Grau
- Termin der Vorlesung Fr 12-14 in Hörsaal 16
- erster Termin 21.10.2005
- letzter Termin 10.2. 2006
- E-mail ina.grau_at_uni-bielefeld.de
- Sprechstunde Di 16-17 in Raum T4-134
- Telefon 106-4310
3Themen der Vorlesung
- Einführung
- Vorgehen bei einer wissenschaftlichen Studie
- Möglichkeiten der Datenerhebung
- Grafische Darstellung von Variablen
- Analyse einzelner Variablen (z.B. Mittelwert)
- Zusammenhänge zwischen mehreren Variablen
- SPSS
- (Statistik II Schlussfolgerungen aus einer
Stichprobe auf die Population Testverfahren)
4Säulendiagramm
5(No Transcript)
6Häufigkeitsverteilung einer Variable
Altersangaben Häufigkeit
20 19
21 25
22 30
23 29
24 20
25 15
gt 25 9
7Bivariate Verteilung zweier kontinuierlicher
Variablen
8Namen und E-mail der Tutoren
- Cemil Sahinöz cemil_at_misawa.de
- Kjell Hoffmann elkjell_at_gmx.net
- Floris van Veen floris_at_veen-van.com
- Sonja Schulz sonja1383_at_web.de
9Termine und Räume der Tutorien
- Mo 10-12 in E01-108
- Di 10-12 in T2-214
- Mi 10-12 in L3-108
- Mi 12-14 in C01-148
- Do 10-12 in U2-147
- teilweise im Cip-Pool U4-114
- (auch in der ersten Sitzung)
10Dringend empfohlene Literatur
- Benninghaus, H. (2001) Einführung in die
sozialwissenschaftliche Datenanalyse. 6. Aufl.,
München, Wien Oldenbourg. - Gehring, U.W./ Weins, C. (2002) Grundkurs
Statistik für Politologen. 3., überarbeitete
Auflage. Opladen Westdeutscher Verlag.
11Weiterführende Literatur
- Diekmann, A. (1995) Empirische Sozialforschung.
Grundlagen, Methoden, Anwendungen. Hamburg
Rowohlt. - Schnell, R. Hill, P.B. Esser, E. (1993)
Methoden der empirischen Sozialforschung. 4.,
überarb. Aufl., München, Wien Oldenbourg. - Wright, D.B. (1997) Understanding statistics. An
introduction for the social sciences. 1st
edition. London et al. Sage. - Kühnel, S.M./ Krebs, D. (2001) Statistik für die
Sozialwissenschaften. Grundlagen, Methoden,
Anwendungen. Reinbek Rowohlt - Knoke, D. / Bohrnstedt, G.W. / Potter Mee, A.
(2002) Statistics for social data analysis. 4th
edition. Itasca, Ill Peacock. - Bleymüller, J./ Gehlert, G./ Gülicher, H. (2002)
Statistik für Wirtschaftswissenschaftler. 13.
Aufl. München Vahlen. - Fahrmeir, L./ Künstler, R./ Pigeot, I./ Tutz, G.
(2003) Statistik der Weg zur Datenanalyse. 4.,
verbesserte Auflage. Berlin et al. Springer. - Bortz, J. (1999) Statistik für
Sozialwissenschaftler. 5. Auflage Berlin/
Heidelberg Springer.
12Für Sie zu tun
- in Tutoriumsliste eintragen
- zum Tutorium Disketten mitbringen, wenn es im
Cip-Pool stattfindet - Cip-Pool-Account im Internet beantragen
- https//www.cipux.uni-bielefeld.de/antrag
- und dann mit Vorlage der Immatrikulations-besch
einigung in Raum T4-142 freischalten lassen,
Sprechst. Mo-Fr 11-12).
13Curriculum Methoden der empirischen
Sozialforschung
Das Curriculum sieht im Grund- und Hauptstudium
eine Folge von aufeinander aufbauenden
Vorlesungen, Übungen und Seminaren vor. Über die
Veranstaltungen und die notwendigen
Leistungsnachweise informiert die folgende
Überblickstabelle.
14Curriculum Methoden der empirischen
Sozialforschung
15Curriculum Methoden der empirischen
Sozialforschung
Wahlpflichtfach Methoden der empirischen
Sozialforschung Im Hauptstudium ist mindestens
eine der scheinfähigen Wahlpflichtveranstaltungen
erfolgreich zu absolvieren. Ein Leistungsnachweis
wird durch eine schriftliche Arbeit im Rahmen
einer der regelmäßig angebotenen
Wahlpflichtveranstaltungen erworben. Im Bereich
der Quantitativen Methoden wird erwartet, dass in
den scheinfähigen Wahlpflichtveranstaltungen
entweder ein Leistungsnachweis für den
Themenbereich "Datenerhebungsverfahren" oder den
Themenbereich "Datenanalyse (Statistik)" erworben
wird. Der jeweils andere Themenbereich ist dann
Gegenstand der Diplom-Fachprüfung.
16Was ist empirische Sozialforschung?
"Empirische Sozialforschung ist die systematische
Erfassung und Deutung sozialer Erscheinungen.
Empirisch bedeutet, dass theoretisch formulierte
Annahmen an spezifischen Wirklichkeiten überprüft
werden. Systematisch weist darauf hin, dass dies
nach Regeln vor sich gehen muss. Theoretische
Annahmen und die Beschaffenheit der zu
untersuchenden Realität sowie die zur Verfügung
stehenden Mittel bedingen den Forschungsablauf."
(Atteslander 1991 16)
17Was sind Methoden? (1)
"Unter Methoden der empirischen Sozialforschung
versteht man die geregelte und nachvollziehbare
Anwendung von Erfassungsinstrumenten wie
Befragung, Beobachtung, Inhaltsanalyse. Je nach
dem Grad der Kontrolle des Forschungsablaufs
spricht man von Experimenten." (Atteslander
1991 16)
18Was sind Methoden? (2)
"... sind erstens Mittel, um Realität zu erfassen
- und damit auch zu schaffen, geleitet von
Theorien, seien sie nun expliziert, bekannt oder
nur 'background ignorance'. Zweitens, alle
Methoden führen zu Aussagen, die auf bestimmten
Stichproben von Objekten, von Räumen und von
Zeiten beruhen. Immer wird die Wahrnehmung
codiert, d.h. Erscheinungen werden Merkmale und
ihre Ausprägungen zugeordnet. Die zentrale Frage
ist, wie die vermuteten Regelmäßigkeiten, die
unterstellte Struktur sozialer Prozesse, in der
Sprache abgebildet und die Zusammenhänge als
Gesetze formuliert werden." (Friedrichs 1973
189)
19Theoriegewinnung und Theorieprüfung (1)
20Theoriegewinnung und Theorieprüfung (2)
Theorien
Beobachtungen
21Stellenwert von Statistik im Forschungsprozeß (1)
- 1. Heutzutage werden empirische Informationen zu
allen möglichen - Sachverhalten erhoben, nicht jede Datenerhebung
erlaubt jedoch inhaltlich valide
Schlußfolgerungen. - Dieser Mangel kann auch nur begrenzt durch
statistische (oder andere) Auswertungsverfahren
ausgeglichen werden. Die Aussagekraft der
erhobenen Daten hängt entscheidend von den
verwendeten sozialwissenschaftlichen Theorien,
Untersuchungsdesigns, Erhebungsinstrumenten und
Auswahlverfahren ab. - 3. Es gibt keine "theoriefreie" empirische
Beobachtung, auch wenn Theorien durch
Konfrontation mit "neuen" empirischen
Informationen "lernen".
22Stellenwert von Statistik im Forschungsprozeß (2)
- 4. Statistik ist eine wichtige wissenschaftliche
Disziplin, aber die Relevanz einer Untersuchung
hängt in erster Linie vom Inhalt und den
verwendeten Methoden (s. Punkt 2) ab, nicht vom
verwendeten statistischen Auswertungsverfahren.
Gleichwohl helfen statistische Kenntnisse,
empirische Untersuchungen so durchzuführen, daß
gültige und zuverlässige Ergebnisse möglich sind. - In den Sozialwissenschaften gibt es neben
statistischen auch andere Auswertungsmethoden für
empirische Informationen. - Eines der Hauptziele von Statistik besteht darin,
eine Vielzahl von Daten auf ihre wesentlichen
Strukturen zu reduzieren. Die Annahmen über das,
was als "wesentlich" betrachtet wird, werden in
Form eines statistischen Modells zusammengefaßt.
Dementsprechend sind die folgenden Ergebnisse
modellabhängig (vgl. Stadtplanbeispiel). Ihre
Verallgemeinerbarkeit steht und fällt daher mit
der Angemessenheit des verwendeten Modells, die
in jedem Anwendungsfall geprüft werden muß.
23Stellenwert von Statistik im Forschungsprozeß (3)
- 7. Bei der Auswertung und Interpretation
empirischer Informationen dürfen drei Dinge nicht
vergessen werden - Theoretische Konstrukte, wie z.B. soziale Schicht
oder Intelligenz, sind nicht direkt, sondern nur
mittels bestimmter Indikatoren (z.B.
Schichtindizes oder Intelligenztests)
beobachtbar. Das verweist auf die Notwendigkeit
der Entwicklung von validen Meßinstrumenten. - Erhebungsmethoden sind mit Meßfehlern verbunden.
Daraus ergibt sich die Notwendigkeit der
Entwicklung von zuverlässigen Meßinstrumenten
bzw. der Verwendung geeigneter statistischer
Methoden zur Kontrolle mangelnder Reliabilität. - Empirische Informationen bestehen in der Regel
aus einer Auswahl von Objekten, Räumen und
Zeiten. Daraus ergibt sich die Frage, ob und in
welcher Weise die Auswertungsergebnisse über
diese Auswahl hinaus verallgemeinert werden
können.
24Begriffsdefinition
"Eine notwendige Voraussetzung zur Beschreibung
und Erklärung eines sozialen Zustandes oder eines
sozialen Ereignisses ist seine begriffliche
Präzisierung. Wissenschaften - gleich welcher
Richtung - arbeiten nie mit konkreten Ereignissen
an sich, sondern immer mit in Sprache gefasster
Realität, mit Aussagen über die Realität. Wenn
solche Aussagen nicht nur von einer einzigen oder
einigen ausgewählten Personen verstanden werden,
sondern allen Interessierten zugänglich sein
sollen, dann ist es unumgänglich, dass der
'gemeinte Sinn' der verwendeten Begriffe von
allen erfasst und geteilt werden kann Man muss
wissen, worüber geredet wird. Die am
Kommunikationsprozess Beteiligten sollen den
verwendeten Begriffen weitestgehend die gleichen
Bedeutungen, die gleichen Vorstellungsinhalte
zuschreiben." (SN89 38, SN93 38, Herv. HJA)
25Operationalisierung (1)
Theorien beschreiben Zusammenhänge zwischen
theoretischen Begriffen. Theoretische Begriffe
als Bestandteile von Theorien (oder 'Konstrukte
') sind nicht direkt beobachtbar. Zur
Überprüfung einer Theorie ist die Angabe von
Korrespondenzregeln für theoretische Begriffe
notwendig. Diese sog. Operationalisierung
beinhaltet Angaben darüber, wie die theoretischen
Konstrukte gemessen werden sollen.
26Operationalisierung (2)
Dimensionale Analyse, Konzeptspezifikation "Die
meisten allgemeinen Konzepte sind viel zu unklar,
als dass direkt Messanweisungen gegeben werden
können. Aus diesem Grund beginnt die
Operationalisierung eines theoretischen Begriffs
meist mit der Klärung, welche theoretischen
Aspekte eines bestimmten Gegenstandsbereichs
('Dimensionen') durch den theoretischen Begriff
bezeichnet werden, bzw. welche Dimensionen das
Konzept anspricht." (SN89 120, SN93 130, Herv.
im Original) Operationalisierung "Die
'Operationalisierung' eines theoretischen
Begriffs besteht aus der Angabe einer Anweisung,
wie Objekten mit Eigenschaften (Merkmalen), die
der theoretische Begriff bezeichnet, beobachtbare
Sachverhalte zugeordnet werden können." (SN89
122, SN93 132, Herv. im Original)
27Grundbegriffe
- Theorie Aussage über Zusammenhang zwischen
theoretischen Begriffen (hypothetischen
Konstrukten), die zuvor definiert wurden - Operationalisierung Messbarmachen der Begriffe,
Umwandlung von theoretischen Begriffen in
Variablen (Variablen, die für ein hypothetisches
Konstrukt stehen, nennt man Indikatoren) - Hypothese Aussage über Zusammenhang zwischen
Variablen Forschung
28Beispiel für die genannten Begriffe
- Theorie Frustration führt zu Aggression
- Begriffsdefinition Frustration ist eine
Hinderung an der Erreichung eines Ziels,
Aggression ist das absichtliche Austeilen
schädigender Reize an eine Person. - Operationalisierung Frustration Personen, die
gerade eine Aufgabe lösen, werden kurz vor dem
Ziel gestört. Aggression Sie haben dann die
Gelegenheit, einer anderen Person Elektroschocks
zu verabreichen. - Hypothese Personen, die soeben gestört wurden,
teilen mehr Elektroschocks aus als Personen, die
nicht gestört wurden.
29Hypothesen (1)
- Beispiele
- Wenn der Entscheidungsspielraum (im Beruf) einer
Person umfangreich ist, ist ihr Selbstwertgefühl
hoch. - anders formuliert Je größer der
Entscheidungsspielraum einer Person ist, desto
höher ist ihr Selbstwertgefühl. - Die zweite Formulierung berücksichtigt, dass
beide Variablen viele Ausprägungen haben können.
30Hypothesen (2)
Definition von Hypothese "Noch unbewiesene
Annahme als Hilfsmittel für wissenschaftliche
Erkenntnisse." (Wahrig 1991 Deutsches
Wörterbuch) Eine Hypothese ist empirisch
falsifizierbar. Behauptungen, die die
Formulierung Wenn-dann enthalten, sind
widerlegt, sobald ein Gegenbeispiel vorliegt. In
den Sozialwissenschaften wird üblicherweise eine
bestimmte Anzahl von Gegenbeispielen zugelassen,
ohne dass die Hypothese als widerlegt gilt.
31Hypothesen (3)
- Eine Hypothese ist eine Aussage, keine Frage
- Die Aussage enthält mindestens zwei semantisch
gehaltvolle Begriffe ... - Die Begriffe sind durch den logischen Operator
'wenn-dann' verbunden. ... - Die Aussage ist nicht tautologisch, d.h. ein
Begriff deckt den anderen semantisch nicht ab.
... - Die Aussage ist widerspruchsfrei, d.h. ein
Begriff schließt den anderen semantisch nicht
aus. - Die empirischen Geltungsbedingungen sind implizit
oder explizit im einzelnen aufgezählt. ... - Die Begriffe sind auf Wirklichkeitsphänomene hin
operationalisierbar. - Die Aussage ist falsifizierbar."
- (Atteslander 1991 65f.) 0
32Häufige Formulierungen von Hypothesen
- Zusammenhangshypothesen
- Schuhgröße und Körpergröße hängen positiv
miteinander zusammen. - Unterschiedshypothesen
- Frauen sind sprachlich begabter als Männer.
- Beides ist häufig austauschbar Das Geschlecht
hängt mit der Sprachbegabung zusammen.
33Typen von Hypothesen
- Symmetrische Hypothesen Schuhgröße und
Körpergröße hängen zusammen (die
wenn-dann-Beziehung kann in beide Richtungen
formuliert werden) - Asymmetrische Hypothesen Alter und
Rückenbeschwerden hängen zusammen (die wenn-dann
Beziehung ist nur in eine Richtung sinnvoll zu
formulieren) eine Variable gilt als Ursache, die
andere als Wirkung.
34Typen von Hypothesen
- Hypothesen können positiv oder negativ sein. Je
ein Beispiel - Je höher die Semesterzahl von Soziologiestudenten,
desto größer ist das Wissen über soziologische
Theorien. - Je länger ein Mitarbeiter in einer Firma
beschäftigt ist, desto niedriger ist seine
Motivation
35Typen von Variablen
- Für asymmetrische Hypothesen gilt
- Die Variable, in der man die Ursache vermutet
unabhängige Variable - Die Variable, in der man die Wirkung vermutet
abhängige Variable - statistisch können kausale Zusammenhänge (Ursache
Wirkungs Zusammenhänge) nicht bewiesen
werden, sondern nur, dass überhaupt ein
Zusammenhang besteht. Ein kausaler Beweis ist mit
Experimenten möglich.
36Experiment
- Ein Experiment unterscheidet sich durch andere
Arten empirischer Untersuchungen dadurch, dass
die unabhängige Variable nicht gemessen, sondern
vom Versuchsleiter hergestellt wird (wie im
Beispiel Frustration Störung oder keine Störung
bei der Erledigung einer Aufgabe. Anderes
Beispiel Medikament oder Placebo) - Um die Wirkung von Störvariablen zu
kontrollieren, müssen die Personen zufällig auf
die Ausprägungen der UV aufgeteilt werden.
37Messen schematische Darstellung
1
Hauptschule
Realschule
2
1
Hauptschule
Gymnasium
3
Numerisches Relativ
Empirisches Relativ
38Messen und Messniveau (1)
"Unter 'Messen' wird allgemein die Zuordnung von
Zahlen ('Messwerten') zu Objekten gemäß
festgelegten Regeln verstanden. Die Mängel dieser
Definition werden bereits dadurch deutlich, dass
die Zuweisung von Schulnoten durch Würfeln eine
definitionsgemäße Messung wäre. Eine brauchbare
Definition muss für eine Messung fordern, dass
die Messwerte zueinander Beziehungen aufweisen,
die den Beziehungen der gemessenen Objekte
entsprechen. So wird z.B. für eine sinnvolle
Längenmessung gefordert, dass der 'größte'
Messwert dem 'längsten' Objekt entspricht, der
'kleinste' Messwert dem 'kürzesten' Objekt. Eine
Messung in diesem Sinne ist eine 'strukturtreue
Abbildung' Die Beziehungen der Objekte ('kürzer'
- 'länger') werden durch die Beziehungen der
zugeordneten Zahlen ('kleiner' - 'größer')
korrekt wiedergegeben."
(Schnell et al. 1993 143, Herv. im Original)
39Messen und Messniveau (2)
"Die Verwendung eines bestimmten Kriteriums, z.B.
Länge, definiert eine bestimmte Beziehung
('Relation') der Objekte zueinander. Eine Menge
von Objekten, über die eine Relation definiert
wurde, bezeichnet man als 'empirisches Relativ',
eine Menge von Zahlen, über die eine Relation
definiert wurde, als 'numerisches Relativ'. ...
Das Problem der Messung besteht nun darin, eine
Zuordnung der Zahlen zu den Objekten zu finden,
so dass die Ordnung im numerischen Relativ der
Ordnung im empirischen Relativ entspricht Das
Problem besteht in der Angabe einer Regel, die
eine strukturtreue Abbildung ermöglicht."
(Schnell et al. 1993 143f., Herv. im Original)
40Codieren
- Bei einigen Variablen ergibt sich die Zuordnung
von Zahlen zu Variablenausprägungen
unproblematisch, z.B. Alter in Jahren 20 - Bei anderen Variablen muss man Entscheidungen
treffen, z.B. beim Geschlecht Mann1, Frau2 - Die codierten Werte werden dann in eine
Datenmatrix eingegeben
41Datenmatrix
Alter Geschlecht
Vp 1 20 1
Vp 2
Vp 3
Vp 4
Vp 5
Vp 6
Vp 7
Vp 8
42Skalenniveaus
Skalenniveaus
43Arten von Variablen
- Diskrete Variablen haben begrenzte Ausprägungen,
z.B. Zahl der Kinder - Kontinuierliche Variablen zwischen zwei Werten
ist jeder Zwischenwert möglich, z.B. Alter, Größe - für die Statistik reicht folgende Unterscheidung
- Kategoriale Variablen wenige Ausprägungen
- Kontinuierliche Variablen viele Ausprägungen
44Arten von Variablen
45Mittelwerte und Streuungsmaße nach Messniveau (1)
Zentrale Tendenz (Mittelwerte)
46Mittelwerte und Streuungsmaße nach Messniveau (2)
Streuung (Streuungsmaße)
47Skalierung
- Häufig werden mehrere Variablen gemessen, die
gemeinsam eine neue Variable ergeben - Index eine Variable (soziale Schicht) ergibt
sich aus mehreren anderen Variablen (Einkommen,
Bildung, Berufsprestige). - Die Berechnung der neuen aus den alten Variablen
erfolgt nach definierten Rechenoperationen im
Beispiel ergibt sich das Problem
unterschiedlicher Einheiten
48Skalierung
- Skala die Summe oder der Mittelwert aus mehreren
Items (Fragen), die dasselbe Konstrukt messen
sollen. Die Einheiten sind bei allen Items
gleich. - Es werden mehrere Items vorgelegt, um die
Messgenauigkeit zu erhöhen. Wenn einige Items
gegensinnig formuliert sind, müssen sie umgepolt
werden, z.B. - Ich habe Angst. nein 1 2 3 4 5 ja
- Ich bin ganz ruhig. nein 1 2 3 4 5 ja
- recode It2 (15) (24) (33) (42) (51).
49Skalierung
- Der Skalenwert ergibt sich aus dem Mittelwert der
einzelnen Items. - Die Mittelung hat gegenüber einer Summierung zwei
Vorteile - Das Minimum und das Maximum der Werte, die
auftreten können, sind wie bei den Items, die
Werte sind leichter interpretierbar. - Fehlende Werte werden ausgeglichen, da nur durch
die Anzahl vorhandener Werte geteilt wird.