Statistik I - PowerPoint PPT Presentation

About This Presentation
Title:

Statistik I

Description:

(SN89: 120, SN93: 130, Herv. im Original) Operationalisierung – PowerPoint PPT presentation

Number of Views:109
Avg rating:3.0/5.0
Slides: 50
Provided by: aki143
Category:
Tags: herv | statistik

less

Transcript and Presenter's Notes

Title: Statistik I


1
Statistik I
  • demnächst in Hörsaal 16 !!

2
  • PD Dr. Ina Grau
  • Termin der Vorlesung Fr 12-14 in Hörsaal 16
  • erster Termin 21.10.2005
  • letzter Termin 10.2. 2006
  • E-mail ina.grau_at_uni-bielefeld.de
  • Sprechstunde Di 16-17 in Raum T4-134
  • Telefon 106-4310

3
Themen der Vorlesung
  • Einführung
  • Vorgehen bei einer wissenschaftlichen Studie
  • Möglichkeiten der Datenerhebung
  • Grafische Darstellung von Variablen
  • Analyse einzelner Variablen (z.B. Mittelwert)
  • Zusammenhänge zwischen mehreren Variablen
  • SPSS
  • (Statistik II Schlussfolgerungen aus einer
    Stichprobe auf die Population Testverfahren)

4
Säulendiagramm
5
(No Transcript)
6
Häufigkeitsverteilung einer Variable
Altersangaben Häufigkeit
20 19
21 25
22 30
23 29
24 20
25 15
gt 25 9
7
Bivariate Verteilung zweier kontinuierlicher
Variablen
8
Namen und E-mail der Tutoren
  • Cemil Sahinöz cemil_at_misawa.de
  • Kjell Hoffmann elkjell_at_gmx.net
  • Floris van Veen floris_at_veen-van.com
  • Sonja Schulz sonja1383_at_web.de

9
Termine und Räume der Tutorien
  • Mo 10-12 in E01-108
  • Di 10-12 in T2-214
  • Mi 10-12 in L3-108
  • Mi 12-14 in C01-148
  • Do 10-12 in U2-147
  • teilweise im Cip-Pool U4-114
  • (auch in der ersten Sitzung)

10
Dringend empfohlene Literatur
  • Benninghaus, H. (2001) Einführung in die
    sozialwissenschaftliche Datenanalyse. 6. Aufl.,
    München, Wien Oldenbourg.
  • Gehring, U.W./ Weins, C. (2002) Grundkurs
    Statistik für Politologen. 3., überarbeitete
    Auflage. Opladen Westdeutscher Verlag.

11
Weiterführende Literatur
  • Diekmann, A. (1995) Empirische Sozialforschung.
    Grundlagen, Methoden, Anwendungen. Hamburg
    Rowohlt.
  • Schnell, R. Hill, P.B. Esser, E. (1993)
    Methoden der empirischen Sozialforschung. 4.,
    überarb. Aufl., München, Wien Oldenbourg.
  • Wright, D.B. (1997) Understanding statistics. An
    introduction for the social sciences. 1st
    edition. London et al. Sage.
  • Kühnel, S.M./ Krebs, D. (2001) Statistik für die
    Sozialwissenschaften. Grundlagen, Methoden,
    Anwendungen. Reinbek Rowohlt
  • Knoke, D. / Bohrnstedt, G.W. / Potter Mee, A.
    (2002) Statistics for social data analysis. 4th
    edition. Itasca, Ill Peacock.
  • Bleymüller, J./ Gehlert, G./ Gülicher, H. (2002)
    Statistik für Wirtschaftswissenschaftler. 13.
    Aufl. München Vahlen.
  • Fahrmeir, L./ Künstler, R./ Pigeot, I./ Tutz, G.
    (2003) Statistik der Weg zur Datenanalyse. 4.,
    verbesserte Auflage. Berlin et al. Springer.
  • Bortz, J. (1999) Statistik für
    Sozialwissenschaftler. 5. Auflage Berlin/
    Heidelberg Springer.

12
Für Sie zu tun
  • in Tutoriumsliste eintragen
  • zum Tutorium Disketten mitbringen, wenn es im
    Cip-Pool stattfindet
  • Cip-Pool-Account im Internet beantragen
  • https//www.cipux.uni-bielefeld.de/antrag
  • und dann mit Vorlage der Immatrikulations-besch
    einigung in Raum T4-142 freischalten lassen,
    Sprechst. Mo-Fr 11-12).

13
Curriculum Methoden der empirischen
Sozialforschung
Das Curriculum sieht im Grund- und Hauptstudium
eine Folge von aufeinander aufbauenden
Vorlesungen, Übungen und Seminaren vor. Über die
Veranstaltungen und die notwendigen
Leistungsnachweise informiert die folgende
Überblickstabelle.
14
Curriculum Methoden der empirischen
Sozialforschung
15
Curriculum Methoden der empirischen
Sozialforschung
Wahlpflichtfach Methoden der empirischen
Sozialforschung Im Hauptstudium ist mindestens
eine der scheinfähigen Wahlpflichtveranstaltungen
erfolgreich zu absolvieren. Ein Leistungsnachweis
wird durch eine schriftliche Arbeit im Rahmen
einer der regelmäßig angebotenen
Wahlpflichtveranstaltungen erworben. Im Bereich
der Quantitativen Methoden wird erwartet, dass in
den scheinfähigen Wahlpflichtveranstaltungen
entweder ein Leistungsnachweis für den
Themenbereich "Datenerhebungsverfahren" oder den
Themenbereich "Datenanalyse (Statistik)" erworben
wird. Der jeweils andere Themenbereich ist dann
Gegenstand der Diplom-Fachprüfung.
16
Was ist empirische Sozialforschung?
"Empirische Sozialforschung ist die systematische
Erfassung und Deutung sozialer Erscheinungen.
Empirisch bedeutet, dass theoretisch formulierte
Annahmen an spezifischen Wirklichkeiten überprüft
werden. Systematisch weist darauf hin, dass dies
nach Regeln vor sich gehen muss. Theoretische
Annahmen und die Beschaffenheit der zu
untersuchenden Realität sowie die zur Verfügung
stehenden Mittel bedingen den Forschungsablauf."
(Atteslander 1991 16)
17
Was sind Methoden? (1)
"Unter Methoden der empirischen Sozialforschung
versteht man die geregelte und nachvollziehbare
Anwendung von Erfassungsinstrumenten wie
Befragung, Beobachtung, Inhaltsanalyse. Je nach
dem Grad der Kontrolle des Forschungsablaufs
spricht man von Experimenten." (Atteslander
1991 16)
18
Was sind Methoden? (2)
"... sind erstens Mittel, um Realität zu erfassen
- und damit auch zu schaffen, geleitet von
Theorien, seien sie nun expliziert, bekannt oder
nur 'background ignorance'. Zweitens, alle
Methoden führen zu Aussagen, die auf bestimmten
Stichproben von Objekten, von Räumen und von
Zeiten beruhen. Immer wird die Wahrnehmung
codiert, d.h. Erscheinungen werden Merkmale und
ihre Ausprägungen zugeordnet. Die zentrale Frage
ist, wie die vermuteten Regelmäßigkeiten, die
unterstellte Struktur sozialer Prozesse, in der
Sprache abgebildet und die Zusammenhänge als
Gesetze formuliert werden." (Friedrichs 1973
189)
19
Theoriegewinnung und Theorieprüfung (1)
20
Theoriegewinnung und Theorieprüfung (2)
Theorien
Beobachtungen
21
Stellenwert von Statistik im Forschungsprozeß (1)
  • 1. Heutzutage werden empirische Informationen zu
    allen möglichen
  • Sachverhalten erhoben, nicht jede Datenerhebung
    erlaubt jedoch inhaltlich valide
    Schlußfolgerungen.
  • Dieser Mangel kann auch nur begrenzt durch
    statistische (oder andere) Auswertungsverfahren
    ausgeglichen werden. Die Aussagekraft der
    erhobenen Daten hängt entscheidend von den
    verwendeten sozialwissenschaftlichen Theorien,
    Untersuchungsdesigns, Erhebungsinstrumenten und
    Auswahlverfahren ab.
  • 3. Es gibt keine "theoriefreie" empirische
    Beobachtung, auch wenn Theorien durch
    Konfrontation mit "neuen" empirischen
    Informationen "lernen".

22
Stellenwert von Statistik im Forschungsprozeß (2)
  • 4. Statistik ist eine wichtige wissenschaftliche
    Disziplin, aber die Relevanz einer Untersuchung
    hängt in erster Linie vom Inhalt und den
    verwendeten Methoden (s. Punkt 2) ab, nicht vom
    verwendeten statistischen Auswertungsverfahren.
    Gleichwohl helfen statistische Kenntnisse,
    empirische Untersuchungen so durchzuführen, daß
    gültige und zuverlässige Ergebnisse möglich sind.
  • In den Sozialwissenschaften gibt es neben
    statistischen auch andere Auswertungsmethoden für
    empirische Informationen.
  • Eines der Hauptziele von Statistik besteht darin,
    eine Vielzahl von Daten auf ihre wesentlichen
    Strukturen zu reduzieren. Die Annahmen über das,
    was als "wesentlich" betrachtet wird, werden in
    Form eines statistischen Modells zusammengefaßt.
    Dementsprechend sind die folgenden Ergebnisse
    modellabhängig (vgl. Stadtplanbeispiel). Ihre
    Verallgemeinerbarkeit steht und fällt daher mit
    der Angemessenheit des verwendeten Modells, die
    in jedem Anwendungsfall geprüft werden muß.

23
Stellenwert von Statistik im Forschungsprozeß (3)
  • 7. Bei der Auswertung und Interpretation
    empirischer Informationen dürfen drei Dinge nicht
    vergessen werden
  • Theoretische Konstrukte, wie z.B. soziale Schicht
    oder Intelligenz, sind nicht direkt, sondern nur
    mittels bestimmter Indikatoren (z.B.
    Schichtindizes oder Intelligenztests)
    beobachtbar. Das verweist auf die Notwendigkeit
    der Entwicklung von validen Meßinstrumenten.
  • Erhebungsmethoden sind mit Meßfehlern verbunden.
    Daraus ergibt sich die Notwendigkeit der
    Entwicklung von zuverlässigen Meßinstrumenten
    bzw. der Verwendung geeigneter statistischer
    Methoden zur Kontrolle mangelnder Reliabilität.
  • Empirische Informationen bestehen in der Regel
    aus einer Auswahl von Objekten, Räumen und
    Zeiten. Daraus ergibt sich die Frage, ob und in
    welcher Weise die Auswertungsergebnisse über
    diese Auswahl hinaus verallgemeinert werden
    können.

24
Begriffsdefinition
"Eine notwendige Voraussetzung zur Beschreibung
und Erklärung eines sozialen Zustandes oder eines
sozialen Ereignisses ist seine begriffliche
Präzisierung. Wissenschaften - gleich welcher
Richtung - arbeiten nie mit konkreten Ereignissen
an sich, sondern immer mit in Sprache gefasster
Realität, mit Aussagen über die Realität. Wenn
solche Aussagen nicht nur von einer einzigen oder
einigen ausgewählten Personen verstanden werden,
sondern allen Interessierten zugänglich sein
sollen, dann ist es unumgänglich, dass der
'gemeinte Sinn' der verwendeten Begriffe von
allen erfasst und geteilt werden kann Man muss
wissen, worüber geredet wird. Die am
Kommunikationsprozess Beteiligten sollen den
verwendeten Begriffen weitestgehend die gleichen
Bedeutungen, die gleichen Vorstellungsinhalte
zuschreiben." (SN89 38, SN93 38, Herv. HJA)
25
Operationalisierung (1)
Theorien beschreiben Zusammenhänge zwischen
theoretischen Begriffen. Theoretische Begriffe
als Bestandteile von Theorien (oder 'Konstrukte
') sind nicht direkt beobachtbar. Zur
Überprüfung einer Theorie ist die Angabe von
Korrespondenzregeln für theoretische Begriffe
notwendig. Diese sog. Operationalisierung
beinhaltet Angaben darüber, wie die theoretischen
Konstrukte gemessen werden sollen.
26
Operationalisierung (2)
Dimensionale Analyse, Konzeptspezifikation "Die
meisten allgemeinen Konzepte sind viel zu unklar,
als dass direkt Messanweisungen gegeben werden
können. Aus diesem Grund beginnt die
Operationalisierung eines theoretischen Begriffs
meist mit der Klärung, welche theoretischen
Aspekte eines bestimmten Gegenstandsbereichs
('Dimensionen') durch den theoretischen Begriff
bezeichnet werden, bzw. welche Dimensionen das
Konzept anspricht." (SN89 120, SN93 130, Herv.
im Original) Operationalisierung "Die
'Operationalisierung' eines theoretischen
Begriffs besteht aus der Angabe einer Anweisung,
wie Objekten mit Eigenschaften (Merkmalen), die
der theoretische Begriff bezeichnet, beobachtbare
Sachverhalte zugeordnet werden können." (SN89
122, SN93 132, Herv. im Original)
27
Grundbegriffe
  • Theorie Aussage über Zusammenhang zwischen
    theoretischen Begriffen (hypothetischen
    Konstrukten), die zuvor definiert wurden
  • Operationalisierung Messbarmachen der Begriffe,
    Umwandlung von theoretischen Begriffen in
    Variablen (Variablen, die für ein hypothetisches
    Konstrukt stehen, nennt man Indikatoren)
  • Hypothese Aussage über Zusammenhang zwischen
    Variablen Forschung

28
Beispiel für die genannten Begriffe
  • Theorie Frustration führt zu Aggression
  • Begriffsdefinition Frustration ist eine
    Hinderung an der Erreichung eines Ziels,
    Aggression ist das absichtliche Austeilen
    schädigender Reize an eine Person.
  • Operationalisierung Frustration Personen, die
    gerade eine Aufgabe lösen, werden kurz vor dem
    Ziel gestört. Aggression Sie haben dann die
    Gelegenheit, einer anderen Person Elektroschocks
    zu verabreichen.
  • Hypothese Personen, die soeben gestört wurden,
    teilen mehr Elektroschocks aus als Personen, die
    nicht gestört wurden.

29
Hypothesen (1)
  • Beispiele
  • Wenn der Entscheidungsspielraum (im Beruf) einer
    Person umfangreich ist, ist ihr Selbstwertgefühl
    hoch.
  • anders formuliert Je größer der
    Entscheidungsspielraum einer Person ist, desto
    höher ist ihr Selbstwertgefühl.
  • Die zweite Formulierung berücksichtigt, dass
    beide Variablen viele Ausprägungen haben können.

30
Hypothesen (2)
Definition von Hypothese "Noch unbewiesene
Annahme als Hilfsmittel für wissenschaftliche
Erkenntnisse." (Wahrig 1991 Deutsches
Wörterbuch) Eine Hypothese ist empirisch
falsifizierbar. Behauptungen, die die
Formulierung Wenn-dann enthalten, sind
widerlegt, sobald ein Gegenbeispiel vorliegt. In
den Sozialwissenschaften wird üblicherweise eine
bestimmte Anzahl von Gegenbeispielen zugelassen,
ohne dass die Hypothese als widerlegt gilt.
31
Hypothesen (3)
  • Eine Hypothese ist eine Aussage, keine Frage
  • Die Aussage enthält mindestens zwei semantisch
    gehaltvolle Begriffe ...
  • Die Begriffe sind durch den logischen Operator
    'wenn-dann' verbunden. ...
  • Die Aussage ist nicht tautologisch, d.h. ein
    Begriff deckt den anderen semantisch nicht ab.
    ...
  • Die Aussage ist widerspruchsfrei, d.h. ein
    Begriff schließt den anderen semantisch nicht
    aus.
  • Die empirischen Geltungsbedingungen sind implizit
    oder explizit im einzelnen aufgezählt. ...
  • Die Begriffe sind auf Wirklichkeitsphänomene hin
    operationalisierbar.
  • Die Aussage ist falsifizierbar."
  • (Atteslander 1991 65f.) 0

32
Häufige Formulierungen von Hypothesen
  • Zusammenhangshypothesen
  • Schuhgröße und Körpergröße hängen positiv
    miteinander zusammen.
  • Unterschiedshypothesen
  • Frauen sind sprachlich begabter als Männer.
  • Beides ist häufig austauschbar Das Geschlecht
    hängt mit der Sprachbegabung zusammen.

33
Typen von Hypothesen
  • Symmetrische Hypothesen Schuhgröße und
    Körpergröße hängen zusammen (die
    wenn-dann-Beziehung kann in beide Richtungen
    formuliert werden)
  • Asymmetrische Hypothesen Alter und
    Rückenbeschwerden hängen zusammen (die wenn-dann
    Beziehung ist nur in eine Richtung sinnvoll zu
    formulieren) eine Variable gilt als Ursache, die
    andere als Wirkung.

34
Typen von Hypothesen
  • Hypothesen können positiv oder negativ sein. Je
    ein Beispiel
  • Je höher die Semesterzahl von Soziologiestudenten,
    desto größer ist das Wissen über soziologische
    Theorien.
  • Je länger ein Mitarbeiter in einer Firma
    beschäftigt ist, desto niedriger ist seine
    Motivation

35
Typen von Variablen
  • Für asymmetrische Hypothesen gilt
  • Die Variable, in der man die Ursache vermutet
    unabhängige Variable
  • Die Variable, in der man die Wirkung vermutet
    abhängige Variable
  • statistisch können kausale Zusammenhänge (Ursache
    Wirkungs Zusammenhänge) nicht bewiesen
    werden, sondern nur, dass überhaupt ein
    Zusammenhang besteht. Ein kausaler Beweis ist mit
    Experimenten möglich.

36
Experiment
  • Ein Experiment unterscheidet sich durch andere
    Arten empirischer Untersuchungen dadurch, dass
    die unabhängige Variable nicht gemessen, sondern
    vom Versuchsleiter hergestellt wird (wie im
    Beispiel Frustration Störung oder keine Störung
    bei der Erledigung einer Aufgabe. Anderes
    Beispiel Medikament oder Placebo)
  • Um die Wirkung von Störvariablen zu
    kontrollieren, müssen die Personen zufällig auf
    die Ausprägungen der UV aufgeteilt werden.

37
Messen schematische Darstellung
1
Hauptschule
Realschule
2
1
Hauptschule
Gymnasium
3
Numerisches Relativ
Empirisches Relativ
38
Messen und Messniveau (1)
"Unter 'Messen' wird allgemein die Zuordnung von
Zahlen ('Messwerten') zu Objekten gemäß
festgelegten Regeln verstanden. Die Mängel dieser
Definition werden bereits dadurch deutlich, dass
die Zuweisung von Schulnoten durch Würfeln eine
definitionsgemäße Messung wäre. Eine brauchbare
Definition muss für eine Messung fordern, dass
die Messwerte zueinander Beziehungen aufweisen,
die den Beziehungen der gemessenen Objekte
entsprechen. So wird z.B. für eine sinnvolle
Längenmessung gefordert, dass der 'größte'
Messwert dem 'längsten' Objekt entspricht, der
'kleinste' Messwert dem 'kürzesten' Objekt. Eine
Messung in diesem Sinne ist eine 'strukturtreue
Abbildung' Die Beziehungen der Objekte ('kürzer'
- 'länger') werden durch die Beziehungen der
zugeordneten Zahlen ('kleiner' - 'größer')
korrekt wiedergegeben."
(Schnell et al. 1993 143, Herv. im Original)
39
Messen und Messniveau (2)
"Die Verwendung eines bestimmten Kriteriums, z.B.
Länge, definiert eine bestimmte Beziehung
('Relation') der Objekte zueinander. Eine Menge
von Objekten, über die eine Relation definiert
wurde, bezeichnet man als 'empirisches Relativ',
eine Menge von Zahlen, über die eine Relation
definiert wurde, als 'numerisches Relativ'. ...
Das Problem der Messung besteht nun darin, eine
Zuordnung der Zahlen zu den Objekten zu finden,
so dass die Ordnung im numerischen Relativ der
Ordnung im empirischen Relativ entspricht Das
Problem besteht in der Angabe einer Regel, die
eine strukturtreue Abbildung ermöglicht."
(Schnell et al. 1993 143f., Herv. im Original)
40
Codieren
  • Bei einigen Variablen ergibt sich die Zuordnung
    von Zahlen zu Variablenausprägungen
    unproblematisch, z.B. Alter in Jahren 20
  • Bei anderen Variablen muss man Entscheidungen
    treffen, z.B. beim Geschlecht Mann1, Frau2
  • Die codierten Werte werden dann in eine
    Datenmatrix eingegeben

41
Datenmatrix
Alter Geschlecht
Vp 1 20 1
Vp 2
Vp 3
Vp 4
Vp 5
Vp 6
Vp 7
Vp 8

42
Skalenniveaus
Skalenniveaus
43
Arten von Variablen
  • Diskrete Variablen haben begrenzte Ausprägungen,
    z.B. Zahl der Kinder
  • Kontinuierliche Variablen zwischen zwei Werten
    ist jeder Zwischenwert möglich, z.B. Alter, Größe
  • für die Statistik reicht folgende Unterscheidung
  • Kategoriale Variablen wenige Ausprägungen
  • Kontinuierliche Variablen viele Ausprägungen

44
Arten von Variablen
45
Mittelwerte und Streuungsmaße nach Messniveau (1)
Zentrale Tendenz (Mittelwerte)
46
Mittelwerte und Streuungsmaße nach Messniveau (2)
Streuung (Streuungsmaße)
47
Skalierung
  • Häufig werden mehrere Variablen gemessen, die
    gemeinsam eine neue Variable ergeben
  • Index eine Variable (soziale Schicht) ergibt
    sich aus mehreren anderen Variablen (Einkommen,
    Bildung, Berufsprestige).
  • Die Berechnung der neuen aus den alten Variablen
    erfolgt nach definierten Rechenoperationen im
    Beispiel ergibt sich das Problem
    unterschiedlicher Einheiten

48
Skalierung
  • Skala die Summe oder der Mittelwert aus mehreren
    Items (Fragen), die dasselbe Konstrukt messen
    sollen. Die Einheiten sind bei allen Items
    gleich.
  • Es werden mehrere Items vorgelegt, um die
    Messgenauigkeit zu erhöhen. Wenn einige Items
    gegensinnig formuliert sind, müssen sie umgepolt
    werden, z.B.
  • Ich habe Angst. nein 1 2 3 4 5 ja
  • Ich bin ganz ruhig. nein 1 2 3 4 5 ja
  • recode It2 (15) (24) (33) (42) (51).

49
Skalierung
  • Der Skalenwert ergibt sich aus dem Mittelwert der
    einzelnen Items.
  • Die Mittelung hat gegenüber einer Summierung zwei
    Vorteile
  • Das Minimum und das Maximum der Werte, die
    auftreten können, sind wie bei den Items, die
    Werte sind leichter interpretierbar.
  • Fehlende Werte werden ausgeglichen, da nur durch
    die Anzahl vorhandener Werte geteilt wird.
Write a Comment
User Comments (0)
About PowerShow.com