Title: Hoofdstuk 3 Maatstaven voor ligging en spreiding
1Hoofdstuk 3Maatstaven voor ligging en spreiding
- 3.1. Centrummaten Gemiddelden
- 3.2. Kwantielen
- 3.3. De spreidingsmaten
2Centrummaten
- het rekenkundig gemiddelde
- de mediaan
- de modus
- bij niet-gegroepeerde waarnemingen
- bij gegroepeerde waarnemingen of
frequentieverdelingen
3Eigenschappen van kengetallen voor
frequentieverdelingen
- a. eenduidig gedefinieerd zijn (ondubbelzinnig)
- b. alle waarnemingen spelen een rol bij de
bepaling van het kengetal - c. de interpretatie moet eenvoudig en
inzichtelijk zijn - d. de kengetallen moeten niet al te gevoelig zijn
voor steekproeftoevalligheden, maar een grote
steekproefstabiliteit bezitten - e. met de kengetallen moeten algebraïsche
bewerkingen mogelijk zijn
4Het rekenkundig gemiddelde
- Wat?
- Het rekenkundig gemiddelde van een reeks
waarnemingsresutaten is gelijk aan de som van
alle resultaten gedeeld door het aantal
waarnemingen (dit is de steekproef- of
popultieomvang) - Symbool
- Formule
5Het rekenkundig gemiddelde eigenschappen (1)
- 1. Vermindert men alle waarnemingen met een
zelfde getal, dan wordt ook het rekenkundig
gemiddelde verminderd met dat getal - ? men mag op de meetschaal een nieuwe oorsprong
invoeren - 2. Vermenigvuldigt men alle resultaten met een
zelfde getal, dan wordt ook het rekenkundig
gemiddelde met dit getal vermenigvuldigd (idem
delen) - ? men mag alle resultaten vereenvoudigen
6Het rekenkundig gemiddelde eigenschappen (2)
- 3. De som van de afwijking van alle
waarnemingsresultaten ten opzichte van hun
rekenkundig gemiddelde is nul - Opm. het rekenkundig gemiddelde wordt in de
statistiek altijd berekend op één rang meer
dan de waarnemingsresultaten.
7Het gewogen rekenkundig gemiddelde (1)
- Wat?
- Als niet aan alle waarnemingen een zelfde belang
mag gehecht worden, vermenigvuldigt men elke
waarde met een wegingsfactor en bepaalt men pas
dan het rekenkundig gemiddelde
8Het gewogen rekenkundig gemiddelde (2)
- Voorbeeld examenuitslagen student D.V.
- Rekenkundig gemiddelde
- Gewogen rek.gemiddelde
-
Vakken Resultaat op 10 studiepunten
Economie 5 6
Statistiek 7 3
Recht 9 4
9Het rekenkundig gemiddelde van gegroepeerde
gegevens
- Formule
- De klassemiddens worden representatief voor elke
klasse alle frequenties worden vermenigvuldigd
met de overeenkomende klassemiddens
10Centrummaten
- het rekenkundig gemiddelde
- de mediaan
- de modus
- bij niet-gegroepeerde waarnemingen
- bij gegroepeerde waarnemingen of
frequentieverdelingen
11De mediaan (1)
- Wat?
- De mediaan van een reeks waarnemings-resultaten
is de middelste van de naar grootte gerangschikte
resultaten. - De mediaan verdeelt een reeks resultaten in twee
gelijke groepen - aantal waarden lt Me aantal waarden gt Me
- Symbool Me
- Synoniem midscore
12De mediaan (2)
- bij oneven aantal waarnemingen
- Me middelste van naar grootte gerangschikte
- bij even aantal waarnemingen
- Me rek. gemiddelde van middelste twee
- Bij gegroepeerde frequentieverdelingen
- Me tweede kwartiel (Q2)
- mediaanklasse zie cumulatief frequentiehistogram
13De modus
- Wat?
- De modus van een reeks waarnemingsresultaten is
de waarneming die het meest voorkomt - ( de uitslag met de hoogste frequentie)
- Symbool Mo
- Opmerkingen
- hebben alle resultaten in een reeks dezelfde
frequentie, dan is er geen modus - de modus is de enige centrummaat ook te gebruiken
voor kwalitatieve kenmerken - unimodale, bimodale, multimodale verdelingen
14De modus bij gegroepeerde waarnemingen (1)
- de modale klasse is de klasse met de hoogste
frequentie - nauwkeuriger
- f frequentie modale klasse
- fl frequentie (lagere) voorgaande klasse
- fh frequentie (hogere) volgende klasse
- b benedengrens modale klasse
- i klasse-interval
15 De modus bij gegroepeerde waarnemingen (2)
- Grafische bepaling van de modus bij
frequentieverdelingen
modale klasse
Mo
16Eigenschappen van kengetallen voor
frequentieverdelingen
- a. eenduidig gedefinieerd zijn (ondubbelzinnig)
- b. alle waarnemingen spelen een rol bij de
bepaling van het kengetal - c. de interpretatie moet eenvoudig en
inzichtelijk zijn - d. de kengetallen moeten niet al te gevoelig zijn
voor steekproeftoevalligheden, maar een grote
steekproefstabiliteit bezitten - e. met de kengetallen moeten algebraïsche
bewerkingen mogelijk zijn
17Keuze van de centrummaten (1)
-
Rekenkundig gemiddelde voldoet in alle opzichten als centrummaat eign a,b,c,d,e gevoelig voor uitbijters
Mediaan ongevoelig voor uitbijters eign a,b,c kleine steekproef-stabiliteit algebraïsch weinig mogelijkheden
Modus snel te bepalen eign a,c nagenoeg geen positieve eigen-schappen
18Keuze van de centrummaten (2)
- De keuze hangt af van
- het meetniveau
- de scheefheid van de verdeling
- extreme waarden
19Keuze centrummaat in functie van het meetniveau
ratio interval ordinaal nominaal
Rek. gemidd. ? ?
Mediaan ? ? ?
Modus ? ? ? ?
20Keuze van de centrummaten (3)
- De keuze hangt af van
- het meetniveau
- de scheefheid
- mogelijke extreme waarden
21Keuze centrummaat in functie van de scheefheid
(1a)
- Symmetrische verdelingen
- ? normale verdelingen
-
-
b.v. IQ-scores, de meeste natuurlijke
verschijnselen
22Keuze centrummaat in functie van de scheefheid
(1b)
- Bimodale symmetrische verdelingen
-
-
-
Mo1
Mo2
23Keuze centrummaat in functie van de scheefheid
(2)
- Scheef naar links (negatief scheef)
- b.v. lichaamsgewicht mannelijke 40-plussers in
België -
-
Mo
staart
24Keuze centrummaat in functie van de scheefheid
(3)
- Scheef naar rechts (positief scheef)
- b.v. belastbaar inkomen Belgische bevolking in
-
-
Mo
staart
25Keuze van de centrummaten (4)
- De keuze hangt af van
- het meetniveau
- de scheefheid
- mogelijke extreme waarden
26Keuze centrummaat in functie van mogelijke
extreme waarden
- Extreme waarden ( uitbijters)
- beïnvloeden het gemiddelde ? de mediaan is hier
beter geschikt dan het rekenkundig gemiddelde - Voorbeeld
- 1 2 2 3 4 5 5 7 9 118
- 15,6 Me 4,5
27Hoofdstuk 3Maatstaven voor ligging en spreiding
- 3.1. Centrummaten Gemiddelden
- 3.2. Kwantielen
- 3.3. De spreidingsmaten
28Kwantielen
- Wat?
- Kwantielen verdelen een frequentieverdeling in
een aantal gelijke stukken ( stukken met gelijke
frequentie) - Doel?
- Kwantielen dienen om een uitkomst te situeren
ten opzichte van andere uitkomsten
29Kwantielen (2)
- Soorten kwantielen
- Kwartielen Q1, Q2 , Q3
- verdelen de frequentieverdeling in 4 gelijke
intervallen, elk met 25 van de uitkomsten - Decielen D1, D2 , , D9
- verdelen de frequentieverdeling in 10 gelijke
intervallen, elk met 10 van de uitkomsten - Percentielen P01, P02 , , P99
- verdelen de frequentieverdeling in 100 gelijke
intervallen, elk met 1 van de uitkomsten
30Kwantielen (3)
De interkwartielafstand (IKA) geeft de range aan
van de middelste helft van de resultaten. De IKA
is ongevoelig voor uitbijters.
31Percentiel ? percentiele rang
- percentiel (P)
- b.v. P57 173,5 cm
- 57 van de resultaten zijn kleiner of gelijk aan
173,5 cm - percentiele rang (p)
-
- b.v. p168cm 48,3
- een lengte van 168cm komt overeen met de 48,3
kleinste resultaten
325-getallen-résumé
-
- Een frequentieverdeling kan omschreven worden
met 5 kengetallen -
-
33Boxplot (boxdiagram)
-
- Een boxplot is de grafische voorstelling
- van het 5-getallen-résumé
- de randen van de box Q1 (bodem)
- Q3 (deksel)
- het tussenschot in de box Me
- twee bakkebaarden
- van de box tot aan Xmin en Xmax
- Doel
- een snelle vergelijking van verschillende
frequentieverdelingen
34Boxplot (5-getallen-résumé)
Xmax
Q3
Me
Q1
Xmin
35Vergelijking boxplots
36Grafische bepaling van kwantielen
percentiel P27 133 percentiele rang P528
96
96
27
133
528
37Hoofdstuk 3Maatstaven voor ligging en spreiding
- 3.1. Centrummaten Gemiddelden
- 3.2. Kwantielen
- 3.3. De spreidingsmaten
38Spreiding, dispersie, variatie
- 3 invalshoeken
- de verschillen tussen de uitkomsten onderling
- de range op de meetschaal, waarbinnen een bepaald
percentage van het totaal aantal waarnemingen
ligt - de verschillen tussen de uitkomsten en de
centrummaten
39De variatiebreedte of de range (1)
- Wat?
- het verschil tussen de uiterste resultaten
- Voordelen
- zeer snel en eenvoudig te bepalen
- Nadeel
- maximaal beïnvloed door uitbijters
40De variatiebreedte of de range (2)
- Bij gegroepeerde gegevens is de range
-
41De interkwartielafsand (IKA)
- Beter dan de range
- Voordeel
- totaal ongevoelig voor uitbijters!
- Ook IDA interdecielafstand (D9 D1)
42Spreiding, dispersie, variatie
- 3 invalshoeken
- de verschillen tussen de uitkomsten onderling
- de range op de meetschaal, waarbinnen een bepaald
percentage van het totaal aantal waarnemingen
ligt - de verschillen tussen de uitkomsten en
- de centrummaten
43Spreiding
- Algemeen
- de afstand tussen een centrummaat C en de
waarnemingsresultaten Xi - Spreiding
- waarin
44De gemiddelde absolute afwijking
- Wat?
- het gemiddeld verschil tussen elke uitslag en
het rekenkundig gemiddelde van alle uitslagen - Symbool
- Formule
voor gegroepeerde gegevens Xi ?mi
45De variantie en de standaardafwijking
- Wat?
- de variantie van een reeks uitslagen
- geeft aan in hoeverre deze afwijken van het
gemiddelde - Symbool
- Formule
mi
46De standaardafwijking (1)
- Variantie
- wordt uitgedrukt in de tweede macht van de
meeteenheid - de standaardafwijking is de vierkantswortel
uit de variantie - de standaardafwijking is de belangrijkste
spreidingsmaat in de statistiek
47De standaardafwijking (2)
fi . mi²
voor gegroepeerde gegevens Xi ? fi .mi
48De standaardafwijking (3)
- De standaardafwijking is de meest gebruikte
spreidingsmaat - normale verdelingen worden gekarakteriseerd door
het rekenkundig gemiddelde en de
standaardafwijking - in een Gauss-curve is de afstand van de
buigpunten tot de symmetrieas steeds gelijk aan
de standaardafwijking - in een normale verdeling ligt steeds een zelfde
percentage van de waarnemingen tussen het
gemiddelde vermeerderd/verminderd met 1, 2 of 3
keer de standaardafwijking
49Normale verdelingen (1)
b.v. N(6312,7)
16
50Normale verdelingen (2)
vlakke normale verdeling
spitse normale verdeling
51Normale verdelingen (3)
156 164 172 180 188 196 204 cm NL
150 157 164 171 178 185 192 cm B
52De variatiecoëfficiënt
- Wat?
- Een relatieve spreidingsmaat, onafhankelijk van
de meeteenheid, om de spreiding van verschillende
steekproeven te vergelijken - Symbool
- Formule
- De standaardafwijking wordt uitgedrukt in
verhouding - tot het rekenkundig gemiddelde