Hoofdstuk 3 Maatstaven voor ligging en spreiding - PowerPoint PPT Presentation

1 / 52
About This Presentation
Title:

Hoofdstuk 3 Maatstaven voor ligging en spreiding

Description:

Hoofdstuk 3 Maatstaven voor ligging en spreiding 3.1. Centrummaten Gemiddelden 3.2. Kwantielen 3.3. De spreidingsmaten Centrummaten het rekenkundig gemiddelde de ... – PowerPoint PPT presentation

Number of Views:108
Avg rating:3.0/5.0
Slides: 53
Provided by: PAUWELS4
Category:

less

Transcript and Presenter's Notes

Title: Hoofdstuk 3 Maatstaven voor ligging en spreiding


1
Hoofdstuk 3Maatstaven voor ligging en spreiding
  • 3.1. Centrummaten Gemiddelden
  • 3.2. Kwantielen
  • 3.3. De spreidingsmaten

2
Centrummaten
  • het rekenkundig gemiddelde
  • de mediaan
  • de modus
  • bij niet-gegroepeerde waarnemingen
  • bij gegroepeerde waarnemingen of
    frequentieverdelingen

3
Eigenschappen van kengetallen voor
frequentieverdelingen
  • a. eenduidig gedefinieerd zijn (ondubbelzinnig)
  • b. alle waarnemingen spelen een rol bij de
    bepaling van het kengetal
  • c. de interpretatie moet eenvoudig en
    inzichtelijk zijn
  • d. de kengetallen moeten niet al te gevoelig zijn
    voor steekproeftoevalligheden, maar een grote
    steekproefstabiliteit bezitten
  • e. met de kengetallen moeten algebraïsche
    bewerkingen mogelijk zijn

4
Het rekenkundig gemiddelde
  • Wat?
  • Het rekenkundig gemiddelde van een reeks
    waarnemingsresutaten is gelijk aan de som van
    alle resultaten gedeeld door het aantal
    waarnemingen (dit is de steekproef- of
    popultieomvang)
  • Symbool
  • Formule

5
Het rekenkundig gemiddelde eigenschappen (1)
  • 1. Vermindert men alle waarnemingen met een
    zelfde getal, dan wordt ook het rekenkundig
    gemiddelde verminderd met dat getal
  • ? men mag op de meetschaal een nieuwe oorsprong
    invoeren
  • 2. Vermenigvuldigt men alle resultaten met een
    zelfde getal, dan wordt ook het rekenkundig
    gemiddelde met dit getal vermenigvuldigd (idem
    delen)
  • ? men mag alle resultaten vereenvoudigen

6
Het rekenkundig gemiddelde eigenschappen (2)
  • 3. De som van de afwijking van alle
    waarnemingsresultaten ten opzichte van hun
    rekenkundig gemiddelde is nul
  • Opm. het rekenkundig gemiddelde wordt in de
    statistiek altijd berekend op één rang meer
    dan de waarnemingsresultaten.

7
Het gewogen rekenkundig gemiddelde (1)
  • Wat?
  • Als niet aan alle waarnemingen een zelfde belang
    mag gehecht worden, vermenigvuldigt men elke
    waarde met een wegingsfactor en bepaalt men pas
    dan het rekenkundig gemiddelde

8
Het gewogen rekenkundig gemiddelde (2)
  • Voorbeeld examenuitslagen student D.V.
  • Rekenkundig gemiddelde
  • Gewogen rek.gemiddelde

Vakken Resultaat op 10 studiepunten
Economie 5 6
Statistiek 7 3
Recht 9 4
9
Het rekenkundig gemiddelde van gegroepeerde
gegevens
  • Formule
  • De klassemiddens worden representatief voor elke
    klasse alle frequenties worden vermenigvuldigd
    met de overeenkomende klassemiddens

10
Centrummaten
  • het rekenkundig gemiddelde
  • de mediaan
  • de modus
  • bij niet-gegroepeerde waarnemingen
  • bij gegroepeerde waarnemingen of
    frequentieverdelingen

11
De mediaan (1)
  • Wat?
  • De mediaan van een reeks waarnemings-resultaten
    is de middelste van de naar grootte gerangschikte
    resultaten.
  • De mediaan verdeelt een reeks resultaten in twee
    gelijke groepen
  • aantal waarden lt Me aantal waarden gt Me
  • Symbool Me
  • Synoniem midscore

12
De mediaan (2)
  • bij oneven aantal waarnemingen
  • Me middelste van naar grootte gerangschikte
  • bij even aantal waarnemingen
  • Me rek. gemiddelde van middelste twee
  • Bij gegroepeerde frequentieverdelingen
  • Me tweede kwartiel (Q2)
  • mediaanklasse zie cumulatief frequentiehistogram

13
De modus
  • Wat?
  • De modus van een reeks waarnemingsresultaten is
    de waarneming die het meest voorkomt
  • ( de uitslag met de hoogste frequentie)
  • Symbool Mo
  • Opmerkingen
  • hebben alle resultaten in een reeks dezelfde
    frequentie, dan is er geen modus
  • de modus is de enige centrummaat ook te gebruiken
    voor kwalitatieve kenmerken
  • unimodale, bimodale, multimodale verdelingen

14
De modus bij gegroepeerde waarnemingen (1)
  • de modale klasse is de klasse met de hoogste
    frequentie
  • nauwkeuriger
  • f frequentie modale klasse
  • fl frequentie (lagere) voorgaande klasse
  • fh frequentie (hogere) volgende klasse
  • b benedengrens modale klasse
  • i klasse-interval

15
De modus bij gegroepeerde waarnemingen (2)
  • Grafische bepaling van de modus bij
    frequentieverdelingen

modale klasse
Mo
16
Eigenschappen van kengetallen voor
frequentieverdelingen
  • a. eenduidig gedefinieerd zijn (ondubbelzinnig)
  • b. alle waarnemingen spelen een rol bij de
    bepaling van het kengetal
  • c. de interpretatie moet eenvoudig en
    inzichtelijk zijn
  • d. de kengetallen moeten niet al te gevoelig zijn
    voor steekproeftoevalligheden, maar een grote
    steekproefstabiliteit bezitten
  • e. met de kengetallen moeten algebraïsche
    bewerkingen mogelijk zijn

17
Keuze van de centrummaten (1)
-
Rekenkundig gemiddelde voldoet in alle opzichten als centrummaat eign a,b,c,d,e gevoelig voor uitbijters
Mediaan ongevoelig voor uitbijters eign a,b,c kleine steekproef-stabiliteit algebraïsch weinig mogelijkheden
Modus snel te bepalen eign a,c nagenoeg geen positieve eigen-schappen
18
Keuze van de centrummaten (2)
  • De keuze hangt af van
  • het meetniveau
  • de scheefheid van de verdeling
  • extreme waarden

19
Keuze centrummaat in functie van het meetniveau
ratio interval ordinaal nominaal
Rek. gemidd. ? ?
Mediaan ? ? ?
Modus ? ? ? ?
20
Keuze van de centrummaten (3)
  • De keuze hangt af van
  • het meetniveau
  • de scheefheid
  • mogelijke extreme waarden

21
Keuze centrummaat in functie van de scheefheid
(1a)
  • Symmetrische verdelingen
  • ? normale verdelingen

b.v. IQ-scores, de meeste natuurlijke
verschijnselen
22
Keuze centrummaat in functie van de scheefheid
(1b)
  • Bimodale symmetrische verdelingen

Mo1
Mo2
23
Keuze centrummaat in functie van de scheefheid
(2)
  • Scheef naar links (negatief scheef)
  • b.v. lichaamsgewicht mannelijke 40-plussers in
    België

Mo
staart
24
Keuze centrummaat in functie van de scheefheid
(3)
  • Scheef naar rechts (positief scheef)
  • b.v. belastbaar inkomen Belgische bevolking in

Mo
staart
25
Keuze van de centrummaten (4)
  • De keuze hangt af van
  • het meetniveau
  • de scheefheid
  • mogelijke extreme waarden

26
Keuze centrummaat in functie van mogelijke
extreme waarden
  • Extreme waarden ( uitbijters)
  • beïnvloeden het gemiddelde ? de mediaan is hier
    beter geschikt dan het rekenkundig gemiddelde
  • Voorbeeld
  • 1 2 2 3 4 5 5 7 9 118
  • 15,6 Me 4,5

27
Hoofdstuk 3Maatstaven voor ligging en spreiding
  • 3.1. Centrummaten Gemiddelden
  • 3.2. Kwantielen
  • 3.3. De spreidingsmaten

28
Kwantielen
  • Wat?
  • Kwantielen verdelen een frequentieverdeling in
    een aantal gelijke stukken ( stukken met gelijke
    frequentie)
  • Doel?
  • Kwantielen dienen om een uitkomst te situeren
    ten opzichte van andere uitkomsten

29
Kwantielen (2)
  • Soorten kwantielen
  • Kwartielen Q1, Q2 , Q3
  • verdelen de frequentieverdeling in 4 gelijke
    intervallen, elk met 25 van de uitkomsten
  • Decielen D1, D2 , , D9
  • verdelen de frequentieverdeling in 10 gelijke
    intervallen, elk met 10 van de uitkomsten
  • Percentielen P01, P02 , , P99
  • verdelen de frequentieverdeling in 100 gelijke
    intervallen, elk met 1 van de uitkomsten

30
Kwantielen (3)
De interkwartielafstand (IKA) geeft de range aan
van de middelste helft van de resultaten. De IKA
is ongevoelig voor uitbijters.
31
Percentiel ? percentiele rang
  • percentiel (P)
  • b.v. P57 173,5 cm
  • 57 van de resultaten zijn kleiner of gelijk aan
    173,5 cm
  • percentiele rang (p)
  • b.v. p168cm 48,3
  • een lengte van 168cm komt overeen met de 48,3
    kleinste resultaten

32
5-getallen-résumé
  • Een frequentieverdeling kan omschreven worden
    met 5 kengetallen

33
Boxplot (boxdiagram)
  • Een boxplot is de grafische voorstelling
  • van het 5-getallen-résumé
  • de randen van de box Q1 (bodem)
  • Q3 (deksel)
  • het tussenschot in de box Me
  • twee  bakkebaarden 
  • van de box tot aan Xmin en Xmax
  • Doel
  • een snelle vergelijking van verschillende
    frequentieverdelingen

34
Boxplot (5-getallen-résumé)
Xmax
Q3
Me
Q1
Xmin
35
Vergelijking boxplots
36
Grafische bepaling van kwantielen
percentiel P27 133 percentiele rang P528
96
96
27
133
528
37
Hoofdstuk 3Maatstaven voor ligging en spreiding
  • 3.1. Centrummaten Gemiddelden
  • 3.2. Kwantielen
  • 3.3. De spreidingsmaten

38
Spreiding, dispersie, variatie
  • 3 invalshoeken
  • de verschillen tussen de uitkomsten onderling
  • de range op de meetschaal, waarbinnen een bepaald
    percentage van het totaal aantal waarnemingen
    ligt
  • de verschillen tussen de uitkomsten en de
    centrummaten

39
De variatiebreedte of de range (1)
  • Wat?
  • het verschil tussen de uiterste resultaten
  • Voordelen
  • zeer snel en eenvoudig te bepalen
  • Nadeel
  • maximaal beïnvloed door uitbijters

40
De variatiebreedte of de range (2)
  • Bij gegroepeerde gegevens is de range

41
De interkwartielafsand (IKA)
  • Beter dan de range
  • Voordeel
  • totaal ongevoelig voor uitbijters!
  • Ook IDA interdecielafstand (D9 D1)

42
Spreiding, dispersie, variatie
  • 3 invalshoeken
  • de verschillen tussen de uitkomsten onderling
  • de range op de meetschaal, waarbinnen een bepaald
    percentage van het totaal aantal waarnemingen
    ligt
  • de verschillen tussen de uitkomsten en
  • de centrummaten

43
Spreiding
  • Algemeen
  • de afstand tussen een centrummaat C en de
    waarnemingsresultaten Xi
  • Spreiding
  • waarin

44
De gemiddelde absolute afwijking
  • Wat?
  • het gemiddeld verschil tussen elke uitslag en
    het rekenkundig gemiddelde van alle uitslagen
  • Symbool
  • Formule

voor gegroepeerde gegevens Xi ?mi
45
De variantie en de standaardafwijking
  • Wat?
  • de variantie van een reeks uitslagen
  • geeft aan in hoeverre deze afwijken van het
    gemiddelde
  • Symbool
  • Formule

mi
46
De standaardafwijking (1)
  • Variantie
  • wordt uitgedrukt in de tweede macht van de
    meeteenheid
  • de standaardafwijking is de vierkantswortel
    uit de variantie
  • de standaardafwijking is de belangrijkste
    spreidingsmaat in de statistiek

47
De standaardafwijking (2)
  • Formule
  • of

fi . mi²
voor gegroepeerde gegevens Xi ? fi .mi
48
De standaardafwijking (3)
  • De standaardafwijking is de meest gebruikte
    spreidingsmaat
  • normale verdelingen worden gekarakteriseerd door
    het rekenkundig gemiddelde en de
    standaardafwijking
  • in een Gauss-curve is de afstand van de
    buigpunten tot de symmetrieas steeds gelijk aan
    de standaardafwijking
  • in een normale verdeling ligt steeds een zelfde
    percentage van de waarnemingen tussen het
    gemiddelde vermeerderd/verminderd met 1, 2 of 3
    keer de standaardafwijking

49
Normale verdelingen (1)
b.v. N(6312,7)
16
50
Normale verdelingen (2)
vlakke normale verdeling
spitse normale verdeling
51
Normale verdelingen (3)
156 164 172 180 188 196 204 cm NL
150 157 164 171 178 185 192 cm B
52
De variatiecoëfficiënt
  • Wat?
  • Een relatieve spreidingsmaat, onafhankelijk van
    de meeteenheid, om de spreiding van verschillende
    steekproeven te vergelijken
  • Symbool
  • Formule
  • De standaardafwijking wordt uitgedrukt in
    verhouding
  • tot het rekenkundig gemiddelde
Write a Comment
User Comments (0)
About PowerShow.com