Title: Hoofdstuk 2: Frequentieverdelingen
1Hoofdstuk 2Frequentieverdelingen
- Absolute, relatieve en cumulatieve frequentie
- Tabellen en grafieken
- 1. Frequentietabellen
- 2. Classificeren van waarnemingen
- 3. Grafieken
2Absolute, relatieve en cumulatieve frequentie
- Gegevens, data ongeordend
- aanschouwelijk voorstellen
- in tabelvorm
- grafisch
-
datareductie
Classificeren
informatieverlies
3De absolute frequentie
- Totaal aantal waarnemingen
- populatiegrootte N
- steekproefgrootte n
- Absolute frequentie f
- het aantal keren dat een kenmerk Xi wordt
waargenomen (geteld) - 3 stappen selecteren, sorteren, tellen
4De relatieve frequentie
- Relatieve frequentie rel.fi
- absolute frequentie gedeeld door de totale
- frequentie
- in decimalen (fractie van 1)
- in procenten
Som relatieve frequenties 1 of 100
5De cumulatieve frequentie
- Ndz. een bepaalde volgorde in de uitkomsten (b.v.
van klein naar groot) - hoeveel waarnemingen zijn groter/kleiner dan een
bepaalde waarde?
6De cumulatieve frequentie (2)
- de cumulatieve frequentie vanaf de grootste
waarde Fg - het aantal waarnemingen dat groter dan of
gelijk is aan een bepaalde grenswaarde - of hoeveel waarden zijn in het schaalpunt of
erboven gelegen
7De cumulatieve frequentie (3)
- de cumulatieve frequentie vanaf de kleinste
waarde Fk - het aantal waarnemingen dat kleiner dan of
gelijk is aan een bepaalde grenswaarde - of hoeveel waarden zijn in het schaalpunt of
eronder gelegen
8De cumulatieve frequentie (4)
- ? F Fk Fg n f n
- bij niet-geclassificeerde waarnemingen
- ? F Fk Fg n (of N)
- bij geclassificeerde waarnemingen
- ook relatief cumulatieve frequenties
9Hoofdstuk 2 Tabellen en grafieken
- Frequentietabellen
- rijen, kolommen, velden/cellen
- Richtlijnen
- een tabel moet overzichtelijker zijn dan de lijst
aparte waarnemingen - bij voorkeur indelen naar maximum drie
gezichtsvelden - getallen met meer dan 3 cijfers worden afgerond
- internationale afspraken voor gebruik van tekens
10Classificeren van waarnemingen (1)
- Classificeren
- samennemen van naburige schaalpunten van een
variabele in een beperkt aantal klassen - Doel data-reductie
11Classificeren van waarnemingen (2)
- 3 manieren
- zoals het de onderzoeker uitkomt
- zó dat elke klasse evenveel van de
oorspronkelijke schaalpunten bevat (elke klasse
is even breed) - zó dat iedere klasse een bepaald aantal gelijk
of ongelijk- waarnemingen bevat
12Classificeren van waarnemingen (3)
- Aanbevelingen voor het classificeren van
waarnemingen - het aantal klassen ligt bij voorkeur tussen 5 en
20 vuistregel is ongeveer vn klassen te nemen - men streeft naar een gelijk klasse-interval
(gelijke klassebreedte) - vermijdt lege klassen of klassen met weinig
waarnemingen (frequentieverdelingen met een
staart )
13Classificeren van waarnemingen (4)
- vermijdt open klassen aan het begin of einde
(soms echter noodzakelijk) - klassegrenzen mogen elkaar niet overlappen en
moeten aaneensluiten (categorisch systeem!) - voor klassegrenzen en middens kiest men best
ronde getallen - bepaalt men de klassegrenzen op één rang meer dan
de waarnemingen, dan kan er nooit twijfel bestaan
in welke klasse een waarneming valt.
14Keuze klassegrenzen en middens (mi)
- 161 cm 171 cm mi 166 cm
- 171 cm 181 cm 176 cm
- 160 cm 170 cm mi 165 cm
- 170 cm 180 cm 175 cm
- 160,5 cm 170,5 cm mi 165,5 cm
- 170,5 cm 180,5 cm 175,5 cm
15Stap voor stap (1)
hoogste Xmax.
turven frequenties
laagste Xmin.
Uitbijters?
Ja ? schrappen aan beide uiteinden
Range R Xmax. Xmin.
16Stap voor stap (2)
- Bepaling klassebreedte
- i R / v n
als nlt40 R/6 als ngt400 R/20
Kleinste waarneming moet in de laagste klasse
liggen
Bepaling klassemiddens mi (bi Bi ) / 2
17Frequentietabel voorbeeld Lichaamslengte 35
studenten van een klas
Klasse (cm) mi fi rel.fi () Fk Fg ? F rel.Fk () rel.Fg
150-158 154 4 11,4 0 35 35 0,0 100
158-166 162 9 25,7 4 31 35 11,4 88,6
166-174 170 12 34,3 13 22 35 37,1 62,9
174-182 178 7 20,0 25 10 35 71,4 28,6
182-190 186 3 8,6 32 3 35 91,4 8,6
totaal 35 100 35 0 35 100 0,0
Cumulatieve frequenties bepaald op de
benedengrens!
18Frequentiedichtheid
- Wat?
- Frequentiedichtheid frequentie/klassebreedte
- fd fi / i
- Nut?
- Om klassen te vergelijken met ongelijke
klassebreedte - Belangrijkste klasse is deze met de hoogste
frequentiedichtheid (dichtste bezetting)
19Stem and leaf-diagram
- Wat?
- Combinatie van een tabel en een grafiek
- Voorbeeld afstand huis-school van 43 studenten
stam loof fi
0 5 7 0 1 2 8 7 3 0 8 6 3 12
1 5 8 2 2 4 9 0 3 5 4 8 0 5 6 14
2 3 1 5 6 8 6 0 4 8
3 9 2 4 3
4 8 3 9 1 0 5 6
90
20Hoofdstuk 2 Grafieken
- Indeling
- frequentiediagrammen
- tijdreeksgrafieken
- spreidings- of correlatiediagrammen
- specifieke voorstellingswijzen
21Grafieken (1)frequentiediagrammen
- 3 soorten
- histogrammen en kolommendiagrammen
- frequentieveelhoeken (-polygonen)
- frequentiecurven
- (waarschijnlijkheidsverdelingen)
22Frequentiediagrammen
- Algemeen kenmerk
- vertikale as frequentieas
- absolute frequentie (fi )
- relatieve frequentie (rel.fi )
- cumulatieve frequentie
- vanaf de kleinste waarde (Fk )
- vanaf de grootste waarde (Fg )
- relatief cumulatieve frequenties
- (rel.Fk en rel.Fg )
- horizontale as meetschaal
23Histogrammen en kolommendiagrammen
- Histogram
- continue kenmerken
- reeks rechthoeken
- opp. evenredig met frequentie kenmerk
- sluiten aan elkaar
- absoluut, relatief, cumulatief, relatief
cumulatief - twee- en driedimensionaal
- Kolommendiagram
- discontinue kenmerken
- los van elkaar getekend
- grotere vrijheid in de vorm
- (b.v. cilinders, objecten )
24Frequentiediagrammen voorbeeld
(1)Lichaamslengte 35 studenten van een klas
Klasse (cm) mi fi rel.fi () Fk Fg ? F rel.Fk () rel.Fg
150-158 154 4 11,4 0 35 35 0,0 100
158-166 162 9 25,7 4 31 35 11,4 88,6
166-174 170 12 34,3 13 22 35 37,1 62,9
174-182 178 7 20,0 25 10 35 71,4 28,6
182-190 186 3 8,6 32 3 35 91,4 8,6
totaal 35 100 35 0 35 100 0,0
Cumulatieve frequenties bepaald op de
benedengrens!
25Frequentiediagrammen voorbeelden (2)
1. Absoluut histogram
26Frequentiediagrammen voorbeelden (3)
2. Staafdiagram 3. Frequentieveelhoek/-polygoon
27Frequentiediagrammenvoorbeelden (4)
- 4. Relatief cumulatief frequentiehistogram vanaf
de kleinste waarde - 5. Relatief cumulatief frequentiepolygoon vanaf
de kleinste waarde
De (relatief) cumulatieve frequentie- veelhoeken
worden geconstrueerd op de benedengrens (of
bovengrens)
28Histogrammen varianten
- puntendiagram
- klassemiddens
- staafdiagram
- loodrechte projectie van de klassemiddens
- frequentieveelhoek (-polygoon)
- klassemiddens verbinden uiterste klassen
verbinden met klassemiddens fictieve aanliggende
klassen met nulfrequentie - frequentiecurve
- klassemiddens verbinden door vloeiende lijn
-
29Gestapelde frequentiediagrammen
-
- Mogelijkheid om histogrammen en
kolommendiagrammen te stapelen - - absoluut
- - relatief
- - voordeel evolutie van het totaal is
gemakke-lijker af te lezen - - nadeel evolutie van de aparte kenmerken is
moeilijk of niet af te lezen
30 Een grafiekje om bestwil misleiding met
grafieken
- nulpunt/nullijn houdt geen verband met de
resultaten en er wordt geen scheurlijn/breuklijn
gebruikt - de verhouding op de assen klopt niet met de
realiteit - de kolommen worden uitgezet op een stijgende lijn
(dus niet op dezelfde hoogte) - de afstanden op de X-as zijn niet evenredig
(bepaalde periodes worden weggelaten) - bepaalde resultaten worden extra in de verf
gezet, b.v. op een cirkeldiagram - Kans op onjuiste diagrammen in een jaarverslag
is 47
31Aanbevelingen voor grafieken
- bij niet rangschikbare kenmerken
- volgorde staven/kolommen speelt geen rol
- aanbeveling rangschikken van klein naar groot
of van groot naar klein - ondelinge afstand tussen de kolommen is
willekeurig - klassen samenvoegen de totale frequentie delen
door het aantal samengenomen klassen - soms is het nuttig de oorsprong van het
assenstelsel te verleggen gebruik een scheurlijn
of breuklijn - op de assen schaalpunten en meeteenheid
vermelden, niet de exacte waarnemingen.
32Waarschijnlijkheidsverdelingen
- homogene verdelingen
- normale verdelingen
- - spits, normaal en vlak
- scheve verdelingen
- scheef naar links
- scheef naar rechts
- eentoppige, tweetoppige en meertoppige
verdelingen - U-vormige verdelingen
- J-vormige en omgekeerd J-vormige verdelingen
33Hoofdstuk 2 Grafieken
- Indeling
- frequentiediagrammen
- tijdreeksgrafieken
- spreidings- of correlatiediagrammen
- specifieke voorstellingswijzen
34Tijdreeksgrafieken
- Algemeen kenmerk
- horizontale as tijdsas
- vertikale as meetschaal
- Soorten
- lijn(en)diagram
- stralendiagram
- sterdiagram, poolcurve of radardiagram
35Tijdreeksgrafieken (1)lijn(en)diagram
- b.v. verloop beurskoersen
- temperatuurverloop in een maand
- evolutie elektriciteitsverbruik in 24u
-
-
36Tijdreeksgrafieken (2)stralendiagram (1)
- Het resultaat in de basisperiode wordt
gelijkgesteld aan 100 en alle volgende uitslagen
worden omgerekend naar die basis
2000 2001 2002
Product A 40.000 36.000 58.000
100 90 145
Product B 150.000 157.500 180.000
100 105 120
Product C 20.000 50.000 40.000
100 250 200
37Stralendiagram (2)
38Stralendiagram (3)
- Voordelen
- - relatieve groei onmiddellijk af te lezen
- - resultaten gemakkelijk te vergelijken
- Nadelen
- - geen absolute resultaten
- - onmogelijk af te lezen welke reeks de hoogste
- scores heeft
39Tijdreeksgrafieken (3)radardiagram/poolcurve/ste
rdiagram
- Concentrisch opgebouwde grafiek, af te lezen in
wijzerszin - toepassingen
- - samenstellen homogene teams (complementaire
- vaardigheden)
- - bezettingsgraden infrastructuren in bepaalde
periode - - kwaliteitsvergelijking reeks producten
- - illustreren van het seizoenkarakter van
verschijnselen
40Radardiagram/poolcurve/sterdiagram (2)
41Radardiagram/poolcurve/sterdiagram (3)
- Voordelen
- - moderne vorm van grafische voorstelling
- - mogelijk veel info op één grafiek
- - bij goed gebruik zeer praktisch
- Nadelen
- - zeer specifiek
- - moeilijk af te lezen door de leek
- - als de volgorde van de uitslagen wordt
gewijzigd, - dan verandert de vorm/het uitzicht van de
grafiek -
42Hoofdstuk 2 Grafieken
- Indeling
- frequentiediagrammen
- tijdreeksgrafieken
- spreidings- of correlatiediagrammen
- specifieke voorstellingswijzen
43Spreidings-, correlatie- of scatterdiagrammen (1)
- Gebruik
- om grafisch de samenhang tussen twee kenmerken
na te gaan - Opbouw
- horizontale as kenmerk 1 oorzaak
- vertikale as kenmerk 2 gevolg
-
- de bekomen combinaties liggen meestal in het
eerste kwadrant van de grafiek
44Spreidingsdiagrammen (2)
- Soorten
- correlatiediagrammen
- laddergrafieken
- grafiek van Claparède
45Correlatiediagrammen
46Laddergrafieken
- Wat?
- Visuele methode om samenhang tussen twee
kenmerken te illustreren - Hoe?
- 2 reeksen uitslagen rangschikken (van klein naar
groot of omgekeerd) ? corresponderende rangorden
verbinden - - geen snijpunten volmaakte ladder 100
positieve correlatie - - 1 snijpunt volmaakte negatieve correlatie
100 neg. corr. - - veel snijpunten geen correlatie
- Opm. 1 afwijkende uitslag kan zorgen voor heel
wat snijpunten -
47Grafiek van Claparède
- Wat?
- 2 tijdreeksgrafieken boven elkaar geplakt
- Aflezing?
- - grafieken evenwijdig grote positieve
correlatie - - 1 snijpunt grote negatieve correlatie
- - veel snijpunten weinig/geen correlatie
48Hoofdstuk 2 Grafieken
- Indeling
- frequentiediagrammen
- tijdreeksgrafieken
- spreidings- of correlatiediagrammen
- specifieke voorstellingswijzen
49Grafieken specifieke voorstellingswijzen
- Overzicht
- cirkeldiagrammen en taartpuntdiagrammen
- stroomdiagrammen (flow-charts)
- beeldstatistieken
- cartogrammen
- driehoeksdiagrammen
- bevolkingspiramiden
50Grafieken specifieke voorstellingswijzen
- Overzicht
- cirkeldiagrammen en taartpuntdiagrammen
- stroomdiagrammen (flow-charts)
- beeldstatistieken
- cartogrammen
- driehoeksdiagrammen
- bevolkingspiramiden
51Cirkeldiagrammen (1)
- Wellicht de meest gebruikte soort grafieken
- Wat?
- - de cirkel wordt verdeeld in sectoren recht
evenredig met de waarde van het voorgestelde
verschijnsel - - zowel de oppervlakte van het segment als de
middelpuntshoek zijn een maat voor de resultaten - - afspraken
- maximum 6 à 10 sectoren
- aflezing starten op 12 uur
- aflezing in wijzerzin
- volgorde van de sectoren respecteren
- kleurlegende/arcering een duidelijk onderscheid
is noodzakelijk -
52Cirkeldiagrammen (2)
- Mogelijkheden
- - twee- en driedimensionaal
- - taartpunten uit de taart geschoven
- De oppervlakte van de cirkel is evenredig met
het totale resultaat - S2 / S 1 ? R22 / ? R12
- ? R2 R1 ? T2 / T1
- ? T2 T1 R22 / R12
-
- __
53Cirkeldiagrammen (3)
54Stroomdiagrammen / flow charts
- met pijlen wordt de richting aangegeven waarin
grootheden zich bewegen - de breedte van de pijlen geeft de omvang van de
verschijnselen weer - mogelijkheid om complexe systemen overzichtelijk
voor te stellen in één diagram - b.v. energieverbruik in een regio
- klantenbewegingen in een winkelcomplex
55Beeldstatistieken
- meest bekend bij het publiek
- zeer toegankelijk want extreem suggestief
- beeldjes illustratief voor verschijnselen
- aantal beeldjes zijn maat voor omvang kenmerken
- eerder illustratief dan nauwkeurig
56Cartogrammen
- Combinatie van een kaart en een grafiek
- geven de ruimtelijke verspreiding van kenmerken
weer - veelal gebruik van conventionele symbolen
- kennis van ruimtelijke entiteiten is noodzakelijk
57Driehoeksdiagrammen
- Gebruik?
- relatieve frequentieverdelingen van 3 kenmerken
in een categorisch systeem - Vorm?
- gelijkzijdige driehoek, elke zijde wordt
verdeeld in 100 - Aflezing?
- - geografen in tegenwijzerzin
- - economisten in wijzerzin
- Toepassingen
- - bevolkingsopbouw
- - verdeling actieve bevolking over de
economische - sectoren
- - textuurdriehoek (bodemkunde)
-
58Bevolkingspiramiden (1)
- Wat?
- de grafische voorstelling van de samenstelling
van een bevolking naar geslacht en leeftijd - Opbouw?
- twee histogrammen, basis tegen basis
- - vertikale as leeftijdsklassen (1 of 5 jaar)
- - horizontale as mannen (links) of vrouwen
- (rechts) in procent of promille
59Bevolkingspiramiden (2)
- Soorten bevolkingspiramiden
- basiszwaar
- theoretisch (gelijkbenig)
- topzwaar
- b.v. bevolkingspiramiden N.I.S.
- het rijk, de gewesten, provincies, gemeenten