Title: Statistiques descriptives
1Statistiques descriptives
2Statistiques descriptives plan
- Distributions de fréquences
- Graphiques de distribution de fréquences
- Mesures de tendance centrale
- Mesures de variabilité
3Tableau de distribution de fréquences
- Définition Tableau ordonné indiquant le nombre
dindividus situés dans chaque catégorie dune
échelle de mesure
8, 9, 8, 7, 10, 9, 6, 4, 9, 8, 7, 8, 10, 9, 8, 6,
9, 7, 8, 8,
4Tableau de distribution de fréquences
Sans les données manquantes
5Histogrammes
6Polygones de fréquences
Distribution de fréquences pour la variable X
5 4 3 2 1
Fréquences
1 2 3 4 5 6 7
Scores (X)
7Diagrammes à bâtonnets
Fréquence
8La courbe normale
Distribution normale des scores
50 40 30 20 10
Fréquences
-3 -2 -1 0 1 2 3
Scores (X)
9Description de distributions symétrie (Skewness)
Asymétrie négative
Asymétrie positive
Distribution bimodale
10Description de distributions applatissement ou
voussure (curtosis)
Platycurtique
Leptocurtique
Fréquence
Fréquence
Scores
Scores
11La distribution de fréquences et les probabilités
34.13
13.59
2.28
12Mesures de tendance centrale
- Mode le score le plus courant, cest-Ã -dire le
score obtenu par le plus grand nombre dunité
dobservation
13Mesures de tendance centrale
- Médiane le score qui correspond au point auquel
et sous lequel on retrouve 50 des scores lorsque
les données sont disposées en ordre numérique
14Mesures de tendance centrale
- Moyenne la somme des scores divisée par le
nombre de scores.
15La moyenne
Distribution de fréquence
X 6 1 5 2 4 2 3 4 2 2 1 1
6 10 8 8 4 1
37
12
16Les caractéristiques de la moyenne
- Modifier un score modifie la moyenne
- Ajouter ou enlever une constante à chaque score
modifie la moyenne par laddition (ou la
soustraction) de cette même constante - Multiplier ou diviser chaque score par une
constante modifie la moyenne par la
multiplication (ou la division) de cette constante
17Moyenne versus médiane
- Lapplatissement de la distribution ninfluence
ni la moyenne, ni la médiane - La moyenne est affectée par les scores extrêmes
et lasymétrie alors que la médiane ne lest pas - Donc, lorsque la distribution est symétrique, la
moyenne et la médiane se trouvent principalement
au même endroit
18(No Transcript)
19Les scores extrêmes univariés
8 7 6 5 4 3 2 1
8 7 6 5 4 3 2 1
Fréquences
Fréquences
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Scores
Scores
Moyenne
Moyenne
20Limpact des scores extrêmes sur la corrélation
et la régression
Y
X
21Limpact des scores extrêmes sur la corrélation
et la régression
Y
X
22La moyenne des moyennes nest pas adéquate
lorsque les groupes sont inégaux
Distribution de fréquences
X1 X2 6 18 7 30 4 12 5 2 6
N1 6
N2 3
Problème Les scores du petit groupe ont eu
autant de poids que ceux du grand groupe
23La moyenne pondérée
24Mesures de variabilité
- Buts des mesures de variabilité
- Ces mesures nous informent sur la dispersion des
scores autour de la moyenne - Ces mesures nous permettent de juger jusquà quel
point la moyenne du groupe est représentative
dun score individuel
25Mesures de variabilité
- Létendue Distance entre la limite réelle
inférieure du score le moins élevé et la limite
réelle supérieure du score le plus élevé - Étendue limite supérieure (score .5) limite
inférieure (score - .5) - SPSS fait simplement le score le plus élevé moins
le score le moins élevé
26Si vous comptez les cases, létendue est de
5. Limite inférieure-limite supérieure 7.5
2.5 5. NB SPSS fait maximum-minimum 7 - 3
4.
27Limpact de létendue sur la corrélation et la
régression
Y
X
283.8
10
29Mesures de variabilité
- Écarts à la moyenne (X - X)
- La variance La moyenne des écarts mis au carré
- Écart-type La racine carré de la moyenne des
écarts au carré ou la racine carré de la variance
30La variance et lécart-type
X Âge
-0.9 4.1 -1.9 -1.9 3.1 0.1 -2.9
18 23 17 17 22 19 16
0.81 16.81 3.61 3.61 9.61 0.01 8.41
?
132
environ 0 (0.51)
42.87
31Population
Échantillon
Variance
Écart-type
32Variabilité de la population
33Pourquoi N-1?
- Sil ny avait pas de correction, lécart-type
dun échantillon serait sous-estimé. - En divisant les écarts à la moyenne par un plus
petit nombre (N-1 plutôt que N), on accroît (et
ainsi corrige) lestimé. - Cette correction fonctionne puisque lorsque lon
prend la moyenne des écart-types de tous les
échantillons possibles dune population, celle-ci
est égale à lécart-type de la population. - La moyenne dun échantillon nest pas un estimé
biaisé, on divise donc par Néchantillon. - Pour trouver lécart-type, nous devons estimer la
moyenne de la population, ce qui enlève un degré
de liberté à notre échantillon. Pourquoi?
Posons 2 chiffres 2 9
Trois chiffres 4 6 8. Moyenne de la
population est 6. Combien de chiffres peuvent
varier?
Pour avoir une moyenne de 6, le troisième chiffre
DOIT ÊTRE 7 (pour faire 18).
34Les caractéristiques de lécart-type
- Ajouter une constante à tous les scores ne
changera pas lécart-type - Multiplier ou diviser tous les scores par une
constante modifiera lécart-type par la
multiplication (ou division) de cette même
constante. - Les scores extrêmes augmentent lécart-type
- Il sera alors plus difficile dobtenir un
résultat significatif
35Étude A
8 7 6 5 4 3 2 1
Fréquences
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17
Scores
Étude B
8 7 6 5 4 3 2 1
Fréquences
1 2 3 4 5 6 7 8 9 10
11 12 13 14 15 16 17
Scores
36(No Transcript)