Title: ANOVA et ses postulats
1ANOVA et ses postulats
2Type De question
Type De mesure des Variables Dépendantes
Nombre De Variables Dépendantes
Nombre De Niveaux ou de VI
Échantillons Dépendants ou indépendants
Satistiques
indépendants
?2
-
Une
dépendants
McNemar
Qualitatives
Analyse discriminante
Multiples
Multiples
indépendants
Test t (ind)
Deux
Différences
dépendants
Test t (dép)
Une
indépendants
ANOVA/ANCOVA
ANOVA/ANCOVA mesures répétées
Multiples
dépendants
Quantitatives
Ind dép
ANOVA/ ANCOVA (mixte)
MANOVA/ MANCOVA
Multiples
Multiples
Ind dép
Qualitatives
Deux
Une
?2 Phi
Relations
Aucune
Analyse Factorielle
Multiples
Corrélation / Régression Simple
Une
Quantitatives
Une
Régression Multiple
Multiples
Corrélation Canonique
Multiples
Multiples
3Lanalyse de la variance (ANOVA)
- Logique de lanalyse
- Les postulats de base
- Les facteurs qui influencent les résultats
- La taille de leffet
- Les commandes de SPSS
4Lanalyse de la variance (ANOVA)
- Lanalyse de variance permet de tester les
différences de moyennes de plusieurs groupes
simultanément - Variable dépendante une seule à la fois et elle
est continue - Variable(s) indépendante(e)s une ou plusieurs
et elles sont catégorielles - (dans SPSS, les catégories sont codées avec un
chiffre et la variable est spécifiée comme étant
continue) - Lanalyse de variance permet dexaminer limpact
de plusieurs variables indépendantes sur la
variable dépendante - Une à la fois et en interaction
5Devis 2x4 Combien de facteurs à combien de
niveaux?
6Les facteurs et leurs niveaux
7Fréquence
Grandeur
8Grandeur
9Les sources de variation
Xij ? (?j - ?)
(Xij - ?j)
10Grande moyenne générale 1m45
Fréquence
Grandeur
1m00
1m60
1m75
Fréquence
1m00
1m60
1m75
11Les sources de variation
12Les hypothèses
- Lhypothèse nulle Ho
- ?1 ?2 ?3
- Lhypothèse alternative Ha
- Au moins une des populations est différentes
dune ou des autres - Spécifiez lalpha (?)
- Par exemple, ? .05
13Fréquence
Grandeur
14Fréquence
VARIANCE
Grandeur
Grande moyenne générale 1m45
Variance Intergroupe
15Deux façons destimer lerreur déchantillonnage
- Si lhypothèse nulle est vraie, les différences
entre les groupes représentent de lerreur
déchantillonnage due aux différences
individuelles - La variance de la distribution déchantillonnage
(lerreur-type) peut être estimée par la variance
dun échantillon selon la formule suivante
écart-type/ ?n. - Donc, la variance intra-groupe peut aussi
représenter lerreur déchantillonnage due aux
différences individuelles
16Grandeur
17Comparons la variabilité intergroupe et
intra-groupe
Variabilité intra-groupe
Variabilité due aux différences individuelles
dun échantillon (Erreur)
18(No Transcript)
19Le test F
VARIANCE INTERGROUPE (Effet) Vraies différences
erreur
F
VARIANCE INTRA-GROUPE(Erreur) erreur
20La distribution F
Fcritique
Zone de rejet de lhypothèse nulle 5 (a .05)
F
0 1 2 3
4 5
Fobtenu ?
21Calculer le Fobtenu
VARIANCE INTERGROUPE (Traitement) Vraies
différences erreur
F
VARIANCE INTRA-GROUPE(Erreur) erreur
22Calculer le Fobtenu
F
23Les degrés de liberté
24Résumé de lANOVA lorsque les groupes sont égaux
Source de variation
Somme des carrés (SC)
Degrés de liberté (dl)
Carrés moyens (CM)
Fobtenu
INTER (traitement)
?n(?j - ?)2 Pour chaque personne, la déviation
de son groupe à la grande moyenne
k - 1 où k est le nombre de niveaux
INTRA (erreur)
?(Xij - ?j)2 Somme des déviations à la moyenne
dans chaque groupe
?(n-1) Somme des degrés de liberté de chaque
groupe
TOTAL
?(Xij - ?)2
Ntotal - 1
25Données (en cm)
Enfants Adolescents Adultes Total 100 160 175
90 150 170 110 170 180 80 140
155 120 180 195 95 155 170 105 165 180 100
160 175 145
Moyenne
26Résumé de lANOVA lorsque les groupes sont égaux
Source de variation
Somme des carrés (SC)
Degrés de liberté (dl)
Carrés moyens (CM)
Fobtenu
INTER (traitement)
22050
3 - 1 2
11025
66.14
INTRA (erreur)
3000
(7-1)(7-1) (7-1) 18
166.7
TOTAL
25050
21 - 1 20
27Calculer le Fcritique
- Pour un alpha prédéterminé, F(dlnumérateur,dldénom
inateur) - Table de F disponible sur le site du cours (voir
aussi Kennedy Bush (1985) du recueil) - avec un alpha de .05, F(df1,df2),
- F(2,18)critique 3.55
28La distribution F
F(2,18)critique 3.55
Zone de rejet de lhypothèse nulle 5 (a .05)
F
0 1 2 3
4 5
F(2,18)obtenu 66.14
29Interprétez les résultats obtenus avec
lordinateur
- Pour les tests dhypothèse, lordinateur présente
le Fobtenu, ainsi que la probabilité de commettre
une erreur de type I (p ??). - Si la probabilité dobtenir un Fobtenu par hasard
est plus petite que la probabilité jugée
acceptable (p.ex., ? .05), alors on rejette
lhypothèse nulle (p.ex., p .03). - Sinon, on accepte lhypothèse nulle (p.ex., p
.34). Il ny a pas de différence. - Il ny a pas de test unilatéral avec lANOVA
30Postulats de base pour lANOVA
- Normalité
- Relativement robuste
- Indépendance des scores
- Si les scores dun même groupe sont corrélés,
lerreur sera sous-estimée. Donc, il y aura
inflation de la probabilité de commettre une
erreur de type I. - Cas fréquent la manipulation expérimentale se
fait en petit groupe
31Postulats de base pour lANOVA
- Homogénéité de la variance
- Les participants devraient provenir dune même
population au niveau de la variable dépendante. - La manipulation expérimentale devrait avoir le
même effet chez tous les membres dun même groupe
- Les tests dhomogénéité de la variance sont
influencés par la normalité des distributions,
ils ne devraient donc pas être utilisés. - Test de Hartley nest pas utilisé, mais le Fmax
qui laccompagne est utile. - Le Fmax la plus grande variance divisée par la
plus petite - Par exemple, 1.34/.94 alors le Fmax sera de 1.43
- Fmax 1.431
32Recommandations
- Homogénéité de la variance
- Si la taille des groupes est égale, le test est
relativement robuste - Si la taille des groupes est inégale
- Grosse différence de N (plus de 41)
- Lorsque le ratio de la plus grande variance sur
la plus petite variance (Fmax) est de 31 ou
plus, il y a hétérogénéité de la variance
(Keppel, 1991) - Alors, si la plus grande variabilité est dans le
plus grand groupe, le test est conservateur
(Tabachnick Fidell, 1996). - Mais si, par contre, la plus grande variabilité
est dans le plus petit groupe, le test est trop
libéral. Donc, utiliser un alpha de .01 (Keppel,
1991 Tabachnick Fidell, 1996) . - Petite différence de N (41 ou moins)
- Le ratio de la plus grande variance sur la plus
petite variance (Fmax) peut aller jusquà 101
(Tabachnick Fidell, 1996).
33Effets de lerreur et de la taille de
léchantillon sur le F
- Plus la variabilité intra-groupe ou lerreur est
petite et plus il sera facile dobtenir une
différence significative. - Le Fobtenu sera plus grand.
- Plus la taille des groupes est grande et plus il
sera facile dobtenir une différence
significative. - Lerreur sera plus petite, donc le Fobtenu sera
plus grand - Le Fcritique sera plus petit.
34La taille de leffet La corrélation (r) et le
pourcentage de variance expliquée (r2, le
coefficient de détermination ou leta-carré (est.
?2))
- Le R2 nous permet dexaminer quelle est la
proportion de la variance qui est due au
traitement par rapport à la variance totale.
35Taille de leffet R2 (aussi appelé coefficient
de détermination ou eta-carré (est. ?2))
Recommandations R2 ? .01 Petit effet R2
? .06 Moyen effet R2 ? .14 Grand effet
Où, SC Somme des carrés F Fobtenu dl
degré de liberté
36La puissance (Cohen, 1992)
- Pour avoir 80 de chance de détecter un effet dit
moyen lorsquil y en a effectivement un, tout
en conservant un alpha de .05. - 2 groupes, n 64 dans chaque groupe
- 3 groupes, n 52 dans chaque groupe
- 4 groupes, n 45 dans chaque groupe
- 5 groupes, n 39 dans chaque groupe
- 6 groupes, n 35 dans chaque groupe
- 7 groupes, n 32 dans chaque groupe
- NB Un effet dit moyen représente ici un
de .25, où seffet/serreur)
Pour plus de détails sur le calcul de la
puissance, voir Cohen, J. (1988). Statisticial
power analysis for the behavioral sciences.
Hillsdale, NJ Lawrence Erlbaum.
37(No Transcript)