Title: POL1803: Analyse des techniques quantitatives
1POL1803 Analyse destechniques quantitatives
2Lanalyse multivariée
- Les variables dintervalles / ratio
3Vote pour le gouvernement sortant
- Année Satis. Vote Chômage
- () () ()
- 1973 56 55 6,7
- 1976 28 34 9,1
- 1981 60 49 10,3
- 1985 39 39 12,3
- 1989 47 50 9,8
- 1994 40 44 12,2
- 1998 52 43 9,9
- 2003 40 33 8,6
- 2007 39 33 7,8
- 2008 54 42 7,2
- 2012 31 31 7,6
- 2013 35 ? 7,5
4Lanalyse multivariée
- Une première mise en pratique
- lanalyse tabulaire multivariée
5Le modèle causal
- Schéma initial
- X Y
- Schéma causal complet
- Z X
-
- Y
6Lintroduction dunevariable contrôle antécédente
- Schéma initial et schéma complet
- B C
- A B
- ?
- C
- A Variable contrôle antécédente
- B Variable indépendante
- C Variable dépendante
7Une 1ère mise en pratique 5 tableaux, 5 gammas,
5 chi-carrés
- B C
- A B
-
- C
- Relation initiale B-C
- Relations de contrôle A-B, A-C
- Relation initiale contrôlée A- B-C, A B-C
8Résultats possibles5 tableaux, 5 gammas, 5
chi-carrés
- Une rélation fallacieuse
- Relation initiale contrôlée nulle et
non-significative - B 0,6 C
- A 0,8 B
-
- 0,7
- C
9Résultats possibles5 tableaux, 5 gammas, 5
chi-carrés
- Une relation quasi-fallacieuse
- Relation initiale contrôlée non-nulle et
non-signif. - B 0,6 C
- A 0,8 B
- 0,2 0,2
- 0,7
- C
10Résultats possibles5 tableaux, 5 gammas, 5
chi-carrés
- Une relation causale confirmée
- Relation initiale contrôlée non-nulle et
significative - B 0,6 C
- A 0,8 B
- 0,4 0,4
- 0,7
- C
11Résultats possibles5 tableaux, 5 gammas, 5
chi-carrés
- Une relation causale spécifiée
- Variation de la relation initiale contrôlée
(1-2 signif.) - B 0,6 C
- A 0,8 B
- 0,2 0,8
- 0,7
- C
12Résultats possibles5 tableaux, 5 gammas, 5
chi-carrés
- Une relation causale spécifiée
- Variation de la relation initiale contrôlée
(1-2 signif.) - B 0,6 C
- A 0,8 B
- 0,2 0,8
- 0,7
- C
13Une deuxième mise en pratique Lanalyse de
régression multivariée
- La régression simple et
- la régression multiple
14Un rappel léquation de régression simple
- Définition
- Outil pour résumer, avec plus de détails, la
relation entre deux variables dintervalles /
ratio. - Permet de prédire (estimer) des valeurs inconnues
de la variable dépendante.
15Un rappel léquation de régression simple
- Formule
- Y a bX
- où Y Valeur de la variable dépendante
- a Intersection ou constante
- b Pente ou coefficient de régression
- X Valeur de la variable indépendante
16Un rappel léquation de régression simple
- Y a bX
- Constante
- Score de la variable dépendante lorsque la
variable indépendante possède la valeur de 0.
17Un rappel léquation de régression simple
18Un rappel léquation de régression simple
- Y a bX
- Coefficient de régression
- Le signe du coefficient reflète la direction de
la relation. - La valeur du coefficient indique leffet sur la
variable dépendante dun mouvement dune unité
sur la variable indépendante.
19Un rappel léquation de régression simple
20Un rappel la statistique tdu coefficient de
régression
- Définition
- Mesure de la signification statistique dun
coefficient de régression (pente). - Critère
- Pour que le coefficient de régression soit
statistiquement significatif (95), la valeur
absolue du t doit dépasser 1,96.
21Un rappel léquation de régression simple
22Un rappel le coefficient de détermination
- Symbole R2
- Définition
- Mesure de la proportion de variation chez la
variable dépendante qui est expliquée par le
modèle dexplication.
23Un rappel le coefficient de détermination
24Vote pour le gouvernement sortant
- Année Satis. Vote Chômage
- () () ()
- 1973 56 55 6,7
- 1976 28 34 9,1
- 1981 60 49 10,3
- 1985 39 39 12,3
- 1989 47 50 9,8
- 1994 40 44 12,2
- 1998 52 43 9,9
- 2003 40 33 8,6
- 2007 39 33 7,8
- 2008 54 42 7,2
- 2012 31 31 7,6
25Léquation de régression multiple
- Définition
- Outil pour résumer, avec plus de détails, les
relations entre une var. dépendante dintervalles
/ ratio et plusieurs variables indépendantes
dintervalles / ratio . - Permet de prédire (estimer) des valeurs inconnues
de la variable dépendante.
26Léquation de régression multiple
- Formule
- Y a bX1 bX2 ...
- où Y Valeur de la variable dépendante
- a Intersection ou constante
- b Pente ou coefficient de régression
- X1 Valeur de la variable indépendante 1
- X2 Valeur de la variable indépendante 2
27Léquation de régression multiple
- Y a bX1 bX2 ...
- Constante
- Score de la variable dépendante lorsque les
variables indépendantes possèdent la valeur de 0.
28Léquation de régression multiple
29Léquation de régression multiple
- Y a bX1 bX2 ...
- Coefficient de régression
- Le signe dun coefficient reflète la direction de
la relation. - La valeur dun coefficient indique leffet sur la
variable dépendante dun mouvement dune unité
sur la variable indépendante en contrôlant les
effets des autres variables indépendantes.
30Léquation de régression multiple
31La statistique tdu coefficient de régression
- Définition
- Mesure de la signification statistique dun
coefficient de régression (pente). - Critère
- Pour que le coefficient de régression soit
statistiquement significatif (95), la valeur
absolue du t doit dépasser 1,96.
32Léquation de régression multiple
33Le coefficient de détermination
- Symbole R2
- Définition
- Mesure de la proportion de variation chez la
variable dépendante qui est expliquée par le
modèle dexplication.
34Le coefficient de détermination
35Pour comparer les effets
- Coeff. de régression standardisés (bêta)
- Décrivent en unités décart-type leffet de
chaque variable sur la variable dépendante en
contrôlant pour les autres.
36Les autres variables
- Des variables indépendantes nominales et
ordinales peuvent être insérées dans une
régression, mais les nominales doivent être
dichotomiques ou dichotomisées.
37Lanalyse de régression multivariée
- La construction des schémas
38Analyse de régression multivariée
- A B C D E F G
-
- Y
- La régression multiple calcule toujours leffet
spécifique sur une variable dép. attribuable à
une variable indép. en contrôlant pour toutes les
autres. Elle ne tient pas compte de lordre
causal.
39Ajout dune variable contrôle
- A C
- A
- C
- B
- A Variable indépendante
- B Variable contrôle
- C Variable dépendante
401 équation de régression simple1 équation de
régression multiple
- A C
- A
- C
- B
- Relation initiale A-C (1 érs)
- Relations contrôlées A-C, B-C (1 érm)
411 équation de régression simple 1 équation de
régression multiple
- Il faut obtenir les 2 équations qui vont produire
3 coefficients de régression, 3 statistiques t et
2 coeff. de détermination. - Lorsquune association est nulle, on ne place pas
de flèche. - Il faut placer les coefficients de régression sur
les flèches des schémas. - Il faut mettre une étoile à côté des coefficients
de régression significatifs (t). - Il faut placer le coefficient de détermination
sous la variable dép. (entre parenthèses).
42Vote pour le gouvernement sortant
- Année Satis. Vote Chômage
- () () ()
- 1973 56 55 6,7
- 1976 28 34 9,1
- 1981 60 49 10,3
- 1985 39 39 12,3
- 1989 47 50 9,8
- 1994 40 44 12,2
- 1998 52 43 9,9
- 2003 40 33 8,6
- 2007 39 33 7,8
- 2008 54 42 7,2
- 2012 31 31 7,6
43Un exemple
- Schéma initial
- Satisfaction (A) Vote (C)
- Schéma causal complet
- Satisfaction (A)
- Vote (C)
-
- Chômage (B)
44Un exemple
45Un exemple
- Schéma initial
- Satisfaction (A) 0,61 Vote (C)
- (0,64)
- Schéma causal complet
- Satisfaction (A)
- Vote (C)
-
- Chômage (B)
46Un exemple
47Un exemple
- Schéma initial
- Satisfaction (A) 0,61 Vote (C)
- (0,64)
- Schéma causal complet
- Satisfaction (A) 0,63
- Vote (C)
- (0,67)
- Chômage (B) 0,76
48Scénarios possibles
- A C
- A
- C
- B
- Scénario relation fallacieuse
- (Le 2è lien A-C est nul et non-significatif)
49Scénarios possibles
- A C
- A 0,25
- C
- B
- Scénario relation quasi-fallacieuse
- (Le 2è lien A-C est non-nul et non-signif.)
50Scénarios possibles
- A C
- A 0,45
- C
- B
- Scénario relation causale directe
- (Le 2è lien A-C est non-nul et significatif)
51Scénarios possibles
- Le scénario de la relation spécifiée (effet
dinteraction) est possible, mais il ne sera pas
rencontré dans lanalyse de régression
multivariée dans ce cours. Seulement la relation
fallacieuse, la relation quasi-fallacieuse et la
relation causale directe seront possibles.
52Lanalyse de régression multivariée
- Linterprétation des schémas
53Interprétation étape par étape
- Satisfaction (A) 0,61 Vote (C)
- (0,64)
- Satisfaction (A)
- Vote (C)
-
- Chômage (B)
- 1) Dabord, la relation initiale (A-C) Discutez
de lasso. stat. qui existe entre les variables
indépendante et dépendante? Est-elle
significative? Quelle proportion de la variable
dépendante est expliquée?
54Interprétation étape par étape
- Satisfaction (A) Vote (C)
- Satisfaction (A) 0,63
- Vote (C)
- (0,67)
- Chômage (B) 0,76
- 2) Ensuite, les relations contrôlées (A-C, B-C)
Discutez de lasso. stat. qui existe entre la
variable contrôle et la variable dépendante en
contrôlant pour leffet de la var. indépendante?
Est-elle significative?
55Interprétation étape par étape
- Satisfaction (A) Vote (C)
- Satisfaction (A) 0,63
- Vote (C)
- (0,67)
- Chômage (B) 0,76
- Discutez de lasso. stat. qui existe entre la
variable indépendante et la variable dépendante
en contrôlant pour leffet de la var. contrôle?
Est-elle significative? Quelle proportion de la
var. dép. est expliquée?
56Interprétation étape par étape
- Satisfaction (A) 0,61 Vote (C)
- (0,64)
- Satisfaction (A) 0,63
- Vote (C)
- (0,67)
- Chômage (B) 0,76
- 3) Finalement, le modèle causal complet Quel
type de scénario est révélé? Relation
fallacieuse? Relation quasi-fallacieuse? Relation
causale directe? Que peut-on conclure au sujet de
la causalité?
57Un exemple conclusions(version succincte)
- Dans le schéma initial, il y a une association
positive et significative entre la satisfaction
et le vote pour le gouvernement sortant. La
satisfaction permet dexpliquer une forte
proportion du vote. - La variable contrôle, le taux de chômage, est
reliée de façon positive mais non-significative
au vote.
58Un exemple conclusions(version succincte)
- Le lien entre les variables indépendante et
dépendante est très peu affecté par lajout de la
variable contrôle. Lorsque que lon tient compte
du taux de chômage, lassociation entre la
satisfaction et le vote demeure presque intacte
et significative.
59Un exemple conclusions(version succincte)
- Lajout dune deuxième variable améliore un petit
peu la proportion de la variation dépendante vote
qui est expliquée par le modèle. La proportion
expliquée est forte dans le schéma complet, comme
cétait le cas dans le modèle initial.
60Un exemple conclusions(version succincte)
- Le profil du modèle causal final correspond au
scénario de la relation causale directe. - On peut donc conclure quil y a vraiment une
relation causale directe entre la satisfaction et
le vote. Parce quun individu est satisfait de
la performance du gouvernement, il risque de
voter pour la réélection de celui-ci.
61Lanalyse de régression multivariée
- Lestimation par intervalle
- à partir de léquation de régression
62Vote pour le gouvernement sortant
- Année Satis. Vote Chômage
- () () ()
- 1973 56 55 6,7
- 1976 28 34 9,1
- 1981 60 49 10,3
- 1985 39 39 12,3
- 1989 47 50 9,8
- 1994 40 44 12,2
- 1998 52 43 9,9
- 2003 40 33 8,6
- 2007 39 33 7,8
- 2008 54 42 7,2
- 2012 31 31 7,6
- 2013 35 ? 7,5
63Estimation à partir deléquation de régression
- Y a bX1 bX2 ...
- Y 6,53 0,63X1 0,76X2
64Estimation à partir deléquation de régression
- Y 6,53 0,63X1 0,76X2
- Y 6,53 (0,6335) (0,767,5)
- Y 6,53 22,05 5,7
- Y 34,28
65Intervalle de confiancedune estimation
- (À 95)
- Estimation ? 1,96 Erreur standard de
lestimation
66Intervalle de confiancedune estimation
- Estimation ? 1,96 Erreur standard de
lestimation - 34,3 ? 1,96 5,14 34,3 ? 10,1
- 24,2 44,4 24,2 lt Y lt 44,4
67Lanalyse de régression multivariée
- Deux exemples de la littérature
68(No Transcript)
69(No Transcript)