Title: Exprimentation
1Expérimentation
Analyse des donnéesappliquée au marketing
2Panorama
- ANOVA
- ANCOVA
- MANOVA, MANCOVA
- MONANOVA
- ANOVA ordinale
3CADRE
- Mesurer dans un cadre scientifique
- Contrôle des manipulations
- Contrôle des effets externes
- Affectation aléatoire des groupes aux
manipulations - (environnement laboratoire non  naturel )
- Sur une (ou plusieurs) variable dépendante
- Intervalle
- Ordinale
- Les effets linéaires
- De variables indépendantes
- Manipulées Effet dune communication
- Mesurées
- influence de la relation individuelle dune
répondant à la marque - Conditions
- Indépendance des erreurs (entre elles et avec les
facteurs) - Normalité
- Homoscédasticité (égalité des variances)
- On parlera de
-  quasi-expérimental si laffectation nest pas
aléatoire
4Formalisation
Différence entre des groupes
Effet dun facteur latent
Description
I
F
X
Relation de causalité
X
X
X
Y
Relation dassociation
Relation avec modératrice
X
Y
Z
Relation avec médiatrice
Y
Z
X
Y
X
5Plans expérimentaux
- Grandes classes
- Quasi-expérimental Avant-Après
- Expérimental
- Double affectation aléatoire des individus aux
cellules des traitements aux cellules - Observation Mesure
- Traitement
- Quelles comparaisons
- Entre les groupes dindividus
- Entre les réponses dun même groupe
A
O
X
6EXPERIMENTATION
- On cherche à mettre en évidence une relation de
cause à effet - entre X et Y
- Conditions à respecter pour établir la relation
- Variation concomitante (dx, dy)
- Séquence temporelle / Présence manipulée
- Élimination des autres causes possibles
- Les sources des effets indésirables
7Mesure spécifique des effets par soustraction
- Source Lambin JJ La recherce Marketing, McGraw
Hill
8Plans statistiques (plusieurs facteurs)
- Mise en évidence de leffet de plusieurs facteurs
- Effet du prix sur
- Des magasins de tailles différentes
- Situés dans des régions différentes
- Plans
- Complet toutes les possibilités
- Permet de tester les effets dinteraction
- Fractionné combinaisons choisies des modalités
- Moins de cellules donc moins gourmand en effectifs
9Plans statistiques
- Combinaison des modalités de plusieurs variables
sur différents groupes - Plan factoriel complet
- 2 variables (X, Y), même nombre de modalités (2)
- 3 modalités -gt 3² groupes 9 groupes
- 3 var, 3 modalités -gt27 groupes
- Plan factoriel complet en blocs aléatoires
- Groupage des individus selon une variable Ã
contrôler - Plan fractionné Carré latin
- 3 variables (X, Y, Z), même nombre de modalités
(3) - le groupe 3 reçoit 3, 1, 2
- Autres tailles
- Gréco-latin 4 variables
- Hyper-gréco-latin 5 variables
3
10ANALYSE DE VARIANCE
- Une variable à expliquer (métrique)
- 1 facteur à 2 modalités test en t
- 1 facteur contrôlé nominal à plusieurs modalités
ANOVA - Plusieurs facteurs ANOVA
- 1 facteur covariable ANCOVA
- Plusieurs variables à expliquer (métriques)
- MANOVA
- MANCOVA
- Modèle linéaire (voir régression linéaire)
11Analyse de variance Postulats
- Expliquer la Variance dune variable quantitative
par une variable nominale - Ex pouvoir explicatif du genre sur le montant
des dépenses - Mesures dans les cellules (combinaison de
traitements) - Normalité
- Égalité des variances, surtout si les effectifs
sont différents - Homogénéité des covariances (échantillons
appariés) - Terminologie
- Variations ou Somme de carrés S ni (mx1 mx.)2
- Hypothèse
- Les effets sont linéaires X Moyenne effet
du facteur erreur - H0 les moyennes des groupes sont identiques
(m1m2m3) - H1 au moins une moyenne est différente des
autres - les facteurs contrôlés sont différents ENTRE les
groupes mais identiques à l'intérieur de chaque
groupe (VF variations factorielles) - les facteurs incontrôlés ont la même influence
quel que soit le groupe (VR variations
résiduelles) - théorème de la décomposition de la
variance (intra et inter) VTVFVR
12Analyse de la qualité F de Fisher et Eta2
- Qualité globale du modèle Test F de Fisher
- I nombre de niveaux du facteur, N nombre
dobservations - (I-1 N-1) degrés de liberté
-
- Interprétation
- H0 aucune relation entre X et Y
- Si F calc gt F critique rejet de H0
- Rapport de corrélation R² ou êta carré (h2) e
0, 1 - Si le F diagnostique lexistence dune relation,
eta carré détermine la force de cette relation - Eta2 Variations expliquées / Variations totales
(R² en régression linéaire) - Sinterprète comme
- le des variations de la variable quantitative
expliquée par la variable indépendante (nominale
ou ordinale) - Interprétation
- .01 petit 0.05 moyen 0.15 grand
13Exemple de lecture
- Effet du prix sur les ventes des magasins (q)
- 3 niveaux de prix
- 4 types de magasin, 30 observations par magasin
- Relation globalement
- significative (F)
- Mais Faible (R2)
- Effet du prix
- Significatif (t)
- Dans quel sens ?
- (demander solution)
14Analyse de variance multivariée Les interactions
- Les effets de variables peuvent se combiner pour
- Samplifier ou Se neutraliser
Sans interactinn
Interactinn non ordinale
Variable dépendante
Interactinn ordinale
Interactinn ordinale
Variable indépendante
152 facteurs avec interaction
- Effet du magasin
- Significatif
- Effet de linteraction
- Significative
- Amélioration de la qualité globale
- Attention !
- Les effets dinteraction sont toujours à analyser
dabord - Car ils changent linterprétation des effets
directs
16Calcul Eta2, Eta2 partiel, Omega2
- proc glm datatest
- class a b
- model ya b ab x1 x2 / solution ss3
- ods output overallanovaanova1
modelanovaanova2 run - data ss
- set anova1 endeof
- retain sse sstotal mse dfe dftotal
- keep sse sstotal mse dfe dftotal
- if source'Error' then do ssess msems
dfedf end - if source'Corrected Total' then do sstotalss
dftotaldf end - if eof then output run
- data eta2
- set anova2
- if _n_1 then set ss
- eta2ss/sstotal
- partial_eta2ss/(sssse)
- omega2(ss-dfmse)/(mse sstotal) run
17Choix des sommes des carrés de Type I à III
- Type
- SS1 I Hiérarchique
- lordre détermine la prise en compte des
variables. - F de leffet SC de leffet / SC des effets
précédents - SS2 II Non expérimental
- F de leffet SC de leffet / SC des effets de
son niveau et des niveaux inférieurs - SS3 III Régression
- F de leffet SC de leffet / SC de tous les
autres effets - Préconisations du choix des type de somme
- Type I si les variables ont un ordre dimportance
ET les groupes de taille identique - Type II déconseillé
- Type III à privilégier (même si effectifs
inégaux) option par défaut - Approfondir http//www.lsp.ups-tlse.fr/Doc_pedag
ogique/PDF/ab-deseq.pdf
18Problème des comparaisons multiples
- Quand il y a plusieurs groupes, les tests en t (2
groupes) ne sont pas adaptés - Car pour chaque test dhypothèse, on additionne
les risques derreur alpha - pour k groupes k.(k-1)/2 comparaisons
- Pour 3 groupes avec un risque alpha5, la
probabilité quaucune comparaison ne soit
significative est (0.950.950.95)0.857 soit un
risque alpha réel de 14.3 - Objectif des corrections
- Comparer les moyennes des groupes en contrôlant
pour linflation des risques a (type I) pour
toutes les comparaisons - Garder un risque a de 5 pour toutes les
comparaisons gt le risque a pour chaque
comparaison sera dautant plus petit que le
nombre de comparaisons est important
19Bonferroni, Scheffé, Dunnett
- Comparaison a priori ou a posteriori des groupes
- Corrections pour des comparaisons multiples
- Dunn-Bonferroni (la correction plus simple a
priori) - a corrigé ? / nombre de tests. 5-gt 1 si 5
comparaisons - Autres tests ( a posteriori)
- Dunnett les groupes sont comparés à un groupe
de contrôle - Contrastes non orthogonaux - Usage fréquent
- Tukey HSD
- Compare toutes les paires possibles
- adapté sil y a de nombreux groupes à comparer
- Scheffé très conservateur mais accepte des
groupes inégaux. - Correction pour toutes les comparaisons possibles
(paires ou composées) en augmentant la différence
critique. - Une différence à elle seule doit être assez
grande pour rendre le F global significatif.
20Test des différences
- Bonferroni (test en t) Scheffé (test en F)
21CONTRASTES
- un test a priori de différences de moyennes
(hypothèse préalable) - Un Contraste est une somme pondérée des moyennes
dont la valeur attendue sous H0 est nulle - C a1.m1 a2.m2 a3.m3
- Comparaison sur une combinaison linéaire de
plusieurs groupes - Test dune combinaison linéaire des (nb
groupes-1) contrastes - Si a 1 0 1 alors on a C m1 - m3
- Si a 1 1/2 1/2 alors on a C m1 - 0.5 m2
-0.5 m3 - Contrastes particuliers
- Helmert (groupes ordonné)
- -1 1 0 0 -1 -1 2 0 -1 -1 -1 3
- Contraste polynomial
- Prise en compte successive dun trend linéaire,
quadratique, cubique
22Contrastes orthogonaux
- Des Contrastes orthogonaux sont indépendants les
uns des autres - Pour que 2 contrastes soient orthogonaux, il faut
que la - Somme des produits des coefficients de chaque
variable soit NULLE - Somme des coefficients dun contraste soit NULLE
- Exemple
- C1 -1 0 1 et C2 -1 2 -1
- C1 1 -1 0 0 et C2 0 0 1 -1
- Générer des contraste orthogonaux
- http//www.bolderstats.com/orthogCodes/
- Tous les contrastes doivent être orthogonaux 2 Ã
2 - Chaque contraste
- a sa somme des carrés
- a 1 degré de liberté au numérateur et ddl erreur
au dénominateur.
23Moyennes et Moyennes estimées
- Moyenne (MEAN) correspond à la moyenne
arithmétique - Cest la moyenne générale
- Moyenne estimée (LSMEANS) correspond à la moyenne
estimée par le modèle utilisé - Cest la moyenne des moyennes des niveaux dun
facteur - Elle est ajustée en fonction de la moyenne des
variables indépendantes - Elles sont différentes
- Sil y a des valeurs manquantes ou des effectifs
différents - Sil y a des variables explicatives (covariates)
24ANCOVA
- ANCOVA
- Permet de tenir compte dun facteur/variable que
l on peut mesurer mais non contrôler - Leffet de la variable non contrôlé est éliminé
dabord avant de prendre en compte les facteurs
25MANOVA
- MANOVA
- Prendre en compte plusieurs variables à expliquer
(Y1, Y2, Y3) - Voir sil y a un effet global de la variable
explicative - Puis chercher sur quelle variable plus
particulièrement il y a un effet par des ANOVA
26SAS ANOVA monotone (Proc Transreg)
- La variable dépendante nest plus métrique
(intervalle) - Fonction de création dun score
- Celui-ci peut être utilisé dans dautres Proc
- MAIS les tests statistiques ne peuvent plus être
utilisés (car les données ont été transformées) - Variantes
- ordinary multivariate multiple regression
- model linear(y1-y3) linear(x1-x4)
- monotone multiple regression model
- model monotone(y) linear(x1-x4)
- smooth monotone (quadratic spline) multiple
regression model - mspline(y) linear(x1-x4)
- parallel monotone curves, separate intercepts
model - linear(y) class(gp) spline(x/degree1)
- MONANOVA monotone ANOVA (conjoint analysis), main
effects model - monotone(y1) class(x1-x3)
- PREFMAP or ideal point regression
- model monotone(y1) point(x1-x3)
- En savoir plus
- Graphical methods for marketing research, Warren
Kuhfeld
27Analyse de variance de Friedman (rangs,
plusieurs variables within)
- Encore appelée CMH (Cochran-Mantel-Haenszel)
- Non paramétrique
- échantillons appariés
- variable dépendante ordinale
- H0 la distribution des rangs des colonnes est
la même selon les lignes - Lien entre
- une variable Ordinale et
- une variable Nominale à plusieurs modalités. ( k
échantillons appariés) - Exemple des juges (ligne) évaluant des vins
(colonnes) - Généralisation de
- Test du signe à plus de 2 colonnes
- Test de corrélation des rangs de Spearman à plus
de 2 lignes - Le rang est calculé pour chaque ligne
indépendamment, puis les rangs de deux lignes
sont comparés - Si H0 est rejetée on peut ensuite comparer les
conditions 2 à 2 pour déterminer celles qui sont
significativement différentes () - En savoir plus http//www.ats.ucla.edu/stat/sas/
whatstat/whatstat.htm
28SAS AV de Friedman (Cochran-Mantel-Haenszel)
- H0 la distribution des scores sur les réponses
à plusieurs tests nest pas différente
data in input id r1 r2 r3 r4 cards A 4 2
1 3 B 3 2 1 4 C 4 1 2 3 proc
print datain run proc sort data in by
id run proc transpose datain
outTransp_in nameR by id var r1 r2 r3
r4 run proc print dataTransp_in run proc
freq dataTransp_in tables idRcol1 /
cmh2 scoresrank noprint run
Acceptation de H0 (?)