Exprimentation - PowerPoint PPT Presentation

1 / 28
About This Presentation
Title:

Exprimentation

Description:

Affectation al atoire des groupes aux manipulations (environnement laboratoire non ' ... Double affectation al atoire des individus aux cellules ; des traitements aux cellules ... – PowerPoint PPT presentation

Number of Views:224
Avg rating:3.0/5.0
Slides: 29
Provided by: POSTA7
Category:

less

Transcript and Presenter's Notes

Title: Exprimentation


1
Expérimentation
Analyse des donnéesappliquée au marketing
  • Pierre DESMET

2
Panorama
  • ANOVA
  • ANCOVA
  • MANOVA, MANCOVA
  • MONANOVA
  • ANOVA ordinale

3
CADRE
  • Mesurer dans un cadre scientifique
  • Contrôle des manipulations
  • Contrôle des effets externes
  • Affectation aléatoire des groupes aux
    manipulations
  • (environnement laboratoire non  naturel )
  • Sur une (ou plusieurs) variable dépendante
  • Intervalle
  • Ordinale
  • Les effets linéaires
  • De variables indépendantes
  • Manipulées Effet dune communication
  • Mesurées
  • influence de la relation individuelle dune
    répondant à la marque
  • Conditions
  • Indépendance des erreurs (entre elles et avec les
    facteurs)
  • Normalité
  • Homoscédasticité (égalité des variances)
  • On parlera de
  •  quasi-expérimental  si laffectation nest pas
    aléatoire

4
Formalisation
Différence entre des groupes
Effet dun facteur latent
Description
I
F
X
Relation de causalité
X
X
X
Y
Relation dassociation
Relation avec modératrice
X
Y
Z
Relation avec médiatrice
Y
Z
X
Y
X
5
Plans expérimentaux
  • Grandes classes
  • Quasi-expérimental Avant-Après
  • Expérimental
  • Double affectation aléatoire des individus aux
    cellules des traitements aux cellules
  • Observation Mesure
  • Traitement
  • Quelles comparaisons
  • Entre les groupes dindividus
  • Entre les réponses dun même groupe

A
O
X
6
EXPERIMENTATION
  • On cherche à mettre en évidence une relation de
    cause à effet
  • entre X et Y
  • Conditions à respecter pour établir la relation
  • Variation concomitante (dx, dy)
  • Séquence temporelle / Présence manipulée
  • Élimination des autres causes possibles
  • Les sources des effets indésirables

7
Mesure spécifique des effets par soustraction
  • Source Lambin JJ La recherce Marketing, McGraw
    Hill

8
Plans statistiques (plusieurs facteurs)
  • Mise en évidence de leffet de plusieurs facteurs
  • Effet du prix sur
  • Des magasins de tailles différentes
  • Situés dans des régions différentes
  • Plans
  • Complet toutes les possibilités
  • Permet de tester les effets dinteraction
  • Fractionné combinaisons choisies des modalités
  • Moins de cellules donc moins gourmand en effectifs

9
Plans statistiques
  • Combinaison des modalités de plusieurs variables
    sur différents groupes
  • Plan factoriel complet
  • 2 variables (X, Y), même nombre de modalités (2)
  • 3 modalités -gt 3² groupes 9 groupes
  • 3 var, 3 modalités -gt27 groupes
  • Plan factoriel complet en blocs aléatoires
  • Groupage des individus selon une variable à
    contrôler
  • Plan fractionné Carré latin
  • 3 variables (X, Y, Z), même nombre de modalités
    (3)
  • le groupe 3 reçoit 3, 1, 2
  • Autres tailles
  • Gréco-latin 4 variables
  • Hyper-gréco-latin 5 variables

3
10
ANALYSE DE VARIANCE
  • Une variable à expliquer (métrique)
  • 1 facteur à 2 modalités test en t
  • 1 facteur contrôlé nominal à plusieurs modalités
    ANOVA
  • Plusieurs facteurs ANOVA
  • 1 facteur covariable ANCOVA
  • Plusieurs variables à expliquer (métriques)
  • MANOVA
  • MANCOVA
  • Modèle linéaire (voir régression linéaire)

11
Analyse de variance Postulats
  • Expliquer la Variance dune variable quantitative
    par une variable nominale
  • Ex pouvoir explicatif du genre sur le montant
    des dépenses
  • Mesures dans les cellules (combinaison de
    traitements)
  • Normalité
  • Égalité des variances, surtout si les effectifs
    sont différents
  • Homogénéité des covariances (échantillons
    appariés)
  • Terminologie
  • Variations ou Somme de carrés S ni (mx1 mx.)2
  • Hypothèse
  • Les effets sont linéaires X Moyenne effet
    du facteur erreur
  • H0 les moyennes des groupes sont identiques
    (m1m2m3)
  • H1 au moins une moyenne est différente des
    autres
  • les facteurs contrôlés sont différents ENTRE les
    groupes mais identiques à l'intérieur de chaque
    groupe (VF variations factorielles)
  • les facteurs incontrôlés ont la même influence
    quel que soit le groupe (VR variations
    résiduelles)
  • théorème de la décomposition de la
    variance (intra et inter) VTVFVR

12
Analyse de la qualité F de Fisher et Eta2
  • Qualité globale du modèle Test F de Fisher
  • I nombre de niveaux du facteur, N nombre
    dobservations
  • (I-1 N-1) degrés de liberté
  • Interprétation
  • H0 aucune relation entre X et Y
  • Si F calc gt F critique rejet de H0
  • Rapport de corrélation R² ou êta carré (h2) e
    0, 1
  • Si le F diagnostique lexistence dune relation,
    eta carré détermine la force de cette relation
  • Eta2 Variations expliquées / Variations totales
    (R² en régression linéaire)
  • Sinterprète comme
  • le des variations de la variable quantitative
    expliquée par la variable indépendante (nominale
    ou ordinale)
  • Interprétation
  • .01 petit 0.05 moyen 0.15 grand

13
Exemple de lecture
  • Effet du prix sur les ventes des magasins (q)
  • 3 niveaux de prix
  • 4 types de magasin, 30 observations par magasin
  • Relation globalement
  • significative (F)
  • Mais Faible (R2)
  • Effet du prix
  • Significatif (t)
  • Dans quel sens ?
  • (demander solution)

14
Analyse de variance multivariée Les interactions
  • Les effets de variables peuvent se combiner pour
  • Samplifier ou Se neutraliser

Sans interactinn
Interactinn non ordinale
Variable dépendante
Interactinn ordinale
Interactinn ordinale
Variable indépendante
15
2 facteurs avec interaction
  • Effet du magasin
  • Significatif
  • Effet de linteraction
  • Significative
  • Amélioration de la qualité globale
  • Attention !
  • Les effets dinteraction sont toujours à analyser
    dabord
  • Car ils changent linterprétation des effets
    directs

16
Calcul Eta2, Eta2 partiel, Omega2
  • proc glm datatest
  • class a b
  • model ya b ab x1 x2 / solution ss3
  • ods output overallanovaanova1
    modelanovaanova2 run
  • data ss
  • set anova1 endeof
  • retain sse sstotal mse dfe dftotal
  • keep sse sstotal mse dfe dftotal
  • if source'Error' then do ssess msems
    dfedf end
  • if source'Corrected Total' then do sstotalss
    dftotaldf end
  • if eof then output run
  • data eta2
  • set anova2
  • if _n_1 then set ss
  • eta2ss/sstotal
  • partial_eta2ss/(sssse)
  • omega2(ss-dfmse)/(mse sstotal) run

17
Choix des sommes des carrés de Type I à III
  • Type
  • SS1 I Hiérarchique
  • lordre détermine la prise en compte des
    variables.
  • F de leffet SC de leffet / SC des effets
    précédents
  • SS2 II Non expérimental
  • F de leffet SC de leffet / SC des effets de
    son niveau et des niveaux inférieurs
  • SS3 III Régression
  • F de leffet SC de leffet / SC de tous les
    autres effets
  • Préconisations du choix des type de somme
  • Type I si les variables ont un ordre dimportance
    ET les groupes de taille identique
  • Type II déconseillé
  • Type III à privilégier (même si effectifs
    inégaux) option par défaut
  • Approfondir http//www.lsp.ups-tlse.fr/Doc_pedag
    ogique/PDF/ab-deseq.pdf

18
Problème des comparaisons multiples
  • Quand il y a plusieurs groupes, les tests en t (2
    groupes) ne sont pas adaptés
  • Car pour chaque test dhypothèse, on additionne
    les risques derreur alpha
  • pour k groupes k.(k-1)/2 comparaisons
  • Pour 3 groupes avec un risque alpha5, la
    probabilité quaucune comparaison ne soit
    significative est (0.950.950.95)0.857 soit un
    risque alpha réel de 14.3
  • Objectif des corrections
  • Comparer les moyennes des groupes en contrôlant
    pour linflation des risques a (type I) pour
    toutes les comparaisons
  • Garder un risque a de 5 pour toutes les
    comparaisons gt le risque a pour chaque
    comparaison sera dautant plus petit que le
    nombre de comparaisons est important

19
Bonferroni, Scheffé, Dunnett
  • Comparaison a priori ou a posteriori des groupes
  • Corrections pour des comparaisons multiples
  • Dunn-Bonferroni (la correction plus simple a
    priori)
  • a corrigé ? / nombre de tests. 5-gt 1 si 5
    comparaisons
  • Autres tests ( a posteriori)
  • Dunnett les groupes sont comparés à un groupe
    de contrôle
  • Contrastes non orthogonaux - Usage fréquent
  • Tukey HSD
  • Compare toutes les paires possibles
  • adapté sil y a de nombreux groupes à comparer
  • Scheffé très conservateur mais accepte des
    groupes inégaux.
  • Correction pour toutes les comparaisons possibles
    (paires ou composées) en augmentant la différence
    critique.
  • Une différence à elle seule doit être assez
    grande pour rendre le F global significatif.

20
Test des différences
  • Bonferroni (test en t) Scheffé (test en F)

21
CONTRASTES
  • un test a priori de différences de moyennes
    (hypothèse préalable)
  • Un Contraste est une somme pondérée des moyennes
    dont la valeur attendue sous H0 est nulle
  • C a1.m1 a2.m2 a3.m3
  • Comparaison sur une combinaison linéaire de
    plusieurs groupes
  • Test dune combinaison linéaire des (nb
    groupes-1) contrastes
  • Si a 1 0 1 alors on a C m1 - m3
  • Si a 1 1/2 1/2 alors on a C m1 - 0.5 m2
    -0.5 m3
  • Contrastes particuliers
  • Helmert (groupes ordonné)
  • -1 1 0 0 -1 -1 2 0 -1 -1 -1 3
  • Contraste polynomial
  • Prise en compte successive dun trend linéaire,
    quadratique, cubique

22
Contrastes orthogonaux
  • Des Contrastes orthogonaux sont indépendants les
    uns des autres
  • Pour que 2 contrastes soient orthogonaux, il faut
    que la
  • Somme des produits des coefficients de chaque
    variable soit NULLE
  • Somme des coefficients dun contraste soit NULLE
  • Exemple
  • C1 -1 0 1 et C2 -1 2 -1
  • C1 1 -1 0 0 et C2 0 0 1 -1
  • Générer des contraste orthogonaux
  • http//www.bolderstats.com/orthogCodes/
  • Tous les contrastes doivent être orthogonaux 2 à
    2
  • Chaque contraste
  • a sa somme des carrés
  • a 1 degré de liberté au numérateur et ddl erreur
    au dénominateur.

23
Moyennes et Moyennes estimées
  • Moyenne (MEAN) correspond à la moyenne
    arithmétique
  • Cest la moyenne générale
  • Moyenne estimée (LSMEANS) correspond à la moyenne
    estimée par le modèle utilisé
  • Cest la moyenne des moyennes des niveaux dun
    facteur
  • Elle est ajustée en fonction de la moyenne des
    variables indépendantes
  • Elles sont différentes
  • Sil y a des valeurs manquantes ou des effectifs
    différents
  • Sil y a des variables explicatives (covariates)

24
ANCOVA
  • ANCOVA
  • Permet de tenir compte dun facteur/variable que
    l on peut mesurer mais non contrôler
  • Leffet de la variable non contrôlé est éliminé
    dabord avant de prendre en compte les facteurs

25
MANOVA
  • MANOVA
  • Prendre en compte plusieurs variables à expliquer
    (Y1, Y2, Y3)
  • Voir sil y a un effet global de la variable
    explicative
  • Puis chercher sur quelle variable plus
    particulièrement il y a un effet par des ANOVA

26
SAS ANOVA monotone (Proc Transreg)
  • La variable dépendante nest plus métrique
    (intervalle)
  • Fonction de création dun score
  • Celui-ci peut être utilisé dans dautres Proc
  • MAIS les tests statistiques ne peuvent plus être
    utilisés (car les données ont été transformées)
  • Variantes
  • ordinary multivariate multiple regression
  • model linear(y1-y3) linear(x1-x4)
  • monotone multiple regression model
  • model monotone(y) linear(x1-x4)
  • smooth monotone (quadratic spline) multiple
    regression model
  • mspline(y) linear(x1-x4)
  • parallel monotone curves, separate intercepts
    model
  • linear(y) class(gp) spline(x/degree1)
  • MONANOVA monotone ANOVA (conjoint analysis), main
    effects model
  • monotone(y1) class(x1-x3)
  • PREFMAP or ideal point regression
  • model monotone(y1) point(x1-x3)
  • En savoir plus
  • Graphical methods for marketing research, Warren
    Kuhfeld

27
Analyse de variance de Friedman (rangs,
plusieurs variables within)
  • Encore appelée CMH (Cochran-Mantel-Haenszel)
  • Non paramétrique
  • échantillons appariés
  • variable dépendante ordinale
  • H0 la distribution des rangs des colonnes est
    la même selon les lignes
  • Lien entre
  • une variable Ordinale et
  • une variable Nominale à plusieurs modalités. ( k
    échantillons appariés)
  • Exemple des juges (ligne) évaluant des vins
    (colonnes)
  • Généralisation de
  • Test du signe à plus de 2 colonnes
  • Test de corrélation des rangs de Spearman à plus
    de 2 lignes
  • Le rang est calculé pour chaque ligne
    indépendamment, puis les rangs de deux lignes
    sont comparés
  • Si H0 est rejetée on peut ensuite comparer les
    conditions 2 à 2 pour déterminer celles qui sont
    significativement différentes ()
  • En savoir plus http//www.ats.ucla.edu/stat/sas/
    whatstat/whatstat.htm

28
SAS AV de Friedman (Cochran-Mantel-Haenszel)
  • H0 la distribution des scores sur les réponses
    à plusieurs tests nest pas différente

data in input id r1 r2 r3 r4 cards A 4 2
1 3 B 3 2 1 4 C 4 1 2 3 proc
print datain run proc sort data in by
id run proc transpose datain
outTransp_in nameR by id var r1 r2 r3
r4 run proc print dataTransp_in run proc
freq dataTransp_in tables idRcol1 /
cmh2 scoresrank noprint run
Acceptation de H0 (?)
Write a Comment
User Comments (0)
About PowerShow.com