Estimations sur un cluster - PowerPoint PPT Presentation

1 / 67
About This Presentation
Title:

Estimations sur un cluster

Description:

M thodes du Maximum de Vraisemblance en Mod le lin aire Mixte ... sur les bords. JM - S m. Doct. 17.05.04. 44. Test d'une composante de la variance = 0. Le ... – PowerPoint PPT presentation

Number of Views:66
Avg rating:3.0/5.0
Slides: 68
Provided by: jeanma6
Category:

less

Transcript and Presenter's Notes

Title: Estimations sur un cluster


1
  • Estimations sur un cluster
  • J. Macario

2
Plan
  • Les choses
  • Les questions
  • Une escroquerie
  • Une vieille recette
  • Maximum de Vraisemblance
  • mise en uvre
  • résultats
  • Développements

3
The reference complètement in French
  • J.L. Foulley, C. Delmas, C. Robert-Granié
  • Méthodes du Maximum de Vraisemblance en Modèle
    linéaire Mixte
  • Journal de la Société Française de Statistique
    (2002)
  • 143 (1-2),pp 5-52
  • très complet
  • très matheux
  • 77 réf. , 3 annexes

4
Estimations sur un cluster
  • Les choses

5
Pour chaque sujet, des "lectures"
6
20 "sujets", 4 "lectures"
7
Le modèle
8
La variance pour un sujet complet Vi
9
Estimations sur un cluster
  • Les questions
  • (pour quoi faire ?)

10
Estimations
  • Valeur de m
  • Variance de l'estimation
  • ou intervalle de confiance
  • Variance intersujet
  • et la précision de l'estimation
  • variance de (l'estimation) de la variance
  • Même chose pour la variance de la lecture

11
Et plus loin, les BLUP
  • Reconstituer les effets sujets
  • qui ont été abandonnés au profit de la variance

le modèle de départ a été
remplacé par une écriture ne dépendant que de
ces paramètres
Peut-on (re)trouver ?
12
Le modèle de départ et sa reformulation
20 sujets
1 moyenne
21 paramètres
3 paramètres
13
Le critère d'ajustement
  • Méthode de Moindres Carrés
  • ordinaires
  • pondérés
  • généralisés
  • Maximum de Vraisemblance
  • REML
  • Resticted Estimation Maximum Likelihood
  • REsidual Maximum Likelihood

14
Bref ...
  • MMCO
  • MMCP
  • MMCG
  • MV
  • REML
  • et BLUP

15
Estimations sur un cluster
  • Une escroquerie

16
Négliger les deux niveaux d'erreur
  • Traiter toutes les valeurs comme des observations
    indépendantes
  • Résultat
  • Estimation de m correcte !
  • Variance résiduelle fausse
  • Variance de l'estimation de m fausse

17
Modèle implicite
18
Modèle implicite
19
Estimations sur un cluster
  • Une vieille recette

20
L'Anova
Anova 1 facteur
Facteur sujet à 20 modalités
avec 4 répétitions dans chaque colonne
à noter N 80
21
La table d'Anova
Inter-sujets
3631,25
19
191,118421
Résiduelle
629,5
60
10,4916667
Totale
4260,75
79
22
Méthode de Henderson de type1
  • Simple et de bon goût
  • Sans biais
  • Mais peut donner des estimations négatives (!)
  • le prix à payer pour le "sans biais" (?)
  • Pas d'estimation disponible de la variance de
    (l'estimation de) la variance

23
Estimation de
24
Détails sur l'escroquerie
  • ddl 19 et pas 79
  • Escroquerie Var(m) 0,67417
  • Avec l'Anova Var(m) 2,38898

100 IC(95)simulés
pas mal !
25
Estimations sur un cluster
  • Maximum de Vraisemblance
  • mise en uvre

26
Formulation
27
Variance pour un sujet
28
Formulation
29
Formulation de V pour plusieurs sujets
30
Formulation de det V
31
Formulation de la somme des carrés
32
Formulation de la somme des carrés
33
Estimations sur un cluster
  • Maximum de Vraisemblance
  • résultats

34
Estimations des paramètres
Résultats du MV
Résultats de l'Anova
m 75,62497
m 75,62500
s2(sujet) 42,76763
s2(sujet) 45,15669
s2(lecture) 10,49167
s2(lecture) 10,49167
35
Un autre problème - MV test de Wald
Résultats de l'Anova
Résultats du MV
m 75,62500
m 75,62497
s2(m) 2,38898
s2(m) 0,88124
IC(95) ( 72,38995 78,86005 )
t Student 19 ddl 2,093
IC(95) ( 75,09592 76,15402 )
t Normal 1,96
36
Une forme de solution(log du) Rapport de
Vraisemblance
IC(95) ( 72,67232 78,57767 )
Rappel Anova IC(95) ( 72,38995 78,86005 )
Rappel Wald IC(95) ( 75,09592 76,15402 )
37
W W W ?
328,908
3,841
325,067
38
W W W ?
78,58
72,67
39
W W W ?
approximation paraboliquede -2LV
Test deWald
40
W W W (2) ?
Anova s2(sujet) 45,16
MV s2(sujet) 42,77
Variation relative 5,29
41
Le MV n'a pas que des désavantages
Résultats de l'Anova
Résultats du MV
s2(sujet) 45,16
s2(sujet) 42,77
s2 s2(sujet) ?
mais
s2 s2(sujet) 0,00971
(IC à construire par RV)
42
Tentative (?) d'amélioration (?) du test de Wald
  • Bidouiller le ddl
  • En principe on est asymptotique
  • estim/s(estim) loi Normale
  • SAS
  • estim/s(estim) loi de Student à n ddl
  • plusieurs choix pour n ddl, aucun indiscutable
  • préconisation Satterthwaite
  • Vraie Préconisation RV !

43
Estimations sur un cluster
  • Un test un peu particulier sur les bords

44
Test d'une composante de la variance 0
  • Le Problème
  • test de l'hypothèse H0 s2(machin) 0
  • la valeur à tester se trouve sur le bord de
    l'intervalle de définition
  • à l'évidence les valeurs négatives pour s2 ne
    sont pas possibles
  • La solution
  • modifier le test du rapport de vraisemblance pour
    le rendre unilatéral

45
Modification du test du rapport de vraisemblance
46
Loi modifiée
c2 à 1 ddl
47
Construction
c2 0 ddl
c2 1 ddl
la demi somme
48
Calcul connaissant la valeur trouver la p-value
49
Trouver le c2 limite pour un seuil a donné
50
Pour un cas plus compliqué
51
MV ou REML
  • Les tests RV sont utilisables avec la
    vraisemblance standard ou avec le REML
  • Si on utilise le REML
  • bien prendre garde de ne comparer que des modèles
    avec LES MÊMES EFFETS FIXES

52
Estimations sur un cluster
  • Perfectionnements

53
Le REML - principe
observations dans Rn
résidus dans Rn-p
modèle dans Rp
54
Dans notre cas
observations dans R20
résidus dans R19
modèle dans R1
55
Question et réponse
Comment passer de R20 à R19 ?
dans R20
dans R19

56
REML - résultats
Résultats de l'Anova
Résultats du MV
s2(sujet) 42,77
s2(sujet) 45,16
s2 s2(sujet) 0,00971
Résultats du REML
s2(sujet) 45,15661
s2 s2(sujet) 0,008323
(IC à construire par R-REML)
57
Pourquoi REML marche ?
58
Pourquoi REML marche ?
59
Le BLUP
  • Best Linear Unbiased Predictor
  • par analogie avec BLUE
  • Best Linear Unbiased Estimator
  • estimateur MMCP ou MV
  • Le résultat théorique

60
Rétrécissement ou Shrinkage
moyennes brutes
s2(sujet) 45,15669
s2(lecture) 10,49167
BLUP
61
Shrinkage
moyennes brutes
s2(sujet) 5,665
s2(lecture) 25,688
BLUP
62
Une promenade dans les lois de proba
63
Une promenade dans les lois de proba
64
Au prix d'une ellipse ...
65
Les formules du BLUP
66
Estimations sur un cluster
  • Variantes

67
Les méthodes apparentées
  • MMCP ou MMCG
  • GEE
  • Two Stage
  • EM
Write a Comment
User Comments (0)
About PowerShow.com